长篇故事自动创作:Re3框架的探索

聚术观商业 2024-10-10 02:13:00

在人工智能领域中,长篇故事的连贯创作一直是一个挑战,它要求系统具备广泛的语言理解能力以及对世界常识的掌握。近年来,虽然已经出现了许多能够自动生成短篇故事的研究成果,但是这些作品通常只有几句话到一两段文字的长度,远低于人们通常阅读的短篇小说,后者往往有好几页纸那么长。为了缩小这一差距,研究人员开始尝试生成更长的故事,即长度在两千至两千五百个单词之间的“短篇小说”。

问题与挑战

在创作如此长的故事时,面临的主要挑战是如何保持整个故事结构的连贯性和与初始设定的相关性。此外,还需要注意叙述风格的一致性,并避免在整个故事中出现事实矛盾。

传统的解决方法通常依赖于较小规模的预训练模型或特定任务的微调模型,这些模型在生成较短文本时表现良好,但在处理长篇幅创作时常常力不从心。例如,可能会出现情节脱节、偏离主题或重复等问题。

解法:Re3框架

为了解决上述问题,研究者们提出了一个名为Recursive Reprompting and Revision(简称Re3)的框架。这个框架的设计灵感来源于人类写作的过程,通过模拟人类作家的工作方式来实现长篇故事的自动生成。

计划(Plan):首先,Re3会利用一个通用语言模型(如GPT3)来创建一个详细的结构化大纲。

草稿(Draft):然后根据这个大纲,逐步生成故事段落,并在每次生成时都注入来自大纲和当前故事状态的信息。

修订(Rewrite):接着会对不同的延续部分进行重新排序,以确保情节的连贯性和对初始设定的相关性。

编辑(Edit):最后,对选定的延续部分进行编辑,以保持长期的事实一致性。

实验结果

实验结果显示,使用Re3框架生成的故事比直接从相同基础模型生成的故事更加连贯且与初始设定相关。评估人员发现,Re3生成的故事中有显著更多的比例具有连贯的情节(增加了14%)和与初始设定的相关性(增加了20%)。此外,与两种基准方法ROLLING和ROLLING-FT相比,Re3在连贯性和相关性方面也有明显的优势。

结论

Re3框架展示了其在生成长篇连贯故事方面的能力,它不仅提高了故事的质量,还减少了写作中的问题。这项研究为未来进一步发展自动故事生成技术提供了新的思路和方向。随着通用大型预训练模型能力的增强,我们期待看到更多复杂而精细的长篇故事自动创作成果。

0 阅读:0