论文信息

论文标题: Guiding Generative Storytelling with Knowledge Graphs - International Journal of Human–Computer Interaction 2025
论文作者: Zhijun Pan et al. - University of the Arts London
论文链接: https://www.tandfonline.com/doi/full/10.1080/10447318.2025.2603634#abstract


研究背景

虽然 LLM(如 GPT-4、Llama)在自动化故事生成方面潜力巨大,但仍面临两大挑战:

  1. 长篇连贯性不足:随着故事篇幅增长,模型容易出现事实幻觉、逻辑矛盾(如地理位置错误、角色行为前后不一) 。
  2. 用户控制力有限:用户难以通过直观方式精确干预故事走向,通常需要复杂的提示词工程(Prompt Engineering) 。

核心贡献

论文提出了一种KG辅助的故事生成流水线,其核心是将非结构化的叙事逻辑转化为结构化的知识条目(节点、关系、描述) 。

在这里插入图片描述

系统架构(Pipeline)主要分为三个阶段:

  • 初始化(Initialization): 根据用户输入的标题、背景和角色,提取并清洗初始知识图谱 。
  • 场景生成(Scene Generation): 在生成第 i i i 个场景时,系统只查询与当前情节相关的 KG 子集,以减少 Token 消耗并增强聚焦度 。
  • 动态更新与编辑(Update & Edit): 每生成一个新场景,系统会自动更新图谱中的节点属性和关系 。
    • 同时,系统支持“编辑模式”,允许用户手动修改图谱,从而即时改写后续情节 。

实验设计

  • 参与者: 15 位具有高等教育或 AI 叙事背景的专业人士 。
  • 实验设置:
    • 阶段 1(编辑器关闭): 对比评估有无 KG 辅助生成的两篇故事(盲测),探究其对叙事质量的影响(RQ1) 。
    • 阶段 2(编辑器开启): 用户通过编辑 KG 来控制故事发展,评估其对创作自主权的影响(RQ2) 。
  • 模型: 为了便于消融研究和透明度分析,实验采用了 Llama 3.1 8B 这种轻量化开源模型,而非封闭的 GPT 模型 。

研究发现

  • RQ1:KG 对质量的提升
    • 在全行业/全题材的统计中,KG 对故事质量的整体提升在统计学上并不总是显著 。
    • 但关键点在于: 在**动作导向(Action-oriented)**或逻辑严密的叙事(如结构化较强的类型片)中,KG 显著改善了事实一致性和情节逻辑 。
  • RQ2:用户控制与互动性
    • 编辑模式大幅增加了用户的“控制感”和“创作主体意识” 。
    • 用户普遍认为通过结构化图谱修改故事比调整提示词更直观、更有趣,增加了创作过程中的“游戏化”体验 。

总结

  1. 这篇论文通过将 RAG(检索增强生成) 的理念引入创意写作,证明了结构化知识在弥补模型“长程记忆”缺陷方面的有效性 。
  2. 查询 kg 的范围限制在当前的 章节是否是最佳的,如何回溯过去的内容?
  3. 如何评估生成的内容的质量,与现实文本的区别。
  4. 是否有真实的demo?
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐