一、 小组人员与分工

本阶段,小组各成员围绕“文澜知微”项目核心功能,进行了明确分工,并行推进了多个模块的开发。

成员

负责模块

主要工作内容

核心成果

陈秋华

历史地图与时空可视化(4.12-4.18)

1. 历史地名数据采集、清洗与格式转换(Shapefile -> SQLite -> GeoJSON) 2. 基于高德地图的前端地图组件开发(含时间轴联动、筛选搜索) 3. 集成 DeepSeek AI 问答面板,实现结合地图上下文的智能问答。

搭建了项目时空可视化基础框架,产出了覆盖10522条、从先秦到清朝的历史地名数据集和可交互地图模块。

秦玮悦

核心业务模块与基础设施(4.10-4.14)

1. 搜索、收藏、阅读历史三大功能模块的前后端全栈开发 2. 相关数据库设计、实体与接口实现 3. 解决历史记录重复、章节跳转等关键 Bug,引入 @Transactional 保证数据一致性。

完成了阅读应用的核心闭环,提升了用户体验,并为其他模块的开发提供了标准化的接口开发规范。

蔺涵霖

AI 历史人物对话与智能增强(4.16-4.23)

1. 历史人物对话效果优化,确定“Prompt工程为主,SFT微调为辅”的技术路线 2. 设计并实现了角色创建、群聊对话的结构化 Prompt 3. 引入 CBDB 数据集,构建“AI生成+数据集兜底”的混合角色创建模式,解决 MySQL/SQLite 双数据库并存问题。

显著提升了AI角色扮演的沉浸感和事实准确性,实现了系统的“智能化”升级,让生成的角色既“可聊”又“可信”。

二、 各部分详细进展

1. 时空可视化基座 (负责:陈秋华)

  • 数据建设:已完成从哈佛大学Dataverse平台的数据采集,并通过Python脚本清洗、合并,成功将复杂的Shapefile数据转换为可供前端高效加载的 GeoJSON 和时间索引文件。

  • 核心功能:地图组件实现了地名按朝代、年份的动态展示与筛选,支持时间轴拖动、朝代快速切换和地名详情查看。

  • AI 融合:创新性地在地图组件中集成了DeepSeek AI问答面板,能结合当前地图的“时空上下文”回答用户关于历史事件、人物的问题,初步实现了“图-文-AI”的联动。

2. 核心业务闭环构建 (负责:秦玮悦)

  • 模块实现:完成了搜索、收藏、历史记录三个紧密相关的功能模块。用户可搜索古籍、收藏书籍、并自动记录阅读进度与历史。

  • 体验优化

    • 实现了人性化的历史记录按“今天/昨天/更早”分组展示。

    • 解决了“同本书多次记录刷屏”和“章节跳转错误”等影响用户体验的关键问题。

    • 在详情页实现了“开始阅读”与“继续阅读”的智能按钮切换,打通了从记录到续读的流程。

  • 架构规范:通过引入 @Transactional 注解解决了高并发下的数据一致性问题,为后续开发树立了规范。

3. AI 历史人物对话优化 (负责:蔺涵霖)

  • 技术路线验证:通过对SFT微调和DeepSeek原生API的对比测试,确定了“以强大的Prompt工程为核心,以公开数据集为知识补充”的优化路线,保证了对话的自然度和沉浸感。

  • Prompt 架构设计:设计了一套层次分明的Prompt体系。首先通过角色画像生成Prompt输出结构化的JSON角色设定;再通过群聊对话Prompt控制多角色在特定场景下进行符合身份的发言,确保角色区分度和历史严谨性。

  • “AI+数据”双引擎:引入CBDB公开历史人物数据库作为兜底。当AI对生僻人物生成不完整时,系统自动从SQLite数据库中补充可靠史料,有效解决了“模型幻觉”问题,提升了角色创建的稳定性和覆盖率。

三、 项目总结与展望

3.1总结

本阶段,小组采用“分模块并行开发”的高效模式,完成了项目从“0到1”的基础构建。我们不仅实现了古籍阅读、历史地图可视化与历史人物AI对话三大核心功能,更重要的是探索并确立了“前端交互为体,AI大模型为用,公开数据为基”的项目核心架构。这种架构保证了系统的趣味性、智能性与知识严谨性的统一。

3.2下阶段规划:

根据各模块的开发日志,下阶段我们将聚焦于功能的深化与串联:

  1. TTS语音朗读:引入语音技术,为用户提供更沉浸的古籍听读体验。

  2. AI智答模块:计划实现多模型切换、对话历史管理等更全面的AI交互功能。

  3. “人物-地图”联动:着手开发历史人物轨迹功能,将组员A的地图能力与组员C的人物数据结合,让用户能在动态地图上直观感受历史人物的一生,最终形成完整的“历史地理可视化系统”。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐