一、阶段任务概述

本阶段(4.22-5.3),小组围绕历史人物轨迹地图可视化、古音朗读增强、AI侧边栏集成三大核心任务并行推进,进一步完善平台功能闭环,提升用户沉浸感与使用体验,实现平台从基础功能到智能化、个性化的升级,为古文沉浸式智慧阅读提供更全面的技术支撑。

成员:陈秋华、秦玮悦、蔺涵霖

时间:4.22-5.3,聚焦三大核心模块开发,同步完成模块整合、测试调试与优化迭代。

二、小组分工及成员完成情况

小组共3名成员,结合项目需求与成员技术特长,明确分工、协同推进,各成员具体分工及完成情况如下,所有已分配任务均按要求完成,无延期情况,核心功能均达到预期目标。

成员

负责模块

具体职责

完成情况

陈秋华

历史人物轨迹地图可视化开发

1. 封装轨迹数据接口,开发getPersonTracksData()方法,处理加载异常;2. 升级HistoricalMap.vue组件,新增轨迹接口定义、响应式数据、核心工具函数;3. 实现轨迹动态渲染、自动播放、朝代人物筛选、轨迹详情联动等核心功能;4. 整合轨迹模块与原有地图框架(历史地名、时间轴、AI问答),优化性能与响应式适配;5. 统一古风视觉风格,解决交互冲突与渲染卡顿问题。

✅ 全部完成,成功落地历史人物轨迹可视化模块,实现“历史地名+人物轨迹”双联动,轨迹播放流畅,多模块交互无冲突,完美适配PC端与移动端,坐标匹配率达标。

秦玮悦

AI侧边栏集成与大模型接入

1. 调研通古AI部署方式,预留接口框架;2. 对接阿里云通义千问大模型API,扩展配置类、服务层与控制器;3. 开发AI侧边栏组件,集成到阅读页,实现对话/摘要双Tab切换;4. 实现DeepSeek/通义千问模型实时切换,保留历史消息原模型标识;5. 完成阅读页改造,实现上下文感知的AI辅助功能,优化交互体验。

✅ 全部完成,AI侧边栏集成到位,通义千问API接入稳定,模型切换流畅,历史消息标识清晰,实现“阅读+AI辅助”并行体验,接口兼容且性能可控。

蔺涵霖

历史人物对话语音朗读模块(增强版)

1. 接入Ancient-Chinese-Phonology数据集,构建单字音系映射表,实现懒加载与异常回落;2. 建立朝代到发音时期的映射策略,实现按朝代差异化朗读;3. 开发IPA可读化转换流程,解决古音无法直接朗读的问题;4. 增强文本归一化,支持数字口语化与全角兼容;5. 完成古音/今音双模式联调测试,保证功能稳定性与可用性。

✅ 全部完成,成功实现“有历史感的朗读”,古音模式可正常使用且不牺牲稳定性,完成数字归一化、停顿处理等优化,用户可自行选择发音模式。

三、各模块完成效果

(一)历史人物轨迹地图可视化模块

1. 核心功能:实现按朝代筛选历史人物,一键加载轨迹;轨迹自动按时间顺序播放,采用金色→橙色古风渐变连线与序号标记,可视化效果直观;轨迹点弹窗展示完整信息(时间、地点、事件、史料出处);支持轨迹清除、播放暂停、地图视野自适应;具备坐标可信度自动识别功能,符合学术展示要求。

2. 模块联动:实现「时间轴→历史地名→人物轨迹→AI问答」全流程闭环,轨迹标记层级高于地名标记,点击轨迹点查看人物信息,点击地名查看地理信息,选中人物后可直接向AI提问相关问题,交互逻辑清晰无冲突。

3. 性能与适配:大数据量下无卡顿,轨迹加载<1秒,播放流畅;完美适配PC、平板、手机等设备,布局无错乱,响应式适配到位。

4. 代码成果:升级HistoricalMap.vue组件,封装坐标校验、年份解析等可复用函数,规范接口定义,严格适配personal_track.geojson数据格式,服务层接口统一,异常处理完善,符合团队开发规范。

(二)AI侧边栏集成与大模型接入模块

1. 核心功能:AI侧边栏为阅读页可折叠组件,点击“问AI”按钮即可展开,包含模型选择、对话/摘要双Tab、输入区域与消息展示区;支持DeepSeek与通义千问实时切换,切换后旧消息保留原模型标识,新消息使用新模型;实现上下文感知,自动获取当前阅读书籍、章节信息,动态生成推荐问题;支持多轮对话,消息携带完整历史上下文,AI可理解连续提问。

2. 大模型接入:成功接入通义千问API(Qwen3.6-Max-Preview),利用其OpenAI兼容格式,复用原有HTTP请求代码;调研通古AI(本地部署开源模型),在代码层面预留接口(配置结构+调用方法),为后续部署接入做好准备。

3. 交互效果:页面布局合理,侧边栏展开/收起平滑无卡顿;消息展示清晰,区分用户与AI角色,标注生成模型;空值防御与错误处理到位,API调用失败时给出友好提示,消息仅保存在前端内存,刷新后重新生成推荐问题。

(三)历史人物对话语音朗读模块(增强版)

1. 核心功能:实现“古音+今音”双模式切换,用户可自行选择;按朝代差异化朗读,建立唐/宋/元/明/清等朝代与对应发音时期的映射;古音可正常朗读,通过IPA可读化转换,实现“可听且可区分”;支持数字口语化转换、全角转半角、语句分组与停顿保留,提升朗读自然度。

2. 稳定性保障:采用懒加载+缓存机制,避免重复读文件;数据集不存在时自动回落至普通模式,不影响整体功能;接口兼容原有调用方式,前端无需大幅修改;预处理与映射逻辑在服务端完成,不增加前端复杂性。

3. 成果亮点:建立了可持续优化的古音推理基础框架,成功将“能朗读”升级为“有历史感的朗读”,提升了历史人物对话的沉浸感,贴合项目整体古风定位。

四、项目现存问题与改进方向

(一)现存问题

1. 历史人物轨迹模块:部分低可信度坐标可进一步优化;轨迹播放仅支持自动播放,缺乏手动控制(快进/快退、倍速)功能;暂未实现多人物轨迹对比展示。

2. AI侧边栏模块:消息仅保存在前端内存,无法持久化,刷新页面后消息清空;智能摘要功能尚未完善,仅完成Tab架构搭建;未实现选中文字弹出浮动菜单(问AI/摘要/复制)功能。

3. 古音朗读模块:朝代发音映射为工程化规则,并非完全语言学重建;五代十国等中间时期的发音缺乏细粒度推理支持;未实现用户偏好记录功能,无法记住用户常用发音模式。

4. 整体优化:各模块间的联动细节可进一步完善,部分页面交互的流畅度可提升;通古AI尚未正式接入,需等待GPU资源支持。

(二)改进方向

1. 轨迹模块优化:提升低可信度坐标匹配精度,补充更多历史人物轨迹数据;新增轨迹手动控制功能,支持快进、快退、暂停、倍速播放;开发多人物轨迹对比展示功能,直观分析人物活动范围;优化轨迹弹窗,增加坐标可信度图例。

2. AI侧边栏优化:实现对话消息持久化,对接数据库保存历史消息;完善智能摘要功能,支持段落、章节、全书摘要;开发选中文字交互功能,弹出浮动菜单,提升用户操作便捷性。

3. 古音朗读优化:优化朝代发音映射策略,引入混合推理方案,实现五代十国等中间时期的发音插值;增加用户偏好记录功能,保存用户常用发音模式,提升个性化体验。

4. 整体优化:细化各模块联动逻辑,提升页面交互流畅度;待获得GPU资源后,部署通古AI模型,完成正式接入,丰富大模型选择。

五、接下来的任务规划

结合项目整体目标与当前进度,后续任务按模块分工推进,计划周期为5.4-5.15,具体任务安排如下:

(一)各成员后续任务

成员

后续任务

任务要求

陈秋华

1. 优化轨迹模块,新增手动控制与多人物对比功能;2. 提升坐标匹配精度,补充历史人物轨迹数据;3. 完善轨迹弹窗与可信度图例;4. 优化模块联动细节,提升渲染性能。

手动控制功能流畅,多人物对比清晰;坐标匹配精度提升,低可信度坐标占比降低;弹窗信息完整,图例直观;模块联动无冲突,性能稳定。

秦玮悦

1. 实现AI对话消息持久化,对接数据库;2. 完善智能摘要功能,实现段落、章节、全书摘要;3. 开发阅读页选中文字浮动菜单;4. 优化AI侧边栏交互细节,提升用户体验。

消息持久化正常,支持历史消息查看;摘要功能精准,贴合文本内容;浮动菜单交互流畅,功能正常;侧边栏交互便捷,无卡顿。

蔺涵霖

1. 优化古音发音映射策略,实现中间时期发音插值;2. 增加用户偏好记录功能,保存发音模式;3. 完善古音朗读异常处理,提升稳定性;4. 配合团队完成模块联调与测试。

中间时期发音准确可区分;用户偏好记录正常,切换设备可同步;古音朗读无异常,稳定性达标;联调顺利,无兼容性问题。

(二)整体任务目标

1. 完成各模块优化任务,完善核心功能,提升用户体验与功能完整性;2. 实现AI消息持久化、轨迹手动控制、古音偏好记录等新增功能;3. 完成全功能测试、bug修复与性能调优,确保平台整体运行稳定;4. 推进通古AI部署接入准备,丰富大模型选择;5. 完善项目文档,整理代码与测试报告,为项目验收做好准备。

六、小组总结

本阶段(4.22-5.3),小组延续分工明确、协同配合的高效开发模式,顺利完成了历史人物轨迹地图可视化、AI侧边栏集成与大模型接入、古音朗读增强三大核心模块的开发任务,实现了平台功能的重大升级。

技术层面,各成员熟练运用Vue3响应式开发、高德地图API、大模型对接、数据处理等技术,解决了轨迹渲染卡顿、古音可读化、模型切换兼容等核心难点,提升了代码可维护性与系统稳定性;项目层面,实现了“历史地名+人物轨迹”双联动、“阅读+AI辅助”并行体验、“古音+今音”差异化朗读,进一步完善了平台闭环,提升了平台的智能化与沉浸感,贴合古文沉浸式智慧阅读的核心定位。

同时,我们也清晰认识到项目现存的不足,后续将严格按照任务规划,聚焦功能优化与细节完善,补齐短板,提升用户体验,确保按时完成项目整体目标,打造出功能完善、体验优良的古文沉浸式智慧阅读平台。

七、备注

1. 所有已完成模块均经过全面测试,接口联调正常,核心功能可正常演示,无重大bug;2. 项目相关代码、测试数据、开发文档已统一归档,代码注释完善,便于后续查阅与维护;3. 通义千问API接入过程中,其兼容模式简化了开发流程,通古AI已预留接口,待GPU资源到位后即可部署;4. 后续任务将严格按照计划推进,若有调整,将及时召开小组会议同步信息,确保团队协同高效。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐