开源智能文档校对软件—AutoDocxProofread
📝 项目简介
AutoDocxProofread(智能校对)是一款专为长文档校对而设计的桌面应用程序。它能够帮助用户有效检测 Word 文档中的错别字、标点符号错误、语法问题和文本一致性问题,并一键修改错误。
针对大模型在处理长文档时存在的遗忘和幻觉问题,软件设计了专门的架构来增强校对的准确性,并能一键导出校对修改后的文档。并且软件采用了并行处理架构,显著提升大模型处理长文档的速度。此外还引入了本地知识库功能,支持RAG功能给模型校对参考。
核心功能与软件优势
-
多种校对模式:
- 逐句精校:适合需要高精度校对的短文本
- 逐段校正:适合长篇文献的校对
- 全文润色:对整篇文档进行语言润色和优化
-
智能错误识别:
- 错别字检测
- 标点符号错误识别
- 语法问题检测
- 上下文一致性检查
-
知识库系统:
- 创建和管理多个本地知识库
- 支持PDF、word和txt文档导入作为参考材料
- 基于向量数据库的RAG检索增强生成算法
-
更快的处理速度和用户友好的操作体验:
- 使用并行处理的方式优化处理效率,显著提升对于长文本的校对速度
- 清晰的错误展示和修改建议
- 一键应用修改建议,一键导出修改后的文档
- 校正参数可调,可以适应不同任务场景
-
便捷的 API 配置管理:
- 兼容openai接口,支持多种大语言模型 API
- 灵活的 API 配置管理
- 支持对于并发数量和请求速度的设置
-
清晰的历史记录管理:
- 清晰查看历史记录,包括时间、校对模型、校对文件路径和具体的结果
- 支持对结果的批量管理
使用展示
用户需要先在功能设置页面选择一个大模型后再开始校对操作。在文档校对页面,首先选择需要校对的文档后,再选择校对模式,选择使用的知识库(非必选),然后开始校对。软件会将校对的结果显示在右边栏,并在文本中高亮展示,以方便查看。然后可以选择是否接受这些修改,可以导出接受修改后的文档:
本应用可以自行设置api,兼容满足openai规范的api接口,推荐使用非推理模型,并且可以限制并发请求数量和请求评率:
可以设置校对的错误类型、严格程度和文本背景,也可以自行设置提示
本应用还可以浏览和管理校对记录:
知识库管理界面:
昼夜模式切换效果:
注意:校对结果的准确度很大程度上取决于模型能力,软件无法保证校对结果的完全准确,还需要人工再次检验。 提示:结果导出功能可能存在疏漏,建议人工核验。 提示:全文润色功能适合较短篇幅的文档。逐句校对对token的消耗很大。
更新记录
- v1.1.6
- 添加进度条,用户可以实时查看校对进度
- 优化api设置功能
- 优化提示词设置,更加清晰方便
- 点击校对结果可以直接跳转
- v1.1.5
- 优化文件导出功能的操作体验
- 优化文件导出逻辑,让错误替换更加准确
- v1.1.4
- 新增代理功能
- v1.1.3
- 新增了请求频率限制,优化对于第三方api转接站的支持
- 优化深色模式显示效果
- 新增token用量统计
- 优化界面效果,改善交互逻辑
- v1.1.2
- 修复全文润色模式中,不使用rag功能时无法正常校对的bug
- 新增昼夜模式切换功能
- 模型并发限制可调,可以适应不同的api供应商对于并发的限制要求
- v1.1.1
- 修复rag功能可用性bug
- v1.1.0
- 重构界面,优化使用逻辑
- 提升软件可用性
🛠 技术栈
- 主框架:Electron + Vue 3 + TypeScript
- UI 组件库:Element Plus
- 构建工具:Vite + Electron Forge
- 文档处理:Mammoth + Docxtemplater
- 向量数据库:LanceDB
- 代码规范:ESLint + Prettier
- 版本管理:Standard Version
🚀 快速开始
环境要求
- Node.js >= 16.x
- npm 或 yarn
安装依赖
npm install
开发模式运行
npm run start
🎯 使用指南
1. 配置 API
首次使用需要配置支持的大语言模型 API:
- 点击导航栏中的"工作区"
- 选择"API 设置"选项卡
- 填写 API 地址、密钥和模型名称
- 点击"测试连接"验证配置
- 点击"保存配置"保存设置
2. 创建知识库
- 点击导航栏中的"知识库"
- 选择"Embedding模型"(需要选择专门的embedding模型)
- 点击"添加知识库"按钮创建新知识库
- 选择知识库后可添加PDF文件作为参考材料
3. 文档校对
- 点击导航栏中的"工作区"
- 选择"文档校对"选项卡
- 点击"选择 DOCX 文件"按钮选择要校对的 Word 文档
- (可选)选择知识库以增强校对准确性
- 选择合适的校对模式:
- 逐句精校:适合需要高精度校对的短文本
- 逐段校正:适合长篇文献的校对
- 全文润色:对整篇文档进行语言润色和优化
- 点击"开始校正"按钮开始校对过程
- 在右侧栏查看校对结果和修改建议
- 点击"应用修改"按钮接受建议的修改
- 点击"导出结果"按钮保存修改后的文档
4. 校正参数设置
- 在“功能设置”页面点击提示词设置,可以选择不同的校正参数,例如文本背景、校正的严格程度和校正的错误类型
- 也可以使用自己的提示词,使用自己的提示词的时候会关闭原始的的提示词,建议参考原始提示词进行修改,否则会影响软件的显示效果
- 点击“恢复默认配置”可以重置上述设置
🔧 开发计划
- word文档格式校对
- 增强用户界面交互体验 (持续进行中)
- 优化.docx文件的处理算法
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐








所有评论(0)