在不断发展的 AI 工作流领域,OpenClaw 用户现在可以直接调用 ComPDF 的专业级能力。

此次集成支持广泛的 PDF 处理功能——包括格式转换、页面编辑、压缩、文件比对和水印添加——全面满足自动化文档处理的核心需求。

什么是 ComPDF Skills?

ComPDF Skills是集成了 AI 技术的高精度 PDF 处理引擎,专为 OpenClaw 打造。它远不止于简单的格式转换。它赋予您的 AI 代理真正读取、理解和编辑复杂 PDF 文件的能力。它将 PDF 中的非结构化数据转换为结构化的、LLM 就绪的格式,弥合了静态文档与动态 AI 工作流之间的鸿沟。ComPDF Skills包含以下几个Skills:


1. PDF Editor Skill(由 ComPDF SDK 驱动)

PDF Editor提供快速的本地处理,无需上传文件。它同时支持 Windows 和 Mac 平台。

支持的功能:

功能 描述
拆分 按页面或范围拆分 PDF
合并 将多个 PDF 合并为一个
提取 提取选定的页面
旋转 旋转单页或整个文件
删除 删除不需要的页面
插入页面 向 PDF 中添加新页面
插入图片 将图片放入 PDF
转换 转换为 PDF/A, PDF/X, PDF/UA 或 PDF/E
优化/压缩 缩小文件大小以便分享
比对 使用叠加比对来发现更改
文本水印 添加文本水印
图片水印 添加图片水印
移除水印 删除现有水印

安装

首次使用时,CLI 二进制文件会自动从 ComPDFKit 官方服务器下载,试用许可证通过电子邮件激活。试用许可证是免费的,因此您可以在邮件激活后立即开始使用。

# Claude Code
claude skill add youna12345/pdf-editor-compdf

# OpenClaw
openclaw install youna12345/pdf-editor-compdf

PDF 转换Skills(由 ComPDF SDK 驱动)

"PDF 转 Word" skill 允许您将 PDF/图片转换为多种格式。内置的 AI 版面分析和多语言 OCR(中文/英文/日文/韩文等)提供的转换质量远超普通工具。

(注意:PDF 转 Word 只是名称,并不意味着它只能将 PDF 转换为 Word 文件。)

支持的格式

Skill 名称 输入 输出
PDF 转 Word PDF, 图片 (JPG/PNG/BMP/TIFF/WEBP 等) Word, Excel, PPT, HTML, Image, TXT, JSON, Markdown, RTF, CSV

安装

首次运行时,AI 模型(约 525MB)将自动下载。它会缓存在本地,无需再次下载。

# Claude Code
claude skill install https://clawhub.ai/youna12345/pdf-to-word-docx

# OpenClaw
openclaw skills install pdf-to-word-docx

PDF API Skills(由 ComPDF Cloud 驱动)

PDF Toolkit 由 ComPDF Cloud API 提供支持,拥有 50 多种文档操作——让云端处理繁重的工作。可在任何平台上使用。

功能

功能 描述
PDF → Word 将 PDF 转换为可编辑的 Word 文档
PDF → Excel 将 PDF 中的表格提取到 Excel 电子表格中
PDF → PPT 将 PDF 转换为 PowerPoint 幻灯片
PDF → Image 将 PDF 页面导出为 PNG/JPG
PDF → Markdown 将 PDF 内容转换为 Markdown 用于文档
PDF → HTML 将 PDF 转换为网页格式
PDF → CSV 将表格数据提取到 CSV
PDF → TXT 提取纯文本
Word → PDF 将 Word 文档转换为 PDF
合并 将多个 PDF 合并为一个
拆分 按页面范围拆分 PDF
压缩 减小文件大小
水印 向 PDF 添加水印
OCR 识别扫描文档中的文本
AI 提取 从身份证、发票等中智能提取结构化数据
AI 解析 智能文档版面分析和内容解析

安装

首次使用前,您需要一个 ComPDF Cloud API 密钥。在 ComPDF 注册以获取公钥——免费套餐允许每 30 天处理 200 个文件。

# Claude Code
claude skill add youna12345/pdf-tools-compdf

# OpenClaw
openclaw install youna12345/pdf-tools-compdf

ComPDF Skills 的主要特性与优势

  • 高保真转换:将 PDF 和图像文件转换为多种可编辑格式,包括 Word、Excel、PPT、HTML、CSV、JSON、RTF、TXT、图像和 Markdown。保留复杂布局(如分栏和表格),无数据丢失。

  • 高级页面操作:为您的代理提供对文档精确的物理级控制。轻松将多个 PDF 合并为一个,将大文件拆分为单独文档,提取特定页面,旋转不对齐的扫描件,删除不需要的部分或添加新页面。

  • 带 OCR 的转换:利用先进的光学字符识别(OCR)技术,准确识别和提取扫描文档和手写笔记中的文本。它保持原始的逻辑布局,确保段落和阅读顺序得以保留。

  • 文档安全与优化:通过压缩文件来减少令牌消耗和处理时间,为 LLM 准备文档。此外,通过向 PDF 添加可自定义的水印来保护您的知识产权。

  • 文档比对:即时高亮显示两个文档版本之间的差异。此功能对于审阅修订后的合同、更新的报告或编辑过的手稿至关重要,可在字符或段落级别显示更改。


应用场景:为 OpenClaw 代理解锁 PDF 处理能力

场景 1:自动化财务报告分析代理
不再为混乱的 PDF 数据而苦恼。一个分析代理可以使用 ComPDF 将复杂的多页财务报告转换为清晰的 Markdown 格式。然后将这些结构化数据直接输入 LLM,进行准确的趋势分析、数据对比和洞察生成。

场景 2:法律/合同审查工作流
法律团队可以自动化繁琐的审查流程。代理可以自动将一份极长的合同拆分成易于管理的部分。然后它可以利用"比对"功能,即时识别并高亮显示合同两个版本之间的差异,标记出潜在的修订或风险。

场景 3:学术数据库数字化
研究人员可以构建强大的知识库。代理可以批量处理数百篇扫描的学术论文,使用 ComPDF 的高精度 OCR 将文本数字化。生成的数据随后被输入到向量数据库中,为 RAG(检索增强生成)创建丰富的来源,为研究助手提供动力。


为何在 ClawHub 上选择 ComPDF?

  • 企业级精度 vs. 开源工具:虽然开源工具通常难以处理跨页表格等复杂元素,但我们的引擎专为准确性而构建。我们确保数据结构和关系得以保留,在数据完整性方面提供显著优势。

  • 多语言全球支持:ComPDF 为全球而生。它为广泛的语言提供高精度 OCR 支持,包括基于拉丁语的文字,以及复杂的 CJK(中日韩)字符和其他小语种。

  • 性能稳定:自信地处理大文件和高容量文档。我们的引擎针对稳定性和高并发性进行了优化,确保在处理大规模 PDF 任务时您的工作流不会崩溃或变慢。

  • 开发者友好:您无需编写一行 Python 代码来调用 API。通过 ClawHub 上的 ComPDF,您可以直接通过直观的 ClawHub UI 配置复杂的文档处理逻辑,加快您的开发速度。


快速入门指南

前往您的 AI 代理,根据需要安装以下 ComPDF Skills。然后按照安装说明操作。之后,您就可以让您的 AI 代理为您转换或编辑 PDF 了。

PDF 工具包(用于在任何平台上转换和编辑 PDF 的 API):
在 ComPDF Cloud 注册以获取 API 公钥——免费套餐允许每 30 天处理 200 个文件。

# Claude Code
claude skill add youna12345/pdf-tools-compdf

# OpenClaw
openclaw install youna12345/pdf-tools-compdf

PDF 转 Word(用于将 PDF 转换为多种格式的 SDK):
首次运行时,它会自动从 download.compdf.com 下载 license.xml,允许 200 次转换。如果您想处理更多文件,请购买官方许可证,并将新的 license.xml 放入 scripts/ 目录以覆盖现有文件,实现无限制转换。

# Claude Code
claude skill install https://clawhub.ai/youna12345/pdf-to-word-docx

# OpenClaw
openclaw skills install pdf-to-word-docx

PDF 编辑器(用于在 Mac 和 Windows 上编辑 PDF 的 SDK):
新用户需要提供您的电子邮件,向 wms.compdf.com/api/license/skillsTrial 发送请求。许可证 XML 将返回。当 30 天试用期到期时,将出现许可证到期通知。请联系销售人员获取许可证:https://www.compdf.com/contact-sales

# Claude Code
claude skill add youna12345/pdf-editor-compdf

# OpenClaw
openclaw install youna12345/pdf-editor-compdf

总结

ComPDF Skills 在 ClawHub 上的推出标志着文档自动化向前迈出了重要一步。它为平台上的 AI 代理配备了以企业级精度"读取"、"理解"和"处理"复杂 PDF 文档的基本能力。

立即安装,让您的代理有能力应对任何文档挑战。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐