现在谁合并PDF还在开会员?不开会员的只能将文件上传到网站处理,但信息安全又让人提心吊胆。PDFsam是一款已运行超过20年的开源PDF桌面处理工具,基于Java与JavaFX构建,采用AGPLv3协议分发,支持合并、拆分、旋转、提取、交替混排五大核心功能,所有处理均在本地完成,无需上传任何文件到云端。本文将从项目背景、技术架构、核心功能实现到横向对比进行全面拆解。

一、引言

在日常办公中,合并PDF、拆分扫描件、旋转方向错误的页面,都是高频需求。市面上的解决方案无非两类:要么开会员使用付费软件的完整功能,要么将文件上传到在线处理网站。前者花钱,后者存在信息安全隐患——商业合同、财务报告、个人证件等敏感文件一旦上传到第三方服务器,数据去向完全不可控。

PDFsam的出现解决了这一困境。它是一款完全免费、开源的PDF桌面处理工具,所有操作均在本地完成,无需注册账号,无需上传文件到云端,完美兼顾了功能完整性与数据安全性。

二、项目背景与技术架构

2.1 项目起源与发展历程

PDFsam(PDF Split And Merge)由意大利开发者Andrea Vacondio创建,项目托管于GitHub(https://github.com/torakiki/pdfsam)。作为一款已持续维护超过20年的开源项目,PDFsam已成为PDF页面级操作领域最具代表性的免费工具之一。

从版本演进来看,PDFsam经历了三个重要阶段:

版本阶段 技术栈 系统要求 当前状态
v1.x - v3.x Java 8 + JavaFX 需自行安装JRE 8及JavaFX 已停止维护
v4.x - v5.x Java + JavaFX(自包含) 64位系统,内置jlinked JDK 稳定版
v6.x JDK 25 + JavaFX 25 64位系统,内置JDK 最新版(2026年)

自v4版本起,PDFsam以自包含应用程序形式发布,内置jlinked JDK,用户无需自行安装Java运行环境。这一设计大幅降低了非技术用户的使用门槛。需要注意的是,v4及之后版本仅支持64位系统,32位系统用户需使用v3版本。

2.2 开源协议与产品线

在开源协议方面,PDFsam Basic自v3版本起采用GNU AGPLv3协议分发,早期版本使用GPLv2。AGPLv3在GPLv3的基础上增加了网络使用条款,要求通过网络提供服务也必须开源,这一协议选择体现了项目维护者对开源精神的坚定承诺。

PDFsam目前形成了三条产品线:

产品 定位 价格 核心功能
PDFsam Basic 免费开源,面向普通用户 完全免费 合并、拆分、旋转、提取、混排
PDFsam Enhanced 专业付费版 付费 编辑、转换、签名、加密、表单填写
PDFsam Visual 专业付费版 付费 可视化页面编排、删除、裁剪、OCR

Basic版本完全免费且可用于商业用途,代码公开可审计。Enhanced和Visual是面向专业用户的两款商业产品,提供了编辑、转换、OCR等更高级的功能。

2.3 Java/JavaFX技术栈

PDFsam Basic基于Java和JavaFX编写,这是理解其跨平台能力和架构设计的关键。JavaFX是Java平台的新一代GUI框架,替代了老旧的Swing,提供了现代化的用户界面组件、CSS样式支持和硬件加速渲染能力。

PDFsam的核心PDF处理能力依赖于两个关键的底层库:

  1. SAMBox:Apache PDFBox的一个分支,专注于为PDFsam和Sejda项目提供底层PDF处理能力。SAMBox对PDFBox进行了大量深度修改,引入了惰性加载/解析机制以优化大文件处理性能,支持JDK 17+,并与PDFBox主分支保持对齐。

  2. Sejda SDK:一个开源的、面向任务的Java PDF编辑库,为PDFsam Basic提供合并、拆分、旋转等核心功能的高级API封装。

在v6.0版本中,SAMBox和Sejda均升级到了全新主版本,应用也同步升级至JDK 25和JavaFX 25,带来了更好的性能和现代Java特性支持。

2.4 跨平台与资源占用

PDFsam支持Windows、macOS和Linux三大主流操作系统,安装包约93.7 MB(内置JDK),运行时约需70 MB磁盘空间和256 MB内存。在资源占用方面,PDFsam以轻量著称,即使在配置较低的设备上也能流畅运行。

三、核心功能的技术实现

PDFsam Basic的核心功能聚焦于PDF的页面级操作,不含内容编辑功能。以下从技术视角拆解其五大核心模块。

3.1 PDF合并:非破坏性文档拼接

PDF合并是PDFsam使用频率最高的模块。用户只需在工具中选择“合并”功能,将PDF文件拖入界面,调整顺序后点击运行即可完成合并。

在技术实现层面,合并操作通过SAMBox读取源文件的页面流,再由Sejda SDK重新编排页面序列,最终写入新的PDF文件。整个过程对原始文件是非破坏性的——源文件保持不变,合并结果写入新文件。合并过程中,原文档的书签(Bookmark)和目录(Table of Contents)结构能够完整保留,用户无需在合并后重新制作导航结构。

v6.0版本还修复了合并模块中字体大小缩放和空目录条目处理等问题,进一步提升了合并输出的质量稳定性。

3.2 PDF拆分:多维度精准分割

PDFsam的拆分功能提供了三种精细化的分割策略:

拆分模式 技术实现 适用场景
按页码拆分 用户指定分割点页码,引擎在对应页面边界切割文档 已知文档结构的手动分割
按书签拆分 读取PDF书签树结构,在指定层级边界分割 大型报告、教材按章节拆分
按文件大小拆分 估算每页数据量,在接近目标大小的边界处分割 邮件附件大小限制场景

多数PDF工具的分割功能只支持按页码“一刀切”,而PDFsam能够根据书签层级(如部分、章、节)进行精准分割。按文件大小拆分的功能则特别适合邮件附件大小限制等实际场景。

3.3 旋转、提取与交替混排

旋转模块支持对所有或部分页面应用90°、180°、270°的旋转操作。提取模块允许用户选择单个页面或页面范围,创建仅包含所需页面的新PDF文件。

交替混排(Mix)模块是PDFsam的一个特色功能,它可以将两个PDF文件的页面按正序或倒序交替排列合并。这一功能特别适合处理单面扫描仪扫出的双面文档——将奇数页扫描件和偶数页扫描件分别保存为两个文件,再用交替混排功能合成完整的文档。

所有上述操作均遵循非破坏性原则:原始文件不受影响,处理结果输出为新文件。

四、v6.0版本的技术革新

2026年发布的PDFsam Basic 6.0是一个主版本更新,带来了多项底层重构和功能增强:

PDF 2.0支持:全面支持PDF 2.0标准中的UTF-8编码字符串,能够正确读写新一代PDF文件格式。输出文件始终包含与文档信息字典同步的XMP元数据流。

问题PDF的鲁棒性提升:增强了对异常PDF文件的处理能力。带有畸形注释、无效色彩空间、损坏的字体字典或损坏元数据的文件,在旧版本中可能导致处理失败,v6.0能够更优雅地处理这些边缘情况。

输出压缩选项升级:输出压缩从简单的开/关二元切换升级为三值选项(Compress / Neutral / Uncompress),为用户提供更精细的压缩控制。

辅助功能改进:整个界面添加了无障碍文本、帮助文本和正确的标签-字段关联,改善了屏幕阅读器的支持。

拖放增强:支持将文件夹拖放到输出字段,PDFsam将自动在该文件夹内生成建议的输出文件路径。

五、与同类工具的横向对比

5.1 与Adobe Acrobat的功能边界

根据什么值得买2025-2026年最新版本的实测对比,PDFsam Basic在“页面重组”类任务(合并、拆分、旋转、混排)上表现优异,甚至比Adobe Acrobat更轻快。但在涉及文本内容编辑、OCR识别、表单填写、批注协作、文件压缩等场景,Adobe的底层渲染引擎和标准兼容性仍是难以逾越的护城河。

功能维度 PDFsam Basic Adobe Acrobat Standard
页面合并/拆分/旋转 ★★★★★ 核心强项 ★★★★☆ 功能完整但较重
文本内容编辑 不支持(仅页面级操作) ★★★★★ 精准编辑
OCR识别 无内置OCR ★★★★★ 98%+识别率
表单填写 不支持 ★★★★★ 自动识别字段
定价 完全免费开源 付费订阅
隐私安全 完全本地处理 需登录Adobe账户

测试结论清晰表明:开源工具在“页面重组”任务上表现优异,但在涉及内容修改、跨平台一致性、法律级文档处理等场景,Adobe的优势仍然不可替代。

5.2 免费层级对比

功能 PDFsam Basic Smallpdf (免费版) iLovePDF (免费版)
合并/拆分 ✅ 无限制 ⚠️ 每日2次 ⚠️ 有文件大小限制
隐私模式 ✅ 完全本地 ❌ 需上传云端 ❌ 需上传云端
离线使用 ✅ 桌面App ❌ 纯Web ❌ 纯Web
价格 永久免费开源 付费解锁 付费解锁
开源 ✅ AGPLv3 ❌ 闭源 ❌ 闭源

PDFsam的最大差异化优势在于完全本地运行——文件不需要上传到任何第三方服务器,这对处理敏感文档的用户来说是一项关键考量。

六、总结

PDFsam用超过20年的时间证明了一件事:专业的PDF页面处理工具可以做到完全免费、开源且安全。它的核心技术栈——Java/JavaFX + SAMBox + Sejda SDK——为跨平台兼容性提供了坚实基础,AGPLv3开源协议保障了代码的长期透明性。

从定位来看,PDFsam Basic专注于PDF的页面级操作,与Adobe Acrobat形成互补而非替代关系:如果你只需要合并合同、拆分扫描件、旋转方向错误的页面,PDFsam是最轻量、最安全的选择;如果需要编辑文本、填写表单、OCR识别,则需要借助更专业的工具。

在数据隐私日益受到重视的今天,一款不需要将文件上传到云端的桌面处理工具,其价值正在被越来越多的用户重新认识。

🎁 配套资源

为了方便各位用户快速上手,笔者已将PDFsam的官方下载指引整理打包:

夸克:https://pan.quark.cn/s/ae0e08db286b
百度:https://pan.baidu.com/s/19dZBkcQujXoItyMZeYdZLQ?pwd=8888

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐