先说两个让我印象深刻的数字

第一个:70%。

2026年5月14日,也就是4天前,PwC 和 Anthropic 宣布扩大合作: 30,000名美国专业人员认证 Claude,Claude Code + Cowork 全美部署, 建立联合卓越中心,新设以 Claude 为核心的 CFO 业务线。

Anthropic CEO Dario Amodei 在声明里说: 「保险承保从10周压缩到10天。安全工作从数小时压缩到数分钟。」 然后来了一句:「部分项目交付效率提升达 70%。」

这是该合作声明里载入的已在生产落地的数字,不是 PPT 里的目标。

第二个:40,000。

GL Reconciler(总账对账 Agent)的错误率约为 0.4%。 听起来非常好,对不对? 但在一个1000万美元的应付账款账本上,0.4% = 40,000美元潜在偏差。 在审计准则下,这不是"统计误差",这是"重大错报"。

这两个数字放在一起,正好说明了审计师用 Claude Code 这件事的全部微妙之处: 它真的提速了,而且提速幅度不小;但在"够不够好"的门槛上,审计有自己的标准。

考虑到国内订阅Claude确实有点困难,参考一下靠谱的网站:claudemax.shop

背景:大四的钱和 PCAOB 的红线

先把格局交代清楚。

大四2025年联合营收 $219亿美元,其中德勤 $705亿,PwC 约 $650亿, EY 约 $500亿,KPMG 约 $360亿。这是世界上最大的专业服务行业之一。

与此同时,**PCAOB(美国公众公司会计监督委员会)**在 2025年12月15日 让一条新规正式生效:技术辅助分析标准(修订 AS 1105 和 AS 2301), 首次在行业层面明确了审计师使用 AI 工具时的职责边界。

AS 1215(审计文档要求)规定: 必须记录谁执行了工作、谁审核了、以及审核日期。

这三个要求加在一起的意思是:AI 可以做工作,但纸面上要看到的是人的名字。

更直接的一句话:审计意见函必须由持牌注册会计师或审计合伙人签署。 没有任何 AI 可以代替这个签字。无任何例外。

这条红线是这篇文章的基础假设。后面所有的"Claude Code 能做什么", 都在这条线以内展开。


Anthropic 为审计师造了什么工具

2026年5月5日,Anthropic 在纽约的邀请制金融服务峰会上发布了 10个预构建金融 Agent 模板(开源,免费), 其中4个直接与审计/财务运营场景高度相关:

GL Reconciler(总账对账 Agent)

  • 连接 ERP / QuickBooks / Xero,自动拉账
  • 逐行核对总账账户,识别差异来源
  • 运行 NAV(净资产价值)计算,核对账本
  • 差异自动路由人工审批——不能自动过账

Month-End Closer(月末关账 Agent)

  • 执行关账清单,自动化标准化检查步骤
  • 生成应计凭证草稿,出具关账报告
  • 凭证是草稿,须财务负责人审批才能过账

Statement Auditor(报表审计 Agent)

  • 检查财务报表的一致性与完整性
  • 核对附注数字与报表正文是否一致(这是审计底稿的基础工作)
  • 生成"审计就绪"质检报告——是送给外部审计前的内部质控层,不是外部审计本身

KYC Screener(合规筛查 Agent)

  • 组建客户实体文件,审查证明材料
  • 运行 AML/KYC 规则引擎,输出结构化风险评级
  • 打包高风险案例升级档案,路由合规团队
  • 人类审查员保留每个案例的最终批准权

安装方式:

# 第一步:添加 Anthropic 插件市场
claude plugin marketplace add anthropics/financial-services

# 第二步:先装核心依赖(其他 Agent 依赖它)
claude plugin install financial-analysis@claude-for-financial-services

# 第三步:按需装审计/运营 Agent
claude plugin install gl-reconciler@claude-for-financial-services
claude plugin install month-end-closer@claude-for-financial-services
claude plugin install statement-auditor@claude-for-financial-services
claude plugin install kyc-screener@claude-for-financial-services

Anthropic 的 financial-services 仓库是 Apache 2.0 开源, 所有代码在 GitHub 公开,可以 clone,可以 pin 到特定 commit—— 对有监管合规要求的事务所,版本可控是必需的。


月末关账:50% 的财务团队需要超过5天,这是你的问题

"50% 的财务团队月末关账需要超过5个工作日。"

这个数字被 Anthropic 和多家金融科技媒体反复引用。 我第一次看到的时候没什么感觉,但想了一秒钟: 50% 意味着月末关账是整个行业的慢性疾病,不是个别公司的问题。

传统月末关账是什么样的?简单描述一下你可能经历过的:

  • Day 1:从 ERP 里导出数据,Excel 整理,确认字段格式
  • Day 2:手工计算各科目应计金额,填凭证模板
  • Day 3:GL 和子账本核对,发现差异,开始查为什么不对
  • Day 4:写差异说明,发给主管审批,等邮件回复
  • Day 5:人工过账,整理报告,发给管理层

每个步骤之间都有等待,差异原因不明的时候会回头返工。 高峰期是每月25日到3日,审计师普遍有"月末综合征"。

Month-End Closer + GL Reconciler 的组合做的是:

  1. 自动从 ERP / QBO / Xero 拉数据(MCP 连接器,无需手动导出)
  2. 逐行核对,识别差异,追踪根因(GL Reconciler 的核心)
  3. 计算应计项目,生成凭证草稿(Month-End Closer)
  4. Statement Auditor 做交叉一致性检查
  5. 人工审核检查点:审计师看草稿,签字,过账
  6. 生成完整的审计日志(谁操作、谁审核、时间戳),满足 AS 1215

PwC 和 Anthropic 实测的结果: 承保业务从10周到10天,安全工作从小时到分钟,部分项目交付效率70%提升。

但这里必须重复一遍那个 40,000 的问题: 0.4% 错误率在小规模账本里无感,在$1000万账本上是$40,000。 Anthropic 自己的文档里也写了: 「Agent 需要干净的数据管道、文档化的例外情况,以及人工审核输出后才能过账。」

机械工作自动化,不等于可以跳过人工核查。


Statement Auditor:送审前的"体检",不是"医生"

这个功能的名字容易让人误解——"Statement Auditor"听起来像是 AI 在做审计。

澄清一下:Statement Auditor 是"审计前质控层"(Pre-Audit QC), 不是外部审计本身,更不能替代外部审计。

它做的事是: 把即将提交外部审计师的财务报表, 先跑一遍内部一致性检查—— 各附注的数字是否和报表正文一致, 跨报表的勾稽关系是否正确(利润表净利润 = 资产负债表未分配利润变化?), 格式是否符合申报标准。

这相当于在寄出简历之前,自己先过一遍拼写检查和格式检查。 有用,而且有时候能发现真实问题; 但这不是面试官,也不能帮你决定这份简历值不值得发出去。

Anthropic 官方文档原话: 「Statement auditor reviews financial statements for consistency, completeness, and audit-readiness.」

注意:audit-readiness 是"是否达到可以送审的状态", 不是"是否通过了审计"。这是两件完全不同的事。


KYC Screener:$35-40亿美元的行业,终于有人想自动化了

美国金融机构每年在 AML(反洗钱)合规操作上的投入约为 $35-40亿美元。 这个数字是一个既庞大又低效的行业体量。

FINRA Rule 2090、爱国者法案、FinCEN 要求,三套规则叠加, 要求金融机构建立客户识别程序、执行客户尽职调查、 对高风险客户做强化尽职调查。

KYC Screener 的做法是:

  1. 解析客户入职文件(身份证明、地址证明、实体结构文件)
  2. 运行公司 KYC/AML 规则引擎,对照已知类型进行比对
  3. 输出结构化结果(风险等级、规则验证结果、需补充材料清单)
  4. 高风险案例打包升级档案,路由合规团队人工处理

FIS(全球最大金融科技公司之一)与 Anthropic 合作构建的 AML 调查 Agent, 实现了调查周期从"数天"到"数分钟"的压缩。 但 FIS CEO 说的很清楚:「人类调查员保留每个案例的最终批准权。」

这句话是关键。 $35-40亿美元的市场里,高价值的不是"收集文件"这件事, 而是"判断这个客户是否真的有风险"—— 那个判断,还是人在做。


PwC Regulatory Pathfinder:合规条文的"翻译机"

审计行业里有一类工作量被严重低估: 读懂新监管法规,然后告诉客户他们要改什么。

GDPR 有99条,EU AI Act 有百余条,PCAOB 每年出新的审计标准…… 每次有新规,事务所的合规部门就要人工逐条拆解, 对照客户现有政策找差距,然后给出修改建议。

这件事有三个特点:文字量大、逻辑严谨、输出格式标准化—— 恰好是 Claude 的强项。

PwC 推出的 Regulatory Pathfinder 就是做这件事的:

  1. 把监管法规拆解成离散的合规义务条目
  2. 分析客户内部合规政策的现有差距
  3. 生成政策更新建议

PwC CEO Paul Griggs 说: 「客户在寻找能够安全、负责任、并能产生可衡量成果的 AI 应用方式。

这个定位很准:不是让 AI 做"合规结论", 而是让 AI 处理"信息整理和初步映射", 人来做最终的"这个差距对我们客户来说是否重大"的判断。


严肃对话:The Register 那句话值得细品

The Register 评论 Anthropic 金融 Agent 发布时有一句话非常刻薄但非常准:

「Anthropic 的 Opus 4.7 在 Vals AI 金融 Agent 基准上得了"行业领先"的64.37%—— 这个失败率放在人类身上会被开除。」

我第一次读到这句话笑了,然后认真想了一分钟。

在大多数行业,64% 的准确率确实是刚及格线。 但在金融和审计里,这个数字要放到任务类型里去看:

  • 如果任务是差异识别:漏掉36%的差异是灾难
  • 如果任务是格式一致性检查:AI 在这类规则明确的任务上通常表现远超基准
  • 如果任务是复杂会计判断:64% 说明还远远不够

问题不是"Claude 能不能用",而是"哪类任务可以交给 Claude"。

Anthropic 自己在 financial-services 仓库的 README 里写的其实很诚实:

These agents draft analyst work product for review by a qualified professional.
They do not make investment recommendations, execute transactions, bind risk,
post to a ledger, or approve onboarding; every output is staged for human sign-off.

翻译:这些 Agent 出草稿,人来最终决定。

这不是法律免责声明套话,这是对 AI 当前能力的准确定位。


边界地图:审计师的四象限

基于上述所有内容,我把审计师用 Claude Code 的场景分成四类:

绿灯(立即可用): 总账差异识别 · 报表数字交叉核对 · KYC 文件收集与初筛 · 关账清单执行 · 法规条文拆解 · 差异说明文本生成

这些任务的共性是:规则明确、高度重复、输出格式标准化。 Claude 在这里节省的是时间,不是替代判断。

黄灯(谨慎试点): 分录凭证草稿 · NAV 净资产价值计算 · AML 案例初步调查

这些任务有真实价值,但 0.4% 错误率的后果在具体业务中差异很大。 需要先在控制期数据上测试,验证 Agent 在你的数据环境里的失败模式, 再逐步扩大范围。

红灯(积累经验后再推): Statement Auditor 用于重大申报 · 复杂会计估计判断(商誉减值、公允价值等)

这些场景需要你先用低风险项目积累对 Agent 失败方式的认识, 才能判断它在高风险场景下是否可靠。

绝对禁区(无论如何不可替代): 审计意见函签发 · 职业怀疑判断 · 监管申报最终提交 · 未满足合规要求时的客户保密信息处理

这里没有灰色地带,PCAOB 已经把线划好了。


最后说一句

我在金融行业待过,做过量化,也写过很多代码。 审计这个行业让我一直觉得有趣的地方是: 它的核心价值是"表达独立意见"——而不是"处理信息"。

Claude Code 能做的,恰恰是信息处理那一层: 收集数据、核对数字、执行清单、生成草稿。

而审计师的核心价值—— 判断管理层的陈述是否可信、识别财务造假的迹象、在压力下保持职业怀疑、 在数字背后看到业务实质—— 这些没有一样是可以外包给 AI 的,不管基准测试得多少分。

KPMG 全球审计主管 Larry Bradley 说了一句话: 「帮助审计师在最高风险领域花费更多时间。

这是 AI 辅助审计的正确描述。 它不是要把审计师替换掉, 而是把那些本来吃掉审计师大量精力的低附加值工作接管, 让审计师把精力放回到他们真正应该在的地方。

用好 Claude Code 的审计师, 和拒绝用任何 AI 工具的审计师, 在处理同等工作量时的效率差距已经开始可见。

但用了 Claude Code 然后不审核就签字的审计师, 将会体验到一种新形式的职业风险。

PCAOB 的那条红线,不是在压制技术进步, 而是在确保不管工具怎么进化, 都有一个有名有姓、有执照、有责任的人,对这份报告负责。

我觉得这是合理的。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐