审计师开始用 Claude Code 了，但 PCAOB 提前划好了红线

feiniao_coding

254人浏览 · 2026-05-19 08:30:09

feiniao_coding · 2026-05-19 08:30:09 发布

先说两个让我印象深刻的数字

第一个：70%。

2026年5月14日，也就是4天前，PwC 和 Anthropic 宣布扩大合作： 30,000名美国专业人员认证 Claude，Claude Code + Cowork 全美部署，建立联合卓越中心，新设以 Claude 为核心的 CFO 业务线。

Anthropic CEO Dario Amodei 在声明里说：「保险承保从10周压缩到10天。安全工作从数小时压缩到数分钟。」然后来了一句：「部分项目交付效率提升达 70%。」

这是该合作声明里载入的已在生产落地的数字，不是 PPT 里的目标。

第二个：40,000。

GL Reconciler（总账对账 Agent）的错误率约为 0.4%。听起来非常好，对不对？但在一个1000万美元的应付账款账本上，0.4% = 40,000美元潜在偏差。在审计准则下，这不是"统计误差"，这是"重大错报"。

这两个数字放在一起，正好说明了审计师用 Claude Code 这件事的全部微妙之处： 它真的提速了，而且提速幅度不小；但在"够不够好"的门槛上，审计有自己的标准。

考虑到国内订阅Claude确实有点困难，参考一下靠谱的网站：claudemax.shop

背景：大四的钱和 PCAOB 的红线

先把格局交代清楚。

大四2025年联合营收 $219亿美元，其中德勤 $705亿，PwC 约 $650亿， EY 约 $500亿，KPMG 约 $360亿。这是世界上最大的专业服务行业之一。

与此同时，**PCAOB（美国公众公司会计监督委员会）**在 2025年12月15日让一条新规正式生效：技术辅助分析标准（修订 AS 1105 和 AS 2301），首次在行业层面明确了审计师使用 AI 工具时的职责边界。

AS 1215（审计文档要求）规定： 必须记录谁执行了工作、谁审核了、以及审核日期。

这三个要求加在一起的意思是：AI 可以做工作，但纸面上要看到的是人的名字。

更直接的一句话：审计意见函必须由持牌注册会计师或审计合伙人签署。没有任何 AI 可以代替这个签字。无任何例外。

这条红线是这篇文章的基础假设。后面所有的"Claude Code 能做什么"，都在这条线以内展开。

Anthropic 为审计师造了什么工具

2026年5月5日，Anthropic 在纽约的邀请制金融服务峰会上发布了 10个预构建金融 Agent 模板（开源，免费），其中4个直接与审计/财务运营场景高度相关：

GL Reconciler（总账对账 Agent）

连接 ERP / QuickBooks / Xero，自动拉账
逐行核对总账账户，识别差异来源
运行 NAV（净资产价值）计算，核对账本
差异自动路由人工审批——不能自动过账

Month-End Closer（月末关账 Agent）

执行关账清单，自动化标准化检查步骤
生成应计凭证草稿，出具关账报告
凭证是草稿，须财务负责人审批才能过账

Statement Auditor（报表审计 Agent）

检查财务报表的一致性与完整性
核对附注数字与报表正文是否一致（这是审计底稿的基础工作）
生成"审计就绪"质检报告——是送给外部审计前的内部质控层，不是外部审计本身

KYC Screener（合规筛查 Agent）

组建客户实体文件，审查证明材料
运行 AML/KYC 规则引擎，输出结构化风险评级
打包高风险案例升级档案，路由合规团队
人类审查员保留每个案例的最终批准权

安装方式：

# 第一步：添加 Anthropic 插件市场
claude plugin marketplace add anthropics/financial-services

# 第二步：先装核心依赖（其他 Agent 依赖它）
claude plugin install financial-analysis@claude-for-financial-services

# 第三步：按需装审计/运营 Agent
claude plugin install gl-reconciler@claude-for-financial-services
claude plugin install month-end-closer@claude-for-financial-services
claude plugin install statement-auditor@claude-for-financial-services
claude plugin install kyc-screener@claude-for-financial-services

Anthropic 的 financial-services 仓库是 Apache 2.0 开源，所有代码在 GitHub 公开，可以 clone，可以 pin 到特定 commit—— 对有监管合规要求的事务所，版本可控是必需的。

月末关账：50% 的财务团队需要超过5天，这是你的问题

"50% 的财务团队月末关账需要超过5个工作日。"

这个数字被 Anthropic 和多家金融科技媒体反复引用。我第一次看到的时候没什么感觉，但想了一秒钟： 50% 意味着月末关账是整个行业的慢性疾病，不是个别公司的问题。

传统月末关账是什么样的？简单描述一下你可能经历过的：

Day 1：从 ERP 里导出数据，Excel 整理，确认字段格式
Day 2：手工计算各科目应计金额，填凭证模板
Day 3：GL 和子账本核对，发现差异，开始查为什么不对
Day 4：写差异说明，发给主管审批，等邮件回复
Day 5：人工过账，整理报告，发给管理层

每个步骤之间都有等待，差异原因不明的时候会回头返工。高峰期是每月25日到3日，审计师普遍有"月末综合征"。

Month-End Closer + GL Reconciler 的组合做的是：

自动从 ERP / QBO / Xero 拉数据（MCP 连接器，无需手动导出）
逐行核对，识别差异，追踪根因（GL Reconciler 的核心）
计算应计项目，生成凭证草稿（Month-End Closer）
Statement Auditor 做交叉一致性检查
人工审核检查点：审计师看草稿，签字，过账
生成完整的审计日志（谁操作、谁审核、时间戳），满足 AS 1215

PwC 和 Anthropic 实测的结果：承保业务从10周到10天，安全工作从小时到分钟，部分项目交付效率70%提升。

但这里必须重复一遍那个 40,000 的问题： 0.4% 错误率在小规模账本里无感，在$1000万账本上是$40,000。 Anthropic 自己的文档里也写了：「Agent 需要干净的数据管道、文档化的例外情况，以及人工审核输出后才能过账。」

机械工作自动化，不等于可以跳过人工核查。

Statement Auditor：送审前的"体检"，不是"医生"

这个功能的名字容易让人误解——"Statement Auditor"听起来像是 AI 在做审计。

澄清一下：Statement Auditor 是"审计前质控层"（Pre-Audit QC），不是外部审计本身，更不能替代外部审计。

它做的事是：把即将提交外部审计师的财务报表，先跑一遍内部一致性检查—— 各附注的数字是否和报表正文一致，跨报表的勾稽关系是否正确（利润表净利润 = 资产负债表未分配利润变化？），格式是否符合申报标准。

这相当于在寄出简历之前，自己先过一遍拼写检查和格式检查。有用，而且有时候能发现真实问题；但这不是面试官，也不能帮你决定这份简历值不值得发出去。

Anthropic 官方文档原话：「Statement auditor reviews financial statements for consistency, completeness, and audit-readiness.」

注意：audit-readiness 是"是否达到可以送审的状态"，不是"是否通过了审计"。这是两件完全不同的事。

KYC Screener：$35-40亿美元的行业，终于有人想自动化了

美国金融机构每年在 AML（反洗钱）合规操作上的投入约为 $35-40亿美元。这个数字是一个既庞大又低效的行业体量。

FINRA Rule 2090、爱国者法案、FinCEN 要求，三套规则叠加，要求金融机构建立客户识别程序、执行客户尽职调查、对高风险客户做强化尽职调查。

KYC Screener 的做法是：

解析客户入职文件（身份证明、地址证明、实体结构文件）
运行公司 KYC/AML 规则引擎，对照已知类型进行比对
输出结构化结果（风险等级、规则验证结果、需补充材料清单）
高风险案例打包升级档案，路由合规团队人工处理

FIS（全球最大金融科技公司之一）与 Anthropic 合作构建的 AML 调查 Agent，实现了调查周期从"数天"到"数分钟"的压缩。但 FIS CEO 说的很清楚：「人类调查员保留每个案例的最终批准权。」

这句话是关键。 $35-40亿美元的市场里，高价值的不是"收集文件"这件事，而是"判断这个客户是否真的有风险"—— 那个判断，还是人在做。

PwC Regulatory Pathfinder：合规条文的"翻译机"

审计行业里有一类工作量被严重低估： 读懂新监管法规，然后告诉客户他们要改什么。

GDPR 有99条，EU AI Act 有百余条，PCAOB 每年出新的审计标准…… 每次有新规，事务所的合规部门就要人工逐条拆解，对照客户现有政策找差距，然后给出修改建议。

这件事有三个特点：文字量大、逻辑严谨、输出格式标准化—— 恰好是 Claude 的强项。

PwC 推出的 Regulatory Pathfinder 就是做这件事的：

把监管法规拆解成离散的合规义务条目
分析客户内部合规政策的现有差距
生成政策更新建议

PwC CEO Paul Griggs 说：「客户在寻找能够安全、负责任、并能产生可衡量成果的 AI 应用方式。」

这个定位很准：不是让 AI 做"合规结论"，而是让 AI 处理"信息整理和初步映射"，人来做最终的"这个差距对我们客户来说是否重大"的判断。

严肃对话：The Register 那句话值得细品

The Register 评论 Anthropic 金融 Agent 发布时有一句话非常刻薄但非常准：

「Anthropic 的 Opus 4.7 在 Vals AI 金融 Agent 基准上得了"行业领先"的64.37%—— 这个失败率放在人类身上会被开除。」

我第一次读到这句话笑了，然后认真想了一分钟。

在大多数行业，64% 的准确率确实是刚及格线。但在金融和审计里，这个数字要放到任务类型里去看：

如果任务是差异识别：漏掉36%的差异是灾难
如果任务是格式一致性检查：AI 在这类规则明确的任务上通常表现远超基准
如果任务是复杂会计判断：64% 说明还远远不够

问题不是"Claude 能不能用"，而是"哪类任务可以交给 Claude"。

Anthropic 自己在 financial-services 仓库的 README 里写的其实很诚实：

These agents draft analyst work product for review by a qualified professional.
They do not make investment recommendations, execute transactions, bind risk,
post to a ledger, or approve onboarding; every output is staged for human sign-off.

翻译：这些 Agent 出草稿，人来最终决定。

这不是法律免责声明套话，这是对 AI 当前能力的准确定位。

边界地图：审计师的四象限

基于上述所有内容，我把审计师用 Claude Code 的场景分成四类：

绿灯（立即可用）： 总账差异识别 · 报表数字交叉核对 · KYC 文件收集与初筛 · 关账清单执行 · 法规条文拆解 · 差异说明文本生成

这些任务的共性是：规则明确、高度重复、输出格式标准化。 Claude 在这里节省的是时间，不是替代判断。

黄灯（谨慎试点）： 分录凭证草稿 · NAV 净资产价值计算 · AML 案例初步调查

这些任务有真实价值，但 0.4% 错误率的后果在具体业务中差异很大。需要先在控制期数据上测试，验证 Agent 在你的数据环境里的失败模式，再逐步扩大范围。

红灯（积累经验后再推）： Statement Auditor 用于重大申报 · 复杂会计估计判断（商誉减值、公允价值等）

这些场景需要你先用低风险项目积累对 Agent 失败方式的认识，才能判断它在高风险场景下是否可靠。

绝对禁区（无论如何不可替代）： 审计意见函签发 · 职业怀疑判断 · 监管申报最终提交 · 未满足合规要求时的客户保密信息处理

这里没有灰色地带，PCAOB 已经把线划好了。

最后说一句

我在金融行业待过，做过量化，也写过很多代码。审计这个行业让我一直觉得有趣的地方是： 它的核心价值是"表达独立意见"——而不是"处理信息"。

Claude Code 能做的，恰恰是信息处理那一层：收集数据、核对数字、执行清单、生成草稿。

而审计师的核心价值—— 判断管理层的陈述是否可信、识别财务造假的迹象、在压力下保持职业怀疑、在数字背后看到业务实质—— 这些没有一样是可以外包给 AI 的，不管基准测试得多少分。

KPMG 全球审计主管 Larry Bradley 说了一句话：「帮助审计师在最高风险领域花费更多时间。」

这是 AI 辅助审计的正确描述。它不是要把审计师替换掉，而是把那些本来吃掉审计师大量精力的低附加值工作接管，让审计师把精力放回到他们真正应该在的地方。

用好 Claude Code 的审计师，和拒绝用任何 AI 工具的审计师，在处理同等工作量时的效率差距已经开始可见。

但用了 Claude Code 然后不审核就签字的审计师，将会体验到一种新形式的职业风险。

PCAOB 的那条红线，不是在压制技术进步，而是在确保不管工具怎么进化，都有一个有名有姓、有执照、有责任的人，对这份报告负责。

我觉得这是合理的。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

C语言函数表实现多态

C 语言通过结构体和函数指针实现面向对象特性摘要：本文展示如何在 C 语言中模拟面向对象编程的核心概念。通过 Animal/Cat/Dog 模型，利用结构体保存公共数据，函数指针表描述抽象行为。具体类型在自己的实现文件中提供函数表，调用端通过抽象接口调用行为，由运行时对象内部的函数表决定实际执行的函数。这种设计实现了封装（不透明类型）、抽象（统一接口）和多态（运行时绑定）等面向对象特性，展示了

AtomGit开源社区

我开发了一个 AI 表单填写 Chrome 插件：AutoFormX，提升 Web 测试和表单联调效率

AutoFormX 是一款面向开发者和测试人员的 Chrome 插件，通过 AI 自动识别网页表单字段并生成合适的测试数据，支持单字段填写和一键填充整个页面。它适用于注册页测试、后台管理系统联调、产品演示数据填充和表单功能验收等场景，支持 DeepSeek、OpenAI 等多种 AI 服务，旨在减少重复填表工作，提升 Web 测试和表单联调效率。

AtomGit开源社区

GB/T 42131——2022 知识图谱

知识的推理计算是从已有的事实或关系推断出知识图谱隐性知识的发现与挖掘。例如，对知识图谱中所有“公司”实体的“成立年份”和“所属行业”进行分布统计，从而快速获得产业的时间与领域格局全貌。：将图中的实体和关系转化为低维、稠密的向量表示，使得语义上相近的实体/关系在向量空间中的距离也近。2.实体类型之间的关系：明确定义类与类之间的语义连接，如 "是一种"（继承关系）、"治疗"、"包含" 等。随本体模型、