本文目录

一、备案的本质:不是选择题,而是必答题

二、三种备案类型:一步错步步错

三、六大材料:每一份都有"隐形陷阱"

四、五个阶段:每一关都有人被卡住

五、四个误区:这些坑千万别踩

六、备案后:动态合规才是真合规

"我们的App只是调用了别人家的API,怎么也收到整改通知了?"

最近,我们团队接到一个客户的紧急求助。这家创业公司的产品经理百思不得其解——他们明明用的是市面上成熟的AI服务接口,只是做了简单的功能封装,怎么就和"未备案"扯上了关系?

一、备案的本质:不是选择题,而是必答题

2023年8月15日,《生成式人工智能服务管理暂行办法》正式施行。同一天施行的还有《互联网信息服务深度合成管理规定》。这两部法规构成了大模型备案的核心法律依据。

截至2025年12月,全国已累计完成663款生成式人工智能服务备案。这个数字背后,是663家企业走完了复杂流程后的"持证上岗"。

监管不是一阵风,而是一场持续的、常态化的治理。所以,备案不是什么可选项,它是你企业生存的底线。


二、三种备案类型:一步错步步错

很多企业一上来就问:"我们需要准备什么材料?"这个问题本身就暴露了一个认知盲区——备案类型都没搞清楚,准备材料岂不是盲人摸象?

目前涉及AI服务的备案主要有三种:

算法备案

针对具有舆论属性或社会动员能力的算法推荐服务。主管部门是中央网信办,线上提交即可。需要提交:《落实算法安全主体责任基本情况》《算法安全自评估报告》《算法拟公示内容》。

上线备案(重点)

针对大语言模型、多模态模型等生成式AI服务。省级网信办初审后上报中央网信办复审。需要提交六份核心材料:上线备案申请表、安全自评估报告、模型服务协议、语料标注规则、关键词拦截列表、评估测试题集。

服务登记

针对仅调用已备案模型API、未做任何调整的应用。只需向属地网信办登记,材料相对简化,不需要安全评估报告。

最大的误区在这里:如果你"借用"了别人的模型又做了二次开发或微调,对不起,你得按新服务重新备案。


三、六大材料:每一份都有"隐形陷阱"

1、备案申请表:承诺即责任

申请表分五大板块:基本情况、模型研制、服务与安全防范、安全评估、附件。每个板块都有容易被忽略的细节。

比如"基本情况"里的"适用场合"一栏,包含自动控制、医疗信息服务、心理咨询、关键信息基础设施等选项。你勾选了哪项,就意味着你承诺服务不会超出这个范围。

更坑的是,表里填的内容必须和其他材料严丝合缝对上。申请表写"服务对象为18岁以上成年人",评估报告里写的却是"包含未成年用户使用场景"——这种矛盾一旦被发现,轻则打回重来,重则直接判定为材料虚假。

2、安全评估报告:五个维度缺一不可

这是被退回最多次的材料,也是最考验专业能力的部分。根据《生成式人工智能服务安全基本要求》(GB/T 45654-2025),安全评估报告必须覆盖五大维度:

语料安全评估

采用人工抽检,从全部语料中随机抽取不少于4000条,合格率≥96%;采用关键词、分类模型等技术抽检,从全部语料中随机抽取不少于总量10%,合格率≥98%。

生成内容安全评估

采用人工抽检、关键词抽检、分类模型抽检三种方式,每种从测试题库中随机抽取不少于1000条,合格率均≥90%。

问题拒答评估

从应拒答测试题库随机抽取不少于300条,拒答率≥95%;从非拒答测试题库随机抽取不少于300条,拒答率≤5%。这就是著名的"双95%原则"。

知识产权及商业秘密评估

说明训练语料中是否存在未经授权使用受版权保护内容的情况,是否涉及商业秘密泄露风险。这是2025年新增的评估维度。

安全措施评估

包括个人信息收集使用是否合规、是否有投诉举报渠道、非法内容拦截措施是否有效、模型更新升级是否有备案变更机制等。

3、服务协议:法务和技术的桥梁

协议必须包含:账号管理规则、服务条款与双方权利义务、隐私保护条款、投诉举报渠道、责任界定与免责范围、规则条款。

一个关键细节是:协议需要适用于当前及未来推出的新功能、新产品或服务。这意味着协议起草时必须具有前瞻性。

4、语料标注规则:流程要经得起追问

规则必须包含五大要素:

  1. 组织架构:明确谁负责标注、谁负责审核、谁负责质检
  2. 人员管理:组织标注人员培训,培训记录要留存
  3. 工具支持:说明使用的标注工具及其流程
  4. 执行步骤:将规则落实到标注操作的每一步
  5. 质量控制:设置质量检查频率和质量检查指标

5、关键词拦截列表:三个硬指标

数量要求

总规模不宜少于10000个。

覆盖率要求

覆盖17种安全风险。A.1中每种风险的关键词不宜少于200个,A.2中每种风险的关键词不宜少于100个。

更新频率

应按照网络安全实际需要及时更新,每周宜至少更新一次。更新日志必须留存。

6、评估测试题集:三类题库缺一不可

生成内容测试题库

总规模不宜少于2000题,覆盖31种安全风险。

拒答测试题库

总规模不宜少于500题,覆盖17种安全风险。

非拒答测试题库

总规模不宜少于500题,覆盖我国制度、信仰、形象、文化、习俗、民族、地理、历史、英烈等方面。

题库必须每月至少更新一次,确保与新型风险同步迭代。


四、五个阶段:每一关都有人被卡住

第一关:地方网信办初审

省级网信办负责材料的形式审查和内容初审。各省市的材料提交方式存在差异:

北京市

需派人到现场测评,通过后发放备案表。备案数量全国第一(183款)。

广东省

需先进行现场备案预测试,需2-3名产品、合规及算法人员参与。需准备10个安全审核账号和10个无过滤账号。

浙江省

允许先提交电子材料及光盘,根据反馈修改后再正式提交。

第二关:技术安全测试

测试内容包括模型在各种场景下的输出安全性、内容合规性、准确性。硬性指标是:生成内容合格率≥90%,拒答率≥95%(应拒答题库)和≤5%(非拒答题库)。

我们有个客户在技术测试前非常有信心,觉得模型迭代了十几版应该没问题。结果第一轮测试下来,合格率只有87%。他们在优化模型时过于追求"流畅度",牺牲了一部分安全性过滤机制。

第三关:中央多部门联合评审

材料从省级递交到中央后,将由中央网信办牵头,会同工信、公安、科技等部门进行联合评审。评审专家会从技术、法律、公共管理不同角度提问。

第四关:上门检查(最容易出事的环节)

最常见的错误:

材料上写的和现场看到的不一样。材料写着"标注团队共20人",实际演示时发现只有5个人。材料写着"关键词库每周更新",检查时发现三个月没动过。这种落差是致命的。

第五关:整改与备案

根据审核和检查过程中发现的问题,企业需要进行针对性整改。终审通过后,备案信息将在官方渠道公示,企业将获得唯一的备案编号。

五、四个误区:这些坑千万别踩

误区一:以为"内测"可以豁免备案

现有规定并未豁免测试阶段。只要服务对象是不特定的公众,无论叫什么名字(内测、公测、邀请测试),都需要备案。

误区二:以为调用第三方API不需要备案

如果只是调用别人已备案的模型API,完全没做任何调整,确实只需要走服务登记。但任何二次开发、功能扩展,都要重新备案。

误区三:以为材料差不多就行

评估报告必须逐项对应17种安全风险论证。如果只是泛泛而谈,审核专家会认为覆盖不完整,直接打回。

误区四:以为拿到备案就万事大吉

获得备案编号只是合规的起点。关键词库每周更新一次,测试题库每月更新一次。如果模型发生重大更新,需履行变更备案手续。

六、备案后:动态合规才是真合规

  1. 定期更新关键词库和测试题库:社会热点在变,新型风险词汇不断涌现。
  2. 定期开展内部评估:对照《生成式人工智能服务安全基本要求》和《人工智能生成合成内容标识办法》,评估模型能力是否达标。
  3. 留存记录:评估结果、问题整改记录都要留存,既是自我管理的需要,也是应对监管检查的证明。
  4. 关注政策动态:2025年以来密集出台新规:《人工智能生成合成内容标识办法》(2025年3月)、《网络安全技术 生成式人工智能服务安全基本要求》(2025年11月)等。


七、为什么要找专业的人

备案涉及的东西太多了。政策理解(几百页的法规文件、随时更新的国标行标)、材料撰写(六份核心文件,每份都有专业门槛)、技术对接(与测评机构、审核部门的沟通)、流程协调(多个部门协同推进)、迎检准备(现场应对检查组)——每一个环节都需要专业知识。

选择代办机构时,关键看三点:

一看:是否有自主成功案例

真正做过备案、有成功经验的机构,才能准确判断材料是否符合要求。

二看:是否有行业背景积累

大模型、深度合成、AIGC等不同领域的备案要求存在差异,有行业背景的团队更能精准把握。

三看:是否能全程辅导跟进

备案过程中难免遇到问题,能否及时响应、协助解决,决定了整个流程的效率。

我们团队专注大模型备案领域多年,已帮助数十家企业顺利完成备案,覆盖北京、上海、广东、浙江、江苏等多个省市。

我们的服务承诺

• 提前诊断问题,避免材料被打回
• 全程专业指导,不走弯路
• 协助对接评测机构,加速流程
• 应对上门检查,做好充分准备

专业的事交给专业的人做。你负责技术研发和产品运营,备案的事交给我们。如果您正在为备案感到困扰,欢迎与我们联系。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐