一、工作流总览:人机协作全景图

╔══════════════════════════════════════════════════════════════════════╗
║              AI辅助质性分析:人机协作总流程                           ║
╠══════════════════════════════════════════════════════════════════════╣
║  🧠 研究者主导层  ←─── 设计 / 判断 / 诠释 / 伦理把关 ───→  🧠 研究者主导层 ║
╠══════════════════════════════════════════════════════════════════════╣
║                                                                      ║
║  [阶段0] 研究设计     [阶段1] 数据准备     [阶段2] AI辅助编码        ║
║   概念框架 + 研究问题  →  转录/清洗/结构化  →  自动编码 + 人工校验   ║
║        ↓                      ↓                      ↓               ║
║  [阶段5] 报告撰写     [阶段4] 展示构建     [阶段3] 深度分析         ║
║   结论 + 理论命题  ←  矩阵/网络/可视化  ←  模式识别 + 备忘录        ║
║                                                                      ║
╠══════════════════════════════════════════════════════════════════════╣
║  🤖 AI辅助层  ←─── 转录/检索/聚类/摘要/草稿生成 ───→  🤖 AI辅助层   ║
╚══════════════════════════════════════════════════════════════════════╝

⚠️ 核心原则:AI 是 分析加速器,不是 分析替代者。 连接关系的指定、意义的诠释、理论的建构——永远由研究者完成


二、阶段0:研究设计(纯人工阶段)

这一阶段 AI 不应主导的原因

设计要素 为何需要研究者 风险若外包给AI
概念框架建立 需要领域知识与理论立场 AI可能生成通用框架而非契合研究的框架
研究问题聚焦 需要对现象的深度感知 AI会提出过于宽泛的问题
编码起始列表 来自研究者的理论预设 预设错误将污染整个分析链
伦理协议设计 需要对场域关系的判断 AI无法感知权力结构与潜在伤害

阶段0产出检查清单

□ 研究问题已明确(1-3个核心问题)
□ 概念框架已草拟(变量与关系初步定义)
□ 演绎编码起始列表已建立(12-50个临时代码)
□ 伦理协议已确认(知情同意/保密/匿名)
□ 数据格式规范已定义(便于AI处理)

三、阶段1:数据准备(人机协作)

1.1 AI可高效完成的任务

原始数据(音频/视频/手写/文档)
           │
           ▼
  ┌─────────────────────────────┐
  │  🤖 AI工具层                 │
  │  • 语音转文字(Whisper等)    │
  │  • OCR扫描文字识别           │
  │  • 格式标准化(时间戳/发言人)│
  │  • 重复内容去除              │
  │  • 基础拼写/语法校对         │
  └─────────────────────────────┘
           │
           ▼
  ┌─────────────────────────────┐
  │  🧠 研究者校验层             │
  │  • 确认转录准确性            │
  │  • 补充语气/停顿/非语言标注  │
  │  • 调整转录层级(详细/简化) │
  │  • 确认发言者标识正确        │
  └─────────────────────────────┘

1.2 转录层级决策(研究者判断)

转录层级 适用场景 AI支持程度
详细层级(含"嗯""呃"、停顿、重音、不完整句) 话语分析、对话分析 低——需大量人工补注
标准层级(自然口语,保留完整句) 主题分析、扎根理论 高——AI转录基本可用
简化层级(流畅总结主要观点) 大规模文档分析 极高——AI可直接摘要

💡 M&H原则:转录者的知识水平和技能决定信息损耗量。使用AI转录时,研究者必须系统性地校验,尤其是专业术语、方言和情感语气。


四、阶段2:AI辅助编码(核心协作阶段)

2.1 第一循环编码:人机分工矩阵

┌────────────────────┬──────────────────────┬──────────────────────┐
│   编码任务          │   🤖 AI负责           │   🧠 研究者负责       │
├────────────────────┼──────────────────────┼──────────────────────┤
│ 描述性编码          │ 自动标注人物/地点/     │ 确认标注的分析价值    │
│ (Descriptive)      │ 事件/行动关键词        │ 调整粒度级别          │
├────────────────────┼──────────────────────┼──────────────────────┤
│ 主题性编码          │ 语义相似性聚类         │ 命名类别/赋予概念意义 │
│ (In Vivo/Thematic) │ 高频词/词组提取        │ 判断类别边界          │
├────────────────────┼──────────────────────┼──────────────────────┤
│ 情感性编码          │ 情感极性识别(+/-/中) │ 细化情感类型与强度    │
│ (Emotion)          │ 情感词汇标注           │ 解读隐含情绪          │
├────────────────────┼──────────────────────┼──────────────────────┤
│ 过程性编码          │ 动词/行动短语提取      │ 识别行动的因果序列    │
│ (Process)          │ 时间顺序整理           │ 构建过程性叙事        │
├────────────────────┼──────────────────────┼──────────────────────┤
│ 演绎编码            │ 按起始代码列表         │ 设计代码列表          │
│ (Deductive)        │ 自动标注与检索         │ 处理边界模糊案例      │
└────────────────────┴──────────────────────┴──────────────────────┘

2.2 AI辅助编码质控:双轨验证流程

Step 1:AI生成初始编码结果
         │
         ▼
Step 2:研究者随机抽样校验(≥20%语料)
         │
         ├─── 一致性 ≥ 85-90%? ───→ 进入Step 3
         │
         └─── 一致性 < 85%? ──→ 重新界定编码规则 → 返回Step 1
         │
Step 3:第二位研究者独立编码同一子集
         │
         ▼
Step 4:计算编码者间一致性(Cohen's Kappa)
         │
         ├─── κ ≥ 0.80:可信 ──→ 确认编码方案
         │
         └─── κ < 0.80:讨论分歧 → 修订操作定义
         │
Step 5:最终编码方案固化 + 形成代码本

📌 编码者间一致性目标:内部一致性与编码者间一致性应达到 85%到90% 的范围(Miles & Huberman),具体取决于编码方案的大小和范围。

2.3 AI不能替代研究者的编码情境

情境 原因 处理方式
同时编码(一段文字有多重意涵) AI难以感知文化语境下的多层含义 研究者手动处理后标注AI
负面案例识别 AI倾向于确认多数模式而忽略异常 研究者主动检索反例
隐喻/讽刺性表达 AI字面理解可能误读 研究者重新校验语用层
沉默/非语言数据 超出文本转录范围 研究者在田野笔记中补注

五、阶段3:深度分析(人主导、AI辅助)

3.1 第二循环模式编码:AI聚类 + 研究者命名

第一循环编码结果(大量离散代码)
              │
              ▼
   🤖 AI:语义聚类 / 共现分析 / 频率排序
              │
              ▼
   聚类草图(AI提案,未命名)
              │
              ▼
   🧠 研究者:审视聚类 → 命名模式类别
              │
       ┌──────┴──────┐
       ▼             ▼
   接受聚类       拆分/合并/拒绝
   → 命名模式    → 重新定义边界
              │
              ▼
   模式代码本(Pattern Codebook)

3.2 AI辅助备忘录生成(与研究者备忘录的区别)

维度 🤖 AI生成备忘录 🧠 研究者撰写备忘录
内容性质 统计摘要、词频报告、模式列表 思想观点,而非简单事实陈述
分析深度 描述性(发生了什么) 解释性+理论性(为什么/意味着什么)
价值 快速生成分析"原材料" 产生洞察顿悟,推动理论构建
使用方式 作为研究者备忘录的输入素材 作为报告和理论构建的核心内容

💡 M&H提醒:备忘录记录的是思想观点,仅仅总结或复述数据示例是不够的。AI生成的摘要≠分析备忘录,研究者必须在此基础上注入理论思考。

3.3 断言与命题发展:人机协作路径

🤖 AI任务:
  ① 基于编码频率生成候选断言草稿
  ② 检索支持/反对特定断言的数据段落
  ③ 按研究问题分类整理证据列表

     ↓ 输入到 ↓

🧠 研究者任务:
  ① 评估断言的证据强度(强烈支持/有条件支持/中性/矛盾)
  ② 将断言转化为"如果-那么"命题形式
  ③ 主动寻找负面证据挑战已有命题
  ④ 修订或推翻证据不足的命题

六、阶段4:展示构建(人机协作)

6.1 AI辅助的数据展示类型

展示类型 AI可完成部分 研究者必须完成部分
概念矩阵 自动填充单元格内容、格式排版 设计行列维度、解读单元格意义
时序矩阵 按时间戳自动排序事件 判断事件的因果关联
因果网络图 生成节点-关系可视化草图 指定连接关系(AI无法自行判定)
元矩阵 多案例数据并置堆叠 浓缩策略、案例排序逻辑
词云/频率图 自动生成 解释频率背后的分析意义

⚠️ 重要警告:CAQDAS/AI软件可以辅助绘制因果流,但研究者必须指定连接关系——软件无法判定哪些变量之间存在因果关系,这是研究者的核心分析责任。

6.2 因果网络构建的人机边界

╔═══════════════════════════════════════════════════════╗
║  因果网络构建中的人机边界                               ║
╠═══════════════╦═══════════════════════════════════════╣
║  🤖 AI可做     ║  🧠 研究者必须做                       ║
╠═══════════════╬═══════════════════════════════════════╣
║ 提取共现变量   ║ 判断共现是否构成因果                   ║
║ 绘制网络图形   ║ 指定箭头方向(因→果)                  ║
║ 识别高度连通节点║ 解释节点的实质含义                    ║
║ 标注连接强度   ║ 区分直接/间接/调节关系                 ║
║ 生成备选网络结构║ 选择最具解释力的网络结构               ║
╚═══════════════╩═══════════════════════════════════════╝

七、阶段5:报告撰写(人主导、AI辅助)

7.1 AI辅助撰写的合理边界

可接受的AI辅助:
  ✅ 生成章节结构草稿(研究者审核修改)
  ✅ 提取引文证据并格式化
  ✅ 生成方法论描述初稿
  ✅ 语言润色与逻辑检查
  ✅ 参考文献格式整理

需要研究者独立完成:
  ❌ 理论贡献的阐述
  ❌ 与既有文献的对话
  ❌ 研究局限性的诚实反思
  ❌ 伦理立场的说明
  ❌ 参与者成员检验结论的记录

7.2 效度验证清单(人工完成,AI辅助检索证据)

# 验证标准 人工 AI辅助
1 描述具有情境丰富性与"厚重性"
2 叙述真实可信、有说服力
3 互补方法与数据源三角验证一致 检索不一致证据
4 数据与理论类别良好连接 匹配检索
5 发现清晰连贯、系统统一
6 描述了确认程序
7 识别了不确定领域
8 寻求了负面证据 检索反例文段
9 考虑了竞争性解释 生成备选解释草稿
10 发现在数据库其他部分得到复制 自动检索验证
11 原始参与者认为结论准确
12 预测准确性已报告(如适用)

八、AI辅助工具选择指南(2026)

8.1 工具分层架构

层级一:专业CAQDAS(传统质性分析软件)
  NVivo / ATLAS.ti / MAXQDA
  → 适合:需要完整项目管理、多数据类型、团队协作
  → AI能力:内置自动编码、词频分析、主题聚类

层级二:通用大语言模型(LLM)
  GPT-4 / Claude / Gemini
  → 适合:辅助编码解释、备忘录草稿、报告撰写
  → 注意:不保证数据保密性,需检查隐私协议

层级三:专业AI质性工具
  Dedoose / QualRobot / Cauliflower
  → 适合:访谈数据的快速主题提取
  → 局限:对非英语数据支持有限

层级四:基础办公软件
  Word + Excel(最低要求)
  → 适合:构建矩阵、编码标注、数据管理
  → AI能力:Copilot辅助可提升效率

8.2 工具选择决策树

研究需要处理音视频数据?
    │
    ├─ 是 → CAQDAS(NVivo/ATLAS.ti)+ Whisper转录
    │
    └─ 否 → 数据量 > 500页文本?
                │
                ├─ 是 → CAQDAS + LLM辅助编码
                │
                └─ 否 → 单独使用LLM / 基础软件即可
                            │
                            └─ 需要跨案例比较?
                                    │
                                    ├─ 是 → 加入Excel元矩阵管理
                                    └─ 否 → Word + LLM即可

九、人机协作的核心伦理边界

9.1 AI使用的不可逾越红线

红线 具体内容 原因
数据保密性 敏感访谈数据不得上传至无隐私保障的AI平台 违反与参与者的保密协议
匿名性维护 AI处理前必须完成去识别化处理 防止身份识别造成伤害
分析归属透明 报告中必须说明AI辅助的具体环节 学术诚信要求
判断不可外包 理论命题、因果判断、意义解释 AI的解释无主体性和责任
负面案例义务 不能因AI未发现就忽略反例 研究真实性的核心要求

9.2 研究者主体性宣言

💬 "无法有意义地回答'什么AI是最好的'。你必须具体了解你在项目中构建的数据库类型以及你将进行的分析类型。" —— 改编自 Miles & Huberman

💬 "好的模型只能来自于其所衍生的测量和更简单分析的质量。" —— Miles & Huberman

AI无法替代研究者的:

  • 🔬 理论敏感性(识别数据背后的理论意涵)
  • 🧭 伦理判断力(权衡效度与避免伤害的冲突)
  • 🔍 反思性(意识到自身视角对分析的影响)
  • 🌐 情境理解力(感知权力关系与文化背景)

十、完整工作流检查清单

阶段0 研究设计
  □ 概念框架建立(人工)
  □ 研究问题聚焦(人工)
  □ 起始代码列表(人工,12-50个)
  □ 伦理协议确认(人工)

阶段1 数据准备
  □ AI转录完成(AI)
  □ 转录准确性校验(人工)
  □ 数据去识别化(人工,AI处理前必做)
  □ 数据格式标准化(AI辅助)

阶段2 第一循环编码
  □ AI初始编码运行(AI)
  □ 随机抽样校验≥20%(人工)
  □ 编码者间一致性≥85-90%(κ≥0.80)
  □ 代码本固化(人工确认)

阶段3 深度分析
  □ AI语义聚类生成模式候选(AI)
  □ 研究者命名模式类别(人工)
  □ 分析备忘录撰写(人工,非AI摘要)
  □ 断言证据检索(AI辅助)
  □ 命题评级与修订(人工)
  □ 负面案例主动检索(人工+AI辅助)

阶段4 展示构建
  □ 矩阵维度设计(人工)
  □ 矩阵填充与排版(AI辅助)
  □ 因果网络:连接关系指定(人工)
  □ 因果网络:图形生成(AI辅助)

阶段5 报告撰写
  □ 章节结构草稿(AI辅助,人工修订)
  □ 效度验证12项清单(人工)
  □ 理论贡献阐述(人工)
  □ AI辅助环节披露(人工,学术诚信)
  □ 参与者成员检验(人工)
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐