0. 引言:这份指南要解决什么问题?

很多人以为“文献综述”= 把一堆论文搬进 Word;结果是:读得很累、写得很虚、引用链条还容易断。

这份指南的目标不是让你立刻写出一篇“完美综述”,而是帮你把一条可复用的工作流跑通:检索 → 筛选 → 入库 → 提取 → 生成

你只需要记住一句话:AI 负责加速,你负责判断与把关。

你最终需要产出两类成果:

  • 成果①:Zotero 个人库(≥10 篇核心文献,题录/摘要/PDF/标签尽量齐全)
  • 成果②:三段式综述初稿(约 300 字,可追溯引用,并做过“降 AI 痕”改写)

1. 行动流程表(照着抄就行)

阶段 环节 你做什么 产出
A 准备 装 Zotero + 打开国产大模型网页 工具就位
B Step 1 检索 关键词金字塔 → 检索式 → 拉文献 80-150 篇候选
C Step 2 筛选 AI 打分排序 + 人工把关 15-18 篇核心
D Step 3 入库 Zotero 一键抓取 + 分类标签 Zotero 永久库
E Step 4 提取 PICO 抽取 → 主题归纳 信息表 + 3-5 主题
F Step 5 生成 三段式综述 + 降痕改写 300 字初稿
G iScholar 一键流程 看案例把流程压到 5 分钟 “我也能一键”

2. 准备:把“兵器”摆在桌上

2.1 大模型(任选 1-2 个即可)

  • DeepSeek-V3 / R1:综述写作、逻辑推理(中文学术语体稳)
  • Qwen3(通义千问):关键词扩展、英文同义词
  • 智谱 GLM(网页免费):信息提取、文档对话
  • Kimi K2:长 PDF 对话(100+ 页拖进去直接聊)

架构师警示:今天不用 ChatGPT/Claude/NotebookLM 付费版——不是它们不强,而是你要的是“可复制、可落地、可在国内随时跑”的流程

2.2 你要打开的三个网站

  • 检索:知网(CNKI)/ 万方 / OpenAlex
  • 管理:Zotero 7 + 浏览器 Connector(红色 Z 图标)
  • 写作:DeepSeek(主笔)+ 通义(词汇辅助)

3. 通用五步法全流程图(先建立直觉,再补术语)

下面这张图不是给你看的,是给你照着抄的:

① 检索
关键词金字塔

② 筛选
AI 打分 + 人工

③ 入库
Zotero 一键抓

④ 提取
PICO 信息表

⑤ 生成
三段式 + 降痕

核心原则一句话:①②③ 自动化,④⑤ 人工把关。


4. Step 1|检索:关键词金字塔,先把范围卡死

4.1 反例(你肯定干过)

只搜“跨境电商 + 阿拉伯”,知网回你 4827 篇。

这不是文献综述,这是“自愿服刑”。

4.2 正解:关键词金字塔(3 层)

  • Layer 1 核心词:研究问题的骨架(2-3 个,≤5 字)
  • Layer 2 扩展词:同义词 + 英文对应词(扩大召回但不跑偏)
  • Layer 3 限定词:年份/地域/方法(决定你能不能读完)

类比:Layer 1 是“主菜”,Layer 2 是“调味料”,Layer 3 是“限购令”。没有 Layer 3,你会把超市搬回家然后饿死。


5. Step 2|筛选:AI 排队,你来验票

5.1 三条机械规则(先自动化)

  1. 标题/摘要必须包含核心词本身
  2. 引用量 ≥ 10(实证类;综述类可放宽)
  3. 语义相似度 ≥ 0.7

Architect Pro-tip:别在 P1 对话里继续问 P2。 同一个对话越聊越久,越容易“顺着前文迎合”。


6. Step 3|入库:Zotero 一键抓取,建立“永久资产”

6.1 分类先建好(别等抓完再整理)

  • 核心文献
  • 方法论参考
  • 背景文献
  • 待读

6.2 一键抓取(5 秒一篇)

必须进详情页再点红色 Z。列表页抓不到 PDF——这叫“你以为你存了,其实你没存”。


7. Step 4|提取:PICO 抽取 + 主题归纳(综述的心脏)

架构师警示:“不要编造”不是道德要求,是工程要求。 引用链条一断,综述就不可复用。


8. Step 5|生成:三段式综述 + 降 AI 痕(不做就等着标红)

8.1 三段式模板

  • 第一段:背景 + 趋势(≈80 字)
  • 第二段:分主题归纳(≈150 字)
  • 第三段:Gap + 引出本研究(≈70 字)

9. 数学公式:你做筛选,本质是在做一个“加权决策”

Scorei=wr⋅Reli+wm⋅Methi+wt⋅Timei Score_i = w_r \cdot Rel_i + w_m \cdot Meth_i + w_t \cdot Time_i Scorei=wrReli+wmMethi+wtTimei

  • ReliRel_iReli:相关性(0-4)
  • MethiMeth_iMethi:方法质量(0-3)
  • TimeiTime_iTimei:时效性(0-3)

金句:模型给分不重要,重要的是它逼你把“为什么选它”说清楚。


10. Python 伪代码:把这堂课写成“可执行流程”

def literature_review_sprint(topic):
	# Step 1: keywords pyramid -> queries
	pyramid = llm_generate_keywords(topic)
	queries = build_queries(pyramid)  # CNKI / Wanfang / OpenAlex
	
	# Step 2: retrieval -> candidate list
	candidates = retrieve_papers(queries, target_n=120)  # 80-150 best
	
	# Step 3: AI scoring -> shortlist
	scored = llm_score(candidates[:30])  # take 30 for ranking
	core_list = human_filter(scored, target_n=18)  # remove off-topic/duplicate/no-pdf
	
	# Step 4: Zotero ingest
	zotero_library = zotero_one_click_save(core_list)
	
	# Step 5: PICO extraction -> themes -> draft
	cards = [llm_extract_pico(pdf) for pdf in zotero_library.pdfs]
	themes, gap = llm_cluster_themes(cards)
	draft_300 = llm_write_three_paragraph(topic, themes, cards)
	safe_draft = llm_rewrite_reduce_ai_trace(draft_300)
	
	return zotero_library, safe_draft

11. 结尾

输出(你交作业的)

引擎(工具链)

输入(你带来的)

选题 Topic

关键词金字塔
(DeepSeek/Qwen)

检索拉文献
(CNKI/万方/OpenAlex)

筛选排序
(AI打分+人工把关)

入库
(Zotero永久库)

信息提取
(PICO JSON卡片)

主题聚类 + Gap
(DeepSeek归纳)

三段式初稿
(300字+引用)

降AI痕改写
(谨慎措辞)

交付物①:≥10篇核心文献Zotero库

交付物②:300字综述初稿(可追溯)

最后一句话:AI 是你的研究助理,你才是研究者。


💬 互动话题

如果只能保留今天流程里的一步自动化,你会保留哪一步?为什么?

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐