AI 时代的学术入门：文献综述实践指南

赛博罗宾

268人浏览 · 2026-06-10 19:10:05

赛博罗宾 · 2026-06-10 19:10:05 发布

0. 引言：这份指南要解决什么问题？

很多人以为“文献综述”= 把一堆论文搬进 Word；结果是：读得很累、写得很虚、引用链条还容易断。

这份指南的目标不是让你立刻写出一篇“完美综述”，而是帮你把一条可复用的工作流跑通：检索 → 筛选 → 入库 → 提取 → 生成。

你只需要记住一句话：AI 负责加速，你负责判断与把关。

你最终需要产出两类成果：

成果①：Zotero 个人库（≥10 篇核心文献，题录/摘要/PDF/标签尽量齐全）
成果②：三段式综述初稿（约 300 字，可追溯引用，并做过“降 AI 痕”改写）

1. 行动流程表（照着抄就行）

阶段	环节	你做什么	产出
A	准备	装 Zotero + 打开国产大模型网页	工具就位
B	Step 1 检索	关键词金字塔 → 检索式 → 拉文献	80-150 篇候选
C	Step 2 筛选	AI 打分排序 + 人工把关	15-18 篇核心
D	Step 3 入库	Zotero 一键抓取 + 分类标签	Zotero 永久库
E	Step 4 提取	PICO 抽取 → 主题归纳	信息表 + 3-5 主题
F	Step 5 生成	三段式综述 + 降痕改写	300 字初稿
G	iScholar 一键流程	看案例把流程压到 5 分钟	“我也能一键”

2. 准备：把“兵器”摆在桌上

2.1 大模型（任选 1-2 个即可）

DeepSeek-V3 / R1：综述写作、逻辑推理（中文学术语体稳）
Qwen3（通义千问）：关键词扩展、英文同义词
智谱 GLM（网页免费）：信息提取、文档对话
Kimi K2：长 PDF 对话（100+ 页拖进去直接聊）

架构师警示：今天不用 ChatGPT/Claude/NotebookLM 付费版——不是它们不强，而是你要的是“可复制、可落地、可在国内随时跑”的流程。

2.2 你要打开的三个网站

检索：知网（CNKI）/ 万方 / OpenAlex
管理：Zotero 7 + 浏览器 Connector（红色 Z 图标）
写作：DeepSeek（主笔）+ 通义（词汇辅助）

3. 通用五步法全流程图（先建立直觉，再补术语）

下面这张图不是给你看的，是给你照着抄的：

核心原则一句话：①②③ 自动化，④⑤ 人工把关。

4. Step 1｜检索：关键词金字塔，先把范围卡死

4.1 反例（你肯定干过）

只搜“跨境电商 + 阿拉伯”，知网回你 4827 篇。

这不是文献综述，这是“自愿服刑”。

4.2 正解：关键词金字塔（3 层）

Layer 1 核心词：研究问题的骨架（2-3 个，≤5 字）
Layer 2 扩展词：同义词 + 英文对应词（扩大召回但不跑偏）
Layer 3 限定词：年份/地域/方法（决定你能不能读完）

类比：Layer 1 是“主菜”，Layer 2 是“调味料”，Layer 3 是“限购令”。没有 Layer 3，你会把超市搬回家然后饿死。

5. Step 2｜筛选：AI 排队，你来验票

5.1 三条机械规则（先自动化）

标题/摘要必须包含核心词本身
引用量 ≥ 10（实证类；综述类可放宽）
语义相似度 ≥ 0.7

Architect Pro-tip：别在 P1 对话里继续问 P2。 同一个对话越聊越久，越容易“顺着前文迎合”。

6. Step 3｜入库：Zotero 一键抓取，建立“永久资产”

6.1 分类先建好（别等抓完再整理）

核心文献
方法论参考
背景文献
待读

6.2 一键抓取（5 秒一篇）

必须进详情页再点红色 Z。列表页抓不到 PDF——这叫“你以为你存了，其实你没存”。

7. Step 4｜提取：PICO 抽取 + 主题归纳（综述的心脏）

架构师警示：“不要编造”不是道德要求，是工程要求。 引用链条一断，综述就不可复用。

8. Step 5｜生成：三段式综述 + 降 AI 痕（不做就等着标红）

8.1 三段式模板

第一段：背景 + 趋势（≈80 字）
第二段：分主题归纳（≈150 字）
第三段：Gap + 引出本研究（≈70 字）

9. 数学公式：你做筛选，本质是在做一个“加权决策”

$Score_i = w_r \cdot Rel_i + w_m \cdot Meth_i + w_t \cdot Time_i$

$Rel_i$ ：相关性（0-4）
$Meth_i$ ：方法质量（0-3）
$Time_i$ ：时效性（0-3）

金句：模型给分不重要，重要的是它逼你把“为什么选它”说清楚。

10. Python 伪代码：把这堂课写成“可执行流程”

def literature_review_sprint(topic):
	# Step 1: keywords pyramid -> queries
	pyramid = llm_generate_keywords(topic)
	queries = build_queries(pyramid)  # CNKI / Wanfang / OpenAlex
	
	# Step 2: retrieval -> candidate list
	candidates = retrieve_papers(queries, target_n=120)  # 80-150 best
	
	# Step 3: AI scoring -> shortlist
	scored = llm_score(candidates[:30])  # take 30 for ranking
	core_list = human_filter(scored, target_n=18)  # remove off-topic/duplicate/no-pdf
	
	# Step 4: Zotero ingest
	zotero_library = zotero_one_click_save(core_list)
	
	# Step 5: PICO extraction -> themes -> draft
	cards = [llm_extract_pico(pdf) for pdf in zotero_library.pdfs]
	themes, gap = llm_cluster_themes(cards)
	draft_300 = llm_write_three_paragraph(topic, themes, cards)
	safe_draft = llm_rewrite_reduce_ai_trace(draft_300)
	
	return zotero_library, safe_draft