AI 时代的学术入门:文献综述实践指南
0. 引言:这份指南要解决什么问题?
很多人以为“文献综述”= 把一堆论文搬进 Word;结果是:读得很累、写得很虚、引用链条还容易断。
这份指南的目标不是让你立刻写出一篇“完美综述”,而是帮你把一条可复用的工作流跑通:检索 → 筛选 → 入库 → 提取 → 生成。
你只需要记住一句话:AI 负责加速,你负责判断与把关。
你最终需要产出两类成果:
- 成果①:Zotero 个人库(≥10 篇核心文献,题录/摘要/PDF/标签尽量齐全)
- 成果②:三段式综述初稿(约 300 字,可追溯引用,并做过“降 AI 痕”改写)
1. 行动流程表(照着抄就行)
| 阶段 | 环节 | 你做什么 | 产出 |
|---|---|---|---|
| A | 准备 | 装 Zotero + 打开国产大模型网页 | 工具就位 |
| B | Step 1 检索 | 关键词金字塔 → 检索式 → 拉文献 | 80-150 篇候选 |
| C | Step 2 筛选 | AI 打分排序 + 人工把关 | 15-18 篇核心 |
| D | Step 3 入库 | Zotero 一键抓取 + 分类标签 | Zotero 永久库 |
| E | Step 4 提取 | PICO 抽取 → 主题归纳 | 信息表 + 3-5 主题 |
| F | Step 5 生成 | 三段式综述 + 降痕改写 | 300 字初稿 |
| G | iScholar 一键流程 | 看案例把流程压到 5 分钟 | “我也能一键” |
2. 准备:把“兵器”摆在桌上
2.1 大模型(任选 1-2 个即可)
- DeepSeek-V3 / R1:综述写作、逻辑推理(中文学术语体稳)
- Qwen3(通义千问):关键词扩展、英文同义词
- 智谱 GLM(网页免费):信息提取、文档对话
- Kimi K2:长 PDF 对话(100+ 页拖进去直接聊)
架构师警示:今天不用 ChatGPT/Claude/NotebookLM 付费版——不是它们不强,而是你要的是“可复制、可落地、可在国内随时跑”的流程。
2.2 你要打开的三个网站
- 检索:知网(CNKI)/ 万方 / OpenAlex
- 管理:Zotero 7 + 浏览器 Connector(红色 Z 图标)
- 写作:DeepSeek(主笔)+ 通义(词汇辅助)
3. 通用五步法全流程图(先建立直觉,再补术语)
下面这张图不是给你看的,是给你照着抄的:
核心原则一句话:①②③ 自动化,④⑤ 人工把关。
4. Step 1|检索:关键词金字塔,先把范围卡死
4.1 反例(你肯定干过)
只搜“跨境电商 + 阿拉伯”,知网回你 4827 篇。
这不是文献综述,这是“自愿服刑”。
4.2 正解:关键词金字塔(3 层)
- Layer 1 核心词:研究问题的骨架(2-3 个,≤5 字)
- Layer 2 扩展词:同义词 + 英文对应词(扩大召回但不跑偏)
- Layer 3 限定词:年份/地域/方法(决定你能不能读完)
类比:Layer 1 是“主菜”,Layer 2 是“调味料”,Layer 3 是“限购令”。没有 Layer 3,你会把超市搬回家然后饿死。
5. Step 2|筛选:AI 排队,你来验票
5.1 三条机械规则(先自动化)
- 标题/摘要必须包含核心词本身
- 引用量 ≥ 10(实证类;综述类可放宽)
- 语义相似度 ≥ 0.7
Architect Pro-tip:别在 P1 对话里继续问 P2。 同一个对话越聊越久,越容易“顺着前文迎合”。
6. Step 3|入库:Zotero 一键抓取,建立“永久资产”
6.1 分类先建好(别等抓完再整理)
- 核心文献
- 方法论参考
- 背景文献
- 待读
6.2 一键抓取(5 秒一篇)
必须进详情页再点红色 Z。列表页抓不到 PDF——这叫“你以为你存了,其实你没存”。
7. Step 4|提取:PICO 抽取 + 主题归纳(综述的心脏)
架构师警示:“不要编造”不是道德要求,是工程要求。 引用链条一断,综述就不可复用。
8. Step 5|生成:三段式综述 + 降 AI 痕(不做就等着标红)
8.1 三段式模板
- 第一段:背景 + 趋势(≈80 字)
- 第二段:分主题归纳(≈150 字)
- 第三段:Gap + 引出本研究(≈70 字)
9. 数学公式:你做筛选,本质是在做一个“加权决策”
Scorei=wr⋅Reli+wm⋅Methi+wt⋅Timei Score_i = w_r \cdot Rel_i + w_m \cdot Meth_i + w_t \cdot Time_i Scorei=wr⋅Reli+wm⋅Methi+wt⋅Timei
- ReliRel_iReli:相关性(0-4)
- MethiMeth_iMethi:方法质量(0-3)
- TimeiTime_iTimei:时效性(0-3)
金句:模型给分不重要,重要的是它逼你把“为什么选它”说清楚。
10. Python 伪代码:把这堂课写成“可执行流程”
def literature_review_sprint(topic):
# Step 1: keywords pyramid -> queries
pyramid = llm_generate_keywords(topic)
queries = build_queries(pyramid) # CNKI / Wanfang / OpenAlex
# Step 2: retrieval -> candidate list
candidates = retrieve_papers(queries, target_n=120) # 80-150 best
# Step 3: AI scoring -> shortlist
scored = llm_score(candidates[:30]) # take 30 for ranking
core_list = human_filter(scored, target_n=18) # remove off-topic/duplicate/no-pdf
# Step 4: Zotero ingest
zotero_library = zotero_one_click_save(core_list)
# Step 5: PICO extraction -> themes -> draft
cards = [llm_extract_pico(pdf) for pdf in zotero_library.pdfs]
themes, gap = llm_cluster_themes(cards)
draft_300 = llm_write_three_paragraph(topic, themes, cards)
safe_draft = llm_rewrite_reduce_ai_trace(draft_300)
return zotero_library, safe_draft
11. 结尾
最后一句话:AI 是你的研究助理,你才是研究者。
💬 互动话题
如果只能保留今天流程里的一步自动化,你会保留哪一步?为什么?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)