第一部分:基础篇 —— 认知与入门

1.1 DeepSeek 是什么?

DeepSeek(深度求索)是一款由深度求索公司打造的纯文本大语言模型。其核心优势在于:

  • 超长上下文 (1M tokens):可以一次性处理《三体》三部曲这样体量的书籍。

  • 免费/高性价比:Web端和App端目前免费;API定价极具竞争力。

  • 推理能力强:在逻辑推理、数学、代码生成领域表现优异,接近国际顶尖闭源模型水平。

1.2 访问方式

  1. Web端:访问官网 chat.deepseek.com ,登录后使用。

  2. App端:在应用商店搜索“DeepSeek”下载。支持语音输入,适合移动场景下的快速问答。

  3. API接入:通过官方API接口,将DeepSeek集成到自己的应用、IDE插件(如Cursor、Continue)或自动化脚本中。

1.3 基础界面功能解析

  • 对话窗口:支持多轮对话,模型会自动记忆上下文(目前上下文长度极长,几乎不用担心溢出)。

  • 联网搜索:Web/App端需手动点击“联网搜索”按钮。适合查询实时新闻、最新股价、今日天气等。

  • 文件上传:支持上传图像、TXT、PDF、PPT、Word、Excel文件。注意:DeepSeek是纯文本模型,不能识别图像内容(多模态识别),但能读取图像中的文字(OCR后的文本)以及文档内的文本信息。


第二部分:核心心法 —— 提问的艺术

要想发挥DeepSeek的最大潜力,必须掌握“结构化提示词”。这里推荐 “CRISPE”框架 的变体。

2.1 万能提示词公式

角色 + 任务 + 背景/上下文 + 输出格式/要求 + 禁忌/约束

  • 示例

    • 角色:你是一位拥有10年经验的资深Python架构师。

    • 任务:请帮我编写一个爬取某网站新闻标题的脚本。

    • 背景:该网站有反爬机制,需要模拟浏览器头;数据量约1000条。

    • 输出格式:使用requestsBeautifulSoup库,代码需包含异常处理,并添加详细注释。

    • 禁忌:不要使用selenium,因为太慢。

2.2 基础技巧

  1. 一问一答:简单问题直接问。

  2. 分点阐述:当需要多维度回答时,要求“分点列出”、“用表格呈现”。

  3. 反向提问:让AI质疑你的方案。“请指出我这个方案的潜在风险。”


第三部分:进阶篇 —— 场景化实战

3.1 文档处理与长文本分析

利用1M超长上下文,DeepSeek是最好的“文档处理助手”。

场景1:合同审核

  • 提示词:请扮演一位资深法务顾问。以下是《XXXX合同》的内容。请帮我审核其中:

    1. 对我方(乙方)不利的条款。

    2. 违约责任是否对等。

    3. 缺失的常见保护性条款。
      请用红色标注风险点(用文字模拟),并提出修改建议。

场景2:论文/研报总结

  • 提示词:请帮我总结这篇2万字的研报。我需要:

    1. 核心结论(100字以内)。

    2. 关键数据(列出3-5个)。

    3. 逻辑论证路径(用流程图的形式描述,使用Mermaid代码)。

    4. 我的行动建议:基于此研报,作为投资者应该关注哪些板块?

3.2 代码开发全栈辅助

DeepSeek在代码方面表现极其出色,几乎可以替代初级程序员。

场景1:从零搭建项目

  • 提示词:我需要搭建一个React + Vite的前端项目,做一个“番茄时钟”。请一步步指导我。

    1. 列出项目结构。

    2. 给出核心组件代码(App.jsx)。

    3. 包含计时器逻辑(25分钟工作,5分钟休息)。

    4. 界面要有现代化CSS(Tailwind CSS)。

场景2:Debug 与代码优化

  • 提示词:以下是我的Python代码,它在运行时报错 KeyError: 'user_id'

    python

    [粘贴代码]

    请帮我分析原因,并给出修正后的代码。同时,请检查这段代码是否存在性能瓶颈。

场景3:编写测试用例

  • 提示词:基于以下API接口文档,使用pytest框架生成完整的单元测试用例,覆盖正常流程、边界值和异常情况。
    [粘贴接口文档]

3.3 创意写作与营销

场景1:爆款文案生成

  • 提示词:请以“职场人如何利用AI每天节省2小时”为主题,写一篇小红书风格的笔记。
    要求:

    • 标题要吸引眼球(使用表情符号)。

    • 正文要有真实感,以第一人称叙述。

    • 包含3-5个具体步骤。

    • 结尾带上话题标签。

场景2:头脑风暴

  • 提示词:我正在准备一场关于“未来教育”的演讲。请作为创意顾问,帮我头脑风暴出10个新颖的切入点。要求避开“元宇宙”、“VR”等陈词滥调,最好结合当下的“AI原生代”概念。


第四部分:高级篇 —— 工程化与Agent

4.1 结构化输出 (JSON Mode)

在API调用或复杂任务中,为了便于程序解析,要求DeepSeek输出严格的JSON格式。

  • 示例

    请提取以下文本中的实体信息。请只输出一个JSON对象,不要包含任何其他文字。
    文本:“张三于2023年入职了百度公司,担任算法工程师。”
    输出格式:
    {
    “person”: “张三”,
    “company”: “百度”,
    “position”: “算法工程师”,
    “year”: 2023
    }

4.2 思维链 (Chain of Thought)

对于复杂数学或逻辑推理题,强制要求模型展示推理步骤,可以大幅提高准确率。

  • 提示词:请一步步思考。先分析已知条件,列出公式,最后给出答案。在得出最终结果前,请先检查你的计算过程是否有误。

4.3 构建智能体 (Agent) 工作流

利用DeepSeek的Function Calling功能,可以构建自主执行任务的Agent。

  • 原理:模型根据用户指令,决定调用哪个外部工具(如:查天气、发邮件、查数据库),并生成调用参数,由你的程序执行后返回结果。

  • 实战场景:搭建一个“智能数据查询助手”。

    • 用户问:“上周北京和上海的销售数据对比。”

    • DeepSeek判断需要调用 query_sales_data(date_range, city) 函数。

    • 你的程序执行SQL查询。

    • 将数据返回给DeepSeek,它生成分析报告和图表描述。

4.4 长上下文的高级玩法:LLM as OS

利用1M上下文,你可以将DeepSeek视为一个“操作系统”,把大量的知识库、代码库、历史记录一次性塞进上下文,让它成为该领域的专家。

  • 技巧

    1. 一次性投喂:将整个项目的所有代码文件(压缩或拼接)上传。

    2. 建立索引:要求模型“记住这些文件的依赖关系”。

    3. 精准修改:下达指令“在 src/utils/helper.js 中增加一个防抖函数”。

    • 注意:虽然上下文极大,但推理速度会随着上下文长度增加略有波动,建议按需使用。

4.5 API 调用实战 (Python示例)

python

import openai  # 兼容OpenAI SDK

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.deepseek.com"  # DeepSeek API地址
)

response = client.chat.completions.create(
    model="deepseek-chat",  # 或者 deepseek-reasoner (推理模型)
    messages=[
        {"role": "system", "content": "你是一位精通Python的数据科学家。"},
        {"role": "user", "content": "请解释一下Transformer架构中的注意力机制,并用代码演示。"}
    ],
    temperature=0.7,
    max_tokens=2048,
    stream=False  # 是否流式输出
)

print(response.choices[0].message.content)

第五部分:避坑指南与性能调优

5.1 常见误区

  1. 上传图片问内容:DeepSeek是纯文本模型。如果你上传一张包含图表的图片,模型看不到图表里的曲线关系,只能读取图片中嵌入的文字。要分析图表,请先用OCR或人工描述图片内容。

  2. 过度依赖“联网搜索”:对于2024年7月之后的知识(DeepSeek知识截止日期),如果需要最新信息,务必手动开启联网按钮。

  3. 一次性问太多:如果在一个问题中塞入5个以上复杂要求,模型可能会遗漏。建议分步执行:“先做完A,确认后再做B”。

5.2 参数调优

在使用API或某些支持参数调节的界面时:

  • Temperature

    • 0.0 - 0.3:适合代码生成、数据提取、事实问答(确定性高)。

    • 0.7 - 1.0:适合创意写作、头脑风暴(随机性高,更有创意)。

  • Top_p:核采样。通常保持默认或与Temperature配合调节。不要同时剧烈调整两者。

5.3 长对话管理

虽然上下文长,但对话轮次过多(例如超过50轮),早期的指令可能会被“淹没”在中间位置(注意力衰减)。建议:

  • 开启新会话:当任务主题切换时,果断开启新对话。

  • 重述关键信息:在长对话后期,如果发现模型“失忆”,可以简单提醒:“请记住我们最初的任务是:XXXX。”


第六部分:总结与展望

6.1 核心竞争力回顾

  • 性价比之王:在同等性能水平下,DeepSeek的免费策略和极低的API价格,使其成为个人开发者和小微企业的首选。

  • 超长上下文:颠覆了传统RAG(检索增强生成)的必要性,对于处理书籍级、代码库级的内容具有天然优势。

  • 中文优化:作为中国团队开发的模型,在中文语境、成语、古诗、本地化业务场景的理解上优于同等级别的海外模型。

6.2 未来实战趋势

  1. 多模态融合:虽然当前版本是纯文本,但未来版本可能会增加视觉识别能力。

  2. 推理模型深化deepseek-reasoner 这类模型专攻数理逻辑,适合科研、数学解题、复杂策略推演。

  3. 本地化部署:随着模型小型化(如1.5B、7B版本),利用Ollama等工具在本地部署私有化DeepSeek,将成为保障数据安全的重要方案。


结语

DeepSeek不仅是一个聊天机器人,它是你的代码副驾驶、你的数据分析师、你的私人顾问。这份秘籍旨在帮你从“会用”进阶到“用好”。真正的实战高手,在于理解模型的边界(何时该用,何时不该用),以及如何通过精巧的提示词设计,将复杂的业务需求拆解为模型能够轻松执行的原子任务。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐