调用深度求索实现文本摘要生成器

ZHW_AI课题组

349人浏览 · 2026-05-20 15:23:43

ZHW_AI课题组 · 2026-05-20 15:23:43 发布

1. 作者介绍

高朝阳，女，西安工程大学电子信息学院，2025级研究生

研究方向：高电压绝缘

电子邮件：1363196836@qq.com

程锡贵，男，西安工程大学电子信息学院，2025级研究生，张宏伟人工智能题组

研究方向：机器视觉与人工智能

电子邮件：15327178796@163.com

2. 算法理论知识介绍

2.1 文本摘要技术对比

本项目采用基于 Transformer 架构的生成式文本摘要方法。与传统方法相比，其特点如下：

抽取式摘要：从原文中提取关键句，不改变原文语句，实现简单，但可读性一般，语义连贯性较差。

生成式摘要（本项目采用）：基于 DeepSeek 大语言模型生成，能理解上下文语义，摘要更加自然流畅。其优点是语义理解能力强，更接近人工总结效果。

2.2 DeepSeek 大模型生成原理

DeepSeek 大模型通过以下核心模块实现对文本的深层理解：

（1）Transformer 架构：当前主流大模型的核心，具有并行计算能力强、长距离语义建模能力强等特点。Encoder（编码器）：负责理解输入文本语义。Decoder（解码器）：负责生成最终摘要文本。

（2）文本编译（Embedding）：实现向量化处理。

（3）Attention 注意力机制：能够动态关注文本中的核心内容，自动分析词语间的关系。

2.3 Attention 机制核心公式

模型通过计算不同词之间的关联程度，自动聚焦于重要内容。其核心公式为：

Attention(Q, K, V) = softmax( (QK^T) / sqrt(d_k) ) V

注：其中 Q 为查询向量，K 为键向量，V 为值向量。

3. 实验过程、代码实现与结果

3.1 开发环境与软件包准备

本项目系统通过本地 Python 程序调用云端 DeepSeek 接口，所需环境如下：

编程语言：Python（语法简洁，第三方库支持丰富）

开发工具：Visual Studio Code (VS Code)（高效的代码编辑与调试）

核心库：requests（用于发送 HTTP 请求，实现网络通信）

模型 API：DeepSeek API（提供大语言模型能力）

3.2 数据集与测试文本介绍

由于本项目主要验证 API 调用流程，采用自定义文本作为测试集：

数据来源：涵盖新闻、科技、学术、技术文档等中文长文本。

单文本长度：200~1000字。

输出摘要长度：50~150字。

测试示例：输入国家能源局发布的《2025年全国电力工业统计数据》长文本。

3.3 核心代码实现

import requests

# API配置
API_KEY = "sk-d30aeec612124a888f1b0d117060c606" 

def generate_summary(text):
    url = "https://api.deepseek.com/v1/chat/completions"
    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    data = {
        "model": "deepseek-chat",
        "messages": [
            {"role": "user", "content": f"请为下面的文本生成一段简洁的中文摘要：\n{text}"}
        ],
        "temperature": 0.2,
        "max_tokens": 1000
    }
    try:
        resp = requests.post(url, json=data, headers=headers, timeout=30)
        resp.raise_for_status()
        result = resp.json()
        return result["choices"][0]["message"]["content"].strip()
    except Exception as e:
        return f"请求失败：{str(e)}"

3.4 实验测试结果

在 VS Code 终端运行程序后，输入电力统计新闻长文本，系统成功调用 API 并返回结果：

生成结果：“国家能源局发布数据显示，2025年全国全社会用电量达9.8万亿千瓦时……非化石能源发电占比提升，资源配置能力增强。”

结论：实验证明系统能够完成从长文本输入到结构化摘要输出的闭环。

3.5 问题分析与优化方向

常见问题：开发中可能遇到 500 Server Error（服务器内部错误），需排查 API 地址、Key 有效性及参数格式。

项目优点：实现简单、开发效率高、摘要效果自然、支持长文本。

存在不足：依赖网络、API 调用有延迟、免费额度有限。

优化方向：

增加 GUI 图形界面

支持 Word/PDF 文件直接读取

增加关键词提取功能

探索本地部署模型

4. 参考连接

DeepSeek 官方文档：https://platform.deepseek.com/

Python Requests 库文档：https://requests.readthedocs.io/

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【4】基于 Docker + YOLOv8 环境实现模型裁剪（GTX1660S + Ubuntu22.04）

删除神经网络中“不重要”的参数很多神经元其实没什么用可以删除不影响太多精度还能减少计算量DockerGTX1660SYOLOv8模型裁剪权重删除Fine-tune恢复ONNX部署方向删除不重要参数更小模型更低显存更快推理这是 AI 部署优化中的核心技术之一。

AtomGit开源社区

2026年国内AI+HR SaaS 口碑榜：谁在领跑中国人力资源数智化？

AtomGit开源社区

【3】基于 Docker + YOLOv8 环境将模型转换为 ONNX（GTX1660S + Ubuntu22.04）

本文详细介绍了YOLOv8模型从PyTorch到ONNX的转换及推理部署流程。主要内容包括：1) ONNX作为通用模型交换格式的优势；2) 在Docker环境中搭建YOLOv8开发环境；3) 使用yolo export命令导出ONNX模型的关键参数配置；4) ONNXRuntime GPU推理验证；5) GTX1660S显卡的部署建议。文章提供了完整的ONNX导出命令和推理测试代码，并阐述了ONN