1. 作者介绍

高朝阳,女,西安工程大学电子信息学院,2025级研究生

研究方向:高电压绝缘

电子邮件:1363196836@qq.com

程锡贵,男,西安工程大学电子信息学院,2025级研究生,张宏伟人工智能题组

研究方向:机器视觉与人工智能

电子邮件:15327178796@163.com

    2. 算法理论知识介绍

    2.1 文本摘要技术对比

    本项目采用基于 Transformer 架构的生成式文本摘要方法。与传统方法相比,其特点如下:

    抽取式摘要:从原文中提取关键句,不改变原文语句,实现简单,但可读性一般,语义连贯性较差。

    生成式摘要(本项目采用):基于 DeepSeek 大语言模型生成,能理解上下文语义,摘要更加自然流畅。其优点是语义理解能力强,更接近人工总结效果。

    2.2 DeepSeek 大模型生成原理

    DeepSeek 大模型通过以下核心模块实现对文本的深层理解:

    1Transformer 架构:当前主流大模型的核心,具有并行计算能力强、长距离语义建模能力强等特点。Encoder(编码器):负责理解输入文本语义。Decoder(解码器):负责生成最终摘要文本。

    2)文本编译(Embedding):实现向量化处理。

    3Attention 注意力机制:能够动态关注文本中的核心内容,自动分析词语间的关系。

    2.3 Attention 机制核心公式

    模型通过计算不同词之间的关联程度,自动聚焦于重要内容。其核心公式为:

    Attention(Q, K, V) = softmax( (QK^T) / sqrt(d_k) ) V

    注:其中 Q 为查询向量,K 为键向量,V 为值向量。

    3. 实验过程、代码实现与结果

    3.1 开发环境与软件包准备

    本项目系统通过本地 Python 程序调用云端 DeepSeek 接口,所需环境如下:

    编程语言:Python(语法简洁,第三方库支持丰富)

    开发工具:Visual Studio Code (VS Code)(高效的代码编辑与调试)

    核心库:requests(用于发送 HTTP 请求,实现网络通信)

    模型 APIDeepSeek API(提供大语言模型能力)

    3.2 数据集与测试文本介绍

    由于本项目主要验证 API 调用流程,采用自定义文本作为测试集:

    数据来源:涵盖新闻、科技、学术、技术文档等中文长文本。

    单文本长度:200~1000字。

    输出摘要长度:50~150字。

    测试示例:输入国家能源局发布的《2025年全国电力工业统计数据》长文本。

    3.3 核心代码实现

    import requests
    
    # API配置
    API_KEY = "sk-d30aeec612124a888f1b0d117060c606" 
    
    def generate_summary(text):
        url = "https://api.deepseek.com/v1/chat/completions"
        headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }
        data = {
            "model": "deepseek-chat",
            "messages": [
                {"role": "user", "content": f"请为下面的文本生成一段简洁的中文摘要:\n{text}"}
            ],
            "temperature": 0.2,
            "max_tokens": 1000
        }
        try:
            resp = requests.post(url, json=data, headers=headers, timeout=30)
            resp.raise_for_status()
            result = resp.json()
            return result["choices"][0]["message"]["content"].strip()
        except Exception as e:
            return f"请求失败:{str(e)}" 
    

    3.4 实验测试结果

    在 VS Code 终端运行程序后,输入电力统计新闻长文本,系统成功调用 API 并返回结果:

    生成结果:“国家能源局发布数据显示,2025年全国全社会用电量达9.8万亿千瓦时……非化石能源发电占比提升,资源配置能力增强。”

    结论:实验证明系统能够完成从长文本输入到结构化摘要输出的闭环。

    3.5 问题分析与优化方向

    常见问题:开发中可能遇到 500 Server Error(服务器内部错误),需排查 API 地址、Key 有效性及参数格式。

    项目优点:实现简单、开发效率高、摘要效果自然、支持长文本。

    存在不足:依赖网络、API 调用有延迟、免费额度有限。

    优化方向:

    增加 GUI 图形界面

    支持 Word/PDF 文件直接读取

    增加关键词提取功能

    探索本地部署模型

    4. 参考连接

    DeepSeek 官方文档:https://platform.deepseek.com/

    Python Requests 库文档:https://requests.readthedocs.io/

    Logo

    AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

    更多推荐