AI 生成的文章如何“去 AI 味“？检测原理与自动化改写实战（附代码）

haoxinpoju

405人浏览 · 2026-06-03 12:42:51

haoxinpoju · 2026-06-03 12:42:51 发布

AI 生成的文章如何"去 AI 味"？检测原理与自动化改写实战（附代码）

阅读本文你需要：Python 基础、了解 LLM 文本生成原理、对 NLP 基本概念（困惑度/词频分布）有初步认知。
本文你会收获：理解 AI 文本检测的 6 个核心维度，拿到一套可运行的自动化去 AI 味改写流水线代码。

一、为什么"去 AI 味"成了刚需

2025 年以来，各大内容平台（微信公众号、百家号、知乎、CSDN）都在升级 AIGC 检测能力。真实的情况是：

头条系已上线 AIGC 标签，检测率较高的文章会被限流
百家号对疑似 AI 内容降低推荐权重
知乎对 AI 回答加标识，影响盐值
公众号虽然没有显式标签，但搜索流量明显向"原创感"强的内容倾斜

我自己在运营公众号的过程中，早期用 GPT-4 直接生成的文章，阅读量比手写的平均低 40%-60%。后来搭了一套自动化"去 AI 味"改写系统，同样的 AI 初稿，改写后的阅读量回升到正常水平。

这篇文章把整个思路拆开讲清楚：检测器是怎么识破你的，以及怎么用代码对抗它。

二、AI 文本检测器在看什么？

先搞清楚敌人在检测什么。市面上的 AI 检测工具（如 GPTZero、Originality.ai、知网 AIGC 检测）核心依赖以下几个统计特征：

2.1 困惑度（Perplexity）

困惑度衡量模型对下一个 token 的"意外程度"。AI 生成的文本困惑度通常较低——因为模型总是选概率最高的词。

人类写作（高困惑度）：
"这个 bug 我调了整整一个下午，最后发现是少了个分号，心态直接炸了。"

AI 写作（低困惑度）：
"在调试过程中，我发现了一个持续存在的错误。经过仔细排查，问题的根本原因是代码中遗漏了一个分号。"

人类用词更"跳跃"，AI 用词更"可预测"。检测器就是利用这个差异。

2.2 突发性（Burstiness）

突发性衡量文本中句子长度和复杂度的波动。人类写作时，短句和长句交替出现（burst），而 AI 生成的文本句子长度更均匀。

指标	人类文本	AI 文本
句长标准差	15-25 字符	8-15 字符
长短句交替频率	高（burst）	低（均匀）
段落长度方差	大	小

2.3 结构指纹

AI 写作有很强的结构偏好，这是检测器最容易抓的特征：

过渡词滥用：然而、此外、值得注意的是、综上所述、首先…其次…最后
段落开头模式：“总而言之”、“从上述分析可以看出”
对称结构癖好：喜欢用排比句、对仗句，“不仅…而且…”、“一方面…另一方面…”
总结性结尾：每段结尾都要来一句概括性陈述

2.4 词汇分布偏差

AI 对某些词汇的偏好明显高于人类：

高频 AI 词汇（人类较少使用）：
"深入探讨"、"全面解析"、"旨在"、"至关重要"、"不可或缺"、
"显著提升"、"有效解决"、"广泛应用于"、"日益增长"

2.5 标点与格式模式

AI 很少在段落结尾不加标点
AI 倾向于使用完整的标点符号组合（冒号+解释、破折号+补充）
人类写作中口语化标点（省略号、感叹号、问号混用）出现频率更高

2.6 语义一致性

AI 生成的文本在语义连贯性上"过于完美"——每个段落都紧扣主题，不会出现人类写作中常见的跑题、插入个人轶事、突然跳转等现象。

总结一下：检测器不是"看懂"了文章内容，而是通过上述 6 个维度的统计特征，判断文本是否符合人类写作的"不完美"模式。

三、手动改写策略（思路篇）

理解了检测原理，改写方向就清楚了。我总结了一套"反检测改写六策略"：

策略 1：打破句长均匀性

# 原文（AI 风格，句长均匀）
"""
在使用 Python 进行数据处理时，pandas 库提供了丰富的功能。
我们可以通过 read_csv 方法读取数据文件，并进行分析操作。
此外，groupby 方法能够实现数据的分组聚合统计。
"""

# 改写后（加入长短句交替）
"""
数据处理我一般直接上 pandas。read_csv 一行搞定文件读取，然后该筛选筛选该聚合聚合。groupby 是真香，分组统计几乎零代码。"""

策略 2：注入口语化表达

替换书面语为口语化表达，加入个人观点和情绪：

AI 写法：   "该方案具有较高的可行性和实用价值"
改写：      "这套方案我跑了两周，效果确实可以，推荐试试"

AI 写法：   "需要注意的是，在使用前需要检查配置文件"
改写：      "别急着跑，先看一眼配置文件，这步跳过会翻车"

策略 3：添加具体数字和场景

AI 文本喜欢泛泛而谈，人类写作更具体：

AI 写法：   "经过一段时间的使用，性能有了明显提升"
改写：      "跑了 3 天压测，QPS 从 1200 涨到 3400，延迟降了 60%"

策略 4：破坏段落结构指纹

不是每段都要"总-分-总"
偶尔用反问句开头
中间插入一个看似跑题但有趣的个人经历

策略 5：替换 AI 偏好词汇

用更"接地气"的词替换 AI 高频词：

AI 偏好词	替换为
深入探讨	聊聊 / 拆解一下
全面解析	具体说 / 实操讲一遍
旨在	目的就是 / 想解决
至关重要	很关键 / 不搞会出事
不可或缺	没它不行 / 必须有
综上所述	所以 / 总结一下

策略 6：段落结尾去标点

这是一个小技巧但很有效——人类在非正式写作中，段落结尾经常不加句号（特别是列表式段落）。AI 几乎不会这样做。

四、自动化改写流水线（代码实战）

手动改写效率太低，我写了一套 Python 自动化流水线，核心思路是：用规则引擎做初级清洗 + 用 LLM 做深度改写。

4.1 整体架构

AI 初稿
  ↓
[规则引擎] → 替换 AI 高频词、打散句长、处理标点
  ↓
[LLM 改写] → 注入口语化表达、加入具体场景、破坏结构指纹
  ↓
[质量检测] → 6 维度评分，不达标则回退重新改写
  ↓
输出成品

4.2 规则引擎代码

import re
import random

class RuleEngine:
    """规则引擎：基于确定性规则的初级去 AI 味处理"""

    # AI 高频词替换表
    AI_WORD_MAP = {
        "深入探讨": ["聊聊", "拆解一下", "具体看看"],
        "全面解析": ["具体说", "实操讲一遍", "展开讲讲"],
        "旨在": ["目标就是", "想解决", "主要是"],
        "至关重要": ["很关键", "这步不能省", "不搞会出事"],
        "不可或缺": ["没它不行", "必须有", "绕不开"],
        "综上所述": ["所以", "总结一下", "总的来说"],
        "值得注意的是": ["提醒一下", "注意了", "这里有个坑"],
        "显著提升": ["涨了不少", "效果明显", "提升很大"],
        "有效解决": ["搞定了", "解决了", "不再有这个问题"],
        "广泛应用于": ["用的人很多", "到处都在用", "很常见"],
        "日益增长": ["越来越多", "越来越大", "一直在涨"],
        "不可或缺的": ["必须有的", "核心的", "关键的"],
        "深入分析": ["仔细看看", "拆开看", "分析一下"],
        "有效提高": ["提升", "改善", "优化"],
        "充分发挥": ["用好", "发挥", "利用"],
        "大幅提升": ["涨了很多", "提升很大", "效果明显"],
        "日益完善": ["越来越成熟", "越来越好", "不断改进"],
        "不断完善": ["一直在优化", "持续改进", "迭代了好几版"],
        "与此同时": ["同时", "另外", "还有"],
        "不仅如此": ["而且", "更关键的是", "还有一点"],
        "在一定程度上": ["某种程度上", "多少有点", "算是"],
        "本文将": ["这篇", "我来", "下面"],
        "随着.*的发展": None,  # 特殊处理，整句重写
    }

    # 段落结尾标点处理规则
    ENDING_PUNCT_RE = re.compile(r'[。！？]¥')

    def __init__(self):
        self.stats = {"words_replaced": 0, "sentences_restructured": 0}

    def replace_ai_words(self, text: str) -> str:
        """替换 AI 高频词为口语化表达"""
        result = text
        for ai_word, replacements in self.AI_WORD_MAP.items():
            if replacements is None:
                continue
            if ai_word in result:
                replacement = random.choice(replacements)
                result = result.replace(ai_word, replacement)
                self.stats["words_replaced"] += 1
        return result

    def break_sentence_uniformity(self, text: str) -> str:
        """打乱句子长度的均匀性"""
        sentences = re.split(r'(?<=[。！？\n])', text)
        result_sentences = []

        for sent in sentences:
            if not sent.strip():
                result_sentences.append(sent)
                continue

            # 随机拆分长句或合并短句
            if len(sent) > 60 and random.random() < 0.3:
                # 拆分成两个短句
                mid = len(sent) // 2
                # 找到最近的逗号或分号位置
                for i in range(mid, min(mid + 15, len(sent))):
                    if sent[i] in '，；':
                        part1 = sent[:i] + '。'
                        part2 = sent[i+1:]
                        sent = part1 + part2
                        self.stats["sentences_restructured"] += 1
                        break
            elif len(sent) < 20 and random.random() < 0.2:
                # 短句有概率去掉结尾标点（模拟口语风格）
                sent = sent.rstrip('。')
                self.stats["sentences_restructured"] += 1

            result_sentences.append(sent)

        return ''.join(result_sentences)

    def add_informal_markers(self, text: str) -> str:
        """添加非正式写作标记（口语化润色）"""
        # 随机插入一些口语化连接词
        informal_inserts = [
            ("，", ["说实话，", "讲真，", "说个事，"], 0.08),
            ("。", ["这事我踩过坑——", "翻车经验来了——", ""], 0.05),
        ]
        result = text
        for target, candidates, prob in informal_inserts:
            if random.random() < prob and candidates:
                insert = random.choice(candidates)
                if insert:
                    positions = [i for i, c in enumerate(result) if c == target]
                    if positions:
                        pos = random.choice(positions)
                        result = result[:pos+1] + insert + result[pos+1:]
        return result

    def process(self, text: str) -> str:
        """执行完整的规则引擎处理流程"""
        text = self.replace_ai_words(text)
        text = self.break_sentence_uniformity(text)
        text = self.add_informal_markers(text)
        return text

4.3 LLM 深度改写代码

import json

DEHUMANIZE_PROMPT = """你是一个中文文本改写专家。你的任务是对以下 AI 生成的文本进行"去 AI 味"改写，使其读起来更像人类写作。

## 改写规则（必须全部执行）：

1. **打破句长均匀性**：长短句交替，偶尔用极短句（5-10字）打断节奏
2. **注入口语化表达**：用"说实话""讲真""翻车了"等口语词替换书面语
3. **加入具体数字和场景**：把模糊表述改为具体数据（如"3天""200行代码""40%提升"）
4. **破坏结构指纹**：
   - 不要用"首先...其次...最后..."结构
   - 不要每段结尾都做总结
   - 偶尔用反问句或感叹句开头
   - 至少有一段用"跑题式"个人经历引入
5. **替换 AI 偏好词汇**：不要用"深入探讨""全面解析""至关重要""值得注意的是""综上所述""旨在""不可或缺"
6. **段落结尾处理**：列表式段落的最后一条，结尾可以不加句号
7. **加入不完美**：允许出现轻微的口语化语病、省略主语、倒装句

## 输入文本：
{text}

## 改写要求：
- 保持原文的技术准确性和核心信息不变
- 改写后的文本技术深度不变，只是表达方式更像人类
- 输出改写后的完整文本，不需要解释改了什么"""


class LLMRewriter:
    """LLM 深度改写器"""

    def __init__(self, api_key: str, base_url: str = None, model: str = "gpt-4o-mini"):
        from openai import OpenAI
        self.client = OpenAI(
            api_key=api_key,
            base_url=base_url  # 支持自定义 API 地址（兼容国产模型）
        )
        self.model = model
        self.stats = {"rewrites": 0, "tokens_used": 0}

    def rewrite(self, text: str, max_retries: int = 2) -> str:
        """调用 LLM 进行深度改写"""
        prompt = DEHUMANIZE_PROMPT.format(text=text)

        for attempt in range(max_retries):
            try:
                response = self.client.chat.completions.create(
                    model=self.model,
                    messages=[
                        {"role": "system", "content": "你是一个专业的中文文本改写专家。"},
                        {"role": "user", "content": prompt}
                    ],
                    temperature=0.8,  # 稍高温度增加多样性
                    max_tokens=4000
                )
                result = response.choices[0].message.content
                self.stats["rewrites"] += 1
                self.stats["tokens_used"] += response.usage.total_tokens
                return result
            except Exception as e:
                print(f"改写失败（第 {attempt + 1} 次）: {e}")
                if attempt == max_retries - 1:
                    raise

        return text  # 全部失败返回原文

4.4 质量检测器代码

import re
import math
from collections import Counter

class AITextDetector:
    """AI 文本检测器：6 维度评分（0-100 分，越高越像人类）"""

    def __init__(self):
        self.dimensions = {}

    def _calc_perplexity_proxy(self, text: str) -> float:
        """困惑度代理指标（基于字/词重复率）"""
        if not text:
            return 0
        chars = list(text)
        char_freq = Counter(chars)
        total = len(chars)
        # 计算字符分布的熵（熵越低=困惑度越低=越像 AI）
        entropy = -sum(
            (count / total) * math.log2(count / total)
            for count in char_freq.values()
        )
        # 归一化到 0-100（中文文本熵通常在 4-7 之间）
        return min(100, max(0, (entropy - 3.5) / 4.0 * 100))

    def _calc_burstiness(self, text: str) -> float:
        """突发性指标（句长方差）"""
        sentences = re.split(r'[。！？\n]', text)
        sentences = [s.strip() for s in sentences if s.strip()]
        if len(sentences) < 2:
            return 50  # 不足 2 句给中间分

        lengths = [len(s) for s in sentences]
        mean_len = sum(lengths) / len(lengths)
        variance = sum((l - mean_len) ** 2 for l in lengths) / len(lengths)
        std = math.sqrt(variance)

        # 句长标准差 / 平均句长，比值越大突发性越强
        cv = std / mean_len if mean_len > 0 else 0
        # 归一化：人类 cv 通常 0.5-1.0，AI 通常 0.2-0.5
        return min(100, max(0, (cv - 0.2) / 0.8 * 100))

    def _check_ai_words(self, text: str) -> float:
        """AI 偏好词检测"""
        ai_words = [
            "深入探讨", "全面解析", "至关重要", "不可或缺",
            "值得注意的是", "综上所述", "旨在", "日益增长",
            "有效解决", "显著提升", "广泛应用于", "与此同时",
            "不仅如此", "在一定程度上", "本文将", "全面覆盖",
            "深入分析", "有效提高", "充分发挥", "大幅提升",
            "日益完善", "不断完善", "具有重要意义",
        ]
        found = sum(1 for word in ai_words if word in text)
        # 每 500 字出现 1 个 AI 词就扣分
        word_per_500 = found / max(1, len(text) / 500)
        return min(100, max(0, 100 - word_per_500 * 30))

    def _check_structure(self, text: str) -> float:
        """结构指纹检测"""
        score = 100
        patterns = [
            (r'首先.*其次.*最后', -15),   # 经典 AI 三段式
            (r'一方面.*另一方面', -10),    # 对称结构
            (r'不仅.*而且', -8),           # 递进结构
            (r'总而言之', -10),            # 总结性开头
            (r'从上述分析可以看出', -10),   # 总结性开头
            (r'值得.*注意的是', -8),       # 过渡词
            (r'需要.*指出的是', -8),       # 过渡词
        ]
        for pattern, penalty in patterns:
            if re.search(pattern, text):
                score += penalty
        return max(0, min(100, score))

    def _check_sentence_endings(self, text: str) -> float:
        """段落结尾标点检测（人类偶尔不加标点）"""
        paragraphs = text.split('\n')
        paragraphs = [p.strip() for p in paragraphs if p.strip() and len(p) > 10]

        if not paragraphs:
            return 50

        # 统计段落结尾标点多样性
        ending_chars = []
        for p in paragraphs:
            last_char = p[-1] if p else ''
            ending_chars.append(last_char)

        unique_endings = len(set(ending_chars))
        total = len(ending_chars)

        # 多样性高 = 更像人类
        return min(100, max(0, unique_endings / max(total, 1) * 100 * 2.5))

    def _check_口语化(self, text: str) -> float:
        """口语化程度检测"""
        oral_markers = [
            "说实话", "讲真", "翻车", "踩坑", "搞定了",
            "跑一下", "试试", "其实吧", "怎么说呢", "对吧",
            "算是", "多少", "挺", "啥", "咋", "嘛", "呢",
            "吧", "啊", "哦", "嘿", "哎", "嗯",
            "别急", "别慌", "稳住", "注意了", "提醒一下",
        ]
        found = sum(1 for word in oral_markers if word in text)
        oral_per_500 = found / max(1, len(text) / 500)
        # 每 500 字 2-5 个口语词是理想范围
        return min(100, max(0, 50 + oral_per_500 * 10))

    def detect(self, text: str) -> dict:
        """执行 6 维度检测，返回评分结果"""
        results = {
            "困惑度多样性": round(self._calc_perplexity_proxy(text), 1),
            "突发性（句长波动）": round(self._calc_burstiness(text), 1),
            "AI 偏好词密度": round(self._check_ai_words(text), 1),
            "结构指纹自然度": round(self._check_structure(text), 1),
            "结尾标点多样性": round(self._check_sentence_endings(text), 1),
            "口语化程度": round(self._check_口语化(text), 1),
        }

        # 加权总分
        weights = {
            "困惑度多样性": 0.15,
            "突发性（句长波动）": 0.20,
            "AI 偏好词密度": 0.20,
            "结构指纹自然度": 0.25,
            "结尾标点多样性": 0.05,
            "口语化程度": 0.15,
        }
        total = sum(results[k] * weights[k] for k in results)
        results["综合评分"] = round(total, 1)
        results["判定"] = "人类风格" if total >= 65 else "疑似 AI" if total >= 45 else "AI 风格明显"

        return results

4.5 编排器：完整流水线

class DeAIPipeline:
    """去 AI 味自动化流水线"""

    def __init__(self, api_key: str, model: str = "gpt-4o-mini"):
        self.rule_engine = RuleEngine()
        self.detector = AITextDetector()
        self.rewriter = LLMRewriter(api_key=api_key, model=model)
        self.min_score = 65  # 最低合格分

    def process(self, text: str, max_rounds: int = 3) -> dict:
        """完整处理流程：规则清洗 → LLM 改写 → 质量检测 → 回退"""
        print("=" * 60)
        print("去 AI 味流水线启动")
        print("=" * 60)

        # 第一阶段：规则引擎初级清洗
        print("\n[阶段1] 规则引擎清洗中...")
        rule_output = self.rule_engine.process(text)
        rule_score = self.detector.detect(rule_output)
        print(f"  规则清洗后评分: {rule_score['综合评分']} ({rule_score['判定']})")

        # 第二阶段：LLM 深度改写（如果规则清洗不够）
        if rule_score["综合评分"] < self.min_score:
            print("\n[阶段2] LLM 深度改写中...")
            for round_num in range(max_rounds):
                llm_output = self.rewriter.rewrite(rule_output)
                llm_score = self.detector.detect(llm_output)
                print(f"  第 {round_num + 1} 轮改写评分: {llm_score['综合评分']} ({llm_score['判定']})")

                if llm_score["综合评分"] >= self.min_score:
                    print("\n[完成] 评分达标！")
                    return {
                        "status": "success",
                        "text": llm_output,
                        "score": llm_score,
                        "rounds": round_num + 1,
                    }
                # 如果还不够，用改写后的文本作为下一轮输入
                rule_output = llm_output
        else:
            print("\n[完成] 规则清洗已达标，跳过 LLM 改写")
            return {
                "status": "success",
                "text": rule_output,
                "score": rule_score,
                "rounds": 0,
            }

        # 达到最大轮次仍未达标
        final_score = self.detector.detect(rule_output)
        print(f"\n[警告] 达到最大轮次 {max_rounds}，最终评分: {final_score['综合评分']}")
        return {
            "status": "partial",
            "text": rule_output,
            "score": final_score,
            "rounds": max_rounds,
        }


def print_score_detail(scores: dict):
    """打印评分详情"""
    print("\n" + "-" * 50)
    print(f"综合评分: {scores['综合评分']} / 100  判定: {scores['判定']}")
    print("-" * 50)
    for key, value in scores.items():
        if key in ("综合评分", "判定"):
            continue
        bar_len = int(value / 5)
        bar = "█" * bar_len + "░" * (20 - bar_len)
        print(f"  {key:16s} {bar} {value:.1f}")
    print("-" * 50)


# 使用示例
if __name__ == "__main__":
    # 示例 AI 初稿
    ai_draft = """
在使用 Python 进行数据处理时，pandas 库提供了丰富的功能。我们可以通过 read_csv 方法读取数据文件，并进行分析操作。此外，groupby 方法能够实现数据的分组聚合统计。

值得注意的是，在实际应用中，数据清洗是一个至关重要的步骤。我们需要处理缺失值、重复数据以及异常值等问题。综上所述，合理利用 pandas 库的功能，能够有效提升数据处理的效率。

本文将深入探讨 pandas 的核心功能，旨在帮助读者全面了解其在数据处理中的应用。
"""

    pipeline = DeAIPipeline(api_key="your-api-key-here")

    # 先检测原始文本
    print("\n[原始文本评分]")
    original_score = pipeline.detector.detect(ai_draft)
    print_score_detail(original_score)

    # 执行去 AI 味处理
    result = pipeline.process(ai_draft)

    print("\n[处理后文本评分]")
    print_score_detail(result["score"])
    print(f"\n[最终文本]\n{result['text']}")

五、效果数据

用同一篇 AI 初稿测试，改写前后对比：

指标	改写前	改写后	变化
综合评分	28.5	72.3	+154%
AI 偏好词数	8 个	1 个	-87.5%
句长标准差	6.2	18.7	+202%
口语化标记数	0	6	-
结构指纹扣分	-35	-5	-

实际运营数据（公众号 30 篇文章 A/B 测试）：

指标	未改写组	改写组
平均阅读量	342	518
7 日留存阅读	89	156
搜索流量占比	23%	41%
AIGC 标签触发率	67%	8%

六、踩坑记录

#	踩坑	解决方案
1	LLM 改写后技术细节出错	在 prompt 中强调"保持技术准确性不变"，改写后做关键术语检查
2	过度口语化导致文章不专业	口语化程度控制在评分 40-70 区间，不是越高越好
3	检测器误判（人类风格被判为 AI）	提高突发性和口语化权重，降低困惑度权重
4	每次改写结果不稳定	固定 temperature=0.8，种子策略保证基础一致性
5	API 成本过高	规则引擎先做一轮免费清洗，只有不达标才调 LLM，成本降低 60%
6	批量处理时代码耗时	加入异步并发处理，10 篇文章从 12 分钟降到 3 分钟

七、总结与扩展

这篇文章的核心结论：

AI 检测器看的是统计特征，不是"理解"内容。6 个维度是检测的核心
规则引擎能解决 40% 的问题（词替换、句长打散），成本低、速度快
LLM 深度改写解决剩下的 60%（口语化、结构破坏、场景注入），但需要质量检测兜底
最佳策略是"规则 + LLM + 检测"三阶段流水线，不是单靠任何一个

可优化的方向：

引入更专业的困惑度计算（基于 KenLM 语言模型）
加入敏感词/合规检测模块（适配不同平台的审核规则）
支持批量文件处理（读取目录下所有 .md 文件自动改写）
接入各平台的 AIGC 检测 API 做真实评分校准

项目文件结构：

de_ai_pipeline/
├── rule_engine.py      # 规则引擎
├── llm_rewriter.py     # LLM 改写器
├── detector.py         # 6 维度检测器
├── pipeline.py         # 编排器
├── prompts/
│   └── dehumanize.txt  # 改写 prompt 模板
├── config.json         # API 配置
└── requirements.txt    # 依赖

你在用 AI 写作时遇到过哪些检测/限流问题？欢迎在评论区交流，我可以针对性地出解决方案。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

**L_mask**（掩码损失）是什么

L_mask 就是告诉模型：“你预测的这个掩码，和正确答案（真实掩码）差了多少？数值越小，说明预测得越准；数值越大，说明错得越离谱。

AtomGit开源社区

【多变量输入超前多步预测】基于TCN-GRU-Attention的光伏功率预测研究附Matlab代码

随着清洁能源的快速发展，光伏发电在能源结构中的占比日益增加。然而，光伏功率受光照强度、温度、云层等多种因素影响，具有很强的随机性和波动性。准确的光伏功率预测对于电力系统的稳定运行、电网调度以及能源管理至关重要。基于深度学习的方法在处理复杂的非线性时间序列预测问题上展现出了巨大潜力。本文将探讨基于 TCN - GRU - Attention 模型的光伏功率预测研究，旨在综合利用各模型优势，实现多变量