ELI5：让机器学习模型说出判断理由

nebulacode

160人浏览 · 2026-06-12 08:48:03

nebulacode · 2026-06-12 08:48:03 发布

文章目录

ELI5：让机器学习模型说出判断理由

ELI5：让机器学习模型说出判断理由

eli5 在 GitHub 上有 328 Star。

这是一个 Python 库，核心就干一件事，解释机器学习分类器的预测结果，把模型内部的判断逻辑摊开来给你看。

正文顶部截图

1、这库能解决什么问题

模型训练完，测试集准确率上去了，但很多时候你并不清楚它内部在做什么。哪个特征的权重最高？为什么这条样本被分到了 A 类而不是 B 类？文本分类里具体是哪些词推动了预测往某个方向走？

ELI5 就是来解决这类问题的。它可以展示模型权重、解释单条预测结果、高亮文本数据中的关键特征，还能把决策树绘制成 SVG 图形。如果你用的是 scikit-learn 的 Pipeline，它也能逐层拆解，帮你定位问题出在哪一环。

README区域截图

2、支持的机器学习框架

覆盖面相当广。scikit-learn 的线性分类器和回归器、决策树、树类集成模型都能解释权重和预测，Pipeline 和 FeatureUnion 也兼容，还能还原 HashingVectorizer 的哈希过程。Keras 的图像分类器可以通过 Grad-CAM 做可视化解释，直接看到模型关注的是图像的哪些区域。xgboost、LightGBM、CatBoost 的特征重要性和单条预测解释都内置了。此外还有 lightning 的分类器和回归器、sklearn-crfsuite 的 CRF 模型，以及 OpenAI Python 客户端的 LLM 预测解释。