Skip to main content

可解释机器学习 (XML)

可解释机器学习（Explainable Machine Learning, XML）是机器学习领域的一个重要分支，旨在使机器学习模型的决策过程透明化、可理解。

为什么需要可解释性？

在实际应用中，仅仅知道模型的预测结果是不够的，我们还需要理解：

模型为何做出这样的预测？ - 了解模型的决策依据
哪些特征最重要？ - 识别关键影响因素
如何信任模型的判断？ - 建立对模型的信任
如何满足监管要求？ - 在金融、医疗等领域的合规需求

特征重要性：最基础的可解释性工具

特征重要性是理解模型行为的第一步。让我们通过一个交互式演示来理解：

Loading feature importance visualization...

核心概念

1. 全局可解释性 vs 局部可解释性

全局可解释性：理解模型整体如何工作（如特征重要性排名）
局部可解释性：理解单个预测的决策过程（如SHAP值）

2. 模型无关方法 vs 模型特定方法

模型无关方法：适用于任何机器学习模型（如Permutation Importance、LIME）
模型特定方法：针对特定模型设计（如树模型的特征重要性、线性模型的系数）

常用技术概览

方法	类型	适用场景	优点	缺点
特征重要性	全局	快速了解模型	计算快速	无法处理特征相关
Permutation Importance	全局	模型无关	更可靠	计算成本较高
PDP (Partial Dependence)	全局	边际效应	直观	忽略特征交互
LIME	局部	单个解释	适用于任何模型	不稳定性
SHAP	局部+全局	理论保证	一致性	计算复杂

后续内容

在本节笔记中，我们将深入探讨：

SHAP值：基于博弈论的可解释性框架
LIME：局部 surrogate 模型
Partial Dependence Plot：部分依赖图
实际案例：在社会科学研究中的应用

学习建议

建议按以下顺序学习：

先理解特征重要性的概念和局限
学习PDP，理解边际效应
掌握SHAP，这是目前最强大的工具之一
在实际项目中应用这些方法

这里是我的笔记

为什么需要可解释性？
特征重要性：最基础的可解释性工具
核心概念
- 1. 全局可解释性 vs 局部可解释性
- 2. 模型无关方法 vs 模型特定方法
常用技术概览
后续内容