理解和比较GBDT、XGBoost和LightGBM-计算机考试-空麓网

学习目标

Adaboost

Adaboost 例子

CART回归树

首先，GBDT使用的决策树是CART回归树，无论是处理回归问题还是二分类以及多分类，GBDT使用的决策树都是都是CART回归树。
为什么不用CART分类树呢？因为GBDT每次迭代要拟合的是梯度值，是连续值所以要用回归树。
树算法最重要是寻找最佳的划分点，分类树用纯度来判断最佳划分点使用信息增益（ID3算法），信息增益比（C4.5算法），基尼系数（CART分类树）。但是在回归树中的样本标签是连续数值，可划分点包含了所有特征的所有可取的值。所以再使用熵之类的指标不再合适，取而代之的是平方误差，它能很好的评判拟合程度。

CART回归树算法1

CART回归树算法2

提升树-回归问题例子

GBDT（梯度提升树）

GBDT 例子

c=(1.1+1.3+1.7+1.8)/4=1.475

GBDT总结

GBDT是基于Boosting的思想，串行地构造多棵决策树来进行数据的预测，对损失函数做梯度下降，每轮迭代都去拟合损失函数在当前模型下的负梯度，把待求的决策树模型当作参数，从而使得参数朝着最小化损失函数的方向更新。
相比AdaBoost, Gradient Boosting可以使用更多类型的损失函数，因此可以解决更多的问题。
最常见的损失函数是平方损失函数，square loss的优点是便于理解和实现，它的负梯度就是残

XGBoost

XGBoost是对GBDT进一步改进
传统GBDT在优化时只用到一阶导数信息，XGBoost则对损失函数进行了二阶泰勒展开，同时用到了一阶和二阶导数。
-XGBoost在损失函数里加入了正则项，用于控制模型的复杂度。正则项里包含了树的叶子节点个数、每个叶子节点上输出的score的L2模的平方和。从Bias-variance tradeoff角度来讲，正则项降低了模型的variance，使学习出来的模型更加简单，防止过拟合，这也是XGBoost优于传统GBDT的一个特性。

XGBoost的近似算法

XGBoost的特点

Shrinkage（缩减），XGBoost在进行完一次迭代后，会将叶子节点的权重乘上该学习率，削弱每棵树的影响，让后面有更大的学习空间。GBDT的实现也有学习速率
列抽样（column subsampling）。XGBoost借鉴了随机森林的做法，支持列抽样，不仅能降低过拟合，还能减少计算，这也是XGBoost异于传统GBDT的一个特性。
稀疏值处理，sparsity-aware split finding。对缺失值自动学习出它的分裂方向（左子树或右子树）。

XGBoost的系统设计

LightGBM

LightGBM的直方图算法

LightGBM的leaf-wise分裂

对于树的分裂方法，它通过leaf-wise分裂产生比level-wise分裂更复杂的树，能够实现更高的准确率
Level-wise同时分裂同一层的叶子，容易进行多线程优化，也好控制模型复杂度，不容易过拟合。但实际上Level-wise是一种低效的算法，因为它不加区分的对待同一层的叶子，带来了很多没必要的开销，因为实际上很多叶子的分裂增益较低，没必要进行搜索和分裂

LightGBM的GOSS采样算法

LightGBM的EFB算法

EFB算法全称是Exclusive Feature Bundling，即互斥特征绑定算法。可有效减少用于构建直方图的特征数量，从而降低计算复杂度，尤其是特征中包含大量稀疏特征的时候。
在许多应用场景下，数据集中会有大量的稀疏特征，这些稀疏特征大部分样本都取值为0，只有少数样本取值非0。通常可以认为这些稀疏特征是互斥的，即它们几乎不会同时取非零值。利用这种特性，可以通过对某些特征的取值重新编码，将多个这样互斥的特征捆绑成为一个新的特征。
对于指定为类别特征的特征，LightGBM可以直接将每个类别取值和一个bin关联，从而自动地处理它们，而无需预处理成onehot编码多此一举。

LightGBM的3个算法优化

XGBoost模型训练的总体的复杂度可以粗略估计为：
训练复杂度 = 树的棵数✖️每棵树上叶子的数量✖️生成每片叶子的复杂度。
生成一片叶子的复杂度 = 特征数量✖️候选分裂点数量✖️样本的数量。
LightGBM的3个算法改进：
- Hitogram算法的主要作用是减少候选分裂点数量
- GOSS算法的作用是减少样本的数量
- EFB算法的作用是减少特征的数量
LightGBM特征并行

LightGBM特征并行

李航《统计学习方法》
陈天齐《Introduction to Boosted Trees》
GBDT算法原理以及实例理解
https://blog.csdn.net/zpalyq110/article/details/79527653
https://github.com/Freemanzxp/GBDT_Simple_Tutorial
XGBoost论文解读
https://jozeelin.github.io/2019/07/19/XGBoost/
GBDT算法原理与系统设计简介
http://wepon.me/files/gbdt.pdf
AdaBoost、GBDT、RF、XGboost、LightGBM的对比分析
https://zhuanlan.zhihu.com/p/56137208
贪心科技机器学习高阶班

理解和比较GBDT、XGBoost和LightGBM