Python金融数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

4.1.3 分类算法的选择

分类算法作为非常实用且有效的数据化运营支持方法,在实际应用中比较广泛。根据不同场景选择合适的分类算法,往往可以达到事半功倍的效果。

·文本的分类,选择朴素贝叶斯算法,例如电子邮件中垃圾邮件的识别。

·训练集较小,选择高偏差、低方差的分类算法,比如朴素贝叶斯、支持向量机(不容易过拟合)。

·如果要求算法模型具有高可解释性,选择决策树。

·如果重视算法的准确率,选择支持向量机或GBDT、XGBoost等基于Boosting的集成算法。

·如果注重结果的稳定性或模型的稳定性,选择随机森林、组合投票模型等基于Bagging的集成算法。