有两种算法可以构建决策树,如CART(分类和回归树)、ID3(迭代二分法3)等
Scikit学习默认使用哪种决策树算法?
当我看一些决策树python脚本时,它神奇地使用fit
和predict
函数生成结果。
科学学习会根据数据聪明地选择最佳决策树算法吗?
它不会自动这样做。
如果我们查看sklearn.tree.决策树分类器页面,我们可以看到默认条件是基尼杂质。
还有一种选择是使用熵来代替标准。
请注意,CART使用基尼杂质,ID3使用熵作为分裂标准。
他们实际上使用了CART,但分割标准是基尼和熵。您可以研究如何调整决策树?解释引擎盖下发生的事情。