决策树算法(决策树的损益值是什么)

编程之家2024-05-1077次浏览

决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。

本质上决策树是通过一系列规则对数据进行分类的过程。

决策树方法最早产生于上世纪60年代，到70年代末。由JRossQuinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。

C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题。

决策树算法是一种分类算法，根据样本特征的不同属性值对样本进行逐层分割，最终形成一棵树状结构，树的不同节点代表不同特征的不同属性值，叶子节点代表不同的分类结果。

决策树算法通过熵和信息增益的计算来选择最优的特征属性，将样本逐层进行分割，从而使得分类结果最为准确。

在分类过程中，将新样本从根节点开始，按照不同特征属性值进行逐层判断，并最终分类。

（1）绘制决策树图。从左到右的顺序画决策树，此过程本身就是对决策问题的再分析过程。（2）按从右到左的顺序计算各方案的期望值，并将结果写在相应方案节点上方。期望值的计算是从右到左沿着决策树的反方向进行计算的。（3）对比各方案的期望值的大小，进行剪枝优选。在舍去备选方案枝上，用“=”记号隔断。

针对每一方案的各种收益，将其所对应的发生概率值与各个收益值相乘，再把这乘了之后的结果相加。决策树法就是把各个方案如此计算后的结果相比，看哪一个收益最大，就选择该方案。