随机森林,80个样本能做随机森林吗
一、随机森林通俗易懂解释
随机森林:指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由LeoBreiman和AdeleCutler提出,并被注册成了商标。定义在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。LeoBreiman和AdeleCutler发展出推论出随机森林的算法。而"RandomForests"是他们的商标。
二、为什么叫随机森林
1.叫随机森林是因为它是由多个决策树组成的,每个决策树都是基于随机选取的数据集和特征集构建的。2.随机森林的随机性体现在两个方面,一是在数据集的随机选取上,每个决策树的数据集都是从原始数据集中随机抽取的;二是在特征集的随机选取上,每个决策树的特征集也是从原始特征集中随机选取的。3.随机森林的这种随机性可以有效地避免过拟合,提高模型的泛化能力,因此被广泛应用于分类、回归等机器学习领域。
三、xgboost与随机森林的区别
二者模型构成不同。
xgboost是串联集成学习模型,通过多种学习器串联成一个强学习器,主要学习方式是迭代损失函数,让误差趋于最小。
随机森林是并联集成学习模型,主要是通过多种学习器随机抽取数据训练模型,然后通过少数服从多数的决策规则来出结果。