179种分类器大评测

最新推荐文章于 2026-04-24 10:53:27 发布

原创

最新推荐文章于 2026-04-24 10:53:27 发布 · 2.9k 阅读

标签

#机器学习 #分类 #算法对比

收录于

一项2014年的研究评测了179种分类器，涵盖17个家族，其中随机森林在多数数据集上表现出色，排名第一，紧随其后的是高斯核支持向量机。尽管随机森林表现优秀，但深度学习在大型数据集上的优势未在评测范围内体现。评测基于UCI数据库，包含121个数据集。

179种分类器大评测

~~300包薯片，我们吃完了！~~
179种分类器，我们测完了！

资料来源

2014年名为

Do we Need Hundreds of Classifiers to Solve Real World Classification Problems?

的文章中（截止目前，被引 823 次），研究人员对 17 个家族，179 个分类器，在 121 个数据集上的表现进行了评测！

上结果

分类器排名

第一是随机森林（Random Forest, RF）！

使用 R 语言中 Caret 库实现，which achieves 94.1% of the maximum accuracy overcoming 90% in the 84.3% of the data sets. <- 这句话我咋没理顺…

突然觉得实验室弥漫的随机森林风似乎很清新…

虽然数据上是第一，但与第二并未表现出效果上的显著性差异（意思就是，第二和第一差不多）

第二是高斯核-支持向量机（SVM with Gaussian Kernel）

使用 C 语言中 LibSVM 库实现，which achieves 92.3% of the maximum accuracy.

当然还有一些模型也不错，显著优于其他的分类器，包括：

SVM with polynomial kernels
extreme learning machine with Gaussian kernel
C5.0
avNNet (a committee of multi-layer perceptrons implemented in R with the caret package)

家族排名

第一名，随机森林家族，前5里有3个该家族的

第二名：SVM家族，前10里有4个

第三名：神经网络家族，前20里有5个

第四名：Boosting家族，前20里有3个

图中，使用

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lxsbit

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

分类器

sanmi8276的博客

02-13

3915

原文作者：fuqiuai 原文地址：数据挖掘领域十大经典算法之—SVM算法（超详细附代码）目录简介相关概念线性分类器起源感知器模型和逻辑回归支持向量机 VS 感知器和逻辑回归引入黑科技-核函数简介 SVM(Support Vector Machine)中文名为支持向量机，是常见的一种判别方法。在机器学习领域，是一个有监督的学习模型，通常用来进行模式识别、分类以及回归分析。相关概念 分类器：分类器就是给定一个样本的数据，判定这个样本属于哪个类别的算法。例如在..

机器学习常用的分类器比较

最新发布

weixin_42601134的博客

04-24

196

机器学习中的分类算法选择是实际项目中的关键决策点。从原理上看，随机森林通过集成多棵决策树实现抗过拟合，而支持向量机（SVM）则依靠核技巧处理非线性分类问题。这两种算法在工程实践中展现出独特价值：随机森林擅长处理混合特征和高维数据，高斯核SVM则在复杂决策边界场景表现优异。研究数据显示，在121个标准数据集测试中，随机森林在84.3%的情况下达到最优性能，与Kaggle竞赛经验高度吻合。对于金融风控、医疗诊断等典型应用场景，合理选择并调优这些算法能显著提升模型效果。本文基于大规模实测数据，深入分析算法特性，并

【Python】利用决策树分类器对鸢尾花进行分类

weixin_43358075的博客

12-18

1万+

1. 决策树（监督学习) 决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。 1.1 特征选择特征选择最终会影响决策树的分类效率。通常在进行特征选择时，会考虑额两个指标:信息增益和信息增益比。 1.2 生成算法 ID3(信息增益) C4.5(信息增益率) CART Classification and Regression Tre...

OpenBMI工具箱深度评测：在运动想象任务中，跨被试分类到底有多难？

weixin_30342209的博客

03-27

393

本文深入评测了OpenBMI工具箱在运动想象任务中的跨被试分类挑战，揭示了不同被试间EEG信号的显著差异及其对模型泛化能力的影响。通过对比多种验证方法和前沿技术（如迁移学习、深度学习架构和元学习策略），探讨了提升跨被试分类准确率的有效途径，为认知科学和脑机接口研究提供了实用见解。

matlab svm 提取目标_CV: HOG+SVM 人脸监测实现与模型评估

weixin_36059241的博客

12-31

508

0.数据集准备第一步，准备数据。原始数据采用FDDB人脸检测测评数据集，FDDB是全世界最具权威的人脸检测评测平台之一，包含2845张图片，共有5171个人脸作为测试集。测试集范围包括：不同姿势、不同分辨率、旋转和遮挡等图片，同时包括灰度图和彩色图，标准的人脸标注区域为椭圆形。当然，为了简单起见，我们不直接使用这个数据集。我的做法是，自己做一些正样本和负样本数据集。正样本，即人脸，从FDDB数据集...

常见分类器优缺点对比

钱艇(C/C++)

05-29

5202

随机森林是一种基于决策树的集成分类器，它通过随机选择特征和样本来构建多个决策树，并将多个决策树的结果进行投票来确定最终的分类结果。总的来说，分类器在数据分析中有着广泛的应用，可以帮助我们处理各种类型的数据，并从中提取有用的信息。在实际应用中，需要根据数据集的特点和分类任务的要求选择合适的分类器，并进行参数调整和模型优化来提高分类性能。K近邻是一种基于距离度量的分类器，它通过计算新样本与训练集中每个样本的距离来确定最近的K个邻居，并根据邻居的类别进行分类。K近邻的分类结果取决于邻居的数量和距离度量方式。

【机器学习】分类器

lly_csdn123的博客

12-05

3466

在机器学习(Machine Learning，ML)中，分类器泛指算法或模型，用于将输入数据分为不同的类别或标签。分类器是监督学习的一部分，它依据已知的数据集中的特征和标签进行训练，并根据这些学习到的知识对新的未标记数据进行分类。分类器的目标是从输入数据中提取有用的特征，并根据这些特征对数据进行分类。这些特征可以是数值型、类别型或其他类型的数据。分类器可以根据数据的属性和学习算法的选择，采用不同的方法进行分类。本文介绍4种常见的分类器：SVM、KNN、RF、NB。

机器学习学习笔记（三）之分类器

qq_46006468的博客

07-19

1万+

分类器：输入数据，识别是什么类，可以拓展为更广泛的用途。将特征数据化，作为判断的依据。和regression有相似的地方，但也有很大区别，把最好不把classification当作regression做对于有多个分组的如class 1，2，3，直接用1，2.，3代表分组会产生不存在的其他关系，如3和2比3和1要接近，这不是我们想要看到的结果，可以用矩阵向量来表示，后文。 分类器的模型：因为loss函数不可微分，那么gradi...

分类器的主要类型（Types of Classifiers）

weixin_52594387的博客

01-15

2570

不同分类器适合不同类型的数据和问题，应根据任务特点和数据分布选择合适的分类器。

贝叶斯分类器详解

tt丫的博客

09-02

4262

目录一、数学基础 1、贝叶斯决策论（1）先验概率和后验概率（2）贝叶斯定理 2、极大似然估计（1）基本思路（2）公式推导（3）常见假设——正态分布二、朴素贝叶斯分类器 1、符号设定 2、后验概率的计算 3、极大似然法求最合适的分布参数 4、常见假设——正态分布 5、拉普拉斯平滑三、代码示例一、数学基础 1、贝叶斯决策论（1）先验概率和后验概率先验概率：根据以往经验和分析得到的概率；后验概率：事情已经发生，要求这件事情发生的原因是由某个因素引起的可能性

几种不同的分类器

leek1727

05-29

5236

1、SVM对噪声（如来自其他分布的噪声样本）鲁棒 SVM本身对噪声具有一定的鲁棒性，但是实验证明，是当噪声率低于一定水平的噪声对SVM没有太大的影响，但是随着噪声率的不断增加，分类器的识别率会降低 2、在AdaBoost算法中所有被分错的样本的权重更新比例相同 AdaBoost算法中不同的训练集是通过每个样本对应的权重来实现的。开始时，每个样本对应的权重是相同的，即其中N为样本个数，在此样本

Sklearn常用分类器总结

qq_35224503的博客

08-19

4703

常用的分类器: SVM、KNN、贝叶斯、线性回归、逻辑回归、决策树、随机森林、xgboost、GBDT、boosting、神经网络NN。 ### KNN Classifier from sklearn.neighbors import KNeighborsClassifier clf = KNeighborsClassifier() clf.fit(train_x, train_...

分类器的种类

Searching_Bird的专栏

05-26

6509

分类器总体来说可以分成如下两类 分类器 统计分类器 回归分类器朴素贝叶斯贝叶斯网络结构化分类器 基于规则的分类器基于距离的分类器神经网络

各种分类器

m0_70413569的博客

11-10

286

分类器的比较

几种分类器小结

dreamzuora的博客

03-07

1万+

朴素贝叶斯分类器是假设数据样本特征完全独立，以贝叶斯定理为基础的简单概率分类器。 AdaBoost算法的自适应在于前一个分类器产生的错误分类样本会被用来训练下一个分类器，从而提升分类准确率，但是AdaBoost算法对于噪声样本和异常样本比较敏感。支持向量机是用过构建一个或者多个高维的超平面来将样本数据进行划分，超平面即为样本之间的分类边界。基于k近邻的K个样本作为分析从而简化计算提升效率...