二手汽车评估
数据集取自uci,对处理好的数据集分别进行逻辑回归、随机森林、knn、svm、GBDT分类建模,寻找较优的分类模型。
数据集特征描述:
| buying | 买入价格(vhigh,high,med,low) |
|---|---|
| maint | 维护的价格(vhigh,high,med,low) |
| doors | 门数(2,3,4,5更多) |
| persons | 可乘人数(2,4,更多) |
| lug_boot | 行李箱大小(small, med, big) |
| safety | 安全性( low, med, high) |
| assessment(目标变量) | 可接受性(unacc, acc, good, vgood) |
导入相关库:

从存储数据集的excel文件将数据集读入、输出数据集前五行。

数据集总共1728条观测、7个特征变量,没有缺失值、没有重复观测:

该博客探讨了二手汽车评估中不同分类模型的效果,包括逻辑回归、随机森林、KNN、SVM和GBDT。结果显示,GBDT和随机森林在分类效果上表现优秀,但考虑到时间成本,作者推荐使用随机森林。数据集包含1728条观测和7个特征,通过编码处理后进行建模。随机森林模型在测试集上的准确率达到了98.55%。






