基于机器学习算法的HIV/AIDS检测分类模型性能评估
1. 资料与方法
1.1 数据来源
本研究使用的埃塞俄比亚人口与健康调查(EDHS)数据由2000年、2005年、2011年和2016年收集的四个不同数据集组成。该调查由中央统计局(CSA)在卫生部的支持下开展。数据包含78,877个实例,分为两类,分别有55,209个和23,668个实例。数据集中有26个属性用于定义案例,部分为数值型,部分为标称型,预期的性能类型为阴性或阳性。具体变量及其描述如下表所示:
| 编号 | 变量 | 值 | 最小值 | 平均值 | 最大值 | 标准差 | 描述 |
| — | — | — | — | — | — | — | — |
| 1 | 性别 | M, F | 1.000000 | 1.502419 | 2.000000 | 0.499998 | 性别 |
| 2 | 年龄 | 连续值 | 1.000000 | 3.259434 | 7.000000 | 1.913984 | 个体年龄 |
| 3 | 地区 | 1,2,3,4,5,6,7,8,9,10,11 | 1.000000 | 5.177661 | 15.000000 | 3.642534 | 个体居住地区 |
| 4 | 居住类型 | 1,2 | 1.000000 | 1.691981 | 2.000000 | 0.461678 | 个体居住场所 |
| 5 | 宗教 | 1–15 | 1.000000 | 2.373800 | 16.000000 | 1.497977 | 个体宗教信仰 |
| 6 | 教育水平 | 0,1,2,3,4 | 0.000000 | 0
超级会员免费看
订阅专栏 解锁全文

3276

被折叠的 条评论
为什么被折叠?



