DAY9 - 热力图与子图绘制

1.1 特征映射准备

对于包含字符串的分类特征,需要先转换为数值型才能进行后续的相关性分析。

data["Home Ownership"].value_counts()#查看

1.2 使用嵌套字典进行特征映射

mappings = {
    "Years in current job": {
        "10+ years": 10,
        "2 years": 2,
        "3 years": 3,
        "< 1 year": 0,
        "5 years": 5,
        "1 year": 1,
        "4 years": 4,
        "6 years": 6,
        "7 years": 7,
        "8 years": 8,
        "9 years": 9
    },
    "Home Ownership": {
        "Home Mortgage": 0,
        "Rent": 1,
        "Own Home": 2,
        "Have Mortgage": 3
    }
}
# 使用映射字典进行转换
data["Years in current job"] = data["Years in current job"].map(mappings["Years in current job"])
data["Home Ownership"] = data["Home Ownership"].map(mappings["Home Ownership"])
data.info()

1.3特征名中文映射

二、相关系数热力图

1.

相关系数的含义**:

- 取值范围: [-1, 1]

**注意事项**:

- 热力图适合展示连续变量之间的关系

- 对于离散变量,相关系数的意义需要谨慎解读

2.主要参数解释

- `annot=True`: 在每个单元格中显示数值

- `cmap`: 配色方案

- `vmin, vmax`: 设置颜色条的最小值和最大值

- `fmt='.2f'`: 数值格式,保留2位小数

- `linewidths`: 单元格之间的线宽

- `center`: 设置颜色的中心值(通常设为0)

- `square=True`: 设置单元格为正方形

- `cbar_kws`: 颜色条的参数设置

三、子图

四、enumerate()函数介绍:同时获得索引和值

五、绘制连续的箱线图

@浙大疏锦行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值