数据预处理 1.5 租房数据分析实例

本博客通过加载和查看LJdata.csv数据集,进行了详细的租房数据分析,包括房屋租金的统计信息、看房人数最多的区域、房屋朝向、户型分布、热门小区等关键指标的探索,旨在揭示租房市场的各种趋势。

目录

租房数据分析实例

1 数据加载和查看

1.1 加载LJdata.csv数据集

1.2查看house_data数据的列标签

1.3重新设置house_data的行标签

1.4查看house_data数据的行列数量

1.5查看数据集的基本信息:每个字段值的数量、是否非空值,以及该字段的数据类型

1.6查看数据集中,所有数值型字段的基本统计信息

1.7查看数据集中,所有非数值型字段的基本统计信息

1.8将DataFrame行列切换

2租房数据简单分析

2.1 查看房屋租金的最高价格、最低价格、平均数、中位数

2.2查找住进最低的房子的全部信息

2.2找到租金最高的房子的全部信息

2.3统计看房人数最多的前20的区域

2.4查看看法人数最多的房屋朝向

2.5查看出租房屋的户型分布情况

2.6查看热门小区(top5)

2.7查看出租房源最多的小区

2.8查看望京租房价格在2000以上的房屋信息

2.9查看租房价格在2000一下的房屋信息,并且按照价格从低到高排序


租房数据分析实例

import pandas as pd

1 数据加载和查看

1.1 加载LJdata.csv数据集

house_data=pd.read_csv('./data/LJdata.csv')
house_data.head()

1.2查看house_data数据的列标签

house_data.columns

1.3重新设置house_data的行标签

house_data.columns=['district', 'address', 'title', 'house_type', 'area', 
                      'price', 'floor', 'build_time', 'direction', 'update_time', 
                      'view_num', 'extra_info', 'link']
house_data.head()

1.4查看house_data数据的行列数量

house_data.shape

1.5查看数据集的基本信息:每个字段值的数量、是否非空值,以及该字段的数据类型

house_data.info()

1.6查看数据集中,所有数值型字段的基本统计信息

house_data.describe()

1.7查看数据集中,所有非数值型字段的基本统计信息

import numpy as np
house_data.describe(include=np.object_)

1.8将DataFrame行列切换

house_data.describe(include=np.object_).T
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值