1.前言
在之前的一篇文章中,我们利用爬虫技术从携程网上获取了大量的景点数据,包括景点名称、地点、评分、评论数、标签等信息。这些数据为我们后续的分析提供了基础。旅游已经成为人们生活中不可或缺的一部分。作为中国最大的在线旅游服务提供商之一,携程网汇集了大量的旅游信息,包括各地景点的介绍、评价等。本文通过对携程景点数据的爬取和可视化,旨在发现中国旅游热门目的地。

2.0数据清洗与可视化
2.1 pandas 读取csv数据
df = pd.read_csv('csv/全国各景点全.csv')
2.2 景点分布散点图
2.2.1 数据处理
# 删除经纬度为空的行data = df.dropna(subset=['坐标'])# 将坐标解析为经纬度data['纬度'] = data['坐标'].apply(lambda x: x.split(',')[0][1:])data['经度'] = data['坐标'].apply(lambda x: x.split(',')[1][:-1])# 选择5A景点的数据data_5a = data[data['是否5A'] == '5A']# 转换为数值类型data_5a['纬度'] = pd.to_numeric(data_5a['纬度'])data_5a['经度'] = pd.to_numeric(data_5a['经度'])
2.2.2 图形绘制
# 绘制散点地图fig = px.scatter_mapbox(data_5a,lat="纬度",


3423

被折叠的 条评论
为什么被折叠?



