import pandas as pd
import numpy as np
# read the file
df = pd.read_excel('2021MCMProblemC_DataSet.xlsx')
# select the right data
reports = df.loc[(df['Lab Status'] == 'Positive ID'), ['Detection Date', 'Latitude', 'Longitude']]
ndata = np.array(reports)
reportsList = ndata.tolist()
reportsList = sorted(reportsList, key=lambda s: s[0]) # 排序
引入pandas 和numpy两个包
用pd读excel
df是dataframe格式的文件
接着,我们从df中选取我们需要的数据
我们筛选的列是Lab Status列,选出所有PositiveID的数据的Detection Date’, ‘Latitude’, 'Longitude’信息

本文介绍如何利用Python中的Pandas库从Excel文件中读取并筛选特定的疫情报告数据,包括实验室状态为阳性确认的记录,并提取检测日期、纬度和经度等关键信息。

2万+

被折叠的 条评论
为什么被折叠?



