pandas中groupby分组后数据调用

最新推荐文章于 2025-02-12 07:30:00 发布

原创

最新推荐文章于 2025-02-12 07:30:00 发布 · 2k 阅读

标签

#数据挖掘 #python

收录于

本文介绍了如何在pandas中利用groupby函数对苹果产地数据进行分组，并通过get_group获取特定产地的数据，使用ngroup添加组别信息，以及利用describe展示各组的统计描述特征。

已知我国苹果主要产地为山东烟台、陕西洛川、新疆阿克苏、甘肃天水、山西临猗。现在假设某岗平台上苹果店铺为356家，平均销量为x吨。构建数据集如下：

shop_id = np.arange(356)
product_ = np.random.choice(["山东烟台", "陕西洛川", "新疆阿克苏", "甘肃天水", "山西临猗"], 356)
quantity = np.random.choice(np.arange(1, 10), 356)
苹果 = pd.DataFrame({"店铺id": shop_id, "产地": product_, "销量": quantity})
苹果.head()