【Python】超强图解 Pandas 18 招!

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

bb018aa06e9f1b5aaabebf012b9992c0.png5699be9cf1af1a6fb265c5cc7966c4c0.png4a3ea3aafe3559735d7a2734639c2fc5.pnga2ee665bbeeba44f749c7a3a4ffadd4e.png

selecting a column

dogs['longevity']
618c2dc09948698992a91edb715db170.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

509f104dd321cbc463a52f8d90a7bd38.png94706a861acfa99fd06c296a1a56fbdc.png

grouping multiple columns

dogs.groupby(['type', 'size'])
dd5737aaad37eda3433c5c3d5deeced6.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

46b27d166ec03785533d46ffaad02bdb.pngc780c8a572b351f26bd3e7741e4e6048.pngaeed09867173787a96f75b3bfd9f04ea.png2831809be44478be220006b87f3052c6.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]
a3208b57742c0199c62e291054a5f8c8.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']
fbde2b4aade6f4c81e3bf68db0e617d0.png

dropping columns

dogs.drop(columns=['type'])
180de6393bb31f457e71f72ed2ab4b20.png

joining

ppl.join(dogs)
3faf235768dd34dad0b8ac4ff77e630d.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')
273f457013ce8f9fffdb14340fcc2802.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')
b651f1909b150a73f8f383e4e5042efe.png

melting

dogs.melt()
b913c47e53e09561e53d8493251a89fd.png

pivoting

dogs.pivot(index='size', columns='kids')
e1ef03ba682436e78eabfd48e9df455e.png

stacking column index

dogs.stack()
6c627b6bb5a5f3b5fc67311882c5a0e2.png

unstacking row index

dogs.unstack()
efe1c189b899c028a8c6ce640e8ea894.png

resetting index

dogs.reset_index()
9fd477878417e983c064aed4c1ea41e8.png

setting index

dogs.set_index('breed')
5860589c04bcb2f79169623ecbee481e.png

来源:https://pandastutor.com/index.html

89190c101e4bf26e05de52a05abd1795.jpeg

往期精彩回顾




适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码

0a030749bd1a5f01acd5837255d55622.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值