深入探索 Pandas 数据框:创建、操作与索引管理
1. 数据框基础
数据框(DataFrame)是 Pandas 中非常重要的数据结构,与系列(Series)不同,它有两个索引数组。第一个索引数组与行相关,功能类似于系列中的索引数组,每个标签与一行中的所有值相关联;第二个数组包含一系列标签,每个标签与特定的列相关联。可以将数据框理解为一个由系列组成的字典,其中键是列名,值是构成数据框列的系列,并且每个系列中的所有元素都根据一个称为索引的标签数组进行映射。
创建数据框最常见的方法是将一个字典对象传递给 DataFrame() 构造函数,字典中的每个键对应一个要定义的列,每个键的值是一个数组。示例代码如下:
import pandas as pd
data = {'color': ['blue', 'green', 'yellow', 'red', 'white'],
'object': ['ball', 'pen', 'pencil', 'paper', 'mug'],
'price': [1.2, 1.0, 0.6, 0.9, 1.7]}
frame = pd.DataFrame(data)
print(frame)
输出结果:
color object price
0 blue ball 1.2
1 green pen 1.0
2 yellow pencil 0.6
3 red paper 0.9
4 white
超级会员免费看
订阅专栏 解锁全文

5621

被折叠的 条评论
为什么被折叠?



