pandas dataframe 选择包含np.nan的列，结果小结

最新推荐文章于 2024-02-28 18:26:36 发布

原创最新推荐文章于 2024-02-28 18:26:36 发布 · 2.2k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #numpy

收录于

探讨了在使用Pandas库进行数据处理时，不同列名选择方式对数据筛选结果的影响。通过对比单列和多列选择的差异，揭示了布尔型Series与DataFrame在实际应用中的行为区别。

dataframe 两种选择列名的不同，导致结果完全不同。
第1种正常的选择列，输出的是布尔型series，可以在dataframe中直接使用；
第2种，[ ]中加 [ ] 可以选择多列，其返回值是布尔型的dataFrame，直接用于筛选出现意外。

构造一个含有np.nan的dataframe,

df4=pd.DataFrame(data=np.arange(0,20).reshape(5,4),columns=['c1','c2','c3','c4'],index=range(0,5))
df4.loc[2,'c2']=np.nan
df4

# 第1种
df4['c2'].isnull()
df4[df4['c2'].isnull()]

对应输出为

0    False
1    False
2     True
3    False
4    False
Name: c2, dtype: bool

   c1	c2	c3	c4
2	8	NaN	10	11

# 第2种
df4[['c2']].isnull()

对应输出为

	c2
0	False
1	False
2	True
3	False
4	False
Name: c2, dtype: bool

    c1	c2	c3	c4
0	NaN	NaN	NaN	NaN
1	NaN	NaN	NaN	NaN
2	NaN	NaN	NaN	NaN
3	NaN	NaN	NaN	NaN
4	NaN	NaN	NaN	NaN

为什么第2种出现这种情况，还没考虑清楚。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yingfly

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python：Pandas学习笔记（一）Series和DataFrame、相关性及NaN处理

Jodness' Blogs

06-27

7998

目录 pandas核心数据结构 Series DataFrame Index对象算数和数据对齐 numpy函数应用与自定义函数 Series和DataFrame的排序和排位相关性和协方差 NaN的数据处理 pandas核心数据结构 pandas是以numpy为基础的，还提供了一些额外的方法 Series series用来表示一维数据结构，与python内部的数组类似，...

参与评论您还未登录，请先登录后发表或查看评论

DataFrame的比较和缺失值比较

缘源园

02-17

1004

# Pandas使用NumPy NaN（np.nan）对象表示缺失值。这是一个不等于自身的特殊对象 np.nan == np.nan #False # Python的None对象是等于自身的 None == None #True # 所有和np.nan的比较都返回False，除了不等于： 9 > np.nan #False 5 != np.nan #True # college_ugds_所有值和.0019比较，返回布尔值DataFrame college = pd.read_csv.

Pandas|DataFrame| DataFrame中的nan值处理

craftsman2020的博客

08-31

6859

DataFrame.dropna()方法的作用：是删除含用空值或缺失值得行或列。语法为：dropna（axis=0，how=‘any’，thresh=None，subset=None，inplace=False）axis:确定过滤的行或列，取值可以为(1) 0或index：删除包含缺失值的行，默认为0。(2) 1或columns：删除包含缺失值的列。how:确定过滤的标准，取值可以为：(1)any:默认值，如果存在NaN值，就删除该行或该列。//有一个就删除行或列。

4.8 Pandas中的Dataframe 缺失值NaN数据处理（Python）

蚊者逆袭的博客

02-10

4798

数据的缺失导致NaN的出现，直接插入DB中会报错，所以要特殊处理一下。

pandas.DataFrame删除某列空值所在的行

枫小秋的博客

06-01

5万+

通过isnull我们发现某列有几个空值，要把该列空值所在行删除怎么操作？用dropna()会删除所有有空值的行，请看下面实例。该函数主要用于滤除缺失数据。如果是Series,则返回一个仅含非空数据和索引值的Series，默认丢弃含有缺失值的行。 xx.dropna() 对于DataFrame: data.dropna(how = 'all') # 传入这个参数后将只丢弃全为缺失值的那些行 data.dropna(axis = 1) # 丢弃有缺失值的列（一般不会这么做，这样会删...

python填充nan_Python Pandas Dataframe填充NaN值

weixin_39955925的博客

12-06

2105

三千列并不多。你有几排？您总是可以随机生成一个相同大小的数据帧并进行逻辑替换(数据帧的大小将决定这是否可行)。在如果您知道数据帧的大小：import pandas as pdimport numpy as np# create random dummy dataframedfrand = pd.DataFrame(data=np.random.randn(rows,cols))# import "...

python pandas 如何找到NaN、缺失值或者某些元素的索引名称以及位置，np.where的使用

云中寻雾的博客

01-08

1万+

我们在处理数据的时候，经常需要检查数据的质量，也需要知道出问题的数据在哪个位置。我找了很久，也尝试了很多办法，都没能找到一种非常直接的函数，本文所要介绍的是一种我认为比较方便的方法：np.where（）我举个例子 import pandas as pd import numpy as np df = pd.DataFrame(np.arange(12).reshape(4,3), ind...

pandas 如何找到NaN、缺失值或者某些元素的索引名称以及位置，np.where的使用

domodo2012的博客

12-05

4210

pandas怎么去除nan_如何删除某些列中的值为NaN的Pandas DataFrame行

weixin_39901685的博客

12-19

136

I have a DataFrame:>>> dfSTK_ID EPS cashSTK_ID RPT_Date601166 20111231 601166 NaN NaN600036 20111231 600036 NaN 12600016 20111231 600016 4.3 NaN601009 20111231 601009 NaN N...

pandas怎么去除nan,如何删除某些列中的值为NaN的Pandas DataFrame行

weixin_35036735的博客

12-19

522

I have a DataFrame:>>> dfSTK_ID EPS cashSTK_ID RPT_Date601166 20111231 601166 NaN NaN600036 20111231 600036 NaN 12600016 20111231 600016 4.3 NaN601009 20111231 601009 NaN N...

pandas中的None与NaN （一）

weixin_44463903的博客

02-16

1万+

pandas中的None与NaN pandas中None与np.nan都视作np.nan 1.创建DataFrame import pandas as pd from pandas import Series,DataFrame import numpy as np df = DataFrame([[10,20,57,np.nan,None], [22,33,56,12,None], [np.na...

pandas 判断是否等于nan_如何检查Pandas DataFrame中的任何值是否为NaN

weixin_39900437的博客

12-19

1014

你有几个选择 .import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(10,6))# Make a few areas have NaN valuesdf.iloc[1:3,1] = np.nandf.iloc[5,3] = np.nandf.iloc[7:9,5] = np.nan现在数据框看起来像这样：0 ...

python判断某列有值_检查pandas中的dataframe列中是否包含某些值

weixin_39993454的博客

12-09

1万+

我认为您需要^{}，如果您需要date列的值包含字符串07311954的行：print df[df['date'].astype(str).str.contains('07311954')]或者如果date列的type是string：print df[df['date'].str.contains('07311954')]如果要检查string1954列中date的最后4位：print df[df...

拯救pandas计划（12）——转换包含np.nan的float64类型列为int64类型

pdcfighting的博客

06-02

2576

拯救pandas计划（12）——转换包含np.nan的float64类型列为int64类型最近发现周围的很多小伙伴们都不太乐意使用pandas，转而投向其他的数据操作库，身为一个数据工作者，基本上是张口pandas，闭口pandas了，故而写下此系列以让更多的小伙伴们爱上pandas。系列文章说明：系列名（系列文章序号）——此次系列文章具体解决的需求平台：windows ...

Pandas中的缺失值分析：None 与 NaN 的区别

hzdt_1的博客

02-28

1875

pandas中对数据进行数学运算时，会自动跳过 NaN 值，以避免对计算结果产生影响。np.nan是浮点类型，能参与到计算中。但计算的结果总是NaN。但可以使用np.nan*()函数来计算nan，此时视nan为0。一般填充方式: 可以选择平均数, 众数, 中位数,拉格朗日插值法/机器学习算法根据规律预测的值去填.通用原则: 合理, 尽量合理, 尽量贴近真实情况.None是Python自带的，其类型为。因此，None不能参与到任何计算中。甚至可以用相邻的数据去填充.

pandas 判断是否等于nan_python 值比较判断，np.nan is np.nan 却 np.nan != np.nan ,pandas 单个数据框值判断nan...

weixin_29061821的博客

01-12

1953

pandas中DataFrame，Series 都有 isnull()方法，而数据框却没有，用了就会报错：AttributeError: ‘float‘ object has no attribute ‘isnull‘怎么判断单个框是否为 np.nanPython常规的判断，==，和is，这对None是有效的None is NoneOut[49]: TrueNone == NoneOut[50]...

pandas中NaN与数据相加np.nansum()

漫步量化

10-17

1万+

问题背景 DataFrame中有两列，每列中包含数据元素、NaN元素，如何将两列相加，使结果等于数据。方案一：直接相加直接相加得到NaN，不是数据。不能实现需求。方案二：concat pandas.concat函数是将数据拼接。不能实现需求。方案三：np.nansum() 专门处理NaN数据，实现需求。先将数据转为numpy.array: 再对numpy进行处理，n...

pandas中对nan空值的判断和陷阱