一、使用replace+空格
ordersdetaildf['商品名称2']=ordersdetaildf['商品名称'].apply(lambda x:x.replace(" ",""))
上述代码表示:在Dataframe当中创建新的一列,名字叫做商品名称2,是对商品名称列当中的空格进行去除之后的新的数据。

对制表符和换行符等等也可以进行同样的操作:
ordersdetaildf['商品名称2']=ordersdetaildf['商品名称2'].apply(lambda x:x.replace("\n","").replace("\\t\\r",""))
二、使用replace+unicode编码
但是在某些情况下,我发现仅仅使用replace是无法去除空格的:
ordetgb=ordersdetaildf.groupby('订单编号',as_index=False)["商品名称"].apply(lambda x:'|'.join(x.values)).reset_index(drop=True) #替换成|很重要
当我想将相同订单编号的商品名称进行合并的时候,发现使用join后会出现很多空格,这是使用replace是无法去除空格


解决方法:
# 经过excel查询code(a1) unicode=u00A0 不间断空格
ordetgb['商品名称']=ordetgb['商品名称'].astype(str).apply(lambda x:x.replace(u"\u00A0",""))

本文介绍了在Python中如何利用replace方法去除DataFrame中的空格、制表符和换行符,以及如何处理Unicode编码中的不间断空格问题。在数据预处理阶段,对数据进行清洗是关键步骤,特别是对于商品名称等字段,去除空格可以提高数据的准确性。文章通过实例展示了在Pandas DataFrame中应用lambda函数和replace方法的技巧,以及处理特殊Unicode编码的解决方案。

3190

被折叠的 条评论
为什么被折叠?



