如何解决dataframe里面根据另一列生成一列

最新推荐文章于 2023-08-13 13:52:52 发布

原创最新推荐文章于 2023-08-13 13:52:52 发布 · 562 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

本文探讨了两个常见的Python编程错误：一是使用lambda函数时的语法错误，未能正确传递DataFrame列；二是使用for循环赋值时未考虑索引，导致覆盖问题。解决方案包括正确使用lambda表达式来格式化URL，并在for循环中结合索引更新DataFrame的列。这些错误和修正对于理解和改进数据处理脚本至关重要。

开始错误的代码段:

1.用lamda根据Program进行修改,其中错误的是没有意识到lambda用法,其中的x就是program,

df['first_url'] = df['Program'].apply(lambda x:"http://www.manmankan.com/dy2013/dianshiju/search.shtml?KeyWords={}&t=2"\
        .format(urlencode({df['Program']:x})))

其中urlencode需要进行字典赋值,选择keyword:x赋值后还要在原字段中删除keyword以防重复

df['Program'].apply(lambda x: "http://www.manmankan.com/dy2013/dianshiju/search.shtml?{}&t=2" \
                    .format(urlencode({'Keywords': x})))

2;采用for循环,一个个quote过去进行赋值,这里错误在first_url不多的覆盖在前一个值

for i in df['Program']:
    a = quote(i)
    df['first_url'] = "http://www.manmankan.com/dy2013/dianshiju/search.shtml?KeyWords={}&t=2".format(a)

应该给予index进行有序排列

for i in df['Program'].index:
    a = quote(df.loc[i,'Program'])
    df.loc[i,'first_url'] = "http://www.manmankan.com/dy2013/dianshiju/search.shtml?KeyWords={}&t=2".format(a)