故事提要:
有个运营的朋友, 6张excel 表需要合并到一张表, 每张表大约65536 个数据, 其中重复的item 需要按一定规则合并。
如果用电脑直接合并excel , 由于数据过多, 系统总是崩溃, 朋友试了很多方法一周也没完美搞定。
正好帮个忙,拿来用python练练手~
比如下面两个重复的数据:
合并后的结果是:
pwk_id :不变, 访问次数: 1+1 = 2 , 操作系统: PC , 总计访问时长:565 + 565 = 1130 , pv: max(2,2) = 2<

使用Python 2.7.10和xlwt、xlrd库,实现了在两小时内合并六张Excel表格并去除4万多条重复数据的功能。程序高效,适合处理大量数据,避免重复问题。

1476

被折叠的 条评论
为什么被折叠?



