在Windows 下,进行utf-8 格式的相关转换时需要注意,许多编译器默认windows上的是ANSI编码的而非utf-8格式,这会导致绝大多数情况下BOM会丢失
因此在windows下进行转换时,要写清楚,比如我有一个gbk格式的csv文件,需要按照如下方式进行转换
import pandas as pd
df = pd.read_csv(path,encoding="gbk")
df.to_csv(path,encoding="utf-8-sig")
如果to_csv 里面直接写encoding=“utf-8” 转出来的结果会有乱码
在Windows环境下,使用Pandas库进行CSV文件的编码转换,从GBK到UTF-8-SIG,避免乱码和BOM丢失的问题。文章详细介绍了转换过程及注意事项。

2万+

被折叠的 条评论
为什么被折叠?



