转载请注明来源 http://blog.csdn.net/imred/article/details/40951125
在linux下看一些txt文件经常出现一些乱码问题,所以就自己编写了一个shell脚本来将GB2312码转换成UTF-8码
#!/bin/bash
#格式:./gb2312_2_utf8.sh 路径名
IFSBACKUP=$IFS #备份IFS变量
IFS=$(echo -en "\n\b") #设置IFS变量不含空格,防止文件名中有空格时出现异常
dst=$(echo $1|sed 's/\/$//') #如果路径末尾有“/”,删除掉,后面再添加
for file in $(ls "$dst"|grep .txt)
do
gb2312file=$dst\/$file
utf8file=$(echo "$gb2312file"|sed 's/.txt$/-utf8.txt/')
string=$(file "$gb2312file"|grep Unicode) #简单判断文件是否为Unicode文件,如果是,则不转换
if [ "$string" = "" ]
then
iconv -f GB18030 -t utf-8 "$gb2312file" > "$utf8file" #GB18030编码,它是GB2312的一个超集
else
echo "$gb2312file" is Unicode text file
fi
done
IFS=$IFSBACKUP
exit 0
转载请注明来源 http://blog.csdn.net/imred/article/details/40951125
本文介绍了一款用于解决Linux系统中TXT文件乱码问题的Shell脚本。该脚本能够批量将GB2312编码的文本文件转换为UTF-8编码,并保留原始文件的同时生成新的UTF-8编码文件。

608

被折叠的 条评论
为什么被折叠?



