linux GB2312转UTF-8 shell脚本

最新推荐文章于 2022-08-17 17:15:50 发布

原创最新推荐文章于 2022-08-17 17:15:50 发布 · 6.6k 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#shell #utf-8 #编码 #乱码 #linux

收录于

Linux 专栏收录该内容

44 篇文章

订阅专栏

本文介绍了一款用于解决Linux系统中TXT文件乱码问题的Shell脚本。该脚本能够批量将GB2312编码的文本文件转换为UTF-8编码，并保留原始文件的同时生成新的UTF-8编码文件。

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125

在linux下看一些txt文件经常出现一些乱码问题，所以就自己编写了一个shell脚本来将GB2312码转换成UTF-8码

#!/bin/bash
#格式：./gb2312_2_utf8.sh 路径名

IFSBACKUP=$IFS							#备份IFS变量
IFS=$(echo -en "\n\b")						#设置IFS变量不含空格，防止文件名中有空格时出现异常

dst=$(echo $1|sed 's/\/$//')					#如果路径末尾有“/”，删除掉，后面再添加
for file in $(ls "$dst"|grep .txt)
do
  gb2312file=$dst\/$file
  utf8file=$(echo "$gb2312file"|sed 's/.txt$/-utf8.txt/')
  string=$(file "$gb2312file"|grep Unicode)			#简单判断文件是否为Unicode文件，如果是，则不转换
  if [ "$string" = "" ]
  then
    iconv -f GB18030 -t utf-8 "$gb2312file" > "$utf8file"	#GB18030编码，它是GB2312的一个超集
  else
    echo "$gb2312file" is Unicode text file
  fi
done

IFS=$IFSBACKUP

exit 0

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125