linux GB2312转UTF-8 shell脚本

本文介绍了一款用于解决Linux系统中TXT文件乱码问题的Shell脚本。该脚本能够批量将GB2312编码的文本文件转换为UTF-8编码,并保留原始文件的同时生成新的UTF-8编码文件。

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125

在linux下看一些txt文件经常出现一些乱码问题,所以就自己编写了一个shell脚本来将GB2312码转换成UTF-8码

#!/bin/bash
#格式:./gb2312_2_utf8.sh 路径名

IFSBACKUP=$IFS							#备份IFS变量
IFS=$(echo -en "\n\b")						#设置IFS变量不含空格,防止文件名中有空格时出现异常

dst=$(echo $1|sed 's/\/$//')					#如果路径末尾有“/”,删除掉,后面再添加
for file in $(ls "$dst"|grep .txt)
do
  gb2312file=$dst\/$file
  utf8file=$(echo "$gb2312file"|sed 's/.txt$/-utf8.txt/')
  string=$(file "$gb2312file"|grep Unicode)			#简单判断文件是否为Unicode文件,如果是,则不转换
  if [ "$string" = "" ]
  then
    iconv -f GB18030 -t utf-8 "$gb2312file" > "$utf8file"	#GB18030编码,它是GB2312的一个超集
  else
    echo "$gb2312file" is Unicode text file
  fi
done

IFS=$IFSBACKUP

exit 0

转载请注明来源 http://blog.csdn.net/imred/article/details/40951125




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值