VBScript中使用ADODB.Stream保存编码为UTF-8的文件,默认是会带上BOM标识的,在一些场景中,我们需要的是不带BOM标识的UTF-8文件,那么需要对文件进行一下处理,简单来说就是去掉带BOM的UTF-8文件的前3个字节,重新保存。
很多例程是先将整个字符串写入UTF-8的文本流,然后指针定位到第3个字节的位置,另外重新建立一个二进制流,将文本流的数据Copy到二进制流,然后二进制流写入文件就得到无BOM的UTF-8文件。没有毛病,我也是这样处理的。
后来看到有网友推荐了一个高级玩法,说前面的处理方式是要将整个字符串编码写入两个流,当字符串很长时,有空间和性能的较多开销,可以在文本流中仅写入一个字符,然后Copy到二进制流,然后在二进制流中进行以下操作:设置结尾标识,计算下流长度,然后重新定位到起始位置,更改流类型为文本流,UTF-8编码,然后再定位到第一个字符编码位置后,写入原字符串后面的所有字符信息,然后再定位到起始位置,更改流类型为二进制流,然后写入文件,这样也可以一个得到没有BOM的UTF-8的文本文件了。这里有几个要点:WriteText如果不是从开头写文本,那么是不会带上BOM标识的,只有定位到流开头Position = 0 才能更改流类型,还有就是UTF-8的文本流写入文件还是会带上BOM标识的。
代码如下:
'VBScript脚本 teststr2utf8.vbs
Sub String2UTF8_WithoutBOM(str,filepath)
Set fs = CreateObject


4045

被折叠的 条评论
为什么被折叠?



