perl unicode与汉字转码程序

本文深入探讨了进制转换、字符与ASCII码的转换、汉字与Unicode码之间的转换,以及如何获取文本中指定头尾标记的文本内容。同时,介绍了将IP转为二进制模式的方法,并提供了文本中相同行的去除技巧。

1、进制转换
  print sprintf("%d",oct("0b_"); 
  print sprintf("%x",oct("0_");  
  print sprintf("%o",_);    
  print sprintf("%b",oct("0x_");
2、字符与ascii码的转换
1)可用chr("97"和ord("a"加循环做
2)用pack 和 unpack
  假设a="hello";
  @a=unpack('H2' lengtha,a); @a为解码值
  a=pack('H2'x scalar@a,@a); a为编码后的字串
#也可以不用数组存放,直接转换到变量中
  asc=unpack ('H*',"hello"; "68656c6c6f" 
  string=pack('H*',"68656c6c6f"; "hello"
3、汉字与unicode码之间的转换
  use Encode;
  a="abc 黑夜白天";
  a=decode ("gb2312",a); a=encode("utf8",a); output as utf8
  map {print "%u",sprintf("%x",_)}unpack ("U*",a); to unicode;
  反之
  @a=("a","b","c"," ","�d1","Y1c","v7d","Y29";
  map {s/%//;_=oct("0x_"}@a;
  print encode ("gb2312",pack("U*",@a)); to gb2312
4、获取文本中指定了头尾标记的文本内容
  print if (file=~/(.*)<\/html>/is);
  或者
  open(FF,"aa.txt";
  print join ', grep {r=//..m{}} && r>1 &&  r!~/e/i} <FF>; #该程序引自CU论坛apile兄
  close(FF);
5、将IP转为二进制模式
  引自CU论坛apile兄
  sub bitsIP(){
    my(ip,netmask)= @_; #("192.168.0.1",24)
    my @ip =split(/\./,ip);
    my unpack("B32", pack("C4",ip[0],ip[1],ip[2],ip[3]));
    my substr= substr(b,0,netmask);
    return substr; #Return the 16 bit binary of "192.168.0"
  }
6、移除文本中的相同行
  while(a=<ONE>{
    h{a}=1;
  }
  print sort keys %h;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值