----------------------
ASP.Net+Android+IOS开发
、
href="http://edu.csdn.net"target="blank">.Net培训
、期待与您交流! ----------------------
4、练习
5、ip地址段排序
6、校验邮箱地址
7、网页爬虫
---------------------- ASP.Net+Android+IOS开发 、 href="http://edu.csdn.net"target="blank">.Net培训 、期待与您交流! ----------------------详细请查看: http://edu.csdn.net
1、正则表达式:符合一定规则的表达式
作用:用于专门操作字符串
特点:用于一些特定的符号来表示一些代码操作,这样就简化书写。
好处:可以简化对字符串的复杂操作。
弊端:符号定义越多,正则越长,阅读性越差
2、具体操作功能:
匹配:String matches方法,用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false
切割:String split()
替换:String replaceAll()
- public class RegexDemo1 {
- public static void main(String[] args) {
- //checkQQ();
- //checkTel();
- //splitDemo("zhangsan.lisi.wangwu","\\.");
- //splitDemo("c:\\abc\\a.txt","\\\\");
- //splitDemo("askfkkkdakjsqqkf","(.)\\1+");//按照叠词完成切割,为了可以让规则结果被重用
- //可以将规则封装成一个组,用()完成。组的出现都有编号
- //从1开始,想要使用已有的组可以通过\n(n就是组的编号)的形式来获取。
- //String str = "wtwer14125243554sdf341241afjl341d";//将字符串中的数字替换成#
- //replaceAllDemo(str,"\\d{5,}","#");
- String str1 = "asdffkjkeeafaiiezzzzzle";//将叠词替换成& //将重叠字幕替换成单个字母
- replaceAllDemo(str1,"(.)\\1+","&");
- replaceAllDemo(str1,"(.)\\1+","$1");
- }
- //校验qq号
- public static void checkQQ(){
- String qq = "870987324";
- String regex = "[1-9][0-9]{4,14}";
- boolean flag = qq.matches(regex);
- if(flag)
- System.out.println(qq+"...is ok");
- else
- System.out.println(qq+"不合法...");
- }
- //校验手机号,手机号段只有13xx,15xx,18xx
- public static void checkTel(){
- String tel = "13451075098";
- String reg = "1[358]\\d{9}";
- boolean flag = tel.matches(reg);
- System.out.println(flag);
- }
- public static void splitDemo(String str,String reg){
- // String str = "zhangsan.lisi.wangwu";
- // String reg = " +";//按照多个空格来进行切割
- // String reg = "\\.";
- String[] arr = str.split(reg);
- System.out.println(arr.length);
- for(String s : arr){
- System.out.println(s);
- }
- }
- public static void replaceAllDemo(String str,String reg,String newStr){
- str = str.replaceAll(reg,newStr);
- System.out.println(str);
- }
- }
3、获取:将字符串中的符合规则的子串取出
操作步骤:
1)将正则表达式封装成对象
2)让正则对象和要操作的字符串相关联
3)关联后,获取正则匹配引擎
4)通过引擎对符合规则的子串进行操作,比如取出
- public class RegexDemo2 {
- public static void main(String[] args) {
- getDemo();
- }
- public static void getDemo(){
- String str = "ming tian jiu yao fang jia le";
- String reg ="\\b[a-z]{3}\\b";
- //将规则封装成对象
- Pattern p = Pattern.compile(reg);
- //让正则对象和要作用的字符串相关联,获取匹配器对象
- Matcher m = p.matcher(str);
- // boolean b = m.find();//将规则作用到字符串上,并进行复核规则的子串查找
- // System.out.println(b);
- // System.out.println(m.group());//用于获取匹配后结果
- while(m.find()){
- System.out.println(m.group());
- }
- }
- }
- //需求:将下列字符串转成:我要学编程
- /*
- 思路:
- 1、如果只想知道该字符串是对是错,使用匹配
- 2、想要将已有的字符串变成另一个字符串,替换
- 3、想要按照自定义 的方式将字符串变成多个字符串,切割,获取规则以外的子串
- 4、想要拿到符合需求的字符串子串,获取,获取符合规则的子串
- */
- public class RegexTest1 {
- public static void main(String[] args) {
- String str1 = "我我...我我..我要...要要..要要..学学学...学学...编编编...编程...程程..程..程";
- String str2 = str1.replaceAll("(\\.)\\1+","");
- System.out.println(str2);
- String str3 = str2.replaceAll("(.)\\1+","$1");
- System.out.println(str3);
- }
- }
- /*
- 192.168.1.254 102.49.23.13 10.10.10.10 2.2.2.2 8.109.90.30
- 将ip地址进行地址段顺序的排序
- 还按照字符串自然顺序,只要让它们每一段都是3位即可
- 1、按照每一段需要的最多的0进行补齐,那么每一段就会至少保证有3位
- 2、将每一段只保留3三位,这样,所有的ip地址都是每一段3位
- */
- public class RegexTest2 {
- public static void main(String[] args) {
- ipSort();
- }
- public static void ipSort(){
- String ip ="192.168.1.254 102.49.23.13 10.10.10.10 2.2.2.2 8.109.90.30";
- ip = ip.replaceAll("(\\d+)","00$1");
- System.out.println(ip);
- ip = ip.replaceAll("0*(\\d{3})","$1");
- System.out.println(ip);
- String[] arr = ip.split(" +");
- TreeSet<String> ts = new TreeSet<String>();
- for(String s : arr){
- ts.add(s);
- }
- for(String s : ts){
- System.out.println(s.replaceAll("0*(\\d+)","$1"));
- }
- /*Arrays.sort(arr);
- for(String s : arr){
- System.out.println(s);
- }*/
- }
- }
- //需求:对邮件地址进行校验
- public class RegexTest3 {
- public static void main(String[] args) {
- checkMail();
- }
- public static void checkMail(){
- String mail = "abc12@sina.com.cn";
- String reg = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+){1,3}";//较为精确的匹配
- // reg = "\\w+@\\w+(\\.\\w)+";//相对不太精确的匹配
- System.out.println(mail.matches(reg));
- }
- }
- //网页爬虫(蜘蛛)
- public class RegexTest4 {
- public static void main(String[] args) throws Exception{
- //getMails1();
- getMails2();
- }
- //获取指定文档中的邮件地址,使用获取功能,Pattern Matcher
- public static void getMails1() throws Exception {
- BufferedReader bufr = new BufferedReader(new FileReader("d:\\mail.txt"));
- String line = null;
- String mailreg = "\\w+@\\w+(\\.\\w+)+";
- Pattern p = Pattern.compile(mailreg);
- while((line=bufr.readLine())!=null) {
- Matcher m = p.matcher(line);
- while(m.find()){
- System.out.println(m.group());
- }
- }
- }
- public static void getMails2() throws Exception {
- URL url = new URL("http://192.168.1.102:8080/myweb/mail.html");
- URLConnection conn = url.openConnection();
- BufferedReader bufIn = new BufferedReader(new InputStreamReader(conn.getInputStream()));
- String line = null;
- String mailreg = "\\w+@\\w+(\\.\\w+)+";
- Pattern p = Pattern.compile(mailreg);
- while((line=bufIn.readLine())!=null) {
- Matcher m = p.matcher(line);
- while(m.find()){
- System.out.println(m.group());
- }
- }
- }
- }
---------------------- ASP.Net+Android+IOS开发 、 href="http://edu.csdn.net"target="blank">.Net培训 、期待与您交流! ----------------------详细请查看: http://edu.csdn.net

309

被折叠的 条评论
为什么被折叠?



