解析XML文件

最新推荐文章于 2024-06-29 12:06:41 发布

原创最新推荐文章于 2024-06-29 12:06:41 发布 · 306 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#java

xml 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍Java中四种XML解析方法：DOM、SAX、JDOM和DOM4J，包括每种方法的操作步骤和运行结果，适合初学者理解XML解析原理。

解析XML文件

在java程序中读取XML文件的过程称为解析XML

解析XML文件的方式

1）DOM解析

操作步骤：

①创建一个DocumentBuilderFactory对象
②创建一个DocumentBuilder对象
③通过DocumentBuilder的parse(...)方法得到Document对象
④通过getElementsByTagName(...)方法获取到节点列表
⑤通过for循环遍历每一个节点
⑥得到每一个节点的属性和属性值
⑦得到每一个节点的节点名和节点值

public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
		//1.创建一个DocumentBuilderFactory对象
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		//2.创建一个DocumentBuilder对象
		DocumentBuilder db =dbf.newDocumentBuilder();
		//3.调用DocumentBuilder的parse(...)方法得到Document对象
		Document doc = db.parse("book.xml");
		//4.通过getElementsByTagName(...)方法获取到节点的列表
		NodeList bookList = doc.getElementsByTagName("book");//得到book节点
		//5.for循环遍历每一个节点
		for(int i =0;i<bookList.getLength();i++) {
			//6.得到每个节点的属性和属性值
			Node book = bookList.item(i);
			NamedNodeMap attrs = book.getAttributes();//得到了属性的集合
			//循环比例属性
			for(int j = 0;j<attrs.getLength();j++) {
				//得到每一个属性
				Node id = attrs.item(j);
				System.out.println("属性的名称："+id.getNodeName()+"\t"+id.getNodeValue());
			}
		}
		System.out.println("\n每个节点的名称和节点的值");
		//7.得到每个节点的节点名和节点值
		for(int i=0;i<bookList.getLength();i++) {
			
			//得到每一个book节点
			Node book = bookList.item(i);
			NodeList subNode = book.getChildNodes();
//			System.out.println("子节点个数为:"+subNode.getLength());
			//for循环遍历每个book的子节点
			for(int j=0;j<subNode.getLength();j++) {
				Node childNode = subNode.item(j);
				short type = childNode.getNodeType();//获取节点的类型
				if(type==Node.ELEMENT_NODE) {
					System.out.println("属性为："+childNode.getNodeName()+"\t"+childNode.getTextContent());
				}
				//System.out.println(childNode.getNodeName());
			}
		}

	}

运行结果：

在这里插入图片描述
代码中两次循环得到book节点，一次是为了输出book特有的id属性；另一次是为了找到book下的子节点，以便于输出子节点的属性及其属性值。

2）SAX解析

SAX，全称Simple API for XML，是一种以事件驱动的XMLAPI，SAX与DOM不同的是它边扫描边解析，自顶向下依次解析，由于边扫描边解析，所以解析XML具有速度快，占用内存小的优点。

操作步骤：

①创建SAXParserFactory的对象
②创建SAXParser对象（解析器）
③创建一个DefaultHandler的子类
④调用parse方法

public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
		//1.创建SAXParserFactory对象
		SAXParserFactory spf = SAXParserFactory.newInstance();
		//2.创建SAXParser对象（解析器）
		SAXParser parser = spf.newSAXParser();
		//3.创建一个DefaultHandler的子类
		BookDefaultHandler bdh = new BookDefaultHandler();
	
		//4.调用parse方法
		parser.parse("book.xml", bdh);
	}

public class BookDefaultHandler extends DefaultHandler{
	/**
	 * 解析开始时调用
	 */
	@Override
	public void startDocument() throws SAXException {
		super.startDocument();
	}
	/**
	 * 解析XML文档结束时调用
	 */
	@Override
	public void endDocument() throws SAXException {
		super.endDocument();

	}
	/**
	 * 解析xml文档中的节点时调用
	 */
	@Override
	public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
		super.startElement(uri, localName, qName, attributes);
//		System.out.println("解析xml文档中的节点时调用");
		/*判断  如果是book节点 获取节点的属性和值*/
		if("book".equals(qName)) {//qName  标签的name
			//获取所有的属性
			int count = attributes.getLength();//属性的个数
			for(int i=0;i<count;i++) {
				String attName = attributes.getQName(i);//属性名称
				String attValue = attributes.getValue(i);//属性值
				System.out.println(attName+"-"+attValue);
			}
		}else if(!"books".equals(qName)&&!"book".equals(qName)) {
			System.out.print(qName+"-");
		}
	}
	/**
	 * 解析xml文档中的节点结束时调用
	 */
	@Override
	public void endElement(String uri, String localName, String qName) throws SAXException {
		super.endElement(uri, localName, qName);
	}
	
	//输出value值
	@Override
	public void characters(char[] ch, int start, int length) throws SAXException {
		super.characters(ch, start, length);
		String value = new String(ch,start,length);
		if(!"".equals(value.trim())){
			System.out.println(value);
		}
	}
}

运行结果：

在这里插入图片描述

3）JDOM解析

操作步骤：

①创建一个SAXBuilder对象
②调用build方法，得到Document对象（通过IO流）
③获取根节点
④获取根节点的直接子节点集合
⑤遍历集合

package com.lmd.jdom;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.List;

import org.jdom.Attribute;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;

public class TestJDOM {
	public static void main(String[] args) throws FileNotFoundException, JDOMException, IOException {
		//1.创建SAXBuilder对象
		SAXBuilder sb = new SAXBuilder();
		//2.调用build方法，得到Document对象（通过IO流）
		Document doc = sb.build(new FileInputStream("book.xml"));
		//3.获取根节点
		Element root = doc.getRootElement();//books节点
		//4.获取根节点的直接子节点集合
		List<Element> bookEle = root.getChildren();
		//5.遍历集合
		for(int i =0;i<bookEle.size();i++) {
			Element book = bookEle.get(i);
			//得到属性集合
			List<Attribute> attList = book.getAttributes();
			//遍历属性的集合得到每一个属性
			for (Attribute attribute : attList) {
				System.out.println(attribute.getName()+"-"+attribute.getValue());
			}
		}
		
		//得到每一个子节点
		System.out.println("--------------------");
		for(int i=0;i<bookEle.size();i++) {
			Element book = bookEle.get(i);
			List<Element> subBook = book.getChildren();
			for (Element element : subBook) {
				System.out.println(element.getName()+"-"+element.getValue());
			}
			System.out.println();
		}
	}
}

运行结果

在这里插入图片描述
本方法需要导入jdom.jar包，导入方法自行搜索。

4）DOM4J解析

操作步骤：

①创建SAXReader对象
②调用read方法
③获取根元素
④通过迭代器遍历直接节点

public static void main(String[] args) throws FileNotFoundException, DocumentException {
		//1.创建SAXReader对象
		SAXReader sr = new SAXReader();
		//2.调用read方法
		Document doc = sr.read(new FileInputStream("book.xml"));
		//3.获取根元素
		Element root = doc.getRootElement();//books
		//4.通过迭代器遍历直接节点
		
		for (Iterator<Element> iteBook = root.elementIterator();iteBook.hasNext();) {
			Element bookEle = iteBook.next();
//			System.out.println(bookEle.getName());
			//得到book的属性
			for (Iterator<Attribute> IteAtt = bookEle.attributeIterator();IteAtt.hasNext();) {
				Attribute att = IteAtt.next();
				System.out.println(att.getName()+"\t"+att.getValue());
			}
		}
		//得到每一个子节点的名称和属性值
		System.out.println("-----------");
		List<Book> bookList = new ArrayList<>();
		for(Iterator<Element> iteBook=root.elementIterator();iteBook.hasNext();) {
			//创建Book对象
			Book book = new Book();
			Element bookEle = iteBook.next();//得到每一个book
			//使用for循环继续遍历
			for(Iterator<Element> subBookEle=bookEle.elementIterator();subBookEle.hasNext();) {
				Element ele = subBookEle.next();
				System.out.println(ele.getName()+"\t"+ele.getText());
				/**
				 * 封装成Book对象
				 * */
				String nodeName = ele.getName();
				//switch判断
				switch (nodeName) {
				case "name":
					book.setName(ele.getText());
					break;
				case "author":
					book.setAuthor(ele.getText());
					break;
				case "price":
					book.setPrice(Double.parseDouble(ele.getText()));
					break;
				}
			}
			//添加到集合中
			bookList.add(book);
		}
		System.out.println("遍历book集合");
		for (Book book : bookList) {
			System.out.println(book);
		}
	}

public class Book {
	private String name;
	private String author;
	private Double price;
	
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
	public String getAuthor() {
		return author;
	}
	public void setAuthor(String author) {
		this.author = author;
	}
	public Double getPrice() {
		return price;
	}
	public void setPrice(Double price) {
		this.price = price;
	}
	
	public Book(String name, String author, Double price) {
		super();
		this.name = name;
		this.author = author;
		this.price = price;
	}
	
	public Book() {
		super();
	}
	@Override
	public String toString() {
		return "Book [name=" + name + ", author=" + author + ", price=" + price + "]";
	}
}

运行结果：

在这里插入图片描述
本方法除了将XML文件解析外，还将XML信息封装到Book实体中，以便于后续的操作使用。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。