xpath 를 이용, java 에서 xml 문서 쉽게 파싱하기
Java 2011. 11. 23. 15:13
xpath 를 이용할수 있다는 걸 알기전에는 무식하게도 Document 클래스의 getElementById() 나 getElementsByTagName() 메소드를 이용해서
상당히 무식하게 난해한 코드로 xml 을 파싱하곤 했었다 -_-
어느날 문득 xpath 에 대해서 살짝 알게되고 나서 부터는 전에 쓰던 방법에 비해서는 아주 간결하고 이해하기 쉬운 코드로 xml 에서 원하는 데이터를 땡겨다 쓰는게 훨씬 수월해 졌다.
※ xpath 문법에 대해서 왠만한걸 쉽게 파악하기 위해서는 요 사이트에 가면 된다.
http://www.zvon.org/xxl/XPathTutorial/General/examples.html
요기 가서 보면 알겠지만 쉽게 쉽게 설명되있다.
xpath 만 어느정도 쓸 수 있으면 xml 에서 원하는 데이터를 땡겨오는건 매우 쉬워지니 살짝 한번 연구해 보는걸 추천한다.
xpath를 이용해서 xml 에서 원하는 데이터를 파싱하는 예제코드를 작성해 보았다.
xpath 를 사용하기 위해서 별다로 다른 라이브러리를 classpath 에 추가 안해도 된다.
예제 코드에서 사용된 xml
<root> <row> <col1 id="c1">값1</col1> <col2 id="c2" val="val2">값2</col2> </row> <row> <col1 id="c3">값3</col1> <col2 id="c4">값4</col2> </row> </root>
예제 코드는 다음과 같다.
import java.io.StringReader; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.xpath.XPath; import javax.xml.xpath.XPathConstants; import javax.xml.xpath.XPathFactory; import org.w3c.dom.Document; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.InputSource; public class XPathTest{ public static void main(String[] args) throws Exception { String xml = "<root><row><col1 id='c1'>값1</col1><col2 id='c2' val='val2'>값2</col2></row>" + "<row><col1 id='c3'>값3</col1><col2 id='c4'>값4</col2></row></root>"; // XML Document 객체 생성 InputSource is = new InputSource(new StringReader(xml)); Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(is); // 인터넷 상의 XML 문서는 요렇게 생성하면 편리함. //Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder() // .parse("http://www.example.com/test.xml"); // xpath 생성 XPath xpath = XPathFactory.newInstance().newXPath(); // NodeList 가져오기 : row 아래에 있는 모든 col1 을 선택 NodeList cols = (NodeList)xpath.evaluate("//row/col1", document, XPathConstants.NODESET); for( int idx=0; idx<cols.getLength(); idx++ ){ System.out.println(cols.item(idx).getTextContent()); } // 값1 값3 이 출력됨 // id 가 c2 인 Node의 val attribute 값 가져오기 Node col2 = (Node)xpath.evaluate("//*[@id='c2']", document, XPathConstants.NODE); System.out.println(col2.getAttributes().getNamedItem("val").getTextContent()); // val2 출력 // id 가 c3 인 Node 의 value 값 가져오기 System.out.println(xpath.evaluate("//*[@id='c3']", document, XPathConstants.STRING)); // 값3 출력 } }
전에 getElementById(), getElementsByTagName() 요걸 쓰던 코드에 비하면 코드도 쉽게 읽히고 심플하기도 서울역에 그지없다.
앞으로 xml 파싱할때는 xpath 를 주로 써야겠다.
※ evalueate() 메소드 맨 끝에 들어가는 파라메터로
XPathConstants.NODESET
XPathConstants.NODE
XPathConstants.BOOLEAN
XPathConstants.NUMBER
XPathConstants.STRING
요런걸 쓸 수 있다. 변수 이름을 보면 대충 어떨때 써야 할지 알 수 있을것이라 생각한다.
요런걸 쓸 수 있다. 변수 이름을 보면 대충 어떨때 써야 할지 알 수 있을것이라 생각한다.
2011/10/05 - [Java] - Jetty Scanner 를 이용한 특정 디렉토리 및 파일 변경사항(delete, change, add) 모니터링하기
2011/10/10 - [Java] - Runtime 에 jar 파일 클래스패스에 추가 시키기 : RuntimeJarLoader
2011/11/13 - [Java] - Java Map 반복(Iteration)시키는 3가지 방법
2011/11/16 - [Java] - JAVA/JSP SQL Injection 해킹 방지를 위한 코딩
2011/11/16 - [Java 예제] - 재귀함수(Recursive funtion)을 이용한 특정 폴더 아래의 모든 파일정보 읽어서 출력하기
2011/10/10 - [Java] - Runtime 에 jar 파일 클래스패스에 추가 시키기 : RuntimeJarLoader
2011/11/13 - [Java] - Java Map 반복(Iteration)시키는 3가지 방법
2011/11/16 - [Java] - JAVA/JSP SQL Injection 해킹 방지를 위한 코딩
2011/11/16 - [Java 예제] - 재귀함수(Recursive funtion)을 이용한 특정 폴더 아래의 모든 파일정보 읽어서 출력하기
'Java' 카테고리의 다른 글
Java 에서 문자열 비교할때 equals() 말고 == (비교연산자) 로 비교하기 (1) | 2011.11.24 |
---|---|
Java에서 파일로 부터 데이터 읽어서 정렬(bubble sort)하기 (0) | 2011.11.24 |
재귀함수(Recursive funtion)을 이용한 특정 폴더 아래의 모든 파일정보 읽어서 출력하기 (0) | 2011.11.16 |
JAVA/JSP SQL Injection 해킹 방지를 위한 코딩 (5) | 2011.11.16 |
Java Map 반복(Iteration)시키는 3가지 방법 (5) | 2011.11.13 |