PubMedのXMLから情報抽出(2)

先週のPubMedのXMLから情報抽出を、JavaのXml構造を扱うDOM(Document Object Model)を使って書き直しました。
"/PubmedArticleSet/PubmedArticle/MedlineCitation/PMID/text()" という形式で直接指定できるXPathの存在に気づいたのが実装後だったため、NodeListとかElementを使って一段階ずつ子ノードを見ていく…という方式で実装しています。（XPathの参考：Java XPath API）
あとは、論文中に登場するIDの方式（最初の3文字がxxxという文字で、その後数字がくる、など）を教わりました。