PubMedのXMLから情報抽出(2)

先週のPubMedのXMLから情報抽出を、JavaXml構造を扱うDOM(Document Object Model)を使って書き直しました。
"/PubmedArticleSet/PubmedArticle/MedlineCitation/PMID/text()" という形式で直接指定できるXPathの存在に気づいたのが実装後だったため、NodeListとかElementを使って一段階ずつ子ノードを見ていく…という方式で実装しています。 (XPathの参考:Java XPath API
あとは、論文中に登場するIDの方式(最初の3文字がxxxという文字で、その後数字がくる、など)を教わりました。