Publications referring to NGS data に新データの追加

http://sra.dbcls.jp/cgi-bin/publication.cgiに新しくPubMedと次世代シークエンサ(NGS)のデータIDの対応を追加しました.

今回追加新たに追加したものは,PubMedのMeSHで"High-Throughput Nucleotide Sequencing"が付いているものです.6月22日に25件ほど追加しています.

追加の流れ

以下の手順で追加しました.id:meguu08 と共に作業しています.

1. eutils経由で High-Throughput Nucleotide Sequencing のMeSHが付いた論文のPubMed ID(PMID)を取得
2. PMIDから次世代シークエンサデータのIDを抽出
3. 2.で抽出した次世代シークエンサのIDはSubmission,Study,Experiment,Sample,Run,Analysisと混ざっているので,Submission(SRAかDRAから始まる)IDに統一する
4. 登録されていない論文と次世代シークエンサのIDを新たにデータベースに追加



2. では,eutilsからxmlファイルを取得できない論文があるので,それらは直接ジャーナルサイトから取得しています.現在対応しているのは,以下のジャーナルです.
・Genome Research
・Proc. Natl. Acad. Sci. U.S.A.
・Nature
・Science (New York, N.Y.)
・Genes & Development
・Nature methods
・Nature genetics
・Nature biotechnology
Bioinformatics
・The Plant Cell
・Briefings in Functional Genomics and Proteomics


今後,PubMedのMeSH以外にデータを追加しようと思っているので,後日HPに更新情報の追記をしたいと思います.