yylab/山内の研究ノート/概要からの関係抽出実験?
アクセスする方法の記述ページ
さしあたってまとめると
- 簡単な手順(他の方法もあり。一番簡単な場合)
- 基本的にURLの後ろに引数を書くことによって動作させる
- ESearchによって、キーワード検索をし、結果としてprimary ID(数字)を得る
- そのprimary IDに関して(複数可)、EFetchによってレコード全体を(希望の形式で)取り出す。
- ESearchの出し方
- データベース名 db=pubmedとかdb=omimとか。すべてのリストはここ
- History usehistory=y とすると、WebEnvやQuery_keyを使える
- WebEnv 今まで使ってきた環境。前の戻り値でXMLで書かれているはず?
- Query_key 前のESearchの戻り値での項番のようなもので、「これ」と言える
- tool こちらのソフトの名前。MCBIが「お前か!」と呼ぶための文字列(空白なし)。tool=xxxxxと書く
- Email 同上。email=yyyy%40zzzzと書くらしい。%40は@のこと
- ここまで共通。以下pubmedの場合
- term=検索文字列。ブール演算子を含んでもよい。例:term=asthma[mh]+OR+hay+fever[mh]。[mh]はMeSH Termsの記号。その他のタグはここ
- field=検索のフィールド。PubMedで選べるフィールドはaffl, auth, ecno, jour, iss, mesh, majr, mhda, page, pdat, ptyp, si, subs, subh, tiab, word, titl, lang, uid, fltr, vol
- 日付の指定 reldate=90(今日から90日前まで)、mindate=2001 maxdate=2002/01/01(初め・終わりの日付)、datetype=edat(日付のタイプ、なんだろう?)
- 表示する項番 retstart=x retmax=y (xは取り出すレコードの順番。0が先頭でデフォルト、yはいくつ取り出すか)
- 取り出すモード retmode=xml (XMLで取り出す。ESearchではxmlしかない。テキストで内容を見たいときはEFetchを使え)
- 取り出すタイプ rettype=countかuilist(デフォルト)か
- ソートキー sort=xxx PubMedではauthor, last+author, journal, pub+dateがある。
- 例 (pukiwikiでは[]を含むリンクをうまく書けないので、項目全体をブラウザにコピー&ペーストして使ってください)
- EFetchの出し方
- データベース名 db=pubmedとかdb=omimとかdb=pmcとかdb=journalsとか
- History usehistory=y とすると、WebEnvやQuery_keyを使える
- WebEnv 今まで使ってきた環境。前の戻り値でXMLで書かれているはず?
- Query_key 前のESearchの戻り値での項番のようなもので、「これ」と言える
- tool こちらのソフトの名前。MCBIが「お前か!」と呼ぶための文字列(空白なし)。tool=xxxxxと書く
- Email 同上。email=yyyy%40zzzzと書くらしい。%40は@のこと
- ここまで共通。以下pubmed系の場合 (配列、タクソノミーなどは形が少し違う)
- レコード識別子(UI) id=11877539,11822933など
- 表示する項番 retstart=x retmax=y (xは取り出すレコードの順番。0が先頭でデフォルト、yはいくつ取り出すか)
- 取り出すモード retmode=xml(journalは不可), html, text, asn.1(journalは不可)
- 取り出すタイプ rettype=uilist, abstract(omim不可), citation(omim不可), medline(omim不可), full(journalとomim)。細かくはここ
- 例