[[ノート/テキストマイニング]]~ 訪問者数 &counter(); 最終更新 &lastmod();~ 以前(08/12/20付)[[医薬品添付文書DB:http://www.info.pmda.go.jp/psearch/html/menu_tenpu_base.html]] というリンクをメニューに貼った。 今般、もう少し考えてみることにした。 ***狙い目 [#ucf174e1] 薬剤師や医師などの医療関係者が、医薬品を使う(処方する)ときに、 医薬品情報を「より容易に」チェックできるようにしよう。 「より容易に」の定義は難しい。今後ユーザ(現場のスタッフ)側からの意見を吸い上げたい。~ 現段階では、技術側からの改良可能な点を考えてみる。 ***データの材料 [#i0b7f52d] まず、以前のリンクで見たような「独立行政法人 医薬品医療機器総合機構(Pharmaceuticals and Medical Devices Agency)」のデータベースがある。 >およそ、各製薬企業が提供した(電子化された)添付文書の内容を集めたもの。~ Web画面表示のほか、(1つ1つの医薬品ごとではあるが)SGML(DTD)形式のファイルをダウンロードすることができる。 <?EBT: ENCODING shift-jis> <!DOCTYPE PACKINS SYSTEM "package_insert.dtd" [ ]> <packins lang="ja" version="2.1"><variablelabel onswitch="on">添付文書</variablelabel> <packageinsertno><variablelabel onswitch="on">添付文書番号</variablelabel>2790803Q1020_2_01</packageinsertno> <companyidentifier><variablelabel onswitch="on">製薬会社識別コード</variablelabel>201315</companyidentifier> <dateofpreparationorrevision><variablelabel onswitch="on">作成又は改訂年月</variablelabel> <serialno onoff="off"><variablelabel>順序番号</variablelabel>1</serialno> <markofrevision><variablelabel>改訂記号</variablelabel>*</markofrevision> <yearmonth><variablelabel>作成改訂年月</variablelabel>2006年11月改訂</yearmonth> <version><variablelabel>版数</variablelabel> (第2版、薬事法改正に伴う改訂)</version> <serialno onoff="off"><variablelabel>順序番号</variablelabel>2</serialno> <markofrevision><variablelabel>改訂記号</variablelabel></markofrevision> <yearmonth><variablelabel>作成改訂年月</variablelabel>1999年1月作成</yearmonth> </dateofpreparationorrevision> <sccj><variablelabel onswitch="on">日本標準商品分類番号</variablelabel> <serialno onoff="off"><variablelabel>順序番号</variablelabel>1</serialno> <sccjno><variablelabel>日本標準商品分類番号</variablelabel>87279</sccjno> </sccj> <sccjetc><variablelabel onswitch="on">日本標準商品分類番号等</variablelabel> <yrmoofreevaluation><variablelabel onswitch="on">再評価結果公表年月(最新)</variablelabel>1982年8月</yrmoofreevaluation> </sccjetc> <therapeuticclassification><variablelabel onswitch="on">薬効分類名</variablelabel> <serialno onoff="off"><variablelabel>順序番号</variablelabel>1</serialno> <detail><variablelabel>薬効分類名称</variablelabel>歯科口腔用剤</detail> </therapeuticclassification> <approvaletc><variablelabel onswitch="on">承認等</variablelabel> <serialno onoff="off"><variablelabel>順序番号</variablelabel>1</serialno> <detailbrandname><variablelabel>販売名毎の明細</variablelabel> <approvalbrandname><variablelabel onswitch="on">販売名</variablelabel><chr><bold>カントップ用8%塩化亜鉛溶液</bold></chr></approvalbrandname> <brandcode><variablelabel onswitch="on">販売名コード</variablelabel> <serialno onoff="off"><variablelabel>順序番号</variablelabel>1</serialno> <yjcode><variablelabel>YJ(医情研)コード</variablelabel>2790803Q1020</yjcode> </brandcode> (途中まで) >これのためのDTDファイルもダウンロード可能である。 >その情報を元に、Web画面に表示されるほか、一般に頒布される本になったりCD-ROMになったりしている。手元に借りてきた、(財)日本医薬情報センター(JAPIC)の「医療用医薬品集」では、上記情報がHTML化された内容をCD-ROMに収容して、提供している。 ***検索機構の材料 [#z941dfc5] 次に、これの検索を考える。医薬品医療機器総合機構のWeb検索ページでは、いろいろな検索項目を設けており、基本的にAND検索をする。具体的には、 -一般名・販売名 -薬効分類(選択肢) -項目内検索1〜3 (AND/OR/NOTでの検索) -以下の項目のあるものを検索(警告・禁忌・相互作用・慎重投与) 我々が手持ちの検索の可能性は、(単純な一致以外には)構造的な一致だろう。文構造(係り受け関係)を限定して検索することが可能だろうが、それがどれだけの効果があるかは、今後の実践にかかってくる。 係り受け関係の解析には、フリーのソフトとして、奈良先端のCaboChaと京都のKNPが有名である。Pythonからのインタフェースを予め提供してくれているCaboChaで解析した例を示す。 原文1: 窩洞に溶液を作用させると,亜鉛は通電しない場合,窩洞表面にわずかに浸透している程度であるが, 通電すると亜鉛の象牙質内への浸透は著明となり,象牙細管に沿って歯髄に達するまで深部に移行する。 また,象牙質に導入された亜鉛はカルシウムと置換して,そこに不溶性の亜鉛化合物として沈着し,象牙細管を填塞する 分析結果: 窩洞に---D 溶液を-D 作用させると,---D 亜鉛は-D 通電しない-D 場合,-----D 窩洞表面に---D わずかに-D 浸透している-D 程度であるが,-D 通電すると-----------------------D 亜鉛の-D | 象牙質内への-D | 浸透は-----D | 著-D | | 明と-D | なり,-------D | 象牙細管に-D | | 沿って---D | 歯髄に-D | 達するまで---D 深部に-D 移行する。-------------------------D また,-----------------------D 象牙質に-D | 導入された-D | 亜鉛は-----------------D カルシウムと-D | 置換して,-------D | そこに-----D | 不溶性の-D | | 亜鉛化合物として-D | 沈着し,---D | 象牙細管を-D | 填-D 塞する EOS * 0 2D 0/1 1.426286 窩洞 名詞,一般,*,*,*,*,* O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 1 2D 0/1 1.388611 溶液 名詞,一般,*,*,*,*,溶液,ヨウエキ,ヨーエキ O を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ O * 2 4D 1/3 0.052055 作用 名詞,サ変接続,*,*,*,*,作用,サヨウ,サヨー O さ 動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ O せる 動詞,接尾,*,*,一段,基本形,せる,セル,セル O と 助詞,接続助詞,*,*,*,*,と,ト,ト O , 記号,読点,*,*,*,*,,,,,, O * 3 4D 0/1 0.831576 亜鉛 名詞,一般,*,*,*,*,亜鉛,アエン,アエン O は 助詞,係助詞,*,*,*,*,は,ハ,ワ O * 4 5D 1/2 1.018153 通電 名詞,サ変接続,*,*,*,*,通電,ツウデン,ツーデン O し 動詞,自立,*,*,サ変・スル,未然形,する,シ,シ O ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ O * 5 8D 0/0 1.048844 場合 名詞,副詞可能,*,*,*,*,場合,バアイ,バアイ O , 記号,読点,*,*,*,*,,,,,, O * 6 8D 1/2 1.361422 窩洞 名詞,一般,*,*,*,*,* O 表面 名詞,一般,*,*,*,*,表面,ヒョウメン,ヒョーメン O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 7 8D 0/1 2.190626 わずか 副詞,助詞類接続,*,*,*,*,わずか,ワズカ,ワズカ O に 助詞,副詞化,*,*,*,*,に,ニ,ニ O * 8 9D 1/3 2.363379 浸透 名詞,サ変接続,*,*,*,*,浸透,シントウ,シントー O し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ O て 助詞,接続助詞,*,*,*,*,て,テ,テ O いる 動詞,非自立,*,*,一段,基本形,いる,イル,イル O * 9 10D 0/3 0.163756 程度 名詞,一般,*,*,*,*,程度,テイド,テイド O で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ O ある 助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル O が 助詞,接続助詞,*,*,*,*,が,ガ,ガ O , 記号,読点,*,*,*,*,,,,,, O * 10 22D 1/2 1.072063 通電 名詞,サ変接続,*,*,*,*,通電,ツウデン,ツーデン O する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル O と 助詞,接続助詞,*,*,*,*,と,ト,ト O * 11 12D 0/1 0.868923 亜鉛 名詞,一般,*,*,*,*,亜鉛,アエン,アエン O の 助詞,連体化,*,*,*,*,の,ノ,ノ O * 12 13D 2/4 1.700219 象牙 名詞,一般,*,*,*,*,象牙,ゾウゲ,ゾーゲ O 質 名詞,一般,*,*,*,*,質,シツ,シツ O 内 名詞,接尾,一般,*,*,*,内,ナイ,ナイ O へ 助詞,格助詞,一般,*,*,*,へ,ヘ,エ O の 助詞,連体化,*,*,*,*,の,ノ,ノ O * 13 16D 0/1 0.184359 浸透 名詞,サ変接続,*,*,*,*,浸透,シントウ,シントー O は 助詞,係助詞,*,*,*,*,は,ハ,ワ O * 14 15D 0/0 0.313452 著 形容詞,自立,*,*,形容詞・アウオ段,ガル接続,著い,シル,シル O * 15 16D 0/1 1.867631 明 名詞,固有名詞,人名,名,*,*,明,アキラ,アキラ O と 助詞,格助詞,一般,*,*,*,と,ト,ト O * 16 20D 0/0 0.321806 なり 動詞,自立,*,*,五段・ラ行,連用形,なる,ナリ,ナリ O , 記号,読点,*,*,*,*,,,,,, O * 17 18D 1/2 1.198726 象牙 名詞,一般,*,*,*,*,象牙,ゾウゲ,ゾーゲ O 細管 名詞,一般,*,*,*,*,細管,サイカン,サイカン O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 18 20D 0/1 0.388663 沿っ 動詞,自立,*,*,五段・ワ行促音便,連用タ接続,沿う,ソッ,ソッ O て 助詞,接続助詞,*,*,*,*,て,テ,テ O * 19 20D 0/1 1.648252 歯髄 名詞,一般,*,*,*,*,歯髄,シズイ,シズイ O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 20 22D 0/1 3.696688 達する 動詞,自立,*,*,サ変・−スル,基本形,達する,タッスル,タッスル O まで 助詞,副助詞,*,*,*,*,まで,マデ,マデ O * 21 22D 0/1 3.320836 深部 名詞,一般,*,*,*,*,深部,シンブ,シンブ O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 22 35D 1/1 0.000000 移行 名詞,サ変接続,*,*,*,*,移行,イコウ,イコー O する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル O 。 記号,句点,*,*,*,*,。,。,。 O * 23 35D 0/0 0.000000 また 接続詞,*,*,*,*,*,また,マタ,マタ O , 記号,読点,*,*,*,*,,,,,, O * 24 25D 1/2 1.680220 象牙 名詞,一般,*,*,*,*,象牙,ゾウゲ,ゾーゲ O 質 名詞,接尾,一般,*,*,*,質,シツ,シツ O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 25 26D 1/3 1.598255 導入 名詞,サ変接続,*,*,*,*,導入,ドウニュウ,ドーニュー O さ 動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ O れ 動詞,接尾,*,*,一段,連用形,れる,レ,レ O た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ O * 26 35D 0/1 0.000000 亜鉛 名詞,一般,*,*,*,*,亜鉛,アエン,アエン O は 助詞,係助詞,*,*,*,*,は,ハ,ワ O * 27 28D 0/1 2.519112 カルシウム 名詞,一般,*,*,*,*,カルシウム,カルシウム,カルシウム O と 助詞,格助詞,一般,*,*,*,と,ト,ト O * 28 32D 1/2 0.460756 置換 名詞,サ変接続,*,*,*,*,置換,チカン,チカン O し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ O て 助詞,接続助詞,*,*,*,*,て,テ,テ O , 記号,読点,*,*,*,*,,,,,, O * 29 32D 0/1 1.011573 そこ 名詞,代名詞,一般,*,*,*,そこ,ソコ,ソコ O に 助詞,格助詞,一般,*,*,*,に,ニ,ニ O * 30 31D 0/1 1.154547 不溶性 名詞,一般,*,*,*,*,不溶性,フヨウセイ,フヨーセイ O の 助詞,連体化,*,*,*,*,の,ノ,ノ O * 31 32D 2/3 1.023025 亜鉛 名詞,一般,*,*,*,*,亜鉛,アエン,アエン O 化合 名詞,サ変接続,*,*,*,*,化合,カゴウ,カゴー O 物 名詞,接尾,一般,*,*,*,物,ブツ,ブツ O として 助詞,格助詞,連語,*,*,*,として,トシテ,トシテ O * 32 34D 1/1 0.066189 沈着 名詞,サ変接続,*,*,*,*,沈着,チンチャク,チンチャク O し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ O , 記号,読点,*,*,*,*,,,,,, O * 33 34D 1/2 0.030409 象牙 名詞,一般,*,*,*,*,象牙,ゾウゲ,ゾーゲ O 細管 名詞,一般,*,*,*,*,細管,サイカン,サイカン O を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ O * 34 35D 0/0 0.000000 填 動詞,自立,*,*,五段・ラ行,体言接続特殊2,填る,ハマ,ハマ O * 35 -1D 1/1 0.000000 塞 名詞,一般,*,*,*,*,* O する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル O EOS ***リンク [#hd6a5240] -[[日本医薬品情報学会>http://www.jasdi.jp/]]~ [[論文誌を発行し始めたばかり:http://www.jstage.jst.go.jp/browse/jjdi/-char/ja]] -[[東大 澤田康文:]] -[[東大 澤田康文(寄附講座?):http://www.f.u-tokyo.ac.jp/~druginfo/]] <「医薬品ライフタイムマネジメント(Drug Lifetime Management、DLM)」を遂行するための「医薬品情報学(Drug Informatics)」の学問体系の確立≫ ということで、少し方向が違うかな? -[[慶應 望月眞弓:http://www.pha.keio.ac.jp/laboratory/laboratory23.html]] -[[千葉大 上田志朗:http://www.p.chiba-u.ac.jp/lab/jyoho/index_japanese.html]] -[[昭和 加藤裕久:http://www10.showa-u.ac.jp/~pharm/labo/labo20.html]]