ノート/ハックメモ

Google-ColabでMeCabを使う

Google ColabはGoogleのクラウド上でPythonのJupyter Notebookが提供される環境です。

試してみると、Jupyter-Notebookの「!」が使えました。(つまりlinuxコマンドが実行できます。)

ほぼUbuntsuの環境のようなので、試しに

!apt-get install mecab libmecab-dev mecab-ipadic-utf8

してみると、うまくmecabがインストールできるではないですか。

その上で

!pip install mecab-python3

によってpythonへのバインドがインストールができたので、

import MeCab
m = MeCab.Tagger("-Ochasen")
print(m.parse("今日は良い天気です"))

を試したら、

今日	キョウ	今日	名詞-副詞可能		
は	ハ	は	助詞-係助詞		
良い	ヨイ	良い	形容詞-自立	形容詞・アウオ段	基本形
天気	テンキ	天気	名詞-一般		
です	デス	です	助動詞	特殊・デス	基本形
EOS

というわけで、無事MeCabが実行できました。Windowsで苦労するよりよさそうです。 (!apt-get ... の部分はおまじないということで。。。)

あと、natto-pyも動きました。

!pip install natto-py

しておいて

from natto import MeCab
mc = MeCab()
print(mc.parse('今日は良い天気です'))

とすると

今日	名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
良い	形容詞,自立,*,*,形容詞・アウオ段,基本形,良い,ヨイ,ヨイ
天気	名詞,一般,*,*,*,*,天気,テンキ,テンキ
です	助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
EOS

が得られます。

なお、FAQに

コードはどこで実行されるのですか?実行中にブラウザ ウィンドウを閉じたらどうなりますか?
コードは、各アカウント専用の仮想マシンで実行されます。仮想マシンには強制的に適用される
最大存続期間があり、一定期間アイドル状態にある仮想マシンは再利用されます。

としてあるので、この一定期間が過ぎて仮想マシンが消されれば、インストールしたMeCabは 消える、つまり!apt-getで再インストールする必要があると想像しています。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2018-03-30 (金) 15:49:24 (256d)