さくらVPSの安いプランとかでmecab-ipadic-NEologdを使う
2018-12-10 2018-12-19
Mecabを使った形態素解析用のWebAPIを作りたいと思い立ち、「まあ遊びだし安いのでいいか」と、さくらVPSの一番安いプランでやろうと思ったら軽ハマリしました。
何のことは無いメモリ不足なのですが、ハマってしまって訳が分からなくなってる人もいると思うので、その解決法を共有します。
さくらVPSの安いプランだと辞書のコンパイルが出来ない
mecabのインストール方法などは他のサイトに沢山書かれてるので特に書きません。ということで、辞書のインストール&コンパイル部分から。
githubに置かれているので、まずは公式に書かれている通りclone。
1 |
git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git |
で、公式見ると「cd mecab-ipadic-neologd」でディレクトリ移動して「./bin/install-mecab-ipadic-neologd -n」でインストールしろ、と書かれているのですが、出来ません。メモリが足らなくて強制終了されます。
https://github.com/neologd/mecab-ipadic-neologd
別の環境で辞書をコンパイルする
ならプランを上げるしかないのか?と考えてしまうところですが、そんなことはありません。別の環境でコンパイルしてあげれば問題なく使えます。
ということで、MACならターミナルで、WindowsならVMかなんか使って、さっきの手順で「./bin/install-mecab-ipadic-neologd -n」の実行までを行います。
すると、出来上がった辞書が「mecab/dir/mecab-ipadic-neologd」に作成されているので、それをディレクトリ毎利用したい環境の同じ場所にぶち込めばOK。後は「mecab -d 辞書の場所」でmecabを実行してあげれば、ちゃんとmecab-ipadic-NEologdでの形態素解析が実行されます。