さくらVPSの安いプランとかでmecab-ipadic-NEologdを使う

2018-12-10 2018-12-19

Mecabを使った形態素解析用のWebAPIを作りたいと思い立ち、「まあ遊びだし安いのでいいか」と、さくらVPSの一番安いプランでやろうと思ったら軽ハマリしました。

何のことは無いメモリ不足なのですが、ハマってしまって訳が分からなくなってる人もいると思うので、その解決法を共有します。

さくらVPSの安いプランだと辞書のコンパイルが出来ない

mecabのインストール方法などは他のサイトに沢山書かれてるので特に書きません。ということで、辞書のインストール&コンパイル部分から。

githubに置かれているので、まずは公式に書かれている通りclone。

で、公式見ると「cd mecab-ipadic-neologd」でディレクトリ移動して「./bin/install-mecab-ipadic-neologd -n」でインストールしろ、と書かれているのですが、出来ません。メモリが足らなくて強制終了されます。

https://github.com/neologd/mecab-ipadic-neologd

別の環境で辞書をコンパイルする

ならプランを上げるしかないのか?と考えてしまうところですが、そんなことはありません。別の環境でコンパイルしてあげれば問題なく使えます。

ということで、MACならターミナルで、WindowsならVMかなんか使って、さっきの手順で「./bin/install-mecab-ipadic-neologd -n」の実行までを行います。

すると、出来上がった辞書が「mecab/dir/mecab-ipadic-neologd」に作成されているので、それをディレクトリ毎利用したい環境の同じ場所にぶち込めばOK。後は「mecab -d 辞書の場所」でmecabを実行してあげれば、ちゃんとmecab-ipadic-NEologdでの形態素解析が実行されます。