Cygwinインストールの続きの続き

なんとか日本語環境は整ったようです。Cygwin JEを知らなかったのはおまぬけでありました。その後Mecabもインストールしてこれまたハマりながらも、なんとか通常の使用には耐えるようになりました。まずは一安心。えーと、つまりやりたいのはMecabを使って形態素解析をすることだったんですね。
けれどもその後Mecab要のPerlモジュールのインストールで失敗し、これはまだ解決してません。つーかどうやったら解決できるのか見当がつきませんが、まあいいや。とりあえずコマンドラインからMecabを動かすことができればあとはどうとでもなるし。
あとはMecab用の辞書ファイルをなんとかできればやりたいことはできるんじゃないかと思います。Cygwinの日本語対応は面倒といえば面倒だったけれども、ソレ用のスクリプトが「便利だったらどれでもいいじゃん!」で配布されていたのでそれを使用させていただきました。ありがたいことです。
しかしここまで時間がかかるとは正直思ってませんでした。なにが問題って結局は日本語の文字コードの問題なんですが、CygwinってそもそもWindows用のパッケージなんだよなあ。ならハナからShift-JISで動くようになってりゃいいんじゃないかと思うんだけど、なんでEUC-JPになってるんだ?
まあEUC-JP(Unix)とShiftJIS(Windows)ってのはある意味伝統的な問題だと言えるんでしょうが、最近ではこれにユニコード化なんてのも絡んできて、さらにややこしいことになってます。この間もPerlでEncodeモジュールを使うのに苦労したし、なんかこう覚えることがずいぶん多いなあと思います。そのへんわかりやすく説明できるのかと言えば正直ちょっと厳しい。
もっとも私は用意されたモノを使ってるだけなんで、あんまり文句を言う筋合いじゃないのかもしれません。それにしたってまあ、面倒くさいには変わりないですな。世の中が全部ユニコードになれば問題は解決されるのかもしれませんが、過去の遺産だって残るわけですから、少なくともあと5年くらいはムリなんじゃないかと思います。で、きっとその頃にはユニコードにも色々と問題があることがわかったりして、それを解決するための新しい何かがまた出てきたりするのです。苦労はずーっと続くのであります。
だからこそ面白いんだってのは逆説的ではありますが、まあそんなもんでしょうね。ユートピアなんてどこにもないんでしょうけど、そこを目指して進んでいくことに意味があるんだろうという気がします。