辞書ファイルの移行(MS-IME → Canna)
やってみたのでメモしておく。
Windows で必要なものは、正規表現で置換できるエディタと、EUC に置換できるツール。Linux 側で nkf してもいいし、Telnet や SSH で EUC 使って書き込んでも OK。
まず、MS-IME から辞書の抽出。辞書ツールのメニューから「ツール」→「一覧の抽出」で。
抽出したファイルをエディタで開いて、書式を合わせます。IME から抽出した場合、本体のフォーマットは「読み\t変換結果\t品詞\n」になってます。これを「読み 品詞 変換結果\n」にしてやればOK。と思う。品詞なのかなこれ(´д`;
おいらの場合、名詞と顔文字で登録したものを移行したかったので、「\t(名詞|顔文字)\n」で検索して品詞指定部分を切り落として、残った部分を変換。「\t」を「 #T35 」に。なんか知らんけどこれでOK。Cannaの辞書形式よく知らんのだ(´д`;
で、おいらの場合は秀丸使って EUC で保存。
その後、scp してここから先は Linux 上での作業。
変換済みのテキストを「dic.ctd」でな具合にリネームして、コマンドラインから「mkbindic dic.ctd」とやると、「dic.cbd」「dic.cld」ができるので、これを Canna の辞書ディレクトリ「/var/lib/canna/dic/canna/」に cp。
でもって、「/var/lib/canna/dic/canna/dics.dir」に
dic.cbd(dic.mwd) -dic---
dic.cld(dic.mwd) -dic---
みたいな感じで追加。
それから、「/etc/init.d/canna restart」するととりあえずシステム辞書に追加されてる状態に。
あとは各自のホームにある「.canna」の「use-dictionary」の項目に「"dic"」を追加して、kinput2 再起動。
これでとりあえず品詞はめちゃくちゃだと思うけど、登録はできます。
参考:Canna で顔文字