辞書ファイルの移行(MS-IME → Canna)

 
 やってみたのでメモしておく。
 Windows で必要なものは、正規表現で置換できるエディタと、EUC に置換できるツール。Linux 側で nkf してもいいし、TelnetSSHEUC 使って書き込んでも OK。
 
 まず、MS-IME から辞書の抽出。辞書ツールのメニューから「ツール」→「一覧の抽出」で。
 抽出したファイルをエディタで開いて、書式を合わせます。IME から抽出した場合、本体のフォーマットは「読み\t変換結果\t品詞\n」になってます。これを「読み 品詞 変換結果\n」にしてやればOK。と思う。品詞なのかなこれ(´д`;
 おいらの場合、名詞と顔文字で登録したものを移行したかったので、「\t(名詞|顔文字)\n」で検索して品詞指定部分を切り落として、残った部分を変換。「\t」を「 #T35 」に。なんか知らんけどこれでOK。Cannaの辞書形式よく知らんのだ(´д`;
 
 で、おいらの場合は秀丸使って EUC で保存。
 その後、scp してここから先は Linux 上での作業。
 
 変換済みのテキストを「dic.ctd」でな具合にリネームして、コマンドラインから「mkbindic dic.ctd」とやると、「dic.cbd」「dic.cld」ができるので、これを Canna の辞書ディレクトリ「/var/lib/canna/dic/canna/」に cp。
 でもって、「/var/lib/canna/dic/canna/dics.dir」に
 
 dic.cbd(dic.mwd) -dic---
 dic.cld(dic.mwd) -dic---
 
 みたいな感じで追加。
 
 それから、「/etc/init.d/canna restart」するととりあえずシステム辞書に追加されてる状態に。
 
 あとは各自のホームにある「.canna」の「use-dictionary」の項目に「"dic"」を追加して、kinput2 再起動。
 
 これでとりあえず品詞はめちゃくちゃだと思うけど、登録はできます。
 
 参考:Canna で顔文字