Ubuntuで辞書に(アニオタ用)単語一括登録

おおざっぱな手順
MS-IME用一括登録テキストファイルを用意
テキストファイルの文字コードがSJISであることを確認
msime2anthy(要JavaRuntime)を使ってAnthy用一括登録テキストファイルに変換
端末を起動しanthy-dic-toolで
anthy-dic-tool --append なんとか.txt
と入力して登録。

今回した事
hirano.xxxxxxxx.jp msime2anthy
http://hirano.blog.shinobi.jp/Entry/1/
こちらで公開されている変換ツールmsime2anthyをダウンロード
Japanese Dictionaries
http://web.me.com/kazariyon/dic/
こちらで公開されている声優さんとアニメの辞書をダウンロード
seiyusan-msime.txt
japanime-msime.txt
MS-IME用の二つのファイルをサクラエディタで開き、名前を付けて保存にて文字コードをSJISに直して保存
(一部SJISだと化けて保存されてしまう文字列があるので注意)
msime2anthy
で開いて変換。
seiyusan-msime.txtは成功
japanime-msime.txtは失敗
どうやら固有名詞はanthyに無いそうなので、japanime-msime.txtをサクラエディタで開き
『固有名詞』を『名詞』に置換。
japanime-msime.txtを再度開き変換、成功。
ファイルをUbuntu側に持って行き、それぞれ名前をseiyu.txt、anime.txtと短くしておく
端末を開きanthy-dic-tool --append seiyu.txtと入力
文字化けしながら登録しているので不安になる。
anime.txtも同様に登録
完了後、『みずしまたかひろ』と入力し『水島大宙』と変換されることを確認
『ひだまりすけっち』と入力し『ひだまりスケッチ×365』が候補に出ることを確認し終了!

msime2anthyはUbuntu環境でも実行できる様子(右クリックのプロパティから実行権を与える必要がある)
テキストファイルがSJIS以外だと変換に失敗する
Ubuntu環境で文字コードを変換するツールに明るくないので今回はWindows環境で変換
辞書公開サイトの共有フォルダはUbuntu版Firefoxに対応していないようなので
iPhoneなどにリファラー偽装する必要がある。

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

この記事へのトラックバック