skkにて、略称や複数の読み/表記がある言葉を簡単に変換できるような辞書を作成するためのユーティリティ。 skk辞書形式かcdb形式(あるいは両方)で出力できます。 「[」や「/」など、skk辞書にて特殊な意味をもつ文字を含む文字列には対応していないので悪しからず。 外部でawk、nkf、tee、skkdic-p2cdb(multiskkservと一緒に配布されている)が必要です。 もしskkdic-p2cdbが無くても、skk辞書形式で出力できるのでmultiskkserv以外でも利用できます。 なお、skk辞書形式ではEUC-JPで出力され、ソートや重複の消去、不正なエントリの削除等は一切ないので、 必要なら別のツールで加工してください。 入力ファイルについて: 「|」で変換先と変換元を区切ります。 変換先と変換元のリストは、各項目を「/」で区切ります。 区切り文字の前後に空白は必要ありません(あった場合も無視されません)。 たとえば 例1/例に/例サン/example 4|れいいち/れいに/れいさん/れいよん/ex5 という行があれば、変換後の辞書を使うと 「れいいち」、「れいに」、「れいさん」、「れいよん」、「ex5」のどれを変換しても、候補に 「例1」、「例に」、「例サン」、「example 4」の全てが現れます。 下の例のような、複数の略称や表記があるような言葉の変換がとても楽になるでしょう。 sample commandline: mskk2cdb.sh -s my_jisho.skkdic -c my_jisho.cdb -d "sudo /etc/init.d/multiskkserv restart" find mywords/ -type f '!' -name '.*' -execdir cat '{}' + | mskk2cdb.sh -c my_jisho2.cdb sample input file: ; comment リトルバスターズ!/Little Busters!|りとばす/りとるばすたーず ; This will be converted to: ; リトルバスターズ! /りとばす/りとるばすたーず/ ; Little Busters! /りとばす/りとるばすたーず/ ; You can also write only one item. うみねこのなく頃に|うみねこ ; This will be converted to: ; うみねこのなく頃に /うみねこ/