■「Papa told me 辞書」について (Tue, 16 Feb 93) ●制作の目的 「Papa told me」の話題で盛り上がるとき、人名や地名を正しく 入力できないと、かなりのストレスがたまりませんか? この辞書を使えば、ほら、「知世ちゃん」「榛野なな恵」etc... ちゃんと変換できるっしょ。その喜びを味わうこと、 そして「Papa told me」の話題で盛り上がることが目的です。 ●データ形式 辞書ファイルのデータ形式は i-dic-2 の形式です。つまり、 (項目) (例) 読み ちせ 表記 知世 分類番号 2 備考 呼びすてにできるのはお父さんだけ の各フィールドをタブで区切って、1件につき1行に並べた テキストファイルです。 「分類番号」は、 I-dic に準拠して、次の意味を持ちます。 但し、一部は意味を変えたり追加しています。 1 姓 2 名前 3 姓名 4 姓名の略した読み 5 固有名詞 6 あだ名から姓名へ及びその逆 7 あまり重要でない脇役等 ( make foo-pure で省略される) 8 あだ名 9 口癖及びセリフなど 10 地名 11 企業名 12 建物及び施設名 13 デザイナー姓名 14 商品名 15 団体名 16 番組名 17 「Papa told me」のサブタイトル 18 榛野なな恵作品の作品名 101 形容詞 102 形容動詞 103 副詞 104 連体詞 105 接続詞 106 助数詞 107 感動詞 108 名詞 109 サ変名詞 110 動詞 0 コメント等 -> これは考えなくてよい この他に、行頭に # を書いた行をコメント行とします。 登録したい語があったら、MLへのメールに書きます。 簡単に抜き出せるように、先頭に識別符号を付けるといいでしょう。 識別符号は Papa told me の頭文字にコロンで、PTM: にしましょう。 これは義務ではありませんが、見落としを避けるためにご協力下さい。 (例1) PTM:ちせ 知世 2 呼びすてにできるのはお父さんだけ (例2 登録しないけどコメントとして書いておく語を抜き出す場合) PTM:#びーる でも夢の中のビールは甘くておいしかったの 9 (例3 抜き出さないけどメールには書いておく場合) #PTM:びーる でも夢の中のビールは甘くておいしかったの 9 ある程度たまったら抜き出し、重複する語を調整したりしてから 正式リリースにするのがよろしいかと思います。 もちろん、各自がメールを受け取った時点で抜き出して使っても 一向に差し支えありません。 ●辞書の利用 基本的に i-dic-2 形式なので、I-dic と同様の利用方法があります。 各種日本語変換FEPの登録辞書にするとか、データベースとか……。 Wnn や ATOK の登録辞書形式にコンバートするための Makefile を 付属する予定です。その他の形式にもなるべく対応させたいので、 皆様のお知恵を拝借したいと思います。 ●ファイル一覧 ptm0216d.lzh package toldme.doc このファイル ptm.i i-dic-2 形式の辞書ファイル (本編) episode.i i-dic-2 形式の辞書ファイル (サブタイトル集) ※以下のファイルは「ツール」として別途アーカイブされます。 Makefile 辞書ファイル作成 Makefile for UNIX MAKEDIC.BAT 辞書ファイル作成バッチファイル for MS-DOS wnn4all.awk Wnn4 形式にコンバートする wnn4pure.awk Wnn4 形式にコンバートする (pure版) atokall.awk ATOK7 形式にコンバートする atokpure.awk ATOK7 形式にコンバートする (pure版) atokconv.sed ATOK7 では使えない文字を修正・削除する atokcut.sed ATOK7 では登録できない語を削除する atokj31.sed ATOK7R (DynaBook) では登録できない語を修正する chkfield[.BAT] 辞書ファイルのフィールドを検査する pickup[.BAT] 登録する語を抜き出す 以上です。
以下の追加分は WXG形式(SJIS)です.
ptm.dic EPISODE.106以降全部
ptm106.dic EPISODE.106
ptm107.dic EPISODE.107
ptm108.dic EPISODE.108
ptm109.dic EPISODE.108
ptm110.dic EPISODE.110
ptm111.dic EPISODE.111