■「Papa told me 辞書」について (Tue, 16 Feb 93)

●制作の目的

「Papa told me」の話題で盛り上がるとき、人名や地名を正しく
入力できないと、かなりのストレスがたまりませんか?
この辞書を使えば、ほら、「知世ちゃん」「榛野なな恵」etc...
ちゃんと変換できるっしょ。その喜びを味わうこと、
そして「Papa told me」の話題で盛り上がることが目的です。


●データ形式

辞書ファイルのデータ形式は i-dic-2 の形式です。つまり、

	(項目)		(例)
	読み		ちせ
	表記		知世
	分類番号	2
	備考		呼びすてにできるのはお父さんだけ

の各フィールドをタブで区切って、1件につき1行に並べた
テキストファイルです。

「分類番号」は、 I-dic に準拠して、次の意味を持ちます。
但し、一部は意味を変えたり追加しています。

	  1	姓
	  2	名前
	  3	姓名
	  4	姓名の略した読み
	  5	固有名詞
	  6	あだ名から姓名へ及びその逆
	  7	あまり重要でない脇役等 ( make foo-pure で省略される)
	  8	あだ名
	  9	口癖及びセリフなど
	 10	地名
	 11	企業名
	 12	建物及び施設名
	 13	デザイナー姓名
	 14	商品名
	 15	団体名
	 16	番組名
	 17	「Papa told me」のサブタイトル
	 18	榛野なな恵作品の作品名
	101	形容詞
	102	形容動詞
	103	副詞
	104	連体詞
	105	接続詞
	106	助数詞
	107	感動詞
	108	名詞
	109	サ変名詞
	110	動詞
	  0	コメント等	-> これは考えなくてよい

この他に、行頭に # を書いた行をコメント行とします。

登録したい語があったら、MLへのメールに書きます。
簡単に抜き出せるように、先頭に識別符号を付けるといいでしょう。
識別符号は Papa told me の頭文字にコロンで、PTM: にしましょう。
これは義務ではありませんが、見落としを避けるためにご協力下さい。

(例1)
PTM:ちせ	知世	2	呼びすてにできるのはお父さんだけ

(例2 登録しないけどコメントとして書いておく語を抜き出す場合)
PTM:#びーる	でも夢の中のビールは甘くておいしかったの	9

(例3 抜き出さないけどメールには書いておく場合)
#PTM:びーる	でも夢の中のビールは甘くておいしかったの	9

ある程度たまったら抜き出し、重複する語を調整したりしてから
正式リリースにするのがよろしいかと思います。
もちろん、各自がメールを受け取った時点で抜き出して使っても
一向に差し支えありません。


●辞書の利用

基本的に i-dic-2 形式なので、I-dic と同様の利用方法があります。
各種日本語変換FEPの登録辞書にするとか、データベースとか……。
Wnn や ATOK の登録辞書形式にコンバートするための Makefile を
付属する予定です。その他の形式にもなるべく対応させたいので、
皆様のお知恵を拝借したいと思います。


●ファイル一覧

	ptm0216d.lzh	package

	toldme.doc	このファイル
	ptm.i		i-dic-2 形式の辞書ファイル (本編)
	episode.i	i-dic-2 形式の辞書ファイル (サブタイトル集)

    ※以下のファイルは「ツール」として別途アーカイブされます。

	Makefile	辞書ファイル作成 Makefile for UNIX
	MAKEDIC.BAT	辞書ファイル作成バッチファイル for MS-DOS
	wnn4all.awk	Wnn4 形式にコンバートする
	wnn4pure.awk	Wnn4 形式にコンバートする (pure版)
	atokall.awk	ATOK7 形式にコンバートする
	atokpure.awk	ATOK7 形式にコンバートする (pure版)
	atokconv.sed	ATOK7 では使えない文字を修正・削除する
	atokcut.sed	ATOK7 では登録できない語を削除する
	atokj31.sed	ATOK7R (DynaBook) では登録できない語を修正する
	chkfield[.BAT]	辞書ファイルのフィールドを検査する
	pickup[.BAT]	登録する語を抜き出す

以上です。

追加分

以下の追加分は WXG形式(SJIS)です.

ptm.dic EPISODE.106以降全部

ptm106.dic EPISODE.106
ptm107.dic EPISODE.107
ptm108.dic EPISODE.108
ptm109.dic EPISODE.108
ptm110.dic EPISODE.110
ptm111.dic EPISODE.111