[mecab-users 358] mecab-NAIST-jdic-0.5.0のリリースにつきまして

Back to archive index

Masayuki ASAHARA masay****@is*****
2009年 5月 13日 (水) 16:25:00 JST


奈良先端大の浅原です。

 NAIST-jdic の最新版 0.5.0 をリリースいたします。
 http://sourceforge.jp/projects/naist-jdic/
 表記ゆれの情報を付与したものです。

----
2009-05-12: masayu-a -at- is.naist.jp

0.5.0 より出力形式で第10フィールド(CSVの辞書ファイルでは第14フィールドに
表記ゆれの情報を追加しました。自動付与されたものではなく人手によるも
のです。国語研の「表記統合辞書」の第5フィールドに相当する情報を追加して
おります。
http://www.kokken.go.jp/lrc/index.php?%A1%D8%C9%BD%B5%AD%C5%FD%B9%E7%BC%AD%BD%F1%A1%D9%2F%CD%F8%CD%D1%A5%DE%A5%CB%A5%E5%A5%A2%A5%EB
尚、固有名詞には表記ゆれ情報を付与していません。
----

また、複合語情報を付与したものを 2009年6月16日にリリース予定です。
ファイル形式について考慮中で pre1, pre2 の 2 パターンのデータ形式を
現在のところ準備しております。
ご意見など masayu-a -at- is.naist.jp までいただければ幸いです。

----
2009-06-16: masayu-a -at- is.naist.jp

0.6.0 より出力形式で第11フィールド(CSVの辞書ファイルでは第15フィールド)
に複合語の情報を追加しました。自動付与されたものではなく人手によるものです。

尚、固有名詞には原則複合語情報を付与していません。

 ※ pre1 と pre2 とで異なる形式を提示しております。

 pre1 葉ノードの情報のみ付与
 <w><w><w>くろ:クロ:名詞-一般::</w><w>み:ミ:名詞-接尾-一般::</w></w><w>
がかる:ガカル:動詞-接尾:五段・ラ行:基本形</w></w>

 pre2 中間ノードの情報も付与
 <w orth="くろみがかる" form="クロミガカル" pos="動詞-自立" ctype="五
段・ラ行" cform="基本形" ><w orth="くろみ" form="クロミ" pos="名詞-一般"
ctype="" cform="" ><w orth="くろ" form="クロ" pos="名詞-一般" ctype=""
cform="" >くろ</w><w orth="み" form="ミ" pos="名詞-接尾-一般" ctype=""
cform="" >み</w></w><w orth="がかる" form="ガカル" pos="動詞-接尾"
ctype="五段・ラ行" cform="基本形" >がかる</w></w>
----

どうぞよろしくお願いいたします




mecab-users メーリングリストの案内
Back to archive index