Yasuharu Den
den****@cogsc*****
2008年 4月 26日 (土) 01:29:37 JST
====================================================================== + + + 日本語形態素解析辞書 UniDic ver. 1.3.8 + + + ====================================================================== 日本語形態素解析辞書 UniDic ver. 1.3.8 を公開します。 フリーの形態素解析システム「茶筌(ChaSen)」と「和布蕪(MeCab)」で利用でき ます。 自然言語処理をはじめ、言語学・国語学や音声情報処理など、多様な目的に適 した体系にもとづいています。 特長: o 国立国語研究所で規定した「短単位」という揺れがない斉一な単位で設計 されています。 o 語彙素・語形・書字形・発音形の階層構造を持ち、表記の揺れや語形の変 異にかかわらず同一の見出しを与えることができます。 o アクセントや音変化の情報を付与することができ、音声処理の研究に利用 することができます。 UniDic ver. 1.3.5 からの変更点: o MeCab版を作成しました(MeCab版はChaSen版よりもさらに高精度です)。 o 語種情報を追加しました。 以下のダウンロードページから、無償でダウンロードできます。 http://download.unidic.org 本件に関するお問い合わせは以下までお願いします。 E-mail: unidi****@kokke***** --- 千葉大学文学部 行動科学科 伝 康晴 den****@cogsc*****