[mecab-users 38] Re: 長音符号から始まる固有名詞

Back to archive index

Taku Kudo taku****@chase*****
2006年 2月 2日 (木) 04:10:39 JST


工藤です

> 長音符号「ー」から始まる単語登録が認められ, どうも mecab がそのように
> 振る舞っていることがわかりました.
>
>     % cat test.txt
>     ホームぺージをリニューアル公開いたしました
>     % mecab test.txt
>     ホ      名詞,一般,*,*,*,*,ホ,ホ,ホ
>     ームぺージをリニューアル        名詞,固有名詞,一般,*,*,*,*
>     公開    名詞,サ変接続,*,*,*,*,公開,コウカイ,コーカイ
>     いたし  動詞,非自立,*,*,五段・サ行,連用形,いたす,イタシ,イタシ
>     まし    助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
>     た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
>     EOS
>
> これ, わたしのところだけの現象でしょうか?

ホームページ (すべてカタカナ)は ipadic にあります。
よくよく調べてみると、この文のペはひらがなのぺで、カタカナの
ペではないようです。

いずれにせよ、長音から始まる単語は変なので修正します。
修正後は、ひらがなの「ぺ」を含むこの文は

ホーム  名詞,一般,*,*,*,*,ホーム,ホーム,ホーム
ぺー    名詞,固有名詞,一般,*,*,*,*
ジ      名詞,一般,*,*,*,*,*
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ

と解析されるようになります。

-- taku



mecab-users メーリングリストの案内
Back to archive index