Taku Kudo
taku****@chase*****
2006年 1月 14日 (土) 01:38:28 JST
工藤です 確かに不思議な現象ですね。 とりあえず、perl の該当部分の処理を C++ のバイナリで行うようにしました。 こちらのほうが高速ですし、環境依存性が減ると思います。 --taku > > どこの処理でとまっているのかは調べていませんが、 > > mecab-dict-index は Perl なので、どこかでパターンマッチングが爆発 > > して、非常に時間がかかっているのかもしれません。(環境依存だし...。) > > どこで処理が止まっているのかを調べたところ、convdic の中の > > @dic = sort { $a->[0] cmp $b->[0] } @dic; > > という部分でとまっているようです。 > $a->[0] と $b->[0] を表示させると、 > > : > 槇,槇山 > 槇山,槇一 > 槇山,槇下 > 槇山,槇原 > 槇山,槇川 > 槇川,槇尾 > 槇尾,槇代 > 槇尾,槇谷 > 槇尾,槇塚台 > 槇尾,槇島 > 槇尾,槇本 > 槇本,槇尾山 > 槇本,槇野々 > 遙堪,槇野々 > 遙堪,槇野地 > --> ここでピタッととまります。HDDはアクセスしたままです。