タグ

javaとIRに関するniamのブックマーク (2)

  • 全文検索エンジン「Lucene.Net」を使う


    Lucene.Net.NET FrameworkASP.NET使WebWindowsLucene.Net Lucene.NetApache Software Foundation1JavaLuceneWikipediaWebLucene-java WikiPowerdBy Lucene.NETLucene.NETJavaApache Software FoundationLucene.Ne
    全文検索エンジン「Lucene.Net」を使う
  • Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ

    Luceneは、こちらのベンチマークなどを見る限り、Sennaなど他の全文検索エンジンに比べて相当遅いとされているようです。 上記ページのベンチマークではLucene 2.0が使われています。僕も数年前にLucene 2.0を使ったことがあって、それ以降はLuceneに触れていなかったんですが、最近のバージョンはパフォーマンスが大幅に改善されているそうなので、どれくらい速くなったのか、インデックス作成速度を比較してみました。 比較に使ったのはLucene 2.4.1(2009/03)とLucene 2.0.0(2006/05)です。以下の条件でインデックス作成時間を計測しました。 データ: 日語版Wikipediaのダンプから先頭20万記事 インデックス形式: 記事タイトル: Store.YES, Index.ANALYZED(元文字列+インデックス) 記事文: Store.COMPR

    Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ
  • 1