asdferqew

<<[*]前の記事へ  [#]次の記事へ>>

[groonga-dev,01606] Re:mroongaログのtoo many postingsの警告メッセージの影響について
(asdferqew at 08/12 18:18)
須藤です。

In
"[groonga-dev,01597] mroongaログのtoo many postingsの警告メッセージの影響について" on Sun, 11 Aug 2013 14:18:57 +0900,
Naoya Murakami wrote:

> ログを見ていて気になったのですが、以下の警告は、何を意味しているのでしょうか?
>
> too many postings(227573) on 21. discarded 96502.
>
> 以下を見てもよくわかりませんでした。言葉通りにとらえると、あまりに多いポスト数なので、
> 実際のポストの数-インデックスの格納に成功したポストの数が捨てられた?

私もうまく説明できないのですが、postingというのはインデックス
に入っているデータのことで、各postingには1つのトークンに関連
した情報が含まれています。例えば、どの文書に含まれていたかと
か、その文書の中で何番目のトークンだったか、などです。

groongaのソースを見てみたところ、1つの文書あたり、最大で
0x1ffff個(= 131071個)のpostingを紐付けることができるみたい
です。エラーメッセージの中には実際のposting数が「227573」で、
捨てたのが「96502」とあるので、227573 - 96502 = 131071と合致
します。

> 実際の検索動作に影響があるか否かを教えてください。

あると思います。
文書の後半にあるトークンは捨てられているので、文書の後半にあ
る内容ではヒットしないのではないかと思います。

--
須藤 功平
株式会社クリアコード (03-6231-7270)

groongaサポート:
http://groonga.org/ja/support/
パッチ採用はじめました:
http://www.clear-code.com/recruitment/
コミットへのコメントサービスはじめました:
http://www.clear-code.com/services/commit-comment.html

_______________________________________________
groonga-dev mailing list
groonga-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/groonga-dev

コメント(0)
トラックバック(0)

<<[*]前の記事へ  [#]次の記事へ>>

このブログのトップ
Seesaaブログ