須藤です。
In
"[groonga-dev,01597] mroongaログのtoo many postingsの警告メッセージの影響について" on Sun, 11 Aug 2013 14:18:57 +0900,
Naoya Murakami wrote:
> ログを見ていて気になったのですが、以下の警告は、何を意味しているのでしょうか?
>
> too many postings(227573) on 21. discarded 96502.
>
> 以下を見てもよくわかりませんでした。言葉通りにとらえると、あまりに多いポスト数なので、
> 実際のポストの数-インデックスの格納に成功したポストの数が捨てられた?
私もうまく説明できないのですが、postingというのはインデックス
に入っているデータのことで、各postingには1つのトークンに関連
した情報が含まれています。例えば、どの文書に含まれていたかと
か、その文書の中で何番目のトークンだったか、などです。
groongaのソースを見てみたところ、1つの文書あたり、最大で
0x1ffff個(= 131071個)のpostingを紐付けることができるみたい
です。エラーメッセージの中には実際のposting数が「227573」で、
捨てたのが「96502」とあるので、227573 - 96502 = 131071と合致
します。
> 実際の検索動作に影響があるか否かを教えてください。
あると思います。
文書の後半にあるトークンは捨てられているので、文書の後半にあ
る内容ではヒットしないのではないかと思います。
--
須藤 功平
株式会社クリアコード (03-6231-7270)
groongaサポート:
http://groonga.org/ja/support/
パッチ採用はじめました:
http://www.clear-code.com/recruitment/
コミットへのコメントサービスはじめました:
http://www.clear-code.com/services/commit-comment.html
_______________________________________________
groonga-dev mailing list
groonga-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/groonga-dev