ホームページ >

文書管理：Solr提出はrdbms提出に等しくない。

2014/5/19 17:50:00 50

Solrにはいわゆる「更新」、「データ完全性外鍵」または「多表」がないということを知っているかもしれませんが、実質的には、Solr/Luceneはインデックス形式で日増しに増加する文書の集合を管理しています。文書のセットを追加、更新または削除するたびに、Solrは新しいセグメント（一山のファイル）をそのデータディレクトリに追加します。最後のセグメントの数はますます大きくなります。このような状況に対応できる仕組みがあるので、ここでは説明を省略します。

Solrでは、一つを通過します。Searcherオブジェクトはすべての検索クエリを処理できます。Searcherはインデックス構成のセグメントの集合において確立される。ここに提出する役割は簡単です。「Solrに新しいSearcherを生成させ、新しいセグメントを含み、現在のSearcherを原子的に置換します。」

　　スピードを求めすぎないでください。

代価を惜しまないで同時に提出することを免れて、あなたがひっきりなしに新しいSearcherを構築するため、その後またそれを投げました。実際、Searcherを同時に構築すると、Solrの構成に明示的な設定が発生し、厳密な上限が課され、デフォルト値は2である。ですから、同時に提出すれば、異常なスタックを獲得する可能性があります。

新しいSearcherを作成する時間を監視します。Solrにおける新規作成/更新を最適化する文書の応答時間（流行説では「リアルタイム」）は、全体としてSolrが新しいSearcherオブジェクトを生成する時間をできるだけ減らすことです。Solrログを監視し、「イベント=newSearcher」を検索し、それらの行のQTimeを検索します。時間をできるだけ合理的に短くするためです。新しいSeacherを構築するスピードが速くなるので、構築されたSeacherが多くなり、挿入、更新、削除の応答が速くなります。

Solrには二つの主要な提出戦略がある。最初のポリシーは、Solrが一定の時間間隔で提出を完了させることであり、この方法は自動的に提出されるものとして、優先的なポリシーとして考慮されるべきであり、アプリケーションの手動管理からの脱却を助けることができる。実際に、自動提出を使用したら、自分で提出するのは非常に悪い方法になります。Searcherの上限を重ねても自動提出のSearcherに適用されることを覚えてください。だから、Searcherを構築する時間よりも自動提出が長いです。固定時間間隔で自動的に提出するのは問題があります。インデックスが更新されていない場合、定期的に新しいSearcherを構築するのはCPUの無駄です。これも私達のために提出された第二の戦略を指摘してくれます。

譲歩するアプリケーション必要に応じて提出します。同時進行は最悪な方法であり、全体のロック機構を実施するべきである。

　　Searcherにウォーミングアップする

「1つのセグメントだけを追加した新しいSearcherを構築するのはどれぐらい遅いですか？Solrはこの点をよくサポートしていますし、非常に速いと思います」と考えるかもしれません。そうです。そのスピードはとても速いです。

唯一の問題は新しいSearcherの最初のいくつかのクエリが非常に遅くなります。これはよくないです。高容量検索環境では、いくつかの遅いクエリが製品のショートボードとなり、最終的にアプリケーション層に影響を与える可能性がある。これらの最初のクエリが遅い背景にある理由は、新しいSearcherキャッシュに充填されたものが無駄です。Solr用語では、これを「Cold Searcher」と呼ぶ。Solrは「Cold Searcher」を使用することができますが、幸いにもこれは他のSearcherも登録されていない場合にのみ存在します。つまり、Solrのインスタンスが開始された直後だけです。他のすべての場合、Solrはサービス要求に使用される際、クエリの速度があまり遅くないことを確認するために、「Searcher」にウォームアップするいくつかの機構を提供する。

二つのセットが新しいSearcherのウォームアップに影響を与えます。両者を結合して使うべきです。

一つはSolrをセットして、ウォームアップのSearcherを調べます。これらのクエリに対しては、いくつかのリアルタイムアプリケーションの典型的な照会サンプルを作成し、フィルタを除去した後、より一般的に使用できるようにすることができます。鍵は、アプリケーションで使用するさまざまな態様をできるだけ含むことであり、十分な空間があれば、このような方法はメモリに全文インデックスをロードします。

もう一つの方法はキャッシュにautwarmingを作ることです。キャッシュautwarmingは、旧キャッシュの値をウォームアップのSearcherキャッシュに予め充填しておくものです。

体の中のSearcherの鍵は、新しいSearcherと登録Searcherの時間的なバランスを確立するために見つけることです。（新しいSearchを作るのは速いですが、危険です。）このバランスを見つけるには実験が必要です。これらはすべてアプリケーション層の必要に応じています。