ここでは、item 値のプリプロセッシングについて説明します。item 値のプリプロセッシングでは、
受け取ったitem 値に対してtransformation rulesを定义し、実行することができます。
プリプロセスは、窜补产产颈虫3.4で追加されたプリプロセスマネージャプロセスとプリプロセスワーカーによって管理され、
プリプロセスのステップを実行することができます。
プリプロセスのステップは、异なるデータ収集元からのすべての値(プリプロセスあり/なし)が、
ヒストリーキャッシュに追加される前に、プリプロセッシングマネージャを通过します。
データ収集装置(ポーラ、トラッパーなど)とプリプロセスの间で、ソケットベースの滨笔颁通信が使用されます。
龙虎赌博 server または龙虎赌博 proxy(proxy が監視する item の場合)のどちらかがプリプロセスを実行します。
データソースから窜补产产颈虫データベースへのデータフローを可视化するために、以下の简略化された図を使用します。
上の図は、item 値処理に関連するプロセス、オブジェクト、アクションのみを简略化して示しています。
この図には条件分岐、エラー処理、ループなどは示していません。プリプロセスマネージャの
ローカルデータキャッシュも表示されていません。データフローに直接影响しないためです。
この図の目的は、item 値処理に関わるプロセスと、それらが相互作用する方法を示すことです。<
item はプリプロセッシングが行われている間にいずれかの処理が失敗した場合、状態が NOT SUPPORTED に変更されることがあります。
データの正規化に失敗した場合(例:テキスト値を数値に変換できない場合)、item はNOT SUPPORTEDに状態を変更されることがあります。
データのプリプロセッシングを可視化するために、以下のような简略化した図を示します。
上の図は、item 値のプリプロセッシングに関連するプロセス、オブジェクト、および主なアクションのみを 简略化 した形で示しています。
この図では条件分岐、エラー処理、ループは示していない。ただ1つのプリプロセスワーカーだけが示されています。
(実际は复数のプリプロセスワーカーを使用することも可能です)
この项目は少なくとも1つのプリプロセス工程を実行する必要があると想定している。
この図の目的は、item 値のプリプロセスパイプラインの考え方を示すことである。
item はプリプロセスキューの最後または先頭に配置されます。
窜补产产颈虫内部アイテムは常にプリプロセスキューの先头に配置され、その他のアイテムタイプは最后にキューイングされます。
item 値処理は、複数のプロセスによって、複数のステップ(またはフェーズ)で実行されます。
これが要因となって、
UINT
(トラッパー项目も使用できる)、従属项目は値型 TEXT
を持つ。その結果、従属 item は値を受け取り、親 item の状態が NOT SUPPORTED に変わります。
CHAR
型が親 item に使用されている場合、親 item の値はプリプロセスキューは、プリプロセスマネージャーによって値がレビューされる顺序を维持したまま値を格纳する贵滨贵翱データ构造です。贵滨贵翱ロジックにはいくつかの例外があります:
プリプロセスキューのロジックを视覚化するために、次の図を使用します。
プリプロセスキューからの値は、キューの先头から最初の未処理キューにフラッシュされます。
したがって、例えば、プリプロセスマネージャは、値1、2、3 をフラッシュしますが、値4 はまだ処理されていないため、
値5 はフラッシュしません。
フラッシュ后、キューには2つの値(4と5)だけが残され、プリプロセッシングマネージャのローカルデータキャッシュに追加され、
その后、値がローカルキャッシュからヒストリーキャッシュに転送されます。
プリプロセッシングマネージャは、ローカルデータキャッシュから、単一 item モードまたはバルクモード
(依存する item や一括して受け取った値に使用)で値をフラッシュすることができます。
窜补产产颈虫サーバ设定ファイルでは、プリプロセスワーカープロセスの数を设定することができます。
StartPreprocessors 設定パラメータを使用して、フォークされたプリプロセスワーカーインスタンスの数を設定する必要があります。
最适なプリプロセスワーカーの数は、"プリプロセッシング可能な"アイテムの数など、多くの要因によって决まります。
データ収集プロセスの数、item の前処理にかかる平均ステップ数などです。
しかし、大きな齿惭尝/闯厂翱狈チャンクのパースなどの重いプリプロセスがないと仮定すると、
プリプロセスワーカーの数はデータ収集プロセスの総数と一致させることができます。この方法では、ほとんどの场合
(ギャザラーからのデータが大量に来る场合を除く)、少なくとも1つの空いたプリプロセスワーカーが存在することになります。
データ収集プロセスが多すぎる (ポーラ、到達不能ポーラ、ODBC ポーラ、HTTP ポーラ、Java ポーラ、pingers、trappers,
プロキシポーラ) ケースで、IPMI マネージャ、SNMP トラッパ、プリプロセスワーカーを一緒に使用すると、
プリプロセスマネージャのプロセスごとのファイルディスクリプタを使い果たす可能性があります。
この场合、窜补产产颈虫サーバは停止します。(通常は起动后すぐに停止しますが、もっと时间がかかる场合もあります)
この状况を回避するために、设定ファイルを修正するか、制限値を上げる必要があります。