Skip to main content

This is documentation for Caché & Ensemble. See the InterSystems IRIS version of this content.Opens in a new tab

For information on migrating to InterSystems IRISOpens in a new tab, see Why Migrate to InterSystems IRIS?

テキストのロード時のパフォーマンスに関する考慮事項

iKnow では通常、大量のテキスト・データを処理するため、ソース・テキストのロード時にパフォーマンスに関する以下の考慮事項に注意する必要があります。

  • 多数のソースのバッチ・ロードを開始する前に、データベースのジャーナリングを停止します。バッチ・ロードが完了した場合は、ジャーナリングを必ず再開します。ジャーナリングの停止と再開の詳細は、"Caché データ整合性ガイド" の “ジャーナリング” の章を参照してください。

  • 多数のソース (または少数の非常に大きなソース) のバッチ・ロードを開始する前に、この操作の処理に十分な大きさのサイズにグローバル・バッファ・プールを設定します。iKnow のインデックス作成によって多数の一時グローバルが作成されます。グローバル・バッファ・プールのメモリがこの一時グローバルの処理に十分な大きさでない場合は、ディスクに書き込まれます。このディスク入出力操作によって、iKnow のパフォーマンスは大きな影響を受ける可能性があります。"Caché システム管理ガイド" の “Caché の構成” の章で “メモリと開始設定” を参照してください。

  • iKnow のインデックス作成には、ソース・テキストの占有容量より大幅に大きなディスク容量が必要です。一時グローバルと永続的グローバルに必要な概算容量の詳細は、このドキュメントの “実装” の章の “グローバルと必要なディスク容量” のセクションを参照してください。

  • ソースに必要な数を超える言語サポートを構成しないでください。iKnow 構成では、実際にソースで使用される言語のみが指定される必要があります。ソースがすべて 1 つの言語である場合は、自動言語識別を指定しないでください。N-gram が言語に要求されないかぎり、EnableNgramsドメイン・パラメータに設定しないでください。

FeedbackOpens in a new tab