Skip to main content

テキストのロード時のパフォーマンスに関する考慮事項

Important:

インターシステムズは、InterSystems IRIS® 自然言語処理 (NLP) を非推奨Opens in a new tabにしました。インターシステムズ製品の今後のバージョンから削除される可能性があります。以下のドキュメントは、既存ユーザのみに向けたリファレンスとしています。代替のソリューションを見いだすためのサポートを必要とする既存ユーザはインターシステムズのサポート窓口Opens in a new tabにお問い合わせください。

NLP では通常、大量のテキスト・データを処理するため、ソース・テキストのロード時に InterSystems IRIS データ・プラットフォームのパフォーマンスに関する以下の考慮事項に注意する必要があります。

  • 多数のソースのバッチ・ロードを開始する前に、データベースのジャーナリングを停止します。バッチ・ロードが完了した場合は、ジャーナリングを必ず再開します。ジャーナリングの停止と再開の詳細は、"データ整合性ガイド" の “ジャーナリング” の章を参照してください。

  • 多数のソース (または少数の非常に大きなソース) のバッチ・ロードを開始する前に、この操作の処理に十分な大きさのサイズにグローバル・バッファ・プールを設定します。NLP のインデックス作成によって多数の一時グローバルが作成されます。グローバル・バッファ・プールのメモリがこの一時グローバルの処理に十分な大きさでない場合は、ディスクに書き込まれます。このディスク入出力操作によって、NLP のパフォーマンスは大きな影響を受ける可能性があります。詳細は、“メモリと開始設定” を参照してください。

  • NLP のインデックス作成には、ソース・テキストの占有容量より大幅に大きなディスク容量が必要です。一時グローバルと永続的グローバルに必要な概算容量の詳細は、このドキュメントの “実装” の章の “グローバルと必要なディスク容量” のセクションを参照してください。

  • ソースに必要な数を超える言語サポートを構成しないでください。NLP 構成では、実際にソースで使用される言語のみが指定される必要があります。ソースがすべて 1 つの言語である場合は、自動言語識別を指定しないでください。N-gram が言語に要求されないかぎり、EnableNgramsドメイン・パラメータに設定しないでください。

FeedbackOpens in a new tab