組織に蓄積される非構造化テキスト・データの量はますます増大しており、これらのテキストの読み取りやカタログ化を行う能力をはるかに超えてしまっています。これらのテキスト・ドキュメントの内容について組織がほとんど、あるいはまったく把握できていない状況はよく発生します。純粋な検索テクノロジに基づく従来の “トップダウン” のテキスト分析では、これらのテキストの内容に関して憶測を立てるため、重要なコンテンツを見落としてしまう可能性があります。
InterSystems IRIS® 自然言語処理 (NLP) では、コンテンツについて事前の知識がなくても、さまざまな自然言語の構造化されていないデータ・ソースに対してテキスト分析を実行できます。このためには、意味的エンティティを識別する言語固有の規則を適用します。これらの規則は、内容ではなく、言語に固有のものなので、NLP ではコンテンツに対する洞察を提供するために、ディクショナリやオントロジを使用する必要はありません。