Skip to main content

ドメイン・アーキテクト

Important:

インターシステムズは、InterSystems IRIS® 自然言語処理 (NLP) を非推奨Opens in a new tabにしました。インターシステムズ製品の今後のバージョンから削除される可能性があります。以下のドキュメントは、既存ユーザのみに向けたリファレンスとしています。代替のソリューションを見いだすためのサポートを必要とする既存ユーザはインターシステムズのサポート窓口Opens in a new tabにお問い合わせください。

InterSystems IRIS には、NLP ドメインの作成、NLP ドメインへのデータの移入、およびインデックス付きデータに対する分析の実行のために、対話型インタフェースとしてドメイン・アーキテクトがあります。ドメイン・アーキテクトにアクセスするには、InterSystems IRIS 管理ポータルを使用します。

これは、以下の 3 つのツールで構成されています。

  • ドメイン・アーキテクト (このページで説明) : NLP ドメインを作成し、そのドメインにソース・テキスト・データを移入するためのツールです。

  • ドメイン・エクスプローラ : 特定のエンティティに注目することで、NLP ドメイン内のデータを分析するためのツールです。

  • インデックス作成結果 : NLP が、ソースに含まれるテキスト・データをどのように分析したかについて表示するためのツールです。さまざまなタイプのエンティティを示すために強調表示が使用されます。

ドメイン・アーキテクトが提供するすべての機能は、ObjectScript を使用して、NLP クラスのメソッドとプロパティを呼び出すことでも使用できます。

アーキテクトへのアクセス

ドメイン・アーキテクトにアクセスする場合の開始点は、管理ポータルの [Analytics] オプションになります。ここから、[Text Analytics] オプションを選択します。これにより、[ドメイン・アーキテクト] オプションが表示されます。

すべての NLP ドメインは、特定のネームスペース内に存在します

ネームスペースは、使用する前に、NLP 対応にしておく必要があります。NLP 対応ネームスペースを選択すると、NLP の [ドメイン・アーキテクト] オプションが表示されます。

Note:

NLP 対応ネームスペースを選択しても [ドメイン・アーキテクト] オプションが表示されない場合、そのユーザには有効な NLP ライセンスがありません。管理ポータルのヘッダで、[ライセンス先] を調べてください。ライセンス・キーを確認するか、有効にしてください。

ネームスペースの有効化

ネームスペースは、ドメイン・アーキテクトで使用する前に、NLP 対応にしておく必要があります。

  • 現在のネームスペースが NLP 対応の場合、[ドメイン・アーキテクト] オプションにドメイン・アーキテクトが表示されます。

    別の NLP 対応のネームスペースを選択するには、管理ポータル・インタフェース・ページの上部にある [変更] オプションを使用します。これにより、利用可能なネームスペースのリストが表示され、その中から選択できます。

  • 現在のネームスペースが NLP 対応でない場合は、[Analytics] オプションに、Analytics 対応のネームスペースのリストが表示されます。表示されたネームスペースの 1 つを選択します。

  • NLP 対応のネームスペースが存在しない場合、[Analytics] オプションには、いずれのオプションも表示されません。

管理ポータルからネームスペースを NLP に対して有効にするには、[システム管理][セキュリティ][アプリケーション][ウェブ・アプリケーション] を選択します。これにより、Web アプリケーションのリストが表示されます。3 番目の列には、リストされた項目がネームスペースであるか ([はい])、ネームスペースでないかが示されます。リストから、目的のネームスペース名を選択します。これにより、[ウェブ・アプリケーション編集] ページが表示されます。ページの [有効] セクションで、[Analytics] チェック・ボックスにチェックを付けます。[保存] ボタンをクリックします。

%SYS ネームスペースを有効にすることはできません。これは、%SYS ネームスペースにおいて NLP ドメイン作成が不可能となっているためです。

管理ポータルの既定のネームスペースを設定できます。管理ポータルで、[システム管理][セキュリティ][ユーザ] を選択します。目的のユーザの名前を選択します。これにより、ユーザ定義を編集できるようになります。[一般] タブで、ドロップダウン・リストから [開始ネームスペース] を選択します。[保存] をクリックします。

ドメインの作成

ドメイン・アーキテクトで、[新規作成] ボタンをクリックして、ドメインを定義します。以下のドメイン値を記載された順序で指定します。

  • [ドメイン名] : ドメインに割り当てる名前は、現在のネームスペースに対して一意にする必要があります (パッケージ・クラス内で一意にするだけではいけません)。ドメイン名に、長さの制限はありません。また、入力可能な任意の文字 (スペースを含む) を使用できます (% 文字も有効ですが、その使用を避けてください)。ドメイン名は、大文字と小文字が区別されません。ただし、ドメイン・アーキテクトは、既定のドメイン定義クラス名を生成する際に、ドメイン名を使用するため、ドメインに名前を付けるときには、やむを得ない理由があり、ほかに方法がない場合を除いて、クラスの名前付け規約に従うことをお勧めします。

  • [定義クラス名] : ピリオドで区切られた、ドメイン定義パッケージ名とクラス名。最初にドメイン名を指定した場合は、[定義クラス名] をクリックすることで、ドメイン定義パッケージとクラスの既定の名前が生成されます。パッケージ名は、既定で User に設定されます。クラス名は、既定でドメイン名に設定されます (英数字以外の文字は取り除かれます)。この既定値は、そのまま使用することも、変更することもできます。

    有効なパッケージ名とクラス名には、英数字のみ使用できます (大文字と小文字が区別されます)。既存のパッケージ名と大文字小文字のみが異なるパッケージ名を指定すると、エラーが発生します。パッケージ内で既存のクラス名と大文字小文字のみが異なるクラス名を指定すると、エラーが発生します。

  • [カスタム更新の許可] : (オプション) このドメインに、データまたはディクショナリを手動で追加する場合は、これを選択します。既定では、カスタムの更新は許可されません。

[完了] ボタンをクリックして、ドメインを作成します。これにより、[モデル要素] の選択画面が表示されます。

新しく作成したドメインは、終了前に [保存] して、[コンパイル] する必要があります。

重複したドメイン名を作成しようとすると、ドメイン・アーキテクトから "このドメイン名はすでに使用されています" というエラーが発行されます。

その他の方法でドメインを作成する場合は、"NLP ドメイン" を参照してください。ドメイン・アーキテクトは、ドメイン定義パッケージ名とクラス名を定義できる、単なるドメイン作成インタフェースであることに注意してください。

ドメインを開く方法

管理ポータル・インタフェースを使ってドメインを作成すると、そのドメインが直ちに開き、新しいドメインをすぐに管理できます。

既存のドメインを管理するには、[開く] ボタンをクリックして、ネームスペース内に存在するすべてのドメインをリスト表示します。この表示ではドメインを含むパッケージがリストされます。パッケージを選択してそのドメインを表示します。既存のドメインを選択します。これにより、[モデル要素] の選択画面が表示されます。

ドメイン定義の変更

ドメインを作成したり開いたりすると、[モデル要素] ウィンドウが表示されます。このウィンドウ内でドメイン名をクリックすると、[詳細] タブに、[ドメイン名] フィールド、[ドメイン・テーブル・パッケージ] フィールド、[カスタム更新の許可] および [無効] のチェック・ボックスが表示されます。ドメインに関するこのような特性は、変更が可能です。

  • [ドメイン名] を変更すると、モデル要素の表示名が変更されます。[開く] ドメイン・ボタンで表示される [定義クラス名] は変更されません。

  • [ドメイン・テーブル・パッケージ] を指定すると、ドメインのデータのテーブル・プロジェクションが指定したパッケージに生成されます。

  • [カスタム更新を許可] チェック・ボックスにチェックを付けると、ドメイン・アーキテクト以外のインタフェースを使用して、データ・ソースとディクショナリをこのドメインに手動でロードできるようになります。

  • [無効] チェック・ボックスにチェックを付けると、ビルド操作中にいずれのデータ (ソース・データ、メタデータ、ディクショナリ・マッチング・データ) もロードできなくなります。これらのデータ型それぞれに個別の [無効] チェック・ボックスがあり、データ型ごとに個別にロードを無効にできます。

名前を変更したドメインは、終了前に [保存] して、[コンパイル] する必要があります。

ドメインの削除

現在のドメインを削除するには、[削除] ボタンをクリックします。すると、[削除] ドメイン・データ・ウィンドウが表示されます。ドメインの内容だけを削除したり、ドメインの定義を削除したりできます。[ドメインおよび定義クラスの削除] をクリックして、ドメインと、そのドメインに関連付けられたクラス定義を削除します。データ・ソース、skiplist、およびその他のモデル要素の仕様も削除します。

モデル要素

ドメインの作成後、または既存のドメインを開いた後で、そのドメインのモデル要素を定義できます。モデル要素を追加または変更するには、いずれかの見出しの横にある、展開表示用の三角形をクリックします。初期状態では、展開表示は行われません。いくつかのモデル要素を定義した後で、展開表示用の三角形をクリックすると、定義したモデル要素が表示されます。

モデル要素を追加するには、見出しをクリックします。その後で、右側の [詳細] タブに表示される [追加] ボタンをクリックします。名前と値を指定します。[詳細] の領域から別の場所に移動すると、モデル要素が自動的に生成されます。モデル要素は作成順にリスト表示され、一番最後に作成した要素がリストの先頭に配置されます。モデル要素を変更しても、リスト内での位置は変わりません。

モデル要素を変更するには、見出しを展開して、定義済みのモデル要素をクリックします。現在の値は、右側の [詳細] タブに表示されます。必要に応じて、名前や値を変更します。[詳細] の領域から別の場所に移動すると、モデル要素が自動的に再生成されます。

モデル要素の作成が完了したら、[すべて展開] ボタン (または展開表示用の三角形のいずれか) をクリックして、これらの定義済みの値を表示します。[要素タイプ] 列には、各モデル要素のタイプが表示されます。赤色の “X” をクリックすると、そのモデル要素が削除されます。

[保存] ボタンをクリックすると、すべての変更内容が保存されます。未保存の変更がある場合は、[ドメイン・アーキテクト] のページ見出しの後に、アスタリスク (*) が表示されます。[保存] をクリックして、変更内容を保存します。

[元に戻す] ボタンをクリックすると、直近の未保存の変更が元に戻されます。[元に戻す] を繰り返しクリックして、変更を加えたときと逆の順序で、未保存の変更を元に戻すことができます。一度変更を保存すると、このボタンは表示されなくなります。

以下の [モデル要素] が用意されています。

ドメイン設定

このモデル要素を使用すると、ドメインの特性を変更できます。すべてのドメイン設定はオプションであり、既定値が採用されます。[ドメイン設定] には、以下のオプションがあります。

  • [言語] : テキスト・データ内で NLP が識別するようにする言語を 1 つ以上選択します。複数の言語にチェックを付けると、自動言語識別が有効になります。これにより、テキストに対して要求される処理が増加します。そのため、選択した言語のテキストが実際にデータ・セットの一部になる見込みがない場合には、複数の言語を選択しないでください。既定の言語は、英語です。

  • [パラメータの追加] : このボタンを使用すると、ドメイン・パラメータの値を指定できます。ドメイン・パラメータは、空のドメインにのみ追加できます。つまり、目的のドメイン・パラメータをすべて追加してから、[データ位置] を指定してドメインを [ビルド] する必要があります。そうしないと、ドメイン・パラメータを追加、変更、または削除するための [コンパイル] は失敗し、エラー・メッセージが表示されます。[削除] ボタンを使用してドメインの内容を削除すると、ドメイン・パラメータを追加、変更、または削除することができます。

    パラメータを追加するには、ドメイン・パラメータの名前と新しい値を指定します。ドメイン・パラメータ名は、大文字と小文字が区別されます。どちらの名前形式も使用できます。例えば、Name=SortField、Value=1 や Name=$$$IKPSORTFIELD、Value=1 のように指定します。検証は実行されません。すべての未指定のドメイン・パラメータには、既定値が採用されます。追加したパラメータを表示するには、[ドメイン設定] の見出しを展開します。

  • [最大概念長] : 概念としてインデックスを付ける必要のある、単語の最大数です。このオプションは、長いシーケンスの単語が概念としてインデックス付けされないようにするために提供されています。既定値 (0) は、単語の最大数に対する言語固有の既定値を使用します。変更する特別な理由がない限り、この既定値を使用する必要があります。

  • [ユーザ・ディクショナリの管理] : このボタンを使用すると “[ユーザ・ディクショナリの管理]” ボックスが表示され、そこで 1 つ以上の文字列をユーザ・ディクショナリに指定できます。指定された文字列のそれぞれは、新しい文字列に書き直す文字列を指定するか、ドロップダウン・リストから属性レベルを割り当てる文字列を指定します。

メタデータ・フィールド

[メタデータの追加] : このボタンを使用すると、ソース・メタデータ・フィールドを指定できます。それぞれのメタデータ・フィールドに、フィールド名、データ型 (String、Number、または Date)、サポートされる操作、およびストレージ・タイプを指定します。ドメインの作成後、必要に応じて、ソースをフィルタ処理するための条件として使用できるメタデータ・フィールドを 1 つまたは複数指定できます。メタデータ・フィールドは、NLP データ・ソースに関連付けられたデータで、NLP がインデックスを作成しないデータです。例えば、テキスト・ソースがロードされた日時は、そのソースのメタデータ・フィールドです。メタデータ・フィールドは、テキスト・データ・ソースをドメインにロードする前に定義する必要があります。

[大小文字区別] チェック・ボックス : 既定では、メタデータ・フィールドは大小文字を区別しません。大小文字を区別させるには、このボックスにチェックを付けます。

[無効] チェック・ボックス : [無効] チェック・ボックスにチェックを付けると、すべてのメタデータ・フィールドを無効にできます。または個々のメタデータ・フィールドと共に表示されている [無効] チェック・ボックスにチェックを付けると、そのメタデータ・フィールドのみを無効にできます。無効化したフィールドは、ビルド操作時にロードされません。

ここで指定したメタデータ・フィールドは、[メタデータ・マッピング] というタイトルの下にある、データ位置の詳細項目 [テーブルからのデータの追加] および [クエリからのデータの追加] に表示されます。

データ位置

追加するデータのソースを指定します。オプションには、[テーブルからのデータの追加][クエリからのデータの追加][ファイルからのデータの追加][RSS データの追加]、および [グローバルからのデータの追加] があります。

  • [ビルド前に既存のデータを削除する] チェック・ボックスを使用すると、ここで指定したソース・テキスト・データを追加する前に、この NLP ドメインのインデックス作成済みのソース・テキスト・データを削除するかどうかを指定できます。このチェック・ボックスを使用してデータを削除する場合は、データのロードを無効にすることはできません。新しいデータをロードすることなく、既存のデータを削除するには、[削除] ボタンの [ドメインのコンテンツのみ削除] オプションを使用します。

  • [無効] チェック・ボックスを使用すると、ソースのインデックス作成を無効にできます。無効にしたソース・データは、ビルド操作時にロードされません。データのロードが無効にされていると、[ビルド前に既存のデータを削除する] チェック・ボックスは無視されます。

    多数のテキストに対するビルド操作は、時間がかかる場合があります。すでにデータ位置をロードしてから、メタデータまたはマッチング・ディクショナリを追加または変更したい場合は、データ位置の [無効] チェック・ボックスにチェックを付けて、データ位置を再ロードすることなくこれらのモデル要素にインデックスを作成できます。

データ位置を指定した後に、ドメインを [保存] および [コンパイル] してから、[ビルド] ボタンを選択して、データのインデックスをビルドする必要があります。

[テーブルからのデータの追加]

このオプションを使用すると、現在のネームスペース内に存在する SQL テーブルに保存されたデータを指定できます。このオプションには、以下のフィールドがあります。

  • [名前] : 抽出対象の結果セット・テーブルの名前を指定するか、そのテーブルの既定の名前を採用します。SQL テーブルの名前付け規約に従ってください。既定の名前は Table_1 です (抽出対象の結果セット・テーブルを追加で定義するたびに、整数がインクリメントされます)。

  • [バッチモード] : ソース・テキスト・データをバッチ・モードでロードするかどうかを示すチェック・ボックスです。

  • [スキーマ] : このドロップダウン・リストから、現在のネームスペースに存在するスキーマを選択します。

  • [テーブル名] : このドロップダウン・リストから、選択したスキーマ内に存在するテーブルを選択します。

  • [ID フィールド] : このドロップダウン・リストでは、選択したテーブルから ID フィールド (プライマリ・レコード識別子) として機能するフィールドを選択します。ID フィールドには、NULL 以外の一意の値が格納されている必要があります。

    ドロップダウン・リストから [カスタム] を選択するとフィールド名を入力できます (例えば、非表示の RowId フィールドや (まだ) 存在していないフィールド)。フィールド名は、大文字と小文字が区別されません。[カスタム] を選択すると、[既定のオプションを表示する] ボタンも表示されます。このボタンは、ドロップダウン・リストからテーブルの最初の非表示ではないフィールドを選択します。また、フィールドのドロップダウン・リストに戻ることもできます。

  • [グループ・フィールド] : 選択したテーブルからセカンダリ・レコード識別子を取得する SQL select-item 式です。このフィールドは、既定で最初の [ID フィールド] の選択に設定されています。

    ドロップダウン・リストから [カスタム] を選択するとフィールド名を入力できます (例えば、非表示の RowId フィールドや (まだ) 存在していないフィールド)。フィールド名は、大文字と小文字が区別されません。[カスタム] を選択すると、[既定のオプションを表示する] ボタンも表示されます。このボタンは、ドロップダウン・リストからテーブルの最初の非表示ではないフィールドを選択します。また、フィールドのドロップダウン・リストに戻ることもできます。

  • [データ・フィールド] : このドロップダウン・リストでは、選択したテーブルから、データ・フィールドとして機能するフィールドを選択します。データ・フィールドには、NLP インデックス作成に向けてロードしたテキスト・データが格納されます。データ型 %String または %Stream.GlobalCharacter (文字ストリーム・データ) のフィールドを指定できます。

    ドロップダウン・リストから [カスタム] を選択するとフィールド名を入力できます (例えば、非表示の RowId フィールドや (まだ) 存在していないフィールド)。フィールド名は、大文字と小文字が区別されません。[カスタム] を選択すると、[既定のオプションを表示する] ボタンも表示されます。このボタンは、ドロップダウン・リストからテーブルの最初の非表示ではないフィールドを選択します。また、フィールドのドロップダウン・リストに戻ることもできます。

  • [WHERE 節] : 結果セット・テーブルに取り込むレコードを限定するために、必要に応じて SQL WHERE 節を指定できます。WHERE キーワードは含めないでください。Where 節は検証されません。

このドメインに対して 1 つ以上のメタデータ・フィールドを定義済みの場合、[メタデータ・マッピング] オプションでこのテーブルのメタデータ・フィールドを指定できます。ドロップダウン・リストから、選択されたテーブルのフィールドを選択するか、[マップなし] を選択するか、[カスタム] を選択できます。[カスタム] を選択すると、アーキテクトは空のフィールドを表示します。このフィールドに、カスタム・マッピングを指定できます。

このドメインに対してメタデータ・フィールドが定義されていない場合、[メタデータのマッピング] オプションでは、[メタデータを追加] ドメイン・オプションを表示する [メタデータの宣言] ボタンが用意されています。

[クエリからのデータの追加]

[クエリからのデータの追加] は、[テーブルからのデータの追加] とほとんど同じですが、既存のテーブル (複数も可) に対する整形式の SQL クエリを指定できます。このテーブルから、以下のフィールドを指定します。

  • [名前] : 抽出対象の結果セット・テーブルの名前を指定するか、そのテーブルの既定の名前を採用します。SQL テーブルの名前付け規約に従ってください。既定の名前は Query_1 です (抽出対象の結果セット・テーブルを追加で定義するたびに、整数がインクリメントされます)。

  • [バッチモード] : ソース・テキスト・データをバッチ・モードでロードするかどうかを示すチェック・ボックスです。

  • [SQL] : クエリ・テキストです (InterSystems SQL SELECT 文)。クエリを定義すると、JOIN 構文を使用して、複数のテーブルからフィールドを選択できます。複数のテーブルを指定する場合は、選択したフィールドに列エイリアスを割り当てます。また、クエリを定義すると、グループ・フィールドとして使用可能な式フィールドを指定できます。

    クエリ文字列に構文エラーが含まれていたり、存在しない項目を参照している場合、[保存] ボタンを押すと SQLCODE エラーとメッセージが表示されます。エラーを確認すると、クエリが保存されます。SQL クエリ文字列フィールドに戻って、エラーを修正します。

    以下のフィールド選択ドロップダウン・リストには、選択したフィールドが表示されます。テーブル・エイリアス接頭語は表示されません。フィールドに列エイリアスがある場合、フィールド名ではなく、このエイリアスがリストされます。

  • [ID フィールド] : このドロップダウン・リストでは、選択したテーブルから、ID フィールドとして機能するフィールドを選択します。ID フィールドには、NULL 以外の一意の値が格納されている必要があります。

  • [グループ・フィールド] : このドロップダウン・リストでは、クエリからセカンダリ・レコード識別子 (グループ・フィールド) として機能する select-item 式 (SQL 関数式など) を選択します。例えば、YEAR(EventDate) などです。

  • [データ・フィールド] : このドロップダウン・リストでは、選択したテーブルから、データ・フィールドとして機能するフィールドを選択します。データ・フィールドには、NLP インデックス作成に向けてロードしたテキスト・データが格納されます。

このドメインに対して 1 つ以上のメタデータ・フィールドを定義済みの場合、[メタデータ・マッピング] オプションで、各定義済みのメタデータ・フィールドに対して [マップなし] または [カスタム] のどちらかを選択できます。既定値は [マップなし] です。[カスタム] を選択すると、アーキテクトは空のフィールドを表示します。このフィールドに、カスタム・マッピングを指定できます。

このドメインに対してメタデータ・フィールドが定義されていない場合、[メタデータのマッピング] オプションでは、[メタデータを追加] ドメイン・オプションを表示する [メタデータの宣言] ボタンが用意されています。

[モデル要素] ウィンドウの [要素タイプ] 列には、FROM 節内の最初のテーブル名以降が切り詰められた形式で、定義したクエリが表示されます。完全なクエリは、[詳細] ウィンドウに表示されます。

ファイルからデータを追加

このオプションを使用すると、ファイルに保存されたデータを指定できます。このオプションには、以下のフィールドがあります。

  • [名前] : 抽出対象のデータ・ファイルの名前を指定するか、そのファイルの既定の名前を採用します。既定の名前は File_1 です (抽出対象のデータ・ファイルを追加で定義するたびに、整数がインクリメントされます)。

  • [パス] : 目的のファイルが格納されているディレクトリへの、完全なディレクトリ・パスです。パスの構文は、ファイルシステムによって異なります。Windows システムの場合は、以下のようになります。C:\\temp\NLPSources\

  • [拡張子] : ファイルの拡張子です (txtxml など)。ファイル拡張子を指定する場合は、先頭のドットを含めないでください。複数の拡張子は、コンマ区切りリストとして指定します。例えば、txt,xml のようにドットやスペースは含めません。これを指定すると、指定した拡張子を含むファイルのみが、結果として抽出されるデータに含まれます。[拡張子] フィールドを空白 (既定) のままにすると、拡張子に関係なく、すべてのファイルが含まれます。

  • [エンコーディング] : ファイルの処理に使用する、文字セット・エンコーディングの種類のドロップダウン・リストです。

  • [フィルタ条件] : 結果として抽出されるデータに含めるファイルを制限するために使用する条件です。

  • [再帰] : 再帰的にファイルを選択するかどうかを示すチェック・ボックスです。チェックを付けると、指定したディレクトリに含まれるファイルと、そのディレクトリのすべてのサブディレクトリに含まれるファイルからデータを抽出できます。チェックを付けない場合は、指定したディレクトリ内のファイルからのみデータを抽出できます。既定は、非再帰です (チェック・ボックスにチェックが付いていません)。

  • [バッチモード] : ソース・テキスト・データをバッチ・モードでロードするかどうかを示すチェック・ボックスです。

[RSS データの追加]

このオプションを使用すると、RSS ストリーム・フィードからのデータを指定できます。このオプションには、以下のフィールドがあります。

  • [名前] : 抽出対象のデータの名前を指定するか、そのデータの既定の名前を採用します。既定の名前は RSS_1 です (抽出対象の RSS ソースを追加で定義するたびに、整数がインクリメントされます)。

  • [バッチモード] : ソース・テキスト・データをバッチ・モードでロードするかどうかを示すチェック・ボックスです。

  • [サーバ名] : URL が検出されたホスト・サーバの名前です。

  • [URL] : 実際の RSS フィードへのサーバ・アドレスに含まれるナビゲーション・パスです。

  • [テキスト要素] : RSS フィードからロードするテキスト要素のコンマ区切りリストです。例えば、title,description などです。既定値は、空です。

[グローバルからのデータの追加]

このオプションを使用すると、InterSystems IRIS グローバルからのデータを指定できます。このオプションには、以下のフィールドがあります。

  • [名前] : 抽出対象のデータの名前を指定するか、そのデータの既定の名前を採用します。既定の名前は Global_1 です (抽出対象のグローバル・ソースを追加で定義するたびに、整数がインクリメントされます)。

  • [バッチモード] : ソース・テキスト・データをバッチ・モードでロードするかどうかを示すチェック・ボックスです。

  • [グローバル参照] : ソース・データを抽出するグローバルです。

  • [開始添え字] : 取り込む添え字の範囲で最初のグローバル添え字です。

  • [終了添え字] : 取り込む添え字の範囲で最後のグローバル添え字です。

  • [フィルタ条件] : 結果として抽出されるデータに含めるファイルを制限するために使用する条件です。

Skiplist

skiplist の定義 : ドメインの作成後、必要に応じて、そのドメインに 1 つまたは複数の skiplist を作成できます。skiplist は、クエリから返されることを望まない用語 (単語や語句) のリストです。したがって、skiplist を使用して、ドメインにロードされたデータ・ソース内の特定の用語を無視する NLP 処理を実行できます。

  • [名前] : 新しい skiplist の名前を指定するか、既定の名前を採用します。skiplist 名では大文字と小文字が区別されません。重複する skiplist 名を指定すると、コンパイル・エラーが発生します。既定の名前は Skiplist_1 です (追加の skiplist を定義するたびに、整数がインクリメントされます)。

  • [エントリ] : skiplist に含める用語を指定します (行ごとに 1 つの用語)。用語は、小文字にする必要があります。重複する用語は許容されます。skiplist 間で用語のコピーおよび貼り付けを実行できます。用語のグループを区切るために、空白行を含めることができます。用語リストの末尾に改行を入れるかどうかは任意です。空白行はエントリと見なされません。

skiplist を追加、変更、または削除する場合、その変更を有効にするには、ドメインを [保存] および [コンパイル] する必要があります。

skiplist の定義が、ドメインへのデータのロード方法に影響を与えることはないため、skiplist に対する変更ではドメインの再構築は必要ありません。

skiplist は、コンパイルされてから、ドメイン・エクスプローラに渡されます。ドメイン・エクスプローラでは、ドメインにロードしたソース・テキスト・データの分析時に、1 つまたは複数の skiplist を指定できます (指定しなくてもかまいません)。skiplist は、一部の (すべてではない) ドメイン・エクスプローラの分析に適用されます。

マッチング

[マッチング] オプションには、ディクショナリを定義し、その項目と用語を指定する [ディクショナリの追加] オプションが用意されています。

[マッチング] オプションには、以下の 4 つのチェック・ボックス・オプションが用意されています。

  • [無効] : [無効] チェック・ボックスにチェックを付けると、すべてのディクショナリを無効にできます。または個々のディクショナリと共に表示されている [無効] チェック・ボックスにチェックを付けると、そのディクショナリのビルドを無効にできます。個別の [無効] チェック・ボックスにチェックを付けることによって、変更したディクショナリのみをビルドできます。既定はオフです。

  • [構築前に削除] : 既定はオン

  • [自動実行] : 既定はオン

  • [辞書エラーを無視] : 既定はオン

ディクショナリの追加

[ディクショナリの追加] ボタンは、ディクショナリ名 (既定値を表示)、オプションの説明、NLP サポート言語のドロップダウン・リストから選択されたディクショナリ言語、および無効のチェック・ボックスというディクショナリ定義オプションを表示します。既定の名前は Dictionary_1 です (追加のディクショナリを定義するたびに、整数がインクリメントされます)。

[項目の追加] ボタンは、項目名 (既定値を表示)、URI 名 (既定値を表示)、NLP サポート言語のドロップダウン・リストから選択された項目言語、および無効のチェック・ボックスという項目定義オプションを表示します。さらに項目を定義するには、ディクショナリ名を選択します。項目は作成順にリストされます (一番最後に作成されたものがリストの先頭にきます)。各項目内で 1 つ以上の用語を定義できます。既定の名前は Item_1、既定の URI 名は uri:1 です (このディクショナリ用に追加の項目を定義するたびに、整数がインクリメントされます)。

[用語の追加] ボタンは、用語を指定する文字列、NLP サポート言語のドロップダウン・リストから選択された用語言語、および無効のチェック・ボックスという用語定義オプションを表示します。さらに用語を定義するには、項目名を選択します。用語は作成順にリストされます (一番最後に作成されたものがリストの先頭にきます)。

保存、コンパイル、およびビルド

ドメインは、用意されているボタンを使用して、保存、コンパイル、およびビルドする必要があります。モデル要素を追加、変更、または削除した後には、ドメインを保存してコンパイルする必要があります。

[保存] ボタンでは、現在のドメイン定義を保存します。ドメイン定義が開かれていない場合は、アーキテクトにより [保存] ボタンが灰色表示 (無効化) されます。アーキテクトは、変更していないドメイン定義を保存しても、エラーを発行しません。

[コンパイル] ボタンでは、現在のドメイン定義をコンパイルします。ドメイン定義を構成するクラスとルーチンのすべてがコンパイルされます。ドメイン定義に加えた変更を保存していない場合は、コンパイル処理により、コンパイル前にドメイン定義を保存するように促すプロンプトが表示されます。

[ビルド] ボタンでは、指定したソースを現在のドメインにロードします。データ位置、メタデータ・フィールド、またはマッチング・ディクショナリに変更を加えた場合は、ドメインをビルドする必要があります。[ドメインのビルド] ウィンドウには、以下に示すような進行状況メッセージが表示されます。

13:50:48: Loading data...
13:51:49: Finished loading 3 sources
13:51:49: Creating dictionaries and profiles...
13:51:49: Finished creating 1 dictionaries, 1 items, 3 terms and 0 formats
13:51:49: Matching sources...
13:51:50: Finished matching sources
13:51:50: Successfully built domain 'mydomain'

ビルド処理には時間がかかる場合があります。特定のモデル要素の [無効] チェック・ボックスにチェックが付けられていると、それに対応するソースは、ビルド処理でロードされません。個別の [無効] チェック・ボックスにチェックを付けることによって、変更したモデル要素のみをビルドできます。

FeedbackOpens in a new tab