スコアリングツール
ツールごとに学習
結合ツールには、「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、Alteryx Designer でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。
スコアリングツールは、R モデルを一連の予測変数に適用して、ターゲットの推定を作成します。 If the target variable is categorical, it provides probabilities that a record (based on the predictor variable) belongs to each category. ターゲット変数が連続の場合は、ターゲット変数の値を推定します。スコアリングツールはモデルのパフォーマンス評価に使用できますが、それ単独では評価を行いません。
このツールはRツールを使用します。オプション 予測ツールのダウンロード に移動し、Alteryx ダウンロードとライセンス ポータルにサインインして、Rツール で使用されるパッケージと Rツールをインストールします。予測ツールのダウンロードと使用 を参照してください。
モデルタイプ
[スコアリング]ツールでは、さまざまな場所からモデルを評価できます。
モデルは、ローカルマシンからワークフローに引き込まれるか、データベース内でアクセスされます。
モデルは、Promoteモデル管理システムに格納されます。
ローカルモデルの設定
[スコアリング]ツールは、標準ワークフローによってアクセスされるモデル、またはIn-DBスイートを使用してアクセスされるモデルに対して構成できます。
標準処理のためのツール設定
入力の接続
[スコアリング]ツールには、次の2つの入力が必要です。
Rベースの予測ツールで作成されたモデルオブジェクト。
モデル構成で選択された、予測フィールドを含むデータストリーム。これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力を[スコアリング]ツール入力に接続して設定を開始します。
サポートされているモデル
[スコアリング]ツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。スコアリングツールでは、モデル作成ツールへの入力が XDF 出力ツールまたは XDF 入力ツールからで、モデルが RevoScaleR 関数を使用して推定された場合にのみ、XDF メタデータストリームを使用できます。
標準のAlteryxデータストリームで推定されたモデルをOracleデータソースのスコアリングに使用できますが、Oracleデータソースに接続されたIn-DB予測ツールを使用してOracle R Enterpriseによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることができません。
設定
このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。
フィールド名または接頭辞は文字で始まり、文字、数字、および特殊文字ピリオド(「.」)および下線(_」)を含める必要があります。Rは大文字小文字を区別します。
これらのフィールドは、真のサンプルパーセンテージにマッチする適合確率を調整するために使用されます。以下を提供する場合に選択する:
The value of the target field that was oversampled: The name of the oversampled field.
The percentage of the oversampled value in the original data prior to oversampling: The percentage of values that were repeated during oversampling.
非正規化線形回帰のみのオプション
ORE-created models
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
値を元のスケールに戻す変換を適用し、スミア推定を使用して後続の変換バイアスを考慮します。
Include a prediction confidence interval: Select to specify the value used to calculate confidence intervals.
XDF入力特有のオプション:
入力XDFファイルをAlteryxデータストリームに配置するのではなく、入力XDFファイルにスコアリングを付加する場合に選択します。
The number of records to score at a time: Select the number of records in a group. 入力データは、Rのメモリ内処理の制限を回避するために、一度に1つのグループにスコアリングされます。
インデータベース処理のためのツール設定
[スコアリング]ツールは、Oracle、Microsoft SQL Server 2016、およびTeradataのインデータベース処理をサポートします。インデータベースのサポートとツールの詳細については、インデータベースの概要 を参照してください。
In-DBバージョンの[スコアリング]ツールにアクセスするには:
キャンバスにIn-DBツールを配置します。[スコアリング]ツールはIn-DBのバージョンに自動的に変更されます。
[スコアリング]ツールを右クリックし、ツールバージョンの選択をポイントし、In-DBバージョンを選択します。
予測インデータベースサポートについての詳細は、予測分析を参照してください。
入力を接続
[スコアリング]ツールには、次の2つの入力が必要です。
Rベースの予測ツールで作成されたモデルオブジェクト。
モデル構成で選択された、予測フィールドを含むデータストリーム。これは、標準のAlteryxデータストリームまたはXDFメタデータストリームです。
これらの入力を[スコアリング]ツール入力に接続して設定を開始します。
サポートされているモデル
[スコアリング]ツールは、RevoScaleR関数を使用して推定された場合でも、予測モデルからのデータストリームを使用できます。スコアリングツールでは、モデル作成ツールへの入力が XDF 出力ツールまたは XDF 入力ツールからで、モデルが RevoScaleR 関数を使用して推定された場合にのみ、XDF メタデータストリームを使用できます。
Oracleデータソースに接続されたIn-DB予測ツールを使用してOREによって推定されたモデルは、標準のAlteryxデータストリームをスコアリングすることはできませんが、標準のAlteryxデータストリームで推定されたモデルを使用してOracleデータソースをスコアリングすることはできます。
設定
その他の特殊文字は使用できず、またRは大文字と小文字を区別します。
結果がデータベースに保存されるテーブルの名前を入力します。
フィールド名または接頭辞は文字で始まり、文字、数字、および特殊文字ピリオド(「.」)および下線(_」)を含める必要があります。
これらのフィールドは、真のサンプルパーセンテージにマッチする適合確率を調整するために使用されます。このオプションによる調整は、ターゲットがバイナリカテゴリ変数である場合にのみ有効です。以下を提供する場合に選択する:
The value of the target field that was oversampled: The name of the oversampled field.
The percentage of the oversampled value in the original data prior to oversampling: The percentage of values that were repeated during oversampling.
線形回帰のみのオプション:
ORE-created models
OREで作成したモデルを使用する場合は、信頼間隔を計算するために元の推定テーブルがデータベースに存在する必要があります。
値を元のスケールに戻す変換を適用し、スミア推定を使用して後続の変換バイアスを考慮します。
Include a prediction confidence interval: Select to specify the value used to calculate confidence intervals.
Microsoft R Serverには、使用される特定のTeradataプラットフォームに関する追加の構成情報が必要です。この情報は、通常、ローカルのTeradata管理者によって提供されます。
Rのバイナリ実行可能ファイルへのTeradataサーバーパス
Microsoft R Serverで使用される一時ファイル書き込み場所。
モデル・ソース(Oracleのみ)
[スコアリング]ツールの(M)入力に渡されるモデルオブジェクトのソースを選択します。これは次のいずれかです。
データベース内では、データストリームの「名前」フィールドの値によって識別されます。
データストリームの「オブジェクト」フィールドに含まれます。
出力の表示
出力には、モデルの予測値を含む元のデータストリームが含まれます。カテゴリターゲットを使用するモデルの場合、ターゲット変数の各レベルの予測確率は、ユーザーが提供する接頭辞と、ターゲット変数の可能なレベルに対応するフィールドの接尾部で構成されるフィールド名で提供されます。
Promoteモデルの構成
Promoteは、予測モデルを展開、管理、スケーリングするためのプラットフォームです。Alteryxは、Promoteプラットフォームに接続して、保存されたモデルにアクセスし、それをスコアリングすることができます。
Promote資格認定書
Alteryx Promote接続を確立します。
Alteryx Promote 接続 : ドロップダウンリストを使用して保存された Promote 接続を選択します。
接続の追加 : 利用可能な Promote 接続の一覧に追加するオプション。Promote接続マネージャは、ワークフローとは独立して動作します。
Promote 接続を追加する
接続の追加 をクリックします。
[接続の追加] ウィンドウでモデルが格納されている場所を指す Alteryx Promote URL を入力します。
次へ を選択します。
「Alteryx Promote資格認定書」ウィンドウで、 ユーザー名とAPIキーを入力します。
[接続]を選択します。
成功した場合、[接続済み] ウィンドウで、 完了 を選択します。新しい接続が選択され、ドロップダウンに表示されます。
Promote 接続を削除する
利用可能な接続を選択します。
接続の削除 をクリックします。
「確認」ウィンドウで、URLとユーザー名が削除する接続に関連付けられていることを確認してください。
OK を選択します。この接続は、ドロップダウンでは使用できなくなりました。
Promote へのアクセス
Promote 機能へのアクセス権があるかどうか不明な場合や、アクセスに必要な資格情報を検索するアシスタントが必要な場合は、ローカル管理者またはサポート担当者に問い合わせてください。
モデルの選択
アクセスできるモデルのリストが生成されます。リストをスクロールするか、検索機能を使用してスコアリングするモデルを探し、モデルパスを選択します。
選択されたモデルモデルパスが選択されると、モデルに関する情報が追加されます。
名前 : 列名。
Owner: The model owner.
モデルの現在の状態。アクセシビリティを反映します。
モデルは最新であり、データを処理する準備ができています。
モデルは現在更新中であり、データを処理できません。
モデルは完成しましたが、コンポーネントは正しくビルドできませんでした。モデルはデータを処理できません。
モデルが正しく構築されず、データを処理できません。
モデルが構築されておらず、データを処理できません。
最後のモデルビルドのタイムスタンプ。
モデルがデータ処理に使用可能であることを確認し、 完了選択します。
設定の概要
構成の要約 は、使用される資格認定書の要約と選択されたモデルのモデル要約を提供します。