ツールごとに学習
ガンマ回帰には、「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、Alteryx Designerでこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。
ガンマ回帰ツールは、ターゲット変数に影響を及ぼすことが予想される1つまたは複数の変数(予測変数)に、ガンマ分布で厳密に正の関心のある変数(ターゲット変数)を関連付けます。
多くのアプリケーションでは、ターゲット変数の値は常に厳密に正(つまり、決して0または負ではありません)ですが、観測値の低い範囲に集中する傾向がありますが、少数のケースでは大きな値を採用します。この性質のターゲット変数は、従来の線形回帰モデルの基礎となる正規性の仮定と一致しないデータ生成プロセスを表します。しかし、値は常に正であり、常に整数ではないので、ポアソン分布または負の二項分布に基づくプロセスに従いません。それらはガンマ分布に基づくプロセスと一致し、線形回帰と同様の手法を用いて、一般化線形モデルフレームワークを介して推定することができます。
このツールでは、入力データが通常の Alteryx データストリームに由来する場合は、オープンソースの R glm 関数がモデル推定に使用されます。入力がXDF入力ツールまたはXDF出力ツールのいずれかに由来する場合は、Revo ScaleR rxGlm関数がモデル推定に使用されます。Revo ScaleRベースの機能を使用する利点は、より大きな(メモリ外の)データセットを分析できることですが、XDFファイルを作成するための追加のオーバーヘッド がかかり、オープンソースのR関数で利用可能なモデル診断出力の一部を作成できません。
このツールはRツールを使用します。オプション > 予測ツールをダウンロード の順に進み、Alteryx Downloads and Licenses ポータルにサインインして、R と R ツール で使用されるパッケージをインストールします。予測ツールのダウンロードと使用 を参照してください。
対象のターゲットフィールドと1つ以上の予測フィールドになり得るフィールドを含む、AlteryxデータストリームまたはXDFメタデータストリームを接続します。
[設定]タブを使用して、ガンマ回帰のコントロールを設定します。
モデル名: 各モデルには後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字ピリオド(".")とアンダースコア("_")を含むことができます。その他の特殊文字は使用できず、またRは大文字と小文字を区別します。
ターゲット変数を選択: 予測するデータストリームからフィールドを選択します。
予測変数を選択: ターゲット変数の値が変更される「原因」と考えられるフィールドをデータストリームから選択します。サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、実行時の例外処理を引き起こす可能性があります。
モデルタイプ: log, inverse, identityのオプションを持つドロップダウンボックス。このオプションは、一般化された線形モデルを推定する際にガンマファミリーで使用されるリンク関数を決定します。
モデル推定にサンプリング重み付けを使用しますか?(オプション)...: チェックボックスをクリックしてデータストリームから重み付けフィールドを選択し、サンプリング重み付けを使用するモデルを推定します。
[グラフィックオプション]タブを使用して、グラフィカル出力のコントロールを設定します。
グラフの解像度: グラフの解像度を 1 インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)
解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。
解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
O アンカー: シリアル化されたモデルのテーブルとそのモデル名で構成されます。
Rアンカー: 統計サマリー、逸脱度検定のタイプII分析(ANOD)、および基本診断プロットなど、ガンマ回帰ツールが生成するレポートスニペットで構成されます。モデル入力がXDF出力またはXDF入力ツールからのものである場合、逸脱度のタイプII分析テーブルおよび基本診断プロットは生成されません。