Skip to main content

Importance Weights Tool Icon 重要度重み付けツール

[重要度重み]ツールは、作成されるモデルのターゲット変数に対する可能性のある各予測子の強さに基づいて、予測モデルで使用する一連の変数を選択するメソッドを提供します。

選択された最後のセットは、ターゲットの予測に関してもっとも強くNを取り込んだり、またはカットオフ重要度の重みレベル、およびモデルに含まれるカットオフポイントを超えるこれらの変数もみを選択したりすることに基づくことがあります。

このアプローチの欠点は、可能性のある相互作用の影響と予測間の相関を無視して、分離したターゲット上の可能性のある予測の強度のみを調べることです。この制限にもかかわらず、このタイプの可変フィルタリングメソッドは実際には頻繁に使用されます。

さまざまな重要度重み測定があり、特定のメソッドの適用性は通常、ターゲットのタイプと予測子(数値またはカテゴリ)の両方に依存します。この状況の1つの欠点は、可能性のあるさまざまな予測の相対的重要性の決定に使用される測定が、数値変数およびカテゴリ変数によって異なることです。「リリーフ」メソッドは例外ですが、そのパフォーマンスは、特定のターゲットタイプと予測タイプの組み合わせに固有の他のメソッドほど堅牢ではありません。

測定の大部分は、FSelector Rパッケージにより提供されています。このパッケージはJavaで記述されたいくつかのメソッドを使用しているため、このマクロを使用するには、AlteryxがインストールされているマシンにJava 7ランタイム環境を入れる必要があります。

重要

このツールは、Alteryx Designer または R ツールでは自動的にインストールされません。このツールを使用するには、Community Galleryからダウンロードします。

入力を接続

望ましいターゲット変数と、予測モデルの推定に使用される一連の潜在的な予測変数との両方を含むAlteryxデータストリーム。

ツールの設定

  • 連続ターゲット: 予測するターゲット変数が数値変数の場合は、このオプションを選択します。このオプションを選択すると、データからターゲット変数フィールドを選択するかどうか、また、潜在的な連続する(数値)またはカテゴリ(カテゴリラベル付きの文字列変数)を調べるかどうかを尋ねるメッセージが表示されます。これを選択をしたら、調べたい予測(選択したタイプ)と1つ以上の比較測定のセットを選択する必要があります。継続的な ターゲットと利用可能な予測変数について:

    • ピアソン相関

    • スピアマン(順位)相関

    • RRELIEFFアルゴリズムを提供する、リリーフ。この使用法は、RRELIEFF測定の計算に使用される、近傍の数(近傍の数)とサンプルサイズ(サンプルサイズ)の両方を選択することができます。

    • 継続的なターゲットとカテゴリ予測に利用可能な重要度重みの測定は次のとおりです。

      • 条件付き平均(ピアソン)相関。この測定は、カテゴリ変数の各レベル(カテゴリ)のターゲット変数の平均レベルを計算すること、さらに実際の値と平均値の間のピアソン相関を計算することに基づいています

      • RRELIEFFアルゴリズムを使用する、リリーフ。この使用法は、RRELIEFF測定の計算に使用される、近傍の数(近傍の数)とサンプルサイズ(サンプルサイズ)の両方を選択することができます。

    • サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、実行時の例外処理を引き起こす可能性があります。

  • カテゴリターゲット: 予測するターゲット変数がカテゴリ変数の場合は、このオプションを選択します。このオプションを選択すると、データからターゲット変数フィールドを選択するかどうか、また、潜在的な連続する(数値)またはカテゴリ(カテゴリラベル付きの文字列変数)を調べるかどうかを尋ねるメッセージが表示されます。これを選択をしたら、調べたい予測(選択したタイプ)と1つ以上の比較測定のセットを選択する必要があります。連続ターゲットと連続予測変数については、次の方法が使用できます。

    • エントロピー情報獲得

    • エントロピー獲得比エントロピー獲得比

    • エントロピー対称的不確実性

    • RRELIEFFアルゴリズムを使用する、リリーフ。この使用法は、RRELIEFF測定の計算に使用される、近傍の数(近傍の数)とサンプルサイズ(サンプルサイズ)の両方を選択することができます。

    • カテゴリターゲットとカテゴリ予測に利用可能な重要度の重みの測定は次のとおりです。

      • クラメールのV(カイ二乗)

      • RRELIEFFアルゴリズムを使用する、リリーフ。この使用法は、RRELIEFF測定の計算に使用される、近傍の数(近傍の数)とサンプルサイズ(サンプルサイズ)の両方を選択することができます。

出力の表示

  • Dアンカー: それぞれの潜在的予測に選択された重要度の重み値を提供するテーブルで構成されます。

  • Rアンカー: 潜在的な予測ごとに選択された重要度の重み値のテーブルと共にターゲットフィールド(およびそのタイプ)と潜在的な予測フィールドのタイプを示すレポートスニペットで構成されます。