Skip to main content

Survival Analysis Tool Icon 生存分析ツール

生存分析ツールは、生存分析の一般的な方法を実装します。生存モデルは、事象が発生するまでの時間(たとえば、生命保険契約の失効)をモデル化します。生存モデルは、打ち切りを特徴とする点でユニークです。そのようなイベントが発生する前にテストや試行が終了する可能性があります(ポリシーが失効する前にポリシー保持者が離れるなど)。

重要

このツールは、Alteryx Designer または R ツールでは自動的にインストールされません。このツールを使用するには、Alteryx Analytics Galleryからダウンロードします。

このツールは、次の2つの目的(構成設定に基づいて決定)で使用できます。

  1. データセットの「生存関数」(つまり、全人口の生存時間の分散を推定する)についての洞察を得ます。

  2. 特定の因子が集団の生存機能に影響を与えるかどうかを決定します(たとえば、群間の生存関数を比較する)。

ツールの設定

グラフィックオプションタブを使用して、出力プロットのコントロールを設定します。

  • モデル名: 各モデルには後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含むことができます。その他の特殊文字は使用できず、またRは大文字と小文字を区別します。

  • 次のいずれかを選択します(データストリーム内のデータに次第で)。

    • Data contains durations: The data includes a field representing durations.

      • Select duration variable: Select the field representing durations.

    • Data contains start and stop times: The data includes a field representing start times and a field representing stop times.

      • Select start time/ left censor variable: Select the field representing start times.

      • Select end time/ right censor variable: Select the field representing end times.

  • 検閲:

    • データには、レコードの寿命の開始の0/1打ち切りを表すフィールドが含まれます。

      • 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が開始時刻または0(「データを含む期間」が先に指定された)で始まったことを示します。

    • データには、レコードの寿命の終わりの0/1切り捨てを表すフィールドが含まれます。

      • 0/1変数を選択します。0は打ち切りを表し、1はレコードの寿命が終了時刻または期間(「データに継続時間が含まれている」場合)で終了したことを示します。

Use the Analysis Options tab to better define how analysis is calculated.

  • このオプションは、1つの変数ごとにグループ化するオプション付きのデータセットの生存曲線を検索します。

    • このオプションは、異なるグループの生存曲線の比較を可能にします。

      • グループ分け変数に対応するフィールドを選択します。

    • このオプションでは、KM推定値のプロット、およびそのテーブルの上限と下限が表示されます。

      • KM推定値の上限と下限を計算するための信頼レベルを入力します。

    • 生存曲線に影響を及ぼす共変量の影響と重要性を確認するために使用します。

      • Select predictor variables: At least one must be selected.

      • Method for tie handling: The method by which to deal with tied times.**

      • このオプションを使用すると、各レコードの重みを含むフィールドを選択できます。

        • Select Field Specifying Weights: Select the field containing case weights.

[グラフィックスオプション]タブを使用して、グラフィカル出力のコントロールを設定します(オプション)。

  • プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。

  • グラフの解像度: グラフの解像度を 1 インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。

出力の表示

各出力アンカーに閲覧ツールを接続して、結果を表示します。

モデル名とオブジェクトのサイズを持つ順番に並んだモデルのテーブルで構成されます。さまざまなモデルの利用可能性は、「分析オプション」の下の「分析タイプ」の選択に依存します。

  • 要約分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト

  • グループ分け分析 - Survオブジェクト、Kaplan-Meier推定オブジェクト、Cox比例ハザードオブジェクト

  • 因子分析 - Survオブジェクト、Cox比例ハザードオブジェクト

Cox PHモデルは、O出力の出力の第2要素から直接アクセスすることができます。そのモデルが「モデル」である場合、SurvオブジェクトとKMestオブジェクトはそれぞれ「modelKMest」によってアクセスできます。

「分析オプション」の下の「分析オプション」の選択に応じて、[生存分析]ツールで生成されたレポートスニペットで構成されます。

  • 要約分析 - 要約統計と生存関数のグラフ。

  • グループ分け分析 - 要約統計量。観察されたもの対各グループの期待される結果。 Logrank、Likelihood Ratio、およびWaldテストのグループの類似性に関するグループ比較テスト結果。異なるグループの生存曲線を比較するグラフ。各グループの明確な生存曲線と累積ハザード曲線。

  • 因子分析 - 要約統計量、Logrank、Likelihood Ratio、およびWaldテストの予測変数の影響に関する因子分析テスト結果。予測因子の影響を列挙するCox比例ハザードモデルの要約。

要約分析とグループ分け分析(この場合、予備のフィールドは追加された特定グループです)では、生存曲線のKaplan-Meier推定値が作成されます。因子分析用には、提供されていません。

*https://en.wikipedia.org/wiki/Survival_analysis **https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html