Skip to main content

Gamma Regression Tool Icon Gamma-Regression-Tool

One-Tool-Beispiel

Es gibt ein One-Tool-Beispiel für das Zähldaten-Regression-Tool. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.

Das Tool „Gamma-Regression“ setzt eine relevante gammaverteilte, streng positive Variable (eine Zielvariable) zu einer oder mehreren Variablen (Prognosevariablen) in Beziehung, die die Zielvariable offensichtlich beeinflussen.

In zahlreichen Anwendungen sind die Werte der Zielvariablen immer positiv (d. h. niemals null oder negativ). Die Werte siedeln sich jedoch tendenziell im unteren Bereich der Beobachtungswerte an, auch wenn in einigen seltenen Fällen hohe Werte vorliegen können. Zielvariablen dieser Art stehen für einen Datenverarbeitungsprozess, der nicht mit den Annahmen der Normalverteilung übereinstimmt, die dem traditionellen linearen Regressionsmodell zugrunde liegen. Die Werte sind jedoch immer positiv und müssen nicht zwingend Ganzzahlen sei, d. h. sie folgen nicht dem Prozess eines Poisson-Modells oder einer negativen Binomialverteilung. Die Werte folgen einem Prozess, der auf einer Gammaverteilung beruht, und können mit Methoden ähnlich der linearen Regression im Rahmen des generalisierten linearen Modells geschätzt werden.*

Bei diesem Tool wird die Open-Source-Funktion „R glm“ für die Modellschätzung verwendet, wenn die Eingabedaten aus einem regulären Alteryx-Datenstrom stammen. Stammt die Eingabe aus einem XDF-Eingabe-Tool oder XDF-Ausgabe-Tool, wird die Funktion „Revo ScaleR rxGlm“ für die Modellschätzung verwendet. Der Vorteil der Verwendung der auf Revo ScaleR basierenden Funktion besteht darin, dass viel größere Datensätze (unzureichender Arbeitsspeicher) analysiert werden können. Dem gegenüber stehen jedoch der Zusatzaufwand zum Erstellen einer XDF-Datei und die fehlende Möglichkeit, eine Modelldiagnoseausgabe zu erstellen, die bei den Open-Source-R-Funktionen verfügbar ist.

Dieses Tool verwendet das R-Tool. Navigieren Sie zu OptionenPrognose-Tools herunterladen und melden Sie sich beim Alteryx Downloads and Licenses-Portal an, um R und die vom R-Tool verwendeten Pakete zu installieren. Siehe Prognose-Tools herunterladen und verwenden.

Eingabe verbinden

Ein Alteryx-Datenstrom oder ein XDF-Metadatenstrom mit einem relevanten Zielfeld sowie einem oder mehreren möglichen Prognosefeldern

Tool-Konfiguration

Auf der Konfiguration-Registerkarte können Sie die Steuerelemente für das Zeitreihendiagramm einstellen.

  • Modellname: Jedes Modell muss über einen Namen verfügen, um das Modell später identifizieren zu können. Modellnamen müssen mit einem Buchstaben beginnen und dürfen Buchstaben, Zahlen und die Sonderzeichen Punkt („.“) und Unterstrich („_“) enthalten. Andere Sonderzeichen sind nicht erlaubt, und bei R wird zwischen Groß- und Kleinschreibung unterschieden.

  • Zielvariablen auswählen: Wählen Sie das Feld im Datenstrom aus, für das die Prognose erstellt werden soll.

  • Prognosevariablen auswählen: Wählen Sie die Felder im Datenstrom aus, die Ihrer Meinung nach Änderungen am Wert der Zielvariablen „verursachen“. Spalten, die eindeutige Bezeichner enthalten, wie z. B. Ersatzprimärschlüssel und natürliche Primärschlüssel, sollten nicht in statistischen Analysen verwendet werden. Sie enthalten keinen Prognosewert und können Laufzeitausnahmen verursachen.

  • Eine Dropdownliste mit den Optionen „Log“, „Invers“ und „Identität“ Mit dieser Option wird festgelegt, welche Link-Funktion mit der Gamma-Familie beim Abschätzen des generalisierten linearen Modells verwendet werden soll.

  • Stichprobengewichtung bei der Modelleinschätzung anwenden: Klicken Sie auf das Kontrollkästchen, und wählen Sie dann ein Gewichtungsfeld im Datenstrom aus, um ein Modell abzuschätzen, das eine Stichprobengewichtung anwendet.

Verwenden Sie die Diagramm-Optionen-Registerkarte, um die Steuerelemente für die grafische Ausgabe festzulegen (optional).

  • Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).

    • Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.

    • Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.

Ausgabe anzeigen

  • O-Anker: Besteht aus einer Tabelle des serialisierten Modells mit seinem Modellnamen.

  • R-Anker: Besteht aus den Berichtsausschnitten, die vom Zähldaten-Regression-Tool generiert werden: einer statistischen Zusammenfassung, einer Varianzanalyse vom Typ II (ANOD) und allgemeiner diagnostischer Diagramme. Die Tabelle der Typ-II-Varianzanalyse und die allgemeinen diagnostischen Diagramme werden nicht erzeugt, wenn die Modelleingabe aus einem XDF-Ausgabe- oder XDF-Eingabe-Tool stammt.