Neuronales-Netzwerk-Tool

Benutzerrolle – Anforderungen

Benutzerrolle*	Tool-/Funktionen-Zugriff
Vollbenutzer	✓
Basisbenutzer	X

* Gilt für Kunden von Alteryx OneProfessional und Enterprise Edition mit Designer-Versionen ab 2025.1.

Das Neuronale-Netzwerk-Tool erstellt ein Feedforward-Perceptron-Modell mit einer einzigen verborgenen Ebene. Die Neuronen in der verborgenen Schicht nutzen eine logistische Aktivierungsfunktion (auch als Sigmoid bekannt) und die Ausgabeaktivierungsfunktion ist von der Art des Zielfeldes abhängig. Insbesondere für binäre Klassifizierungsfragen (z. B. die Wahrscheinlichkeit, ob ein Kunde kauft oder nicht kauft) wird die logistische Ausgabeaktivierungsfunktion verwendet. Bei multinomialen Klassifizierungsfragen (z. B. die Wahrscheinlichkeit, ob ein Kunde Option A, B oder C wählt) wird Softmax als Ausgabeaktivierungsfunktion verwendet. Bei Regressionsfragen (bei dem das Ziel ein fortlaufendes numerisches Feld ist) wird für die Ausgabe eine lineare Aktivierungsfunktion verwendet.

Neurale Netzwerke stellen den ersten maschinellen Lernalgorithmus (im Gegensatz zu herkömmlichen statistischen Ansätzen) für die Prognosemodellierung dar. Die Motivation hinter der Methode ist die Imitation der Struktur von Neuronen im Gehirn (daher der Name der Methode). Die grundlegende Struktur eines neuralen Netzwerks beinhaltet eine Reihe von Eingaben (Prognosefelder), die in eine oder mehrere „verborgene“ Schichten geleitet werden, wobei jede verborgene Schicht einen oder mehrere „Knoten“ aufweist (auch bekannt als „Neuronen“).

In der ersten verborgenen Schicht werden die Eingaben linear kombiniert (wobei jeder Eingabe in den einzelnen Knoten eine Gewichtung zugewiesen wird) und auf die gewichtete lineare Kombination der Prognosen wird eine „Aktivierungsfunktion“ angewendet. In der zweiten und den nachfolgenden verborgenen Schichten werden die Ausgaben von den Knoten vor der vorherigen verborgenen Schicht in den einzelnen Knoten der verborgenen Schicht linear kombiniert (wobei wiederum den einzelnen Knoten aus der vorherigen verborgenen Schicht eine Gewichtung zugewiesen wird) und auf die gewichtete lineare Kombination wird eine „Aktivierungsfunktion“ angewendet. Schlussendlich werden die Ergebnisse aus den Knoten der finalen verborgenen Schicht in einer finalen Ausgabeschicht kombiniert, für die eine mit dem Zieltyp konsistente Aktivierungsfunktion verwendet wird.

Das Schätzen (bzw. das „Lernen“ laut Wortschatz der Literatur zu neuralen Netzwerken) umfasst eine Suche der Gewichtungsgruppen für die einzelnen Eingaben oder Knotenwerte der vorherigen Schicht, durch die die objektive Funktion des Modells minimiert wird. Im Falle eines fortlaufenden numerischen Feldes wird demnach die Summe der quadratischen Fehler der finalen Prognose des Modells im Vergleich zu den Istwerten minimiert, während Klassifizierungsnetzwerke versuchen, eine Entropie-Kennzahl für binäre und multinomiale Klassifizierungsprobleme zu minimieren. Wie zuvor erwähnt ist bei dem Tool „Neurales Netzwerk“ (das auf dem R nnet-Paket basiert) nur eine einzelne verborgene Schicht zulässig (die eine beliebige Anzahl Knoten aufweisen kann) und es wird immer eine logistische Transferfunktion in den Knoten der verborgenen Schicht verwendet. Trotz dieser Beschränkungen haben unsere Forschungen ergeben, dass das nnet-Paket derzeit das robusteste Paket für neurale Netzwerke in R ist.

Obwohl modernere statistische Lernmethoden (wie von den Boosting-, Forest- und Spline-Modell-Tools erzeugte Modelle) im Normalfall eine höhere Prognoseeffizienz in Bezug auf neurale Netzwerkmodelle bieten, übertreffen die neuralen Netzwerkmodelle in einigen speziellen Anwendungen (die vorab nicht bestimmt werden können) andere Methoden für Klassifizierungs- und Regressionsmodelle. Zudem werden neurale Netzwerkmodelle in einigen Bereichen wie der Finanzrisikobewertung als weit verbreitete Standardmethode betrachtet.

Wichtig

Dieses Tool wird nicht automatisch mit Designer installiert. Um es zu verwenden, laden Sie die Alteryx-Prognose-Tools für Ihre Version von Designer herunter und installieren Sie sie. Abhängig von Ihrem Alteryx-Kontotyp stehen Ihnen zwei Download-Optionen zur Verfügung:

Von Alteryx One herunterladen
Vom Alteryx Licensing & Downloads Portal herunterladen.

Weitere Informationen finden Sie unter Prognose-Tools herunterladen und verwenden.

One-Tool-Beispiel

Für dieses Tool gibt es ein One-Tool-Beispiel. Gehen Sie zu Beispiel-Workflows und erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Designer aufrufen können.

Tool-Konfiguration

Erforderliche Parameter

Modellname: Jedes Modell muss über einen Namen verfügen, um das Modell später identifizieren zu können. Modellnamen müssen mit einem Buchstaben beginnen und dürfen Buchstaben, Zahlen und die Sonderzeichen Punkt („.“) und Unterstrich („_“) enthalten. Andere Sonderzeichen sind nicht erlaubt und bei „R“ wird zwischen Groß- und Kleinschreibung unterschieden.
Zielfeld auswählen: Wählen Sie das Feld im Datenstrom aus, für das die Prognose erstellt werden soll. Dieses Ziel muss ein Zeichenfolgentyp sein.
Prognosefelder auswählen: Wählen Sie die Felder im Datenstrom aus, die Ihrer Meinung nach Änderungen am Wert der Zielvariablen „verursachen“. Spalten, die eindeutige Kennungen enthalten, wie etwa Ersatzprimärschlüssel und natürliche Primärschlüssel, sollten nicht in statistischen Analysen verwendet werden. Sie enthalten keinen Prognosewert und können Laufzeitausnahmen verursachen.
Stichprobengewichtung bei der Modelleinschätzung anwenden (optional): Aktivieren Sie das Kontrollkästchen, und wählen Sie dann ein Gewichtungsfeld im Datenstrom aus, um ein Modell abzuschätzen, das eine Stichprobengewichtung anwendet.
Die Anzahl der Knoten in der verborgenen Ebene: Die Anzahl der Knoten (Neuronen) in der einzigen verborgenen Ebene des Modells. Der Standardwert lautet 10.
Effekt-Diagramme einbeziehen: Wenn diese Option aktiviert ist, werden Effekt-Diagramme erstellt, die die Beziehung zwischen der Prognosevariablen und dem Ziel zeigen, wobei der durchschnittliche Effekt der anderen Prognosefelder berücksichtigt wird. Die Anzahl der zu erstellenden Diagramme wird gesteuert durch „den Mindestgrad an Wichtigkeit eines Felds, das in den Diagrammen enthalten sein soll“, was den Prozentsatz der gesamten Prognosekraft des Modells angibt, die ein bestimmtes Feld zur Prognose beitragen muss, damit ein Randeffektdiagramm für dieses Feld erstellt wird. Je höher der Wert für diese Auswahl ist, desto kleiner ist die Anzahl der erstellten Randeffektdiagramme.

Modellanpassung

Benutzerdefinierte Skalierung/Normalisierung...: Die numerischen Methoden, die die Grundlage der Optimierung der Modellgewichtungen bilden, können problematisch sein, wenn sich die Eingaben (Prognosefelder) in verschiedenen Skalen befinden (z. B. Einkommen, das von siebentausend bis eine Million reicht, in Kombination mit der Anzahl der im Haushalt lebenden Personen im Bereich von eins bis sieben).
Keine: Standard.
Z-Bewertung: Alle Prognosefelder werden skaliert, sodass sie den Mittelwert null und die Standardabweichung eins haben.
Einheitsintervall:: Alle Prognosefelder werden skaliert, sodass sie den Minimalwert null und den Maximalwert eins haben, während alle anderen Werte zwischen null und eins liegen.
Null zentriert: Alle Prognosefelder werden skaliert, sodass sie den Minimalwert minus eins und den Maximalwert eins haben, während alle anderen Werte zwischen minus eins und eins liegen.
Gewichtungsabnahme: Die Gewichtungsabnahme beschränkt die Verschiebung der neuen Werte in den einzelnen Iterationen (auch als „Epoche“ bezeichnet) des Schätzungsprozesses. Der Wert der Abnahme sollte zwischen null und eins liegen. Höhere Werte führen zu einer höheren Beschränkung der möglichen Verschiebungen der Gewichtungen. Generell hat sich ein Gewichtungsabnahmewert zwischen 0,01 und 0,2 bewährt.
Der +/- Bereich der initialen (zufälligen) Gewichtungen um den Wert null: Die den Eingabevariablen in den einzelnen verborgenen Knoten zugeordneten Gewichtungen werden mithilfe von zufälligen Nummern initialisiert. Diese Option ermöglicht dem Benutzer das Festlegen des Bereichs der verwendeten zufälligen Nummern. Generell sollten die Werte um 0,5 liegen. Kleinere Werte können jedoch besser geeignet sein, wenn alle Eingabevariablen groß sind. Der Wert 0 ist in der Tat ein Sonderwert, der dazu führt, dass das Tool anhand der Eingabedaten einen geeigneten Zusammenstellungswert findet.
Die maximale Anzahl der im Modell zulässigen Gewichtungen: Diese Option wird relevant, wenn in der verborgenen Schicht eine hohe Anzahl Prognosefelder und Knoten vorhanden ist. Eine Reduzierung der Anzahl Gewichtungen beschleunigt die Modellschätzung und reduziert die Wahrscheinlichkeit, dass der Algorithmus ein lokales Optimum (anstelle eines globalen Optimums) für die Gewichtungen findet. Aus dem Modell ausgeschlossene Gewichtungen werden implizit auf null festgelegt.
Die maximale Anzahl Iterationen für die Modellschätzung: Dieser Wert regelt die Anzahl Versuche, die der Algorithmus zum Suchen nach Verbesserungen im Modellgewichtungssatz bezüglich vorheriger Gewichtungssätze hat. Wenn vor dem Erreichen der maximalen Anzahl Iterationen keine Verbesserungen in den Gewichtungen gefunden werden, wird der Algorithmus beendet und der beste Gewichtungssatz wird zurückgegeben. Diese Option ist standardmäßig auf 100 Iterationen festgelegt. Generell macht es in Abhängigkeit vom Verhalten des Algorithmus ggf. Sinn, diesen Wert auf Kosten der Laufzeit für die Modellerstellung zu erhöhen.

Diagramm-Optionen

Diagrammgröße: Wählen Sie Inch oder Zentimeter für die Diagrammgröße aus.
Diagrammauflösung: Wählen Sie die Diagrammauflösung in Punkten pro Inch aus: 1x (96 dpi), 2x (192 dpi) oder 3x (288 dpi).
- Eine geringere Auflösung erzeugt eine kleinere Datei und eignet sich am besten für die Anzeige auf einem Bildschirm.
- Eine höhere Auflösung erzeugt eine größere Datei mit einer besseren Druckqualität.
Größe der Basisschriftart (Punkte): Wählen Sie die Größe der Schrift im Diagramm aus.

Ausgabe anzeigen

O-Anker: Objekt. Besteht aus einer Tabelle des serialisierten Modells mit seinem Modellnamen.
R-Anker: Bericht. Umfasst die vom Tool „Neurales Netzwerk“ generierten Berichtsausschnitte: eine grundlegende Modellübersicht sowie Haupteffektdiagramme für die einzelnen Klassen der Zielvariablen

_{https://en.wikipedia.org/wiki/Artificial_neural_network}

In diesem Abschnitt: