Herramienta Puntuación
Ejemplo de cada herramienta
La herramienta Mosaico tiene un ejemplo de uso. Visita Flujos de trabajo de muestra para aprender cómo acceder a este y muchos otros ejemplos directamente en Alteryx Designer.
La herramienta Puntuación crea una estimación de un objetivo mediante la aplicación de un modelo R a un conjunto de variables predictoras. If the target variable is categorical, it provides probabilities that a record (based on the predictor variable) belongs to each category. Si la variable objetivo es continua, estima el valor de la variable objetivo. La herramienta Puntuación se puede utilizar para evaluar el rendimiento de un modelo, pero no lo hace por sí sola.
Esta herramienta utiliza la herramienta R. Ve a Opciones Descargar herramientas predictivas e inicia sesión en el portal de descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Visita Descargar y usar herramientas predictivas.
Tipo de modelo
The Score tool can evaluate models from a number of locations:
Local Model: The model is pulled into the workflow from a local machine or is accessed within a database.
Promote Model: The model is stored in the Promote model management system.
Configure for Local Model
The Score tool can be configured for models accessed by a standard workflow or for models accessed using the In-DB suite.
Configurar la herramienta para el procesamiento estándar
Conectar entradas
La herramienta Puntuación requiere dos conexiones de entrada.
El ancla de entrada M acepta un objeto de modelo producido con una herramienta predictiva basada en R.
A data stream that contains the predictor fields selected in the model configuration. This can be a standard Alteryx data stream or an XDF metadata stream.
Connect these inputs to the Score tool input to begin configuration.
Supported Models
The Score tool can use a data stream from a predictive model, even if it was estimated using a RevoScaleR function. La herramienta Puntuación solo puede usar un flujo de metadatos XDF si la entrada de la herramienta de modelado es de una herramienta de salida XDF o de entrada XDF, y el modelo se calculó mediante una función de RevoScaleR.
Models estimated by Oracle R Enterprise using an In-DB predictive tool connected to an Oracle data source cannot be used to score a standard Alteryx data stream, although models estimated with a standard Alteryx data stream can be used to score Oracle data sources.
Configuración
The adjustments made through this option are only valid if the target is a binary categorical variable.
The new field name (continuous target) or prefix (categorical target): The field name or prefix must start with a letter and may contain letters, numbers, and the special characters period (".") and underscore ("_"). R distingue entre mayúsculas y minúsculas.
The target field has an oversampled value: These fields are used to adjust the fitted probabilities to match the true sample percentages. Select to provide:
The value of the target field that was oversampled: The name of the oversampled field.
The percentage of the oversampled value in the original data prior to oversampling: The percentage of values that were repeated during oversampling.
Opciones solamente para regresiones lineales no regularizadas
ORE-created models
Si utilizas un modelo creado en ORE, la tabla de estimación original debe existir en la base de datos para estimar los intervalos de confianza.
The target field has been natural log transformed: Select to apply a transformation that fits the values back to the original scale and to use a Smearing estimator to account for the subsequent transformation bias.
Include a prediction confidence interval: Select to specify the value used to calculate confidence intervals.
Opciones específicas de las entradas XDF
Append scores to the input XDF file: Select to append scores to the input XDF file instead of placing them into an Alteryx data stream.
The number of records to score at a time: Select the number of records in a group. Input data is scored one group at a time to avoid the in-memory processing limitation of R.
Configurar la herramienta para el procesamiento en base de datos
The Score tool supports Oracle, Microsoft SQL Server 2016, and Teradata in-database processing. Visita Información general sobre el procesamiento en base de datos para obtener más información sobre la compatibilidad y las herramientas de la categoría En base de datos.
Para acceder a la versión en base de datos de la herramienta Modelo aumentado:
Coloca una herramienta de la categoría En base de datos en el lienzo. The Score tool automatically changes to the In-DB version.
Haz clic con el botón derecho en la herramienta Modelo aumentado, apunta a Elegir la versión de la herramienta y selecciona el Modelo aumentado en base de datos.
Visita Analítica predictiva para obtener más información sobre la compatibilidad con analítica predictiva en base de datos.
Conectar una entrada
La herramienta Puntuación requiere dos conexiones de entrada.
El ancla de entrada M acepta un objeto de modelo producido con una herramienta predictiva basada en R.
A data stream that contains the predictor fields selected in the model configuration. This can be a standard Alteryx data stream or an XDF metadata stream.
Connect these inputs to the Score tool input to begin configuration.
Supported Models
The Score tool can use a data stream from a predictive model, even if it was estimated using a RevoScaleR function. La herramienta Puntuación solo puede usar un flujo de metadatos XDF si la entrada de la herramienta de modelado es de una herramienta de salida XDF o de entrada XDF, y el modelo se calculó mediante una función de RevoScaleR.
Models estimated by ORE using an In-DB predictive tool connected to an Oracle data source cannot be used to score a standard Alteryx data stream, although models estimated with a standard Alteryx data stream can be used to score Oracle data sources.
Configuración
No se permite el uso de otros caracteres especiales. Además, R distingue entre mayúsculas y minúsculas.
Output table name: Type the name of the table that the results are saved to in the database.
The new field name (continuous target) or prefix (categorical target): The field name or prefix must start with a letter and may contain letters, numbers, and the special characters period (".") and underscore ("_").
The target field has an oversampled value: These fields are used to adjust the fitted probabilities to match the true sample percentages. The adjustments made through this option are only valid if the target is a binary categorical variable. Select to provide:
The value of the target field that was oversampled: The name of the oversampled field.
The percentage of the oversampled value in the original data prior to oversampling: The percentage of values that were repeated during oversampling.
Opciones solo para regresión lineal
ORE-created models
Si utilizas un modelo creado en ORE, la tabla de estimación original debe existir en la base de datos para estimar los intervalos de confianza.
The target field has been natural log transformed: Select to apply a transformation that fits the values back to the original scale and to use a Smearing estimator to account for the subsequent transformation bias.
Include a prediction confidence interval: Select to specify the value used to calculate confidence intervals.
Teradata-specific configuration: Microsoft Machine Learning Server needs additional configuration information about the specific Teradata platform to be used. This information is typically provided by a local Teradata administrator.
The Teradata server paths to R's binary executables.
The temporary file write location that is used by Microsoft Machine Learning Server.
Origen del modelo (solo Oracle)
Model Source: Select the source of the model object that is passed into the (M) input of the Score tool. This can be either:
In the database, identified by the value in the "Name" field of the data stream.
Contained in the "Object" field of the data stream.
Ver la salida
The output includes the original data streams with the predicted values of the model. In the case of a model that uses a categorical target, a predicted probability for each level of the target variable is provided in a field name comprised of the user-provided prefix and the suffix of the field that corresponds to the possible level of the target variable.
Configure for Promote Model
Promote is a platform for deploying, managing, and scaling predictive models. Alteryx can connect to the Promote platform to access stored models and score against them.
Promote Credentials
Establish an Alteryx Promote Connection.
Conexión de Alteryx Promote: una lista desplegable que se utiliza para seleccionar de las conexiones Promote guardadas.
Agregar conexión: una opción para agregar a la lista de conexiones Promote disponibles. El administrador de conexiones Promote opera independientemente de los flujos de trabajo.
Agregar una conexión Promote
Haz clic en Agregar conexión.
En la ventana Agregar Conexión, introduce una URL de Alteryx Promote, una dirección URL que apunte a la ubicación en la que se almacena el modelo.
Selecciona Siguiente.
En la ventana Credenciales Alteryx Promote, escribe tu Nombre de usuario y Clave de API.
Selecciona Conectar.
Si tienes éxito, en la ventana Conexión establecida, selecciona Finalizar. La nueva conexión está seleccionada y visible en la lista desplegable.
Eliminar una conexión Promote
Selecciona una conexión disponible.
Haz clic en Quitar conexión.
En la ventana Confirmación, comprueba que la dirección URL y el Nombre de usuario están asociados a la conexión que deseas quitar.
Selecciona Guardar. La conexión ya no está disponible en la lista desplegable.
Acceso a Promote
Si no estás seguro sobre si tienes acceso a la función Promote o necesitas ayuda para encontrar tus credenciales necesarias, comunícate con tu administrador local o con tu representante de soporte técnico.
Selección del modelo
A list of the models you have access to is generated. Scroll through the list or use the search function to find the model you want to score and select the model path.
Once a model path is selected, information regarding the model populates.
Nombre: nombre de la columna.
Owner: The model owner.
Status: The current state of the model, reflecting its accessibility.
Online: Model is up-to-date and ready to process data.
Building: Model is currently being updated and cannot process data.
Failed Unit Test: Model finished building, but components failed to build correctly. The model cannot process data.
Failed: Model failed to build correctly and cannot process data.
Offline: Model has not been built and cannot process data.
Last Updated: The timestamp of the last model build.
Verify that the model is available for data processing and select Done.
Resumen de la configuración
The Configuration Summary provides a summary of the Credentials used and the Model Summary of the selected model.