Skip to main content

Simulation Scoring Tool Icon Herramienta Puntuación de simulación

La herramienta Puntuación de simulación toma una muestra de una aproximación de una distribución de errores de un objeto modelo. Mientras que la puntuación estándar intenta predecir el valor medio predicho, la puntuación de simulación también considera la distribución de errores para proporcionar un rango de valores posibles.

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión en el portal Descargas y licencias de Alteryx para instalar R y los paquetes utilizados por la herramienta R. Para obtener más información, ve a Descargar y usar herramientas predictivas.

Conectar entradas

Metodología de la distribución de errores de la muestra

  • Si estás puntuando un modelo LM, la distribución de errores puede muestrearse directamente debido a las propiedades de LM.

  • Si estás puntuando otros modelos (no LM), se asume la homocedasticidad de las distribuciones de errores con respecto a los predictores. Esto permite calcular una única distribución de error mediante la puntuación del modelo contra un conjunto de validación. Esa distribución de errores se muestra y se agrega a los resultados de la puntuación para los datos entrantes.

Aviso

No conectes esta entrada cuando el objeto modelo entrante utilice una herramienta Regresión lineal.

  • Ancla S: los datos de simulación para puntuar. Esto debe contener todos los campos (con tipos y nombres idénticos) utilizados para crear el modelo predictivo asociado.

Configurar la herramienta

  • Resultados de nombres de la simulación de puntuación: el nombre del campo para los resultados generados. El nombre del campo debe comenzar con una letra y puede contener letras, números y caracteres especiales como el punto (“.”) y el guión bajo (“_”). Ten en cuenta que R reconoce mayúsculas y minúsculas.

  • La cantidad de registros que se debe puntuar por vez: la herramienta puede dividir los datos de entrada en trozos, puntuar un trozo a la vez y, por lo tanto, evitar la limitación de procesamiento en memoria de R. Esta opción controla el número máximo de registros entrantes contenidos en cada trozo de datos.

  • ¿Cuántas muestras a partir de la distribución de errores por iteración?: el número de extracciones de la distribución de errores del modelo para cada registro entrante.

  • Definir semilla aleatoria (opcional): especifica una semilla aleatoria. Esta opción está oculta si hay un campo semilla en los datos que se van a puntuar.

Ver la salida

  • Ancla D: los datos a ser puntuados, junto con la puntuación simulada.