Skip to main content

Create Samples Tool Icon Ferramenta Criar Amostras

Requisitos da função de usuário

Função de usuário*

Acesso à ferramenta/ao recurso

Usuário completo

Usuário básico

X

*Aplica-se a clientes do Alteryx OneProfessional e Enterprise Edition nas versões 2025.1 e posteriores do Designer.

Use a ferramenta Criar Amostras para dividir os registros de entrada em duas ou três amostras aleatórias. Na ferramenta, você pode especificar a porcentagem de registros desejada nas amostras de treinamento e de validação. Se o total for inferior a 100%, os registros restantes serão colocados na amostra de teste (holdout).

Fluxo de trabalho de exemplo

Esta ferramenta tem um fluxo de trabalho de exemplo. Acesse Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente no Alteryx Designer.

Configurar a ferramenta

  1. Porcentagem para a amostra de treinamento : a porcentagem dos dados a ser colocada na amostra de treinamento (entre 1% e 99%).

  2. Porcentagem para a amostra de validação : a porcentagem dos dados a ser colocada na amostra de validação (entre 1% e 99%).

  3. Semente aleatória : um valor inteiro entre 1 e 1.000. A alteração desse valor modifica a amostra na qual uma linha individual de dados é colocada. A menos que haja um motivo específico para alterá-lo, o valor padrão recomendado é 1.

Visualizar a saída

Há três âncoras que saem da ferramenta Criar Amostras:

  • Âncora E : o fluxo de saída de treinamento contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de treinamento acima.

  • Âncora V : o fluxo de validação contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de validação acima.

  • Âncora H : o fluxo de teste (holdout) inclui todos os registros que não foram colocados nas amostras de treinamento e de validação.

Se houver um número ímpar de registros e as configurações para as amostras de treinamento e validação estiverem definidas como 50%, o fluxo de saída de treinamento terá um registro a mais do que o de validação.