Skip to main content

Create Samples Tool Icon Ferramenta Criar Amostras

Fluxo de trabalho de exemplo

A ferramenta Criar Amostras tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

Use a ferramenta Criar Amostras para dividir os registros de entrada em duas ou três amostras aleatórias. Na ferramenta, você pode especificar a porcentagem de registros desejada nas amostras de treinamento e de validação. Se o total for inferior a 100%, os registros restantes serão colocados na amostra de teste (holdout).

Configurar a ferramenta

  1. Porcentagem para a amostra de treinamento : a porcentagem dos dados a ser colocada na amostra de treinamento (entre 1% e 99%).

  2. Porcentagem para a amostra de validação : a porcentagem dos dados a ser colocada na amostra de validação (entre 1% e 99%).

  3. Semente aleatória : um valor inteiro entre 1 e 1.000. A alteração desse valor modifica a amostra na qual uma linha individual de dados é colocada. A menos que haja um motivo específico para alterá-lo, o valor padrão recomendado é 1.

Visualizar a saída

Há três âncoras que saem da ferramenta Criar Amostras:

  • Âncora E : o fluxo de saída de treinamento contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de treinamento acima.

  • Âncora V : o fluxo de validação contém uma amostra aleatória dos registros da entrada. A contagem de registros neste fluxo é igual à porcentagem do total de registros especificada na configuração da amostra de validação acima.

  • Âncora H : o fluxo de teste (holdout) inclui todos os registros que não foram colocados nas amostras de treinamento e de validação.

Se houver um número ímpar de registros e as configurações para as amostras de treinamento e validação estiverem definidas como 50%, o fluxo de saída de treinamento terá um registro a mais do que o de validação.