Fluxo de trabalho de exemplo
A ferramenta Gráfico de Lift tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
A ferramenta Gráfico de Lift produz um gráfico de resposta cumulativa capturada (também chamado de gráfico de ganhos) e um gráfico de taxa de resposta incremental usados para avaliar visualmente a acurácia comparativa de diferentes modelos de classificação binária (sim/não) para prever novos dados ou para fazer uma avaliação das implicações econômicas esperadas do uso de um modelo preditivo em um processo de negócio.
Ambos os gráficos se baseiam na agregação de dados em dez grupos (decis) que são ordenados com base na probabilidade prevista de uma resposta favorável para cada modelo e, em seguida, na comparação dessa resposta com o que seria esperado se a seleção de clientes em potencial fosse feita aleatoriamente. No caso do gráfico de resposta cumulativa, o mesmo examina qual porcentagem da resposta total seria obtida se todos os clientes do banco de dados de uma organização fossem contatados. A resposta é obtida contatando os melhores 10%, 20% e assim por diante, com base nas previsões do modelo. O eixo x (horizontal) do gráfico é a porcentagem do banco de dados contatado, enquanto o eixo y (vertical) é a porcentagem da resposta total capturada ao chegar ao "melhor" decil do banco de dados com base no modelo.
Por exemplo, os melhores 20% de clientes potenciais com base no modelo podem representar 50% da resposta favorável que seria obtida se todos os clientes potenciais fossem contatados. O gráfico de taxa de resposta incremental fornece a taxa de resposta favorável para cada um dos grupos de decis ordenados com base no modelo no banco de dados. Além disso, a ferramenta produz uma tabela de ganhos e medidas da área sob a curva e do coeficiente de Gini para fornecer métricas comparativas gerais do desempenho de diferentes modelos quando a opção de gráfico de resposta cumulativa capturada é selecionada, e uma tabela de taxas de resposta em diferentes decis para cada modelo quando a opção de taxa de resposta incremental é selecionada.
Essa ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.
A ferramenta requer:
A junção de modelos de classificação binária, como a ferramenta Rede Neural, a ferramenta Regressão Logística, a ferramenta Árvore de Decisão, a ferramenta Modelo de Floresta, a ferramenta Modelo de Boosting, a ferramenta Modelo de Spline ou a ferramenta Passo a Passo em um único fluxo de dados.
Um fluxo de dados do Alteryx ou fluxo de metadados XDF consistente com o objeto do modelo (em termos de nomes de campos e de tipos de campos) e todos têm a mesma variável-alvo binária.
Tipo de gráfico de lift: selecione o gráfico Resposta cumulativa total ou Taxa de resposta incremental.
Taxa de resposta real (deve estar entre 0 e 1): muitas vezes, o banco de dados usado para construir um modelo preditivo foi "superamostrado" para aumentar a porcentagem de observações que têm uma das duas categorias de resposta-alvo. Ao especificar a taxa de resposta real (original) da variável-alvo, o gráfico de lift construído levará em conta a amostragem excessiva de um nível do alvo. Se não houver superamostragem, o valor dessa opção deve corresponder à taxa de resposta do banco de dados utilizado para desenvolver os modelos.
Nível do alvo (o rótulo para a resposta desejada da variável-alvo): esta opção permite a criação de um gráfico de lift que seja consistente com o contexto da decisão, e possibilita a verificação de erros para garantir que o gráfico criado seja relevante.
Nome da amostra (opcional): esta opção permite que o usuário coloque um rótulo no gráfico criado indicando qual amostra no fluxo de dados foi usada para criar o gráfico, ou que forneça outras informações que o criador de dados considera relevantes para o gráfico.
Número de registros a serem lidos ao mesmo tempo: use para limitar quantos registros são extraídos do fluxo de dados de uma só vez.
Tamanho do gráfico: configure o tamanho do gráfico em polegadas ou centímetros.
Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).
Resoluções mais baixas geram um arquivo menor, melhor para visualização em um monitor.
Resoluções mais altas geram um arquivo maior e com melhor qualidade de impressão.
Tamanho da fonte base (pontos): configure o tamanho da fonte.
A saída da ferramenta é um campo "Relatório" do Alteryx que consiste em um gráfico em R e uma tabela de lift/ganhos. Esses elementos podem ser usados para auxiliar na criação de relatórios personalizados.