Skip to main content

Blue icon with sigma. Ferramenta Sumarizar In-DB

Use a ferramenta Sumarizar In-DB para sumarizar os dados dentro de um banco de dados por meio de agrupamento, soma, contagem, contagem de registros distintos e muito mais. A saída contém apenas os resultados dos cálculos.

A opção de processamento no banco de dados (in-DB) permite a combinação e a análise de grandes conjuntos de dados sem a necessidade de extrair os dados do banco, o que possibilita melhorias de desempenho significativas em relação aos métodos tradicionais de análise. Para mais informações sobre a categoria de ferramentas No Banco de Dados, consulte Visão geral do processamento em banco de dados .

Configurar a ferramenta

Os campos de dados da entrada são exibidos na seção Campos . Selecione o campo ao qual os processos de resumo serão aplicados (Shift + clique para selecionar múltiplos campos aos quais aplicar o mesmo processo).

  1. Use o menu Selecionar , localizado à direita, para selecionar múltiplos campos. As opções incluem...

    • Tudo : seleciona todos os campos para aplicar à seção Ações .

    • Nenhum : desmarca todos os campos.

    • Numérico : seleciona somente campos numéricos (inteiros, decimais fixos, floats, doubles) para aplicar à seção Ações .

    • Cadeia de caracteres : seleciona somente campos de cadeia de caracteres para aplicar à seção Ações .

    • Geografia : seleciona somente campos espaciais para aplicar à seção Ações .

  2. Com os campos selecionados, clique no botão Adicionar . O que você selecionar aparece na seção Ações . Diferentes funções de resumo estão disponíveis dependendo do tipo do campo de dados selecionado. As funções de sumarização incluem...

    • Agrupar por : combina em um único registro todos os registros que apresentam valores idênticos dentro do campo especificado. Todos os dados relativos aos registros de cada grupo criado são então sumarizados. Qualquer tipo de dados que não seja blob ou objeto geográfico apresenta essa opção. Se nenhum campo for especificado para Agrupar por , o arquivo inteiro será sumarizado.

    • Contar : conta os registros no grupo.

    • Contar distintos : conta os registros exclusivos no grupo.

    • Contar não nulos : conta os registros no grupo que não são nulos. "Nulo" significa que não há um valor definido para o campo. Isso é diferente de ter um zero ou uma cadeia de caracteres vazia.

    • Contar nulos : conta os registros no grupo que são nulos.

    • Mínimo : retorna o valor mínimo.

    • Máximo : retorna o valor máximo.

    • Funções de sumarização do tipo Numérico incluem...

      • Soma : retorna o valor da soma para o grupo. A soma é calculada realizando a adição de todos os valores em um grupo.

      • Média : calcula o valor médio para o grupo. A média é calculada dividindo a soma de todos os valores pelo número total de valores.

      • Desvio padrão : calcula o desvio padrão para o grupo. O desvio padrão é uma medida de variabilidade usada em estatística.

      • Variância : calcula a variância do grupo. A variância é calculada multiplicando o desvio padrão por si mesmo (StdDev^2).

  3. Na seção Ações , você pode selecionar um campo e usar os botões para cima, para baixo e de excluir para especificar a ordem dos campos para a saída.

  4. Renomeie um campo digitando um novo nome de campo na coluna Nome do campo de saída .