Skip to main content

GCS como armazenamento de dados privado

Siga este guia para configurar seu espaço de trabalho do Alteryx One Platform para substituir o Alteryx Data Storage (ADS) por uma instância sua do Google Cloud Storage (GCS).

Nota

No futuro, as organizações que desejarem aplicar suas próprias políticas de segurança de autenticação a espaços de trabalho individuais poderão habilitar o login único (SSO) para cada espaço de trabalho que desejarem. Atualmente, as contas de serviço do Google provisionam o Google Cloud Storage como armazenamento de dados privado do Alteryx no modo de espaço de trabalho. O modo de espaço de trabalho permite que todos os usuários acessem os ativos de dados que criam, mantêm e usam no espaço de trabalho do Alteryx One. Os usuários podem alterar os caminhos de carregamento e saída padrão para todos os ativos de dados com os quais trabalham no bucket padrão. Isso permite que todos os usuários no espaço de trabalho acessem o armazenamento do GCP e executem a passagem de credenciais para outras conexões compatíveis.

Limitações

Conectividade

  • Não há conectividade com o Amazon Redshift.

  • Os espaços de trabalho provisionados com o GCS como armazenamento de dados privado não são compatíveis com conexões do Snowflake.

  • Para o Google Cloud Platform (GCP), o Alteryx One só permite um projeto do GCP por espaço de trabalho com pushdown para a mesma conexão do Big Query (com o mesmo projeto e conta de serviço).

Disponibilidade do motor

  • Os espaços de trabalho provisionados com o GCS como armazenamento de dados privado não são compatíveis com o Spark EMR como um motor ou capacidades de reamostragem.

  • Os motores do Alteryx não oferecem suporte a tempos de execução de trabalhos superiores a 1 hora.

Plataforma

  • Depois de configurar o GCS como armazenamento de dados privado, não é possível alternar entre as opções de armazenamento de dados privado (por exemplo, GCS para S3).

  • Os espaços de trabalho provisionados com o GCS como armazenamento de dados privado não são compatíveis com o Machine Learning.

Pré-requisitos

  • Ser um usuário em um plano do Alteryx One Professional ou Enterprise.

  • Ter uma função de Administrador do espaço de trabalho atribuída a você no Alteryx One.

  • Ter acesso administrativo ao projeto do GCP de destino.

  • Ter um bucket do GCS criado no GCP.

Guia de configuração do Google Cloud Storage no Alteryx One

Para configurar o GCS como armazenamento de dados privado, primeiro você deve escolher qual método de autenticação do GCS deseja usar. Em seguida, habilite o GCS como armazenamento de dados privado no seu espaço de trabalho.

Configurar a autenticação do GCS

Estabeleça uma conexão segura entre o Alteryx One e seu local do GCS. Você tem duas opções para autenticar o GCS para o seu armazenamento de dados privado...

  • Autorização na nuvem: use a autorização na nuvem para aproveitar seu IAM do Google para buscar credenciais de usuário com escopo sob demanda para acessar o Google Storage.

  • Chave da conta de serviço: as chaves de conta de serviço autenticam aplicativos, scripts ou serviços com as APIs do Google. O Alteryx One utiliza a conta de serviço para buscar credenciais no nível do espaço de trabalho usando uma conta de serviço do Google.

Autorização na nuvem

Etapa 1: configurar o login único (SSO)

Siga o Google Cloud Platform SSO Setup Guide (OIDC) para configurar o SSO para o seu espaço de trabalho.

Etapa 2: configurar o aplicativo interno do GCP
  1. Acesse APIs e serviços no console do GCP.

  2. Vá para a tela de consentimento do OAuth.

  3. Clique em Interno e selecione Criar.

  4. No campo Nome, insira um nome para o seu aplicativo. Por exemplo, o nome do seu espaço de trabalho.

  5. Em Domínios autorizados, selecione Adicionar domínio e insira alteryxcloud.com.

  6. Clique em Salvar e continuar.

  7. Adicione estes escopos:

    openid

    https://www.googleapis.com/auth/userinfo.email

    https://www.googleapis.com/auth/userinfo.profile

    https://www.googleapis.com/auth/devstorage.read_write

    https://www.googleapis.com/auth/bigquery

  8. Selecione Registrar.

  9. Selecione Credenciais.

  10. Clique em Criar credenciais e escolha ID do cliente OAuth.

  11. Selecione Aplicativo web no menu suspenso Tipo de aplicativo.

  12. No campo Nome, insira um nome para o seu aplicativo. Por exemplo, o nome do seu espaço de trabalho.

  13. Em URLs de redirecionamento autorizados, clique no botão Adicionar URI e insira o URL de retorno de chamada de produção e teste. Siga este modelo...

    1. Produção: https://{platformEnvironment}/workspace/${workspaceName}/sso/googleCallback

    2. Teste: https://{platformEnvironment}/workspace/test/${workspaceName}/sso/googleCallback.

    3. Por exemplo...

      https://us1.alteryxcloud.com/workspace/YOUR-WORKSPACE-NAME/sso/googleCallback
      https://us1.alteryxcloud.com/workspace/test/YOUR-WORKSPACE-NAME/sso/googleCallback

    Nota

    Essas alterações podem levar alguns minutos para entrar em vigor.

  14. Clique em Salvar.

  15. Anote e copie o ID do cliente e o Segredo do cliente. Você os usará posteriormente na Etapa 3.

Etapa 3: configurar a autorização na nuvem no Alteryx One
  1. Volte para o seu espaço de trabalho do Alteryx One.

  2. Acesse menu Perfil > Administrador do espaço de trabalho > Tratamento de dados privados > Autorização na nuvem e selecione Google Cloud Platform.

  3. Insira o ID do cliente do GCP que você copiou na Etapa 2 depois de criar credenciais no console do GCP.

  4. Insira o Segredo do cliente do GCP que você copiou na Etapa 2 depois de criar credenciais no console do GCP.

  5. Clique em Salvar.

  6. O Alteryx One orienta você a sair e fazer login novamente antes de continuar.

Chave da conta de serviço

  1. Acesse o Console do Google Cloud e faça login com sua conta do Google.

  2. Se você tiver um projeto existente, selecione o projeto onde deseja criar a chave da conta de serviço. Se você não tiver um projeto, crie um agora.

  3. No painel esquerdo, selecione IAM e Administrador e, em seguida, Contas de serviço.

  4. Selecione Criar conta de serviço.

  5. Insira os detalhes da conta de serviço:

    1. Insira um nome para sua conta de serviço.

    2. [Opcional] Insira uma descrição. Por exemplo, o nome do seu espaço de trabalho do Alteryx One.

    3. Escolha uma função para a conta de serviço. Por exemplo, Projeto > Editor ou funções de API específicas, dependendo das suas necessidades. Observe que o Alteryx One requer estas permissões:

      storage.buckets.get

      storage.buckets.list

      storage.objects.create

      storage.objects.delete

      storage.objects.get

      storage.objects.list

    4. Clique em Continuar.

  6. Na seção "Chaves", selecione Criar chave e, em seguida, selecione o tipo de chave JSON.

  7. Selecione o tipo de chave JSON e, em seguida, clique em Criar. A chave privada é gerada e baixada automaticamente para o seu computador. Você a usará posteriormente na Etapa 2.

    Cuidado

    Mantenha o arquivo da chave JSON seguro, pois ele fornece acesso à sua conta de serviço.

Configurar o GCS como armazenamento de dados privado

  1. Faça login no seu espaço de trabalho do Alteryx One.

  2. Acesse menu Perfil > Administrador do espaço de trabalho > Tratamento de dados privados > Armazenamento e selecione Google Cloud Storage.

  3. Se você criou uma chave de conta de serviço, em "Chave de conta de serviço", copie e cole toda a chave JSON que você criou anteriormente. Se você configurar a autorização na nuvem, ignore esta etapa.

  4. Em "Bucket padrão", insira o nome do bucket do GCS.

  5. [Opcional] Insira um ID de projeto. Isso substituirá o ID do projeto na chave da conta de serviço.

  6. Selecione Salvar para provisionar seu espaço de trabalho do Alteryx One com o GCS como armazenamento de dados privado.

Nota

O Alteryx One cria automaticamente um caminho padrão quando um usuário faz login em um espaço de trabalho pela primeira vez após o GCS ter sido configurado como o armazenamento base.

Alterar os locais de upload e saída do diretório

Os usuários podem atualizar suas preferências de espaço de trabalho para um local de saída e upload de destino no bucket padrão provisionado. Para alterar as preferências de local, siga estas etapas:

  1. Faça login no seu espaço de trabalho do Alteryx One.

  2. Acesse menu Perfil > Preferências > Armazenamento.

  3. Selecione Editar ao lado do diretório de saída ou de upload. Você também pode criar novos diretórios dentro do bucket padrão.

    Nota

    Por padrão, o diretório de upload é gs://${defaultBucket}/${workspaceId}/${personId}/uploads e o de saída é gs://${defaultBucket}/${workspaceId}/${personId}/queryResults.

Procurar conjuntos de dados do Google Cloud Storage no Alteryx One

Depois de habilitar o GCS como um armazenamento de dados privado, os usuários podem procurar e importar conjuntos de dados do bucket padrão provisionado pelo administrador. Para procurar os dados, siga estas etapas:

  1. Faça login no seu espaço de trabalho do Alteryx One.

  2. Vá para a página Dados.

  3. Selecione Importar dados. No painel esquerdo, você deve ver o Google Cloud Storage como uma opção de importação de dados.

  4. Selecione Google Cloud Storage para acessar seus dados.

VPC Service Controls for Private Data Storage

When configuring Private Data Storage with a GCS bucket with VPC Service Controls enabled, add the Alteryx data plane Google Cloud project to your VPC Service Controls service perimeter. Without this configuration, Alteryx services may be unable to access the storage bucket.

Alteryx Data Plane GCP Projects

Add the appropriate Alteryx data plane project number for your deployment region to the VPC Service Controls perimeter.

Region

GCP Region

Control Plane Project

GCP Project Number

us1

us-west1

c-us-w1-p00002

774973207721

eu1

europe-west3

c-eu-w3-p00003

180689404527

au1

australia-southeast1

c-au-se1-p00004

530857852645

Add Alteryx Project to VPC Service Controls Perimeter

  1. Go to the Google Cloud Console and sign in with your Google account.

  2. Go to Security > VPC Service Controls.

  3. Select the service perimeter that protects your GCS bucket and select Edit Perimeter.

  4. Under Resources, select Add Projects.

  5. Add the Alteryx data plane project number for your deployment region and select Save.