Skip to main content

Vue d'ensemble des outils En base de données

Le traitement en base de données permet de fusionner et d’analyser des jeux de données volumineux sans les déplacer de la base de données, ce qui apporte des performances considérablement supérieures à celles des méthodes d’analyse traditionnelles qui nécessitent le déplacement des données vers un environnement différent pour effectuer leur traitement.

La réalisation d’une analyse dans la base de données peut réduire le temps de traitement. En utilisant Designer comme interface, vous pouvez très facilement intégrer les workflows en base de données aux workflows standard afin de réaliser des opérations supplémentaires de fusion et d'analyse des données.

Limitations

Actuellement, les Spatial objects ne sont pas pris en charge par les outils En base de données.

Si le même workflow est ouvert plusieurs fois, que vous modifiez l'un d'eux, puis que vous les exécutez tous, vous risquez de rencontrer un comportement inattendu. Fermez toutes les versions du même workflow avant de le modifier.

Bases de données prises en charge

Prise en charge des pilotes

  • Le traitement en BDD exige Alteryx 64 bits avec des pilotes de base de données 64 bits.

  • Pour exécuter des workflows sur Alteryx Server, le pilote ODBC doit être configuré en tant que DSN système. Pour le traitement En base de données, le type de connexion doit être « Système » et la connexion ODBC doit être configurée en tant que DSN système.

Pour obtenir la liste complète des plateformes de données prises en charge par Alteryx, consultez la page Sources de données et formats de fichier pris en charge .

Outils En base de données

Consultez ci-dessous les listes des outils En base de données.

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Score Tool

Changement de version des outils

Si un outil prédictif prenant en charge le traitement En base de données est placé sur le canevas avec un autre outil En BDD, il bascule automatiquement vers la version En BDD. Pour changer manuellement la version de l'outil…

  1. Cliquez sur l'outil avec le bouton droit de la souris.

  2. Pointez le curseur sur Sélectionner la version de l'outil .

  3. Sélectionnez une version différente de l'outil.

Consultez la page Analyse prédictive pour en savoir plus sur la prise en charge en base de données prédictive.

Ancrages d'outils et connexions En base de données

Étant donné que le traitement du workflow en base de données se produit dans la base de données, les outils en base de données ne sont pas compatibles avec les outils Alteryx standard. Plusieurs indicateurs visuels montrent la compatibilité de connexion.

Visualization of Standard tool connection.

Les outils standard utilisent une flèche d’ancrage verte pour se connecter à un autre outil. La connexion s’affiche comme une seule ligne.

Visualization of In-Database tool connection.

Les outils en base de données utilisent un ancrage de base de données carré de couleur bleue pour se connecter à un autre outil En base de données. La connexion entre deux outils En base de données apparaît sous la forme d'une ligne double. Compte tenu de la nature du traitement En base de données, la progression de la connexion n’est pas affichée.

Pour connecter des outils standard à des outils en base de données, servez-vous des outils Sortie ou Entrée dynamique ou des outils Flux de données.

Fonctionnement du traitement en base de données

Les données sont intégrées et extraites dans un workflow En base de données à l'aide des outils Entrée du flux de données et Sortie du flux de données ou en vous connectant directement à une base de données au moyen de l' outil Connecter en BDD . Les outils Entrée du flux de données et Sortie du flux de données utilisent un ancrage en BDD pour se connecter aux outils en BDD et un ancrage de workflow standard pour se connecter aux outils de workflow standard.

Chart showing many different connections

Comment ça marche ?

  1. Définissez la connexion à la base de données avec l’outil Connecter en BDD ou utilisez l’outil Entrée du flux de données pour diriger les données d’un workflow standard vers une table temporaire de la base de données.

  2. Connectez d’autres outils en BDD au workflow pour traiter les données.

  3. Utilisez l'outil Écrire des données en BDD pour créer ou mettre à jour une table dans la base de données ou l'outil Sortie du flux de données pour envoyer les résultats en BDD vers un workflow pour effectuer un traitement standard.

  4. Exécutez le workflow pour traiter les données dans la plate-forme de données. Aucun résultat n’est envoyé au moteur Alteryx tant que le workflow En base de données n’a pas été traité en totalité.

Avantages du traitement en base de données en termes de performances

Lorsqu’un volume important de données entre et sort d’une base de données, le traitement du workflow peut prendre plus de temps. Vous pouvez utiliser le traitement en base de données pour accélérer un workflow.

Par exemple, dans un workflow standard, une grande table de base de données est intégrée à la mémoire pour être jointe à une petite feuille de calcul. La majeure partie du temps d'exécution est consacrée à la diffusion en continu des enregistrements de la base de données. Dans un workflow en BDD, la petite feuille de calcul est diffusée dans la base de données, ce qui réduit considérablement le temps d’exécution.

Questions fréquentes

Vous devez posséder des droits de lecture pour accéder à la base de données sous-jacente.

Vous devez posséder des droits d’écriture pour créer une table dans la base de données.

Les tables temporaires sont supprimées à la fin du traitement. Si Alteryx plante pendant l’exécution de l’outil Entrée du flux de données, la prochaine fois qu’un workflow En base de données sera exécuté, tous les fichiers temporaires créés par Alteryx dans la base de données des trois jours précédents seront effacés.

Pour permettre la visibilité d’une table temporaire entre des sessions, Alteryx doit créer une table permanente qui sera supprimée à la fin d’un workflow. Pour extraire des données d’une base de données et y écrire des données, vous devez avoir des autorisations CRÉER. Sauf pour Microsoft SQL Server.

Comme pour les connexions à la base de données, les règles sous-jacentes sont conservées pendant le traitement au moyen des outils standard Entrée de données et Sortie de données. Si un délai d’expiration est appliqué à la base de données ou si le nombre de requêtes par jour est limité, la connexion à la base de données est affectée.

Une instruction SELECT est déclenchée par l’outil Connecter en BDD et des requêtes supplémentaires sont créées par les outils situés en aval et imbriqués dans cette requête. Vous pouvez compléter la requête et l'envoyer à la base de données sous-jacente en ajoutant l'un des trois outils suivants : Écrire en BDD, Sortie du flux de données, Parcourir en BDD.

Elle est ensuite envoyée à la base de données sous-jacente. Vous pouvez saisir votre propre instruction SQL dans la zone Requête pour l’outil Connecter en BDD, qui vient également s’intégrer à l’instruction SELECT.

La requête SQL pour la base de données sous-jacente est déclenchée au moment de l’exécution pour chaque outil Parcourir en BDD, Sortie du flux de données ou Écrire des données en BDD.

L’outil Explorer les données en BDD peut être configuré pour mettre les données en cache sous la forme d’un fichier .yxdb lors de l’exécution du workflow.

Une fois que les données sont en cache, si le workflow est réexécuté et si la connexion à la base de données ou la requête n’a pas été modifiée (notamment le nombre d’enregistrements à explorer), la requête n’est pas réexécutée. À la place, les données sont extraites du cache.

Un message de sortie indique si les données étaient en cache. Vous pouvez cliquer sur le lien pour ouvrir les résultats des données sous la forme d’un fichier .yxdb dans une fenêtre distincte.

Le cache en BDD est utilisé chaque fois qu’un workflow est réexécuté sans modifier les outils situés en amont. La modification d’un outil en amont déclenche une nouvelle requête et la création d’un nouveau cache.

Non, l’option « Explorer les [100] premiers enregistrements » limite uniquement le nombre d’enregistrements affichés dans l’outil Parcourir en BDD. D’autres outils du workflow traitent le nombre d’enregistrements passant par un point donné.

Le champ comporte un type de données CLOB/LOB et ne fonctionnera pas avec la plupart des opérateurs de comparaison dans les outils Filtre ou Formule. Avec cette erreur, aucune colonne n’est créée, même lorsque les données correspondent à la comparaison. Ce comportement est attendu de SQL et Oracle, car ils ne prennent pas en charge les comparaisons avec les données LOB.