Skip to main content

Panoramica In-Database

L'elaborazione In-Database consente la combinazione e l'analisi di grandi set di dati senza estrarli da un database e può offrire significativi miglioramenti delle prestazioni rispetto ai metodi di analisi tradizionali che richiedono lo spostamento dei dati in un ambiente separato per l'elaborazione.

L'esecuzione dell'analisi nel database può ridurre i tempi di elaborazione. Utilizzando Designer come interfaccia, i flussi di lavoro In-Database si integrano facilmente con i flussi di lavoro standard consentendo di eseguire ulteriori operazioni di combinazione e analisi dei dati.

Limitazioni

Gli oggetti spaziali al momento non sono supportati con gli strumenti In-Database.

Se lo stesso flusso di lavoro è aperto più volte, modificando uno dei flussi di lavoro e rieseguendoli tutti potresti riscontare un comportamento imprevisto. Chiudi tutte le versioni dello stesso flusso di lavoro prima di apportare modifiche.

Database supportati

Supporto driver

  • L'elaborazione In-Database richiede Alteryx a 64 bit con driver di database a 64 bit.

  • Per eseguire i flussi di lavoro su Alteryx Server, è necessario che il driver ODBC sia configurato come DSN di sistema. Per l'elaborazione In-Database, Tipo di connessione deve essere impostato su "Sistema" e la connessione ODBC deve essere configurata come DSN di sistema.

Per l'elenco completo delle piattaforme dati supportate da Alteryx, consulta Origini dati e formati di file supportati .

Strumenti In-Database

Esamina i seguenti elenchi di strumenti In-Database.

Boosted Model Tool Icon
Decision Tree Tool Icon
Forest Model Tool Icon
Linear Regression Tool Icon
Logistic Regression Icon
Score Tool

Modifica delle versioni degli strumenti

Quando uno strumento predittivo con supporto In-Database viene posizionato sull'area di disegno con un altro strumento In-DB, passa automaticamente alla versione In-DB. Per modificare manualmente la versione dello strumento...

  1. Fai clic con il pulsante destro del mouse sullo strumento.

  2. Seleziona Scegli versione strumento .

  3. Seleziona una versione diversa dello strumento.

Per ulteriori informazioni sul supporto predittivo all'interno del database, consulta Analisi predittiva .

Connessioni e ancoraggi degli strumenti In-Database

Poiché l'elaborazione del flusso di lavoro In-Database avviene all'interno del database, gli strumenti In-Database non sono compatibili con gli strumenti Alteryx standard. Diversi indicatori visivi mostrano la compatibilità della connessione.

Visualization of Standard tool connection.

Gli strumenti standard utilizzano un ancoraggio con una freccia verde per la connessione a un altro strumento. La connessione è rappresentata da una riga singola.

Visualization of In-Database tool connection.

Gli strumenti In-Database utilizzano un ancoraggio con quadrati blu per la connessione a un altro strumento In-Database. La connessione tra due strumenti In-Database è rappresentata da una riga doppia. A causa della natura dell'elaborazione In-Database, lo stato della connessione non viene visualizzato.

Per collegare gli strumenti standard agli strumenti In-Database, utilizza gli strumenti Input dinamico e Output dinamico o gli strumenti Flusso di dati.

Funzionamento di In-Database

I dati vengono trasmessi da e verso un flusso di lavoro In-Database utilizzando gli strumenti Flusso di dati in entrata e Flusso di dati in uscita o tramite connessione diretta a un database con lo strumento Connetti In-DB . Gli strumenti Flusso di dati in entrata e Flusso di dati in uscita utilizzano un ancoraggio In-DB per connettersi agli strumenti In-DB e un ancoraggio del flusso di lavoro standard per connettersi agli strumenti del flusso di lavoro standard.

Chart showing many different connections

Funzionamento

  1. Definisci la connessione al database tramite lo strumento Connetti In-DB oppure utilizza lo strumento Flusso di dati in entrata per trasmettere i dati da un flusso di lavoro standard a una tabella temporanea nel database.

  2. Connetti altri strumenti In-Database al flusso di lavoro per elaborare i dati.

  3. Usa lo strumento Scrivi dati In-DB per creare o aggiornare una tabella nel database oppure utilizza lo strumento Flusso di dati in uscita per trasmettere i risultati In-DB a un flusso di lavoro per l'elaborazione standard.

  4. Esegui il flusso di lavoro per elaborare i dati nella piattaforma dati. Non viene restituito nessun risultato ad Alteryx Engine fino a quando l'intero flusso di lavoro In-Database non viene elaborato.

Vantaggi delle prestazioni In-Database

L'elaborazione del flusso di lavoro può richiedere più tempo quando una grande quantità di dati viene trasmessa da e verso un database. Puoi utilizzare l'elaborazione In-Database per velocizzare un flusso di lavoro.

Ad esempio, in un flusso di lavoro standard una tabella di database di grandi dimensioni viene inviata in memoria per essere integrata in un piccolo foglio di calcolo. La maggior parte del tempo di esecuzione è assorbita dalla trasmissione dei record del database. In un flusso di lavoro In-Database, il piccolo foglio di calcolo viene trasmesso nel database, riducendo notevolmente i tempi di esecuzione.

Domande frequenti

Per accedere al database sottostante è necessario disporre dei privilegi di lettura.

Per creare una tabella nel database è necessario disporre dei privilegi di scrittura.

Le tabelle temporanee vengono eliminate al termine dell'esecuzione. Se Alteryx subisce un arresto anomalo durante l'esecuzione dello strumento Flusso di dati in entrata, alla successiva esecuzione di un flusso di lavoro In-Database tutti i file temporanei creati da Alteryx nel database nei tre giorni precedenti vengono eliminati.

Per consentire la visibilità di una tabella temporanea tra le sessioni, Alteryx deve creare una tabella permanente che verrà eliminata alla fine di un flusso di lavoro. È necessario disporre delle autorizzazioni DI CREAZIONE per trasmettere i dati da un database e scriverli in un database. Microsoft SQL Server rappresenta un'eccezione.

Le regole sottostanti vengono preservate durante il processo, analogamente alle connessioni al database, tramite gli strumenti Dati di input e Dati di output standard. Un eventuale timeout del database o un limite al numero di query, che è possibile eseguire ogni giorno, influirà sulla connessione al database.

Lo strumento Connetti In-DB attiva un'istruzione SELECT e gli strumenti a valle creano altre query che vengono annidate all'interno di questa query. L'aggiunta di uno dei tre strumenti seguenti completa la query e la invia al database sottostante: Scrivi in-DB, Flusso di dati in uscita, Sfoglia In-DB.

Puoi immettere un'istruzione SQL personalizzata nella casella Query per lo strumento Connetti In-DB, che viene incorporata anche nell'istruzione SELECT.

La query SQL per il database sottostante viene attivata in fase di esecuzione per ogni strumento Sfoglia In-DB, Flusso di dati in uscita o Scrivi dati In-DB.

Lo strumento Sfoglia dati In-DB può essere configurato per memorizzare i dati nella cache con il formato file .yxdb durante l'esecuzione del flusso di lavoro.

Una volta che i dati sono memorizzati nella cache, se il flusso di lavoro viene eseguito di nuovo e la connessione o la query relativa al database (incluso il numero di record da sfogliare) non è stata modificata, la query non verrà eseguita una seconda volta in quanto i dati verranno estratti dalla cache.

Un messaggio di output indica se i dati sono stati memorizzati nella cache. Fai clic sul collegamento per aprire i risultati come file .yxdb in una finestra separata.

La cache In-Database viene utilizzata ogni volta che si esegue nuovamente un flusso di lavoro senza apportare modifiche agli strumenti a monte. La modifica di uno strumento a monte attiva una nuova query e crea una nuova cache.

No, l'opzione "Sfoglia i primi [100] record" limita solo il numero di record visualizzati nello strumento Sfoglia In-DB. Gli altri strumenti elaboreranno il numero di record che passano in qualsiasi punto del flusso di lavoro.

Il campo ha il tipo di dati CLOB/LOB e non funziona con la maggior parte degli operatori di confronto negli strumenti Filtro o Formula. L'errore indica che non viene restituita nessuna colonna, anche quando i dati corrispondono al confronto. Questo è il comportamento previsto con SQL e Oracle, in quanto non supportano i confronti con i dati LOB.