17 Giugno 2022 688 parole, 3 lettura minima Ultimo aggiornamento : 17 Giugno 2022

ETL: Anatella in versione web ad alte prestazioni

Di Pierre-Nicolas Schwab Dottorato di ricerca in marketing, direttore di IntoTheMinds
Se sei interessato alla scienza dei dati, sai che la preparazione dei dati è un passaggio che richiede molto tempo. Ecco perché la scelta del giusto software ETL è così importante. La mia soluzione preferita si chiama Anatella. Apprezzo le […]

Se sei interessato alla scienza dei dati, sai che la preparazione dei dati è un passaggio che richiede molto tempo. Ecco perché la scelta del giusto software ETL è così importante. La mia soluzione preferita si chiama Anatella. Apprezzo le sue qualità in termini di velocità e ricchezza delle trasformazioni proposte. Quindi, ovviamente, sono sempre entusiasta quando un nuovo prodotto arriva sul mercato. In questo caso, è la versione web di Anatella che permette al publisher Timi di proporre un prezzo molto dirompente.


Anatella sul web: cosa cambia riguardo l’interfaccia

La versione web non dovrebbe risultare molto complicata per coloro che usano Anatella sulla versione desktop. L’unica differenza che si nota è la presenza di una finestra sulla sinistra che serve come intermediario per gestire i file. I file da trascinare e rilasciare dovrebbero essere gestiti su questa finestra e non sulla finestra di Anatella.

anatella web version

Per il resto, non cambia nulla. Fatta l’identificazione, la finestra si apre e si adatta alla risoluzione dello schermo. Si trova facilmente l’orientamento e devo ammettere che è un vantaggio innegabile comparato ad alcune soluzioni che presentano una versione web differente.


Alcune funzioni specifiche

Nel menu di questa versione web sono presenti alcune funzionalità specifiche aggiuntive. Uno di questi è particolarmente adatto poiché è una condivisione dello schermo integrata. La soluzione, fornita da Beyond SSL, consente di collaborare in tempo reale con più persone in una finestra di Anatella. L’ho trovato estremamente comodo e intelligente. Non è necessario installare software aggiuntivo come AnyDesk. Tutto è integrato in Anatella.

L’altra nuova funzionalità è il caricamento di file. Nella versione locale di Anatella, si deve utilizzare un connettore di “uscita” per estrarre i dati nella posizione desiderata. Questa opzione è, ovviamente, ancora disponibile in quanto è il cuore dell’ETL. La versione propone anche la possibilità di scaricare direttamente i dati di output (vedi screenshot sotto). Questa è un’aggiunta minore, ma alla fine può farti risparmiare un po’ di tempo se non ricordi dove sono archiviati i dati.

download anatella web


Prestazioni impressionanti

Le versioni web di altri ETL che avevo testato fino ad ora non mi hanno mai davvero sorpreso. La sorpresa è stata lì perché i risultati del mio precedente benchmark sono esplosi. Ciò è probabilmente dovuto all’architettura e alla costruzione del software. È stato con curiosità che ho lanciato un’operazione su 1 miliardo di linee.

1 billion lines handled on anatella web version

Mentre nel mio ultimo benchmark, ci sono voluti 760 secondi per realizzare l’operazione, la versione web di Anatella se la cava in 35,59 secondi. La ragione di ciò è la macchina virtuale su cui gira Anatella. Anche quando si carica un file flat da 10 GB con un miliardo di righe sulla macchina virtuale, l’operazione viene realizzata in 72,63 secondi.

La scelta della CPU è una diretta conseguenza di un articolo in cui Frank Vanden Berghen, l’inventore di Anatella, metteva a confronto le prestazioni single-thread e multi-thread di tutta una serie di CPU. Alla fine di questo benchmark si è distinto l’AMD Ryzen 9 5950x (cerchiato nel grafico sottostante). Si tratta quindi di CPU che equipaggia la macchina virtuale su cui gira la versione web di Anatella.

best cpu for data science

Benchmark di diverse CPU sul mercato per applicazioni di data science (crediti: Timi).


Un’offerta interessante

Il rilascio di questa versione web permette a Timi di proporre un’offerta di lancio molto interessante a 99€/mese. Il prezzo normale sarà di 499€/mese. Ma anche a questo prezzo è estremamente competitivo. Nella versione web, il tuo ETL è direttamente operativo, perfettamente configurato e super performante, grazie a una macchina all’avanguardia. Inoltre, la formula di abbonamento mensile ti consente di ridurre al minimo i costi se lo desideri. Questo è piuttosto dirompente in un mercato in cui le licenze annuali sono la regola.

La ciliegina sulla torta è che a questo prezzo si ottengono anche 200 Gb di spazio di archiviazione (su SSD) che non rovinano nulla. Infine, per soddisfare le prerogative dei più sensibili, il server è in Europa, e la società che ospita i tuoi dati è europea. Un buon modo per essere conformi al 100% con il GDPR e il Cloud Act.

Per saperne di più, visita il sito di Timi.



Posted in imprenditorialità.

Pubblica la tua opinione

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *