17 junio 2022 823 palabras, 4 min. read

ETL: Anatella en versión web con un gran rendimiento

Por Pierre-Nicolas Schwab Doctor en marketing, director de IntoTheMinds
Si te interesan la ciencia de los datos, ya sabrás que la preparación de datos es un paso que consume mucho tiempo. Esa es la razón por la que elegir el software ETL adecuado es tan importante. Mi solución preferida […]

Si te interesan la ciencia de los datos, ya sabrás que la preparación de datos es un paso que consume mucho tiempo. Esa es la razón por la que elegir el software ETL adecuado es tan importante. Mi solución preferida se llama Anatella, y aprecio sus cualidades en términos de velocidad y en la riqueza de las transformaciones propuestas. Así que, por supuesto, siempre me entusiasma cuando llega un producto nuevo al mercado. En este caso, es la versión web de Anatella que permite que su editor, Timi, ofrezca un precio de lo más disruptivo.


Anatella en la web: qué cambia en términos de interfaz

La versión web no debería desorientar demasiado a aquellos que ya usan Anatella en su versión de escritorio. La única diferencia notable es la presencia de una ventana en la izquierda que sirve como intermediario para gestionar tus archivos. Las acciones de arrastrar y soltar los archivos deberían realizarse en esta ventana, y no en la de Anatella en sí mismo.

anatella web version

En cuanto al resto, nada cambia. Nada más identificarte, se abre la ventana y se adapta a la resolución de tu pantalla. Te orientarás enseguida, y debo admitir que es una ventaja innegable cuando se compara con algunas soluciones cuya versión web sí que difiere.


Algunas funciones específicas

En el menú de esta versión web hay algunas características adicionales concretas. Una de ellas es especialmente adecuada, puesto que permite compartir la pantalla de manera integrada. La solución, ofrecida por Beyond SSL, te permite colaborar en tiempo real con varias personas en una ventana Anatella. Me pareció un detalle de lo más conveniente e inteligente. No requiere la instalación de software adicional como AnyDesk; todo está integrado dentro de Anatella.

La otra característica nueva es la subida de archivos. En la versión local de Anatella, tienes que usar un conector «de salida» para extraer los datos en la ubicación deseada. Es una opción que, por supuesto, sigue estando disponible al tratarse del núcleo de la ETL, pero esta versión también propone la opción de descargar el archivo de salida directamente (ver captura de pantalla más abajo). Se trata de un añadido menor, pero al final bien puede ahorrarte algo de tiempo si no logras recordar dónde se almacenan los datos.

download anatella web


Rendimiento impresionante

Las versiones web de otras ETL que he probado hasta ahora nunca me han sorprendido. En este caso sí había una sorpresa ya que los resultados previos de mi prueba explotaron algo que seguramente se deba a la arquitectura y construcción del software. Lleno de curiosidad, decidí lanzar una operación con 1 billón de líneas.

1 billion lines handled on anatella web version

Si bien mi última prueba comparativa llevó 760 segundos llevar a cabo la operación, la versión web de Anatella lo consigue en 35,59 segundos. La razón detrás de esto es la máquina virtual en la que se ejecuta Anatella. Incluso si cargamos un archivo plano de 10 GB con un billón de líneas en la máquina virtual, la operación se realiza en 72,63 segundos.

La elección de CPU es una consecuencia directa de un artículo en el que Frank Vanden Berghen, el inventor de Anatella, comparó el rendimiento en un hilo único o en hilos múltiples de toda una serie de CPUs. Al final de su prueba, la AMD Ryzen 9 5950x destacaba (señalada en el gráfico que hay a continuación). Así, se trata de la CPU que equipa la máquina virtual en la que se ejectura la versión web de Anatella.

best cpu for data science

Prueba de distintas CPU en el mercado para la aplicación de ciencia de datos (Crédito: Timi).


Una oferta interesante

El lanzamiento de esta versión web permite que Timi proponga una oferta introductoria muy atractiva por 99€/mes. El precio normal será de 499€/mes pero, incluso a ese precio, es extremadamente competitivo. En la versión web, tu ETL es operativo de manera directa, está perfectamente configurado, y tiene un rendimiento superbo gracias a una máquina de última generación. Además, la fórmula de la suscripción mensual te permite reducir los costes al mínimo que desees, lo cual resulta de lo más disruptivo en un mercado en el que imperan las licencias anuales.

La cereza del pastel es que, por este precio, también obtienes 200Gb de almacenamiento (en SSD), lo cual no empeora precisamente la oferta. Por último, para cumplir las prerrogativas de los más sensibles, el servidor está en Europa y la empresa que aloja tus datos es europea. Es una buena manera de cumplir al 100% la RGPD y la Cloud Act.

Para saber más, visita la página web de Timi.



Posted in Data y IT.

Publique su opinión

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *