Starburst Data anunció esta semana que ha más que duplicado su financiación con el anuncio de una nueva ronda Serie D de 250 millones de dólares esta semana y la apertura de un nuevo portal para su motor de consultas distribuidas. La compañía afirma que esto ha triplicado aproximadamente su valoración anterior, para la cual hubo números publicados contradictorios (aquí y aquí). Los anuncios se realizan junto con Datanova, el evento anual en línea de la compañía.
Al ingresar a 2022, la compañía continúa duplicando la malla de datos. La página de inicio de la empresa se caracteriza a sí misma como «El motor de análisis para Data Mesh». Tendremos más que decir sobre eso en un momento.
Esta semana en Datanova, está anunciando una extensión que agrega una interfaz de portal similar a un catálogo a su motor de consulta distribuido basado en Trino. En el aspecto administrativo, el portal permite a los productores de datos y a los ingenieros de datos definir metadatos, realizar un seguimiento del uso y aplicar derechos y accesos basados en roles. En el lado del usuario final, pueden usar el portal para descubrir, explorar y agregar revisiones de conjuntos de datos. Aunque es un catálogo de datos en el sentido «ligero», no pretende reemplazar los catálogos de datos empresariales. Como un catálogo liviano que incluye su propio motor de consulta, Starburst, sin embargo, continúa admitiendo la integración con Alation y Collibra.
En la hoja de ruta, Starburst está aumentando la compatibilidad con los formatos de tablas de datos de código abierto emergentes, incluidos Delta Lake e Iceberg, con la compatibilidad con Delta Lake más adelante.
Con la nueva financiación, un tema clave para Starburst este año es la expansión global, especialmente en la comercialización; si bien actualmente tiene presencia sobre el terreno en América del Norte y Europa, este año marca el punto en el que se instalará en Asia y la Cuenca del Pacífico. Subrayando eso, está agregando Alibaba para su servicio en la nube Galaxy (que se convirtió en GA hace solo dos meses en AWS, Azure y Google Cloud). Starburst también está aprovechando su asociación con Red Hat, tanto en la nube privada como en Red Hat OpenShift Dedicated, un servicio administrado por Red Hat en AWS y Google Cloud. Starburst está certificado en OpenShift, está disponible en el mercado de Red Hat y es uno de los cuatro ISV en el servicio en la nube OpenShift Data Science de Red Hat. Y está aumentando el compromiso con los sospechosos habituales de los integradores de sistemas globales.
Starburst Enterprise también está disponible en HPE Marketplace como un motor de consulta distribuido para HPE Ezmeral Runtime, y pronto ambos comenzarán a comercializarse conjuntamente en América del Norte y Europa. Pero, para que conste, también lo es el rival de Starburst, Ahana, donde parte del equipo de administración comparte raíces comunes con la parte del equipo de productos de Ezmeral que vino de MapR.
Starburst aún se encuentra en la etapa inicial donde el crecimiento es geométrico; su negocio se ha triplicado anualmente durante los últimos tres años. Lo más destacado es el reciente lanzamiento de Starburst Galaxy, el servicio de nube gestionada; Habiendo sido lanzado a fines del año pasado, el negocio de SaaS en la nube aún no aparece en gran medida en las cifras de ingresos. Si bien Starburst no está dispuesto a abandonar los clientes locales o autogestionados por la empresa Starburst, hay un pequeño secreto de que la empresa prevé que la mayor parte del crecimiento futuro provendrá del servicio SaaS en la nube.
Y ahí es donde una nueva incorporación clave al equipo directivo, Javier Molina, como director de ingresos, desempeñará un papel clave. Anteriormente vicepresidente sénior de ventas mundiales en MongoDB, el servicio Atlas SaaS era el centro de atención. Lanzado hace casi seis años, Atlas ahora representa más de la mitad de los ingresos de MongoDB. Una lección clave que está aprendiendo Molina es que Atlas no creció de manera explosiva de la noche a la mañana. No fue hasta la adquisición de mLab, que agregó la incorporación de autoservicio, que Atlas alcanzó su trayectoria actual. Con el lanzamiento de Starburst Galaxy hace apenas dos meses, puede esperar que se haga un gran énfasis en el autoservicio, lo que permitirá a los clientes consumirlo a pedido sin la burocracia de los contratos anuales.
Claramente, Starburst se está posicionando para superar las insignificantes batallas de mente compartida con respecto a quién tiene el motor de consulta de fuente abierta al posicionar la consulta distribuida, que es en el fondo su tecnología Trino, como un engranaje clave en la creación de productos de datos. Y la creación de productos de datos es fundamental para la adopción de malla de datos por parte de Starburst. Lo están promocionando hasta el punto en que la malla de datos se ha convertido en el eslogan de la empresa. Y son una fuente de acceso a capítulos preliminares resumidos del próximo libro de Zhamak Dehghani (autor del concepto actual de malla de datos).
Al autoproclamarse como «el motor de análisis de la malla de datos», Starburst camina por una línea muy fina, ya que la malla de datos no es una tecnología; es un conjunto de mejores prácticas y patrones de diseño arquitectónico para localizar el control del ciclo de vida de los conjuntos de datos, que deben tratarse como productos. Entonces, no, Starburst no llama a Starburst Enterprise o Galaxy una solución de malla de datos per se. Pero la distinción es bastante sutil.
Por supuesto, las herramientas y tecnologías serán esenciales para respaldar las diversas tareas de la malla de datos. Y hay muchas tareas que superarán a los humanos, desde administrar y automatizar la ingesta de datos, las canalizaciones de datos, la calidad de los datos y la validación de que los datos son confiables, válidos y actuales. Los humanos claramente impulsan el proceso, pero la tecnología escala sus esfuerzos.
Vaya al grano: Starburst Enterprise o Galaxy es solo una pieza del rompecabezas de la malla de datos. Pero la malla de datos es solo una pieza del rompecabezas Starburst. Vamos a explicar.
Como hemos explicado (aquí y aquí), esperamos que este año, las mallas de datos reciban su primer escrutinio serio y retroceso. Eso es realmente algo bueno. Es de esperarse para cualquier práctica tecnológica que se esté sometiendo a una investigación seria. Si bien hay organizaciones que reclamarán victorias de la noche a la mañana, la malla de datos siempre será un viaje, y no todas las organizaciones adoptarán esas prácticas.
La consulta distribuida será una parte clave de la ejecución para cualquier organización basada en datos, ya sea que adopte o no prácticas de malla de datos. Si bien Starburst ciertamente da en el blanco al señalar el papel de la consulta distribuida y sus ganchos para la gobernanza, tendría sentido que Starburst también generalizara su mensaje y no se atara de la cadera a la malla de datos. Y ahí es donde podrían comenzar las sinergias con las estructuras de datos.