Atlassian implementa la política de ‘eliminación temporal’ y mejora las copias de seguridad para evitar otra interrupción

El CTO saliente de Atlassian, Sri Viswanath, ha anunciado que la empresa establecerá una política de «eliminación temporal» en todos los sistemas como uno de los varios pasos que la empresa tomará para evitar otra interrupción desastrosa que deshabilitó accidentalmente varios servicios en la nube y tardó casi dos semanas en solucionarse.

Atlassian reconoció por primera vez la interrupción en su página de estado el 5 de abril. La empresa no restauró los servicios para todos los clientes afectados hasta el 18 de abril.

La empresa culpó de la interrupción a un script de mantenimiento reciente que, según Viswanath, resultó en la eliminación inmediata de 883 sitios, lo que representa a 775 clientes. Los sitios eliminados también contenían información de contacto de los clientes, lo que significaba que los clientes no podían presentar tickets de soporte como lo harían normalmente, y Atlassian no podía comunicarse de inmediato con los clientes afectados, dijo Viswanath.

Sin embargo, al revisar el incidente, Atlassian dijo que tomó una serie de acciones inmediatas para evitar situaciones similares en el futuro. Esto incluye evitar la eliminación de datos y metadatos de clientes que no hayan pasado por un proceso de «eliminación temporal». En su lugar, todas las operaciones nuevas que requieran eliminación se probarán primero en los propios sitios de Atlassian para validar su enfoque y, una vez que se complete la validación, moverá progresivamente a los clientes a través del mismo proceso.

«Se debe prohibir la eliminación de un sitio completo; y la eliminación temporal debe requerir protecciones de varios niveles para evitar errores», describió Viswanath en una publicación de blog.

«Implementaremos una política de ‘eliminación temporal’, evitando que scripts o sistemas externos eliminen datos de clientes en un entorno de producción. Nuestra política de ‘eliminación temporal’ permitirá una retención de datos suficiente para que la recuperación de datos se pueda ejecutar de forma rápida y segura. Los datos solo se eliminará del entorno de producción después de que haya expirado un período de retención».

Cualquier actividad de eliminación temporal de datos también debe tener un plan de reversión probado, agregó Atlassian.

Además, Atlassian dijo que acelerará su programa de recuperación ante desastres para que la restauración se pueda automatizar para eventos de eliminación de múltiples sitios y múltiples productos para un conjunto más grande de clientes, y garantizará que este proceso se pruebe y actualice regularmente para reducir el tiempo de recuperación.

Según Viswanath, Atlassian también revisará su proceso de gestión de incidentes para incidentes a gran escala y realizará ejercicios simulados, además de mejorar la copia de seguridad de los contactos clave y modernizar las herramientas de soporte para que los clientes sin una URL de sitio válida o ID de Atlassian aún puedan comunicarse directamente con el personal técnico. apoyo.

Invertir en un sistema de escalamiento y flujos de trabajo unificados, basados ​​en cuentas, que permitan almacenar varios objetos, como tickets y tareas, debajo de un solo objeto de cuenta de cliente, además de revisar el libro de jugadas de comunicación de incidentes de la empresa y ejecutar una función de gestión de escalamiento para que sea globalmente consistente en todas las geografías para los clientes conforman los pasos adicionales que Atlassian dijo que tomará.

En una carta escrita por los cofundadores y codirectores ejecutivos de la empresa, Scott Farquhar y Mike Cannon-Brookes, el objetivo de estas acciones se centra en recuperar la confianza de sus clientes.

«Queremos reconocer la interrupción que interrumpió el servicio para los clientes a principios de este mes. Entendemos que nuestros productos son una misión crítica para su negocio, y no tomamos esa responsabilidad a la ligera. La responsabilidad es nuestra. Punto final. Para esos clientes afectados, estamos trabajando para recuperar su confianza”, escribieron.

Para el tercer trimestre que terminó el 31 de marzo, la compañía reportó una pérdida neta de $31 millones, en comparación con los ingresos netos de casi $160 millones durante el tercer trimestre del año fiscal 2021. Mientras tanto, los ingresos crecieron un 30 % año con año a $740,5 millones.

Atlassian finalizó su tercer trimestre con un recuento total de clientes, sobre la base de una suscripción activa o un contrato de mantenimiento, de 234 575 clientes, lo que sumó 8054 nuevos clientes netos durante el trimestre.

La compañía agregó que, durante el trimestre, su número de clientes se redujo en aproximadamente 1.800 debido principalmente a los clientes con sede en Rusia que no pudieron pagar, como consecuencia de las sanciones impuestas a sus redes de pago.

Durante los resultados, la compañía también nombró a Rajeev Rajan como el nuevo CTO de la compañía cuando Viswanath termine con la compañía a fines del año fiscal 2022.

Cobertura relacionada

Deja un comentario