Desarrollar capacidades de ciencia de datos profundas y continuas no es un proceso fácil: se necesitan las personas, los procesos y la tecnología adecuados. Encontrar a las personas adecuadas para los roles correctos es un desafío continuo, como lo pueden atestiguar los empleadores y los solicitantes de empleo.
«La parte de las personas es probablemente el aspecto menos entendido de toda esta ecuación», dijo John Thompson, jefe global de análisis avanzado e IA de CSL Behring, durante un panel de discusión virtual el jueves.
Como jefe de análisis en una de las principales empresas internacionales de biotecnología, Thompson supervisa equipos de ciencia de datos que abordan una amplia gama de iniciativas. Él y los expertos en el panel virtual, organizado por la firma de MLOps Domino Data Lab, acordaron que escalar la ciencia de datos requiere más que solo científicos de datos.
Para iniciar las iniciativas de ciencia de datos en CSL Behring, Thompson dice que comienza con un «equipo esquelético que necesita para que un proyecto tenga éxito». Eso generalmente incluye ingenieros, científicos de datos, un visualizador de datos de UI o UX y expertos en la materia.
Un equipo de ciencia de datos exitoso también necesita un líder que pueda asegurarse de que los proyectos se mantengan enfocados en los objetivos comerciales.
«Si decimos que la ciencia de datos es un deporte de equipo, no solo necesitas a todos los jugadores, necesitas un entrenador», dijo Matt Aslett, director de investigación de datos, AIy canal de análisis en 451 Research.
Está claro que un equipo completo de ciencia de datos comprende más que solo científicos de datos, pero no es necesariamente inteligente consolidar los equipos de ciencia de datos dentro de un departamento de TI, agregó Nick Elprin, director ejecutivo y cofundador de Domino Data Lab.
«Una de las cosas que hemos visto entre las empresas con las que trabajamos que tienen más éxito es que alinean estrechamente a esos equipos con los objetivos comerciales», dijo. «Cómo guía su trabajo y prioriza, cuanto más se acerque al objetivo principal de la empresa, más probabilidades tendrá de [be successful]. Cuando te mueves más hacia TI, te alejas más de los objetivos principales».
Los gerentes también deben considerar cómo se organizan sus equipos cuando están contratando, dijo Elprin. Deberían preguntar, dijo, «¿Qué tipos de habilidades van a hacer fundamentales para el puesto y qué aumentarán con otras personas con las que colaborarán?
«Las empresas tienen éxito [building data science teams] con personas que conocen las estadísticas y la programación básica y las complementan con personas que conocen devOps u otras capacidades de ingeniería», agregó Elprin.
Mientras tanto, es importante considerar cuándo se necesitan realmente científicos de datos profesionales frente a herramientas que pretenden «democratizar» la ciencia de datos y el aprendizaje automático.
«Depende de la naturaleza del problema al que esté apuntando su gente de ciencia de datos y aprendizaje automático», dijo Elprin. «Para problemas genéricos, algunas de las soluciones de ML automático pueden ser efectivas. Si está hablando de un problema exclusivo de su negocio o fundamental para su diferenciación, necesita más de… la flexibilidad que conlleva el desarrollo de sus propios modelos patentados. y usando el poder del código para expresar esas ideas».
Finalmente, avanzar en proyectos de ciencia de datos impactantes requiere la aceptación de los ejecutivos, señaló Thompson.
«El verdadero desafío es el proceso de gestión de cambios a nivel macro; no se trata realmente del proceso de ciencia de datos», dijo. Para darse cuenta del valor total de una iniciativa completa de ciencia de datos, dijo que es importante transmitir a los ejecutivos que «al final, impulsará el cambio. Debe estar listo para impulsar el cambio… si no quiere hacer eso, tal vez deberíamos hacer un proyecto, no un programa».