Microsoft está actualizando su Traductor y otros servicios de IA de Azure con un conjunto de modelos de IA llamado Z-code, anunciaron los funcionarios el 22 de marzo. Estas actualizaciones mejorarán la calidad de las traducciones automáticas y ayudarán a que estos servicios admitan más que solo los más comunes. idiomas que tienen menos datos de entrenamiento disponibles.
Los nuevos modelos de código Z utilizan un enfoque escaso de «Mezcla de expertos», que los ejecutivos de Microsoft describieron como más eficiente de ejecutar porque solo necesita involucrar una parte del modelo para completar una tarea. El resultado, según Microsoft: escala masiva en la cantidad de parámetros del modelo mientras se mantiene constante la cantidad de cómputo.
Microsoft implementó recientemente modelos de código Z para mejorar las tareas comunes de comprensión del idioma, como el reconocimiento de entidades de nombre, el resumen de texto, la clasificación de texto personalizado y la extracción de frases clave en sus diversos servicios de Azure AI. Pero el desarrollo de hoy marca «la primera vez que una empresa ha demostrado públicamente que puede usar esta nueva clase de modelos Mixture of Experts para potenciar los productos de traducción automática».
Z-code es parte del proyecto XYZ-code más grande de Microsoft, que busca combinar modelos de texto, visión, audio y múltiples idiomas para crear sistemas de IA más potentes e integrados que puedan hablar, escuchar, ver y comprender mejor. Los modelos de código Z se enmarcan en las iniciativas Microsoft AI at Scale y Turing, que buscan desarrollar grandes modelos preentrenados con grandes cantidades de datos textuales y que pueden integrarse directamente en Microsoft y en productos desarrollados por clientes.
Los funcionarios dijeron que para poner estos modelos en producción, Microsoft está utilizando GPU NVIDIA y su Triton Inference Server para implementarlos y escalarlos de manera eficiente.
Hablando de NVIDIA, Microsoft anunció hoy que está trabajando con NVIDIA para llevar su capacidad informática confidencial a las GPU de NVIDIA.
El director de tecnología y miembro técnico de Azure, Mark Russinovich, explicó la importancia en una publicación de blog del 22 de marzo:
«Con las GPU confidenciales, los datos se cifran cuando se transfieren entre la CPU y la GPU a través del bus PCIe con claves que se intercambian de forma segura entre el controlador del dispositivo de NVIDIA y la GPU. El único lugar donde se descifran los datos es dentro de un hardware aislado y protegido. entorno dentro del paquete GPU donde se puede procesar para generar modelos o resultados de inferencia. Al igual que otras soluciones informáticas confidenciales de Azure, las GPU confidenciales admiten atestación criptográfica basada en una identidad de GPU única aprovisionada por NVIDIA durante la fabricación. Mediante la atestación remota, las organizaciones pueden verificar de forma independiente que sus datos solo se procesan dentro de GPU confidenciales genuinas y correctamente configuradas».