Acercarse / Inflexión AI UK Ltd. en el Ayuntamiento el segundo día del Foro Económico Mundial (FEM) en Davos, Suiza, el miércoles 17 de enero de 2024. Cofundador y director ejecutivo Mustafa Sulaiman. Suleman se unió a Microsoft. Marzo.

Microsoft está desarrollando un nuevo modelo de lenguaje de IA a gran escala llamado MAI-1, que podría rivalizar con los modelos de última generación de Google, Anthropic y OpenAI, según un informe. Información. Esta es la primera vez que Microsoft construye un modelo interno de IA de esta escala después de invertir más de 10 mil millones de dólares en OpenAI por los derechos para reutilizar los modelos de IA de la startup. GPT-4 de OpenAI es compatible no solo con ChatGPT sino también con Microsoft Copilot.

El desarrollo de MAI-1 fue dirigido por Mustafa Sulaiman, el ex director de Google AI que recientemente se desempeñó como CEO de la startup de AI Inflection, que compró la mayor parte del personal y la propiedad intelectual de la startup en marzo por 650 millones de dólares. Aunque MAI-1 puede basarse en técnicas aportadas por antiguos empleados de Inflection, se informa que es un modelo de lenguaje grande (LLM) completamente nuevo, según lo confirmaron dos empleados de Microsoft familiarizados con el proyecto.

Con casi 500 mil millones de parámetros, MAI-1 requiere más potencia informática y datos de entrenamiento que los modelos de código abierto anteriores de Microsoft (como Phi-3, que cubrimos el mes pasado). Esto coloca a MAI-1 en la misma liga que GPT-4 de OpenAI Rumor Más de 1 billón de parámetros (en combinaciones de expertos) e incluso más que modelos más pequeños como los 70 mil millones de parámetros de Meta y Mistral.

READ  Elon Musk ahora tiene problemas con las PC con Windows y le pidió ayuda a Satya Nadella

El desarrollo de MAI-1 sugiere un enfoque dual hacia la IA dentro de Microsoft, centrándose tanto en pequeños modelos de lenguaje impulsados ​​localmente para dispositivos móviles como en modelos más grandes y sofisticados impulsados ​​por la nube. Según se informa, Apple está explorando un enfoque similar. También destaca el deseo de la compañía de explorar el desarrollo de la IA independientemente de OpenAI, cuya tecnología actualmente impulsa las funciones de IA generativa más ambiciosas de Microsoft, incluido un chatbot integrado en Windows.

El propósito exacto del MAI-1 no ha sido determinado (ni siquiera por Microsoft), y su mejor uso depende de su rendimiento, según una de las fuentes. Para entrenar el modelo, Microsoft asigna una gran cantidad de servidores con GPU Nvidia y compila datos de entrenamiento de una variedad de fuentes, incluido GBT-4 de OpenAI y texto generado a partir de datos públicos de Internet.

Dependiendo del progreso en las próximas semanas, Microsoft podría obtener una vista previa del MAI-1 en su conferencia de desarrolladores Build a finales de este mes, según los informes.