Page Nav

HIDE
HIDE
GRID_STYLE

Top Ad

//

Dernières nouvelles:

latest

Kyutai : l’OpenAI « à la française » dévoile le premier assistant vocal IA en temps réel au monde

 En 2023, Iliad, le géant des télécoms, a lancé Kyutai, un laboratoire de recherche dédié à l'intelligence artificielle générative. En s...


 En 2023, Iliad, le géant des télécoms, a lancé Kyutai, un laboratoire de recherche dédié à l'intelligence artificielle générative. En seulement six mois, avec une équipe de 8 chercheurs, Kyutai a développé une solution d'IA vocale révolutionnaire baptisée Moshi. Cette IA est capable de répondre oralement en temps réel et de transcrire également en temps réel, exploitant un modèle de langage multimodal appelé Helium, qui compte 7 milliards de paramètres.

Pour parvenir à cette avancée, les chercheurs de Kyutai ont innové en comprimant d'abord l'audio en pseudo-mots, puis en entraînant le modèle à prédire chaque segment audio à partir du précédent, similaire au fonctionnement d'un modèle de langage textuel classique. Bien que Moshi soit pour l'instant qualifié de "prototype expérimental" par Patrick Pérez, le dirigeant de Kyutai et ancien directeur de Valeo.ai, il est déjà capable de générer jusqu'à 100 000 transcriptions dans un style oral.

Xavier Niel, fondateur d'Iliad, a exprimé sa satisfaction quant aux avancées significatives réalisées par Kyutai, les comparant même au modèle GPT-4o d'OpenAI en termes d'impact potentiel et d'innovation dans le domaine de l'IA générative.

Cette avancée marque une étape importante pour Iliad dans le domaine de la recherche en intelligence artificielle, ouvrant de nouvelles perspectives pour les applications vocales et de transcription en temps réel.

Aucun commentaire