Rechercher

Spotify va utiliser l’IA pour traduire les podcasts

Spotify
Logo Spotify. | Source : Getty Images

La plateforme Spotify va bientôt utiliser l’intelligence artificielle (IA) pour traduire les podcasts, a annoncé la société, lundi 25 septembre, dans le cadre d’un partenariat avec OpenAI.

 

Lundi, Spotify a annoncé lancer un projet pilote pour sa fonction « Traduction vocale », qui traduira les podcasts dans d’autres langues en respectant la voix et le style de l’orateur d’origine.

Cette fonctionnalité a été créée en partenariat avec OpenAI, qui a annoncé mettre en place de nouvelles « capacités vocales et d’image » pour ChatGPT, permettant aux utilisateurs de parler avec le chatbot d’IA en générant un « son semblable à celui d’un humain à partir d’un simple texte et de quelques secondes d’échantillon de discours ».

La nouvelle fonctionnalité de Spotify est basée sur l’outil de transcription vocale « Whisper » d’OpenAI, qui transcrit le discours anglais et traduit à partir d’autres langues vers l’anglais.

Le projet pilote comprend trois épisodes de podcasts, dont Lex Fridman Podcast, Armchair Expert et The Diary of a CEO with Steven Bartlett, disponibles en espagnol pour les utilisateurs abonnés et non abonnés, avec des épisodes disponibles en français et en allemand « dans les jours et les semaines à venir ».

Tous les podcasts traduits seront disponibles dans « Voice Translations » de Spotify, qui sera mis à jour avec des épisodes et des podcasts supplémentaires « au cours des semaines et des mois à venir ».

Au total, 100 millions d’utilisateurs écoutent « régulièrement » des podcasts sur Spotify, selon la plateforme.

D’autres entreprises ont commencé à utiliser l’IA générative pour leurs produits au cours des derniers mois. Meta a annoncé au début de l’année lancer AudioCraft, un outil qui permet aux utilisateurs de créer de la musique et des sons générés par l’IA. Le Financial Times a rapporté en août que Google et Universal Music Group étaient en pourparlers sur la possibilité d’accorder des licences pour les mélodies et les voix d’artistes dans le cadre de la musique générée par l’IA. Google a également annoncé au début du mois avoir intégré son chatbot Bard dans ses autres applications, notamment YouTube, Gmail et Drive. Face aux inquiétudes concernant la protection de la vie privée et la sécurité, OpenAI a déclaré mettre progressivement à disposition ses capacités d’image et de voix pour ChatGPT, après que l’entreprise a averti que les nouvelles fonctionnalités pouvaient présenter de nouveaux risques, notamment « la possibilité pour des acteurs malveillants d’usurper l’identité de personnalités publiques ou de commettre des fraudes ».

 

Article traduit de Forbes US – Auteur : Ty Roush

<<< À lire également : Spotify teste une plateforme de vente directe de billets de concert >>>

Vous avez aimé cet article ? Likez Forbes sur Facebook

Newsletter quotidienne Forbes

Recevez chaque matin l’essentiel de l’actualité business et entrepreneuriat.

Abonnez-vous au magazine papier

et découvrez chaque trimestre :

1 an, 4 numéros : 30 € TTC au lieu de 36 € TTC