Teams: Microsoft supprime les bruits de fond grace à l’IA



Microsoft vient de mettre en ligne une nouvelle fonctionnalité dans Teams qui va supprimer les bruits de fonds souvent présents lors de vos réunions réalisées en télétravail. Pour tester merci de vous munir de votre aspirateur préféré. !

Article original : https://techcommunity.microsoft.com/t5/microsoft-teams-blog/reduce-background-noise-in-microsoft-teams-meetings-with-ai/ba-p/1992318

 

Qu’il s’agisse de réunions multiples se déroulant dans un petit espace, d’enfants jouant bruyamment à proximité ou de bruits de construction à l’extérieur de votre bureau à domicile, les bruits de fond indésirables peuvent être vraiment gênants dans les réunions des équipes. Nous sommes heureux d’annoncer que les utilisateurs auront la possibilité de supprimer les bruits de fond indésirables pendant leurs appels et leurs réunions grâce à notre nouvelle option de suppression des bruits basée sur l’IA.

Les utilisateurs peuvent activer cette nouvelle fonction utile en ajustant les paramètres de leur appareil avant leur appel ou leur réunion et en sélectionnant « Elevé » dans le menu déroulant « Suppression du bruit » (notez que cette fonction n’est actuellement prise en charge que dans le client de bureau Windows Teams). Pour plus d’informations sur la façon de l’activer et pour en savoir plus, consultez cet article de support : https://aka.ms/noisesuppression.

Notre nouvelle fonction de suppression du bruit fonctionne en analysant le flux audio d’un individu et utilise des réseaux neuronaux profonds spécialement formés pour filtrer le bruit et ne retenir que la parole. Alors que les algorithmes traditionnels de suppression du bruit ne peuvent s’attaquer qu’à des sources de bruit stationnaires simples, comme un bruit de ventilateur constant, notre approche basée sur l’IA apprend la différence entre la parole et les bruits inutiles et est capable de supprimer divers bruits non stationnaires, comme la frappe au clavier ou le craquement d’un emballage alimentaire. Avec l’augmentation du travail à domicile due à la pandémie COVID-19, les bruits tels que passer l’aspirateur, les cours contradictoires de votre enfant ou les bruits de cuisine sont devenus plus courants mais sont efficacement supprimés par notre nouvelle suppression du bruit basée sur l’IA, illustrée dans la vidéo ci-dessous

https://techcommunity.microsoft.com/t5/microsoft-teams-blog/reduce-background-noise-in-microsoft-teams-meetings-with-ai/ba-p/1992318

La suppression du bruit basée sur l’IA repose sur l’apprentissage machine (ML) pour apprendre la différence entre la parole propre et le bruit. L’essentiel est de former le modèle ML sur un ensemble de données représentatif pour s’assurer qu’il fonctionne dans toutes les situations que nos clients de l’équipe connaissent. L’ensemble de données doit être suffisamment diversifié en termes de parole propre, de types de bruit et d’environnements dans lesquels nos clients participent à des réunions en ligne.

 

Pour atteindre cette diversité, nous avons créé un vaste ensemble de données comprenant environ 760 heures de données de parole propre et 180 heures de données de bruit. Pour respecter les normes strictes de Microsoft en matière de confidentialité, nous avons veillé à ce qu’aucune donnée sur les clients ne soit recueillie pour cet ensemble de données. Au lieu de cela, nous avons utilisé soit des données accessibles au public, soit le crowdsourcing pour collecter des scénarios spécifiques. Pour la parole propre, nous nous sommes assurés d’avoir un équilibre entre la parole féminine et masculine et nous avons recueilli des données dans plus de 10 langues, y compris des langues tonales, afin de garantir que notre modèle ne changera pas le sens d’une phrase en déformant le ton des mots. Pour les données sur le bruit, nous avons inclus 150 types de bruit afin de nous assurer que nous couvrons divers scénarios que nos clients peuvent rencontrer, de la frappe au clavier à la chasse d’eau des toilettes ou au ronflement. Un autre aspect important était d’inclure les émotions dans notre discours propre afin que des expressions comme le rire ou les pleurs ne soient pas supprimées. Les caractéristiques de l’environnement à partir duquel nos clients rejoignent les réunions de leur équipe en ligne ont également un impact important sur le signal vocal. Pour saisir cette diversité, nous avons formé notre modèle avec des données provenant de plus de 3 000 environnements de salles réelles et de plus de 115 000 salles créées synthétiquement.

Comme nous utilisons un apprentissage approfondi, il est important de disposer d’une infrastructure de formation de modèles puissante. Nous utilisons Microsoft Azure pour permettre à notre équipe de développer des versions améliorées de notre modèle ML. Un autre défi est que l’extraction de la parole propre originale à partir du bruit doit être faite d’une manière que l’oreille humaine perçoit comme naturelle et agréable. Comme il n’existe pas de mesures objectives fortement corrélées à la perception humaine, nous avons mis au point un cadre qui nous a permis d’envoyer les échantillons audio traités à des fournisseurs d’approvisionnement de foule où les auditeurs humains évaluent leur qualité audio sur une échelle d’une à cinq étoiles pour produire des scores d’opinion moyens (MOS). Grâce à ces évaluations humaines, nous avons pu développer une nouvelle mesure perceptuelle qui, associée aux évaluations humaines subjectives, nous a permis de progresser rapidement dans l’amélioration de la qualité de nos modèles d’apprentissage profond.

Pour faire progresser la recherche dans ce domaine, nous avons également ouvert notre ensemble de données et le cadre de crowdsourcing de la qualité perceptive. Cela a été la base de deux concours que nous avons organisés dans le cadre des conférences Interspeech 2020 et ICASSP 2021, comme indiqué ici : https://www.microsoft.com/en-us/research/dns-challenge/home/

Enfin, nous avons veillé à ce que notre modèle d’apprentissage approfondi puisse fonctionner efficacement sur le client Teams en temps réel. En optimisant la perception humaine, nous avons pu obtenir un bon compromis entre la qualité et la complexité, ce qui garantit que la plupart des appareils Windows utilisés par nos clients peuvent bénéficier de notre suppression du bruit basée sur l’IA. Notre équipe travaille actuellement à l’introduction de cette fonctionnalité sur nos plateformes Mac et mobiles.

La suppression du bruit basée sur l’IA est un exemple de la manière dont notre technologie d’apprentissage approfondi a un impact profond sur la qualité de l’expérience de nos clients.

Votre commentaire

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s