WOWWW - Nouvelles

Des lunettes connectées qui lisent sur les lèvres

2023-05-03
Des chercheurs ont mis au point des lunettes connectées capables de détecter les mots articulés silencieusement. Elles pourraient être utilisées pour commander son smartphone, voire même être combinées à un synthétiseur vocal pour donner une voix aux personnes muettes.

Bientôt, vos lunettes de vue pourraient vous permettre de commander votre smartphone. Des chercheurs de l’université de Cornelle aux États-Unis ont intégré un système de sonar sur des lunettes connectées qui peuvent détecter les mouvements des lèvres. Baptisées EchoSpeech, elles sont extrêmement discrètes, et utilisent même une monture de lunettes du commerce.

Le système est composé de deux haut-parleurs miniatures sous un œil qui émettent des ultrasons en direction de la bouche. Deux microphones, placés sous l’autre œil, enregistrent les échos. La combinaison permet d’enregistrer quatre signaux différents qui sont ensuite analysés par un système d’apprentissage profond qui déduit les mouvements de la bouche. Selon les chercheurs, avec seulement deux sessions d’entraînement, les EchoSpeech peuvent déjà reconnaître 31 commandes.

Un système qui ne nécessite qu’un smartphone

Le choix d’un système sonore plutôt que des caméras offre plusieurs avantages. Les composants sont moins chers et plus petits, rendant les lunettes beaucoup plus discrètes et légères, et donc plus confortables à porter. L’autonomie est également meilleure. Les EchoSpeech fonctionnent une dizaine d’heures entre deux recharges, là où une solution similaire avec des caméras serait limitée à seulement 30 minutes. De plus, les données audio sont beaucoup plus simples à traiter. Les lunettes envoient toutes les données par Bluetooth à un smartphone qui peut les traiter en temps réel. Enfin, cette solution est plus respectueuse de la vie privée qu’une caméra qui enregistre le visage. Les données sont traitées localement et les lunettes filtrent les fréquences plus basses, évitant ainsi d’enregistrer toute conversation aux alentours.

À terme, les EchoSpeech pourraient permettre de dicter du texte dans des lieux où il n’est pas possible de parler, par exemple dans une bibliothèque ou dans un lieu bruyant comme un restaurant ou une salle de concert. De plus, elle pourrait être combinée avec un système de synthèse vocale pour donner une voix aux personnes muettes et leur permettre de communiquer sans langage des signes. Les chercheurs travaillent actuellement sur la reconnaissance des expressions faciales, ainsi que les mouvements des yeux et du haut du corps. Un tel système pourrait notamment être intégré sur les casques de réalité virtuelle pour animer son avatar.