Réalisations

Supports d'application

Les supports d’application destinés à un public d’acteurs de terrain (Action de valorisation d’utilité sociale) sont les suivants :

Support S1 : Études de synthèse du Cued Speech Français et Américain
Support S2 : Logiciel de Cued Speech en réalité augmentée avec main codeuse
Support S3 : Capsules avec vidéos codées automatiquement

S1. Études de synthèse du Cued Speech Français et Américain

Ces documents seront élaborés durant le projet et seront mis à disposition.

S2. Logiciel de Cued Speech en réalité augmentée avec main codeuse

Accéder au logiciel :

Notice d'installation Télécharger SPPAS Accéder au code source

Suivi des versions :

4.10 (avril 2023) : Pour la langue française uniquement, SPPAS peut produire la suite de clés à coder à partir d'une transcription orthographique, accompagnée ou non d'un fichier audio. Système à base de règles définies par des experts du codage (WP2-L1).
4.11 (juin 2023) : La preuve de concept a été re-programmée et donc débuggée. Elle fonctionne avec n'importe quelle vidéo, et pas uniquement la démo. L'angle du bras est différent selon la clé.
4.12 (août 2023) : SPPAS permet de corriger manuellement les annotations, y compris les annotations vidéo.
4.13 (oct. 2023) : la main codeuse peut être intégrée à la vidéo avec différentes options d'affichage, via une interface graphique (minimale) spécifique. Fonctionne pour la démo uniquement, et en mode de debug seulement. C'est un prototype de la future interface.
4.17 (jan. 2024) : SPPAS peut produire les clés avec différentes règles de synchronisation audio-main, avec l'introduction d'un modèle à base de règles définies par des experts du codage (WP3-L1).
4.22 (juil. 2024). Livrable "Système version 1" : trois modèles différents de l'angle de l'avant-bras ont été introduits pour afficher la main sur la vidéo ; deux modèles différents permettent d'estimer la position des voyelles par rapport au visage ; six séries de photos de mains sont proposées ainsi que deux séries de mains dessinées ; des filtres peuvent être appliqués à la main dessinée pour ajouter des informations.
4.25 (31 mars 2025). Livrable "Système version 2" : un nouveau modèle pour l'angle de l'avant-bras a été introduit pour afficher la main sur la vidéo ainsi que de nouveaux modèles permettent d'estimer la position des voyelles par rapport au visage ; les modèles utilisés par défaut ont été changés et de nouvelles options de génération sont mises à disposition.
4.26 (26 juin 2025). SPPAS peut produire la suite de clés à coder à partir d'une transcription orthographique, accompagnée ou non d'un fichier audio pour l'anglais américain. Système à base de règles définies par des experts du codage (WP2-L2). Tester le système en ligne.

Video preview — Illustrations du résultat de codage automatique avec trois vidéos réalisées en 07/2024 avec le logiciel SPPAS - version 4.22.

S3. Capsules avec vidéos codées automatiquement

Les enregistrements relatifs à la création des capsules ont été réalisés en avril 2024. La synchronisation audio/vidéo, la transcription orthographique (manuelle), les annotations phonétiques (automatiques) et vidéos (automatiques) ont été réalisées en août 2024. Une première version des vidéos codées a été produite en septembre 2024. Elles sont en cours d'analyse.

Les capsules seront disponibles dans le courant de la 3ᵉ année du projet.

Communications scientifiques

Publications

Brigitte Bigi (2023).

An analysis of produced versus predicted French Cued Speech keys.

In 10th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, ISBN: 978-83-232-4176-8, pp. 24-28, Poznań, Poland.

Cued Speech is a communication system developed for deaf people to complement speechreading at the phonetic level with hands. This visual communication mode uses handshapes in different placements near the face in combination with the mouth movements of speech to make the phonemes of spoken language look different from each other. This paper presents an analysis on produced cues in 5 topics of CLeLfPC, a large corpus of read speech in French with Cued Speech. A phonemes-to-cues automatic system is proposed in order to predict the cue to be produced while speaking. This system is part of SPPAS-the automatic annotation an analysis of speech, an open-source software tool. The predicted keys of the automatic system are compared to the produced keys of cuers. The number of inserted, deleted and substituted keys are analyzed. We observed that most of the differences between predicted and produced keys comes from 3 common position's substitutions by some of the cuers.

Núria Gala, Brigitte Bigi, Marie Bauer (2024).

Automatically Estimating Textual and Phonemic Complexity for Cued Speech: How to See the Sounds from French Texts

In The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pp. 1817-1824, Turin, Italie.

In this position paper we present a methodology to automatically annotate French text for Cued Speech (CS), a communication system developed for people with hearing loss to complement speech reading at the phonetic level. This visual communication mode uses handshapes in different placements near the face in combination with the mouth movements (called ‘cues’ or ‘keys’) to make the phonemes of spoken language look different from each other. CS is used to acquire skills in lip-reading, in oral communication and for reading. Despite many studies demonstrating its benefits, there are few resources available for learning and practicing it, especially in French. We thus propose a methodology to phonemize written corpora so that each word is aligned with the corresponding CS key(s). This methodology is proposed as part of a wider project aimed at creating an augmented reality system displaying a virtual coding hand where the user will be able to choose a text upon its complexity for cueing.

Brigitte Bigi, Núria Gala (2024).

Preuve de concept d'un système de génération automatique en Langue française Parlée Complétée

In 35ème Journées d’Études sur la Parole (JEP). Toulouse, France.

La Langue française Parlée Complétée (LfPC) est un système de communication développé pour les personnes sourdes afin de compléter la lecture labiale avec une main, au niveau phonétique. Il est utilisé par les enfants pour acquérir des compétences en lecture, en lecture labiale et en communication orale. L’objectif principal est de permettre aux enfants sourds de devenir des lecteurs et des locuteurs compétents en langue française. Nous proposons une preuve de concept (PoC) d’un système de réalité augmentée qui place automatiquement la représentation d’une main codeuse sur la vidéo pré-enregistrée d’un locuteur. Le PoC prédit la forme et la position de la main, le moment durant lequel elle doit être affichée, et ses coordonnées relativement au visage dans la vidéo. Des photos de mains sont ensuite juxtaposées à la vidéo. Des vidéos annotées automatiquement par le PoC ont été montrées à des personnes sourdes qui l’ont accueilli et évalué favorablement.

Conférences invitées

Núria Gala, Brigitte Bigi (2023).

Création de ressources en langue française parlée complétée pour faciliter l'accès à la langue orale via l'écrit

Journée scientifique de l'Institut des Sciences et Techniques de la Réadaptation, Institut des Sciences & Techniques de la Réadaptation, 3 juin 2023, Lyon, France.

La Langue française Parlée Complétée (LfPC ou Cued Speech) est un codage des sons via des informations visuelles : chaque son est représenté avec une forme de main pour une consonne et une position autour du visage pour une voyelle. La LfPC est utilisée par le public sourd et malentendant pour acquérir de bonnes compétences en lecture, en lecture labiale et en expression orale. Il permet notamment aux enfants sourds ou malentendants de devenir des bons lecteurs, compétence indispensable pour tous les apprentissages. Malgré les nombreux travaux démontrant ses avantages, il n’existe que peu de ressources en LfPC. Aussi, ce projet vise à développer des ressources pour l’apprentissage et la pratique de la LfPC. Nous nous proposons de développer un système de réalité augmentée qui place automatiquement la représentation d’une main codeuse sur une vidéo d’un locuteur pré-enregistré. Un logiciel de codage automatique LfPC et des bibliothèques de vidéos codées à but pédagogique seront ainsi produits en respectant tous les critères de l’Open Science. Le système de codage sera développé sur la base d’observations d’un corpus de 4 heures d’enregistrement audio/vidéo (Bigi et al., 2022). Les supports textuels de la ressource seront issus du projet ANR ALECTOR, ce sont des textes simplifiés pour faciliter la lecture (Gala et al. 2020).

Séminaires

Séminaires internes - LPL

Brigitte Bigi (2023).

Réunion équipe VESPA - Variation Et Singularité dans la PArole, Laboratoire Parole et Langage, 3 juin 2023, Aix-en-Provence, France.

Brigitte Bigi (2023).

Voir les sons avec du "Cued Speech" automatisé : la réalité augmentée au service des personnes sourdes

Journée annuelle scientifique du Laboratoire Parole et Langage, 23 juin 2023, Aix-en-Provence, France.

Núria Gala, Brigitte Bigi (2024).

Un outil de réalité augmentée pour coder automatiquement les sons du français

1er Afterwork de la Cognition, organisé par le LPL en partenariat avec l'Institut Carnot Cognition, autour du thème "Langage et apprentissage", 6 juin 2024, Aix-en-Provence, France.

Brigitte Bigi (2025).

SPPAS : coder automatiquement les sons en LfPC

Journée annuelle scientifique du Laboratoire Parole et Langage, 1-2 juillet 2025, Aix-en-Provence, France.

Séminaires invités

Brigitte Bigi (2025).

14 mars 2025, Nancy, France.

Brigitte Bigi (2025).

7 juillet 2025, Superbagnères, France.

Livrables du projet

Work package 1 – Collecte et annotation de corpus codés

WP1-L1 - Segmentation phonétique de CLeLfPC

Cette annotation permet d'indiquer quel phonème a été prononcé, et à quel moment. Elle concerne 10 locuteurs du corpus CLeLfPC, version 6, déposée sous licence CC-By-NC-4.0 sur https://www.ortolang.fr

WP1-L2 - Annotation en clés de CLeLfPC

Cette annotation permet d'indiquer quelles clés ont été réalisées durant la lecture. Elle concerne 10 locuteurs du corpus CLeLfPC, version 8, déposée sous licence CC-By-NC-4.0 sur https://www.ortolang.fr

WP1-L3 - Transitions des clés de CLeLfPC

Cette annotation permet d'indiquer à quels moments ont lieu les transitions des positons et des configurations de la main durant la lecture. Elle concerne 5 locuteurs du corpus CLeLfPC, version 10, déposée sous licence CC-By-NC-4.0 sur https://www.ortolang.fr

WP1-L4 - Annotation des mains et du visage

Cette annotation permet d'indiquer quelles sont les coordonnées des mains et du visage du locuteur dans chaque image des vidéos. Elle concerne les 25 locuteurs du corpus CLeLfPC, version 8, déposée sous licence CC-By-NC-4.0 sur https://www.ortolang.fr

Work package 2 – Des phonèmes aux clés (QUOI ?)

WP2-L1 - Système prédictif des séquences de clés (français)

Le système de prédiction automatique des clés à partir d'un fichier audio et de sa transcription, pour la langue française, est disponible à partir de la version 4.10 de SPPAS

Work package 3 – Synchronisation main/son (QUAND ?)

WP3-L1 - Système prédictif des moments de transition de positions

Le système de prédiction automatique des moments de transitions de la main d'une voyelle à l'autre est disponible à partir de la version 4.17 de SPPAS

WP3-L2 - Analyse des moments de transition de positions

Etude des moments de transition de positions observés dans les annotations du corpus CLeLfPC : analyse de la désynchronisation entre la position de la main et la réalisation acoustique correspondante.

Work package 4 - Trajectoire de la main (OU ?)

WP4-L1 - Angle de la main

Ce livrable s'attache à décrire les différents modèles d'angles de la main implémentés et une étude des valeurs d'angles observées dans des données annotées de CLeLfPC.

WP4-L2 - Coordonnées des positions des voyelles

Ce livrable s'attache à décrire les différents modèles implémentés pour déterminer les coordonnées des voyelles sur le visage détecté, et propose une étude des valeurs observées dans des données annotées de CLeLfPC.

Work package 6 – Supports d'application

WP6-L1 - Enregistrements et annotations en lecture de textes

Les premières étapes du processus de création des capsules : sélection du contenu textuel à enregistrer, modalités d'enregistrement, annotations manuelles et codage automatique de SPPAS.