
Brigitte Bigi, CRHC
projet financé par la FIRAH 2023-2026
Séminaire ATILF, Nancy, 14 mars 2024
https://sppas.org | ![]() |
![]() |
Segmentation phonétique pour de la parole :
... et bien d'autres
si on regarde euh
euh la CSCE etc vous avez à jamais à aucun moment justement euh
euh au n- niveau des délimitations euh étatiques vous n'avez justement euh
euh cette superposition
euh donc euh
il y a euh
euh de ce point de vue là euh un flou et euh bon moi je suis assez euh
14 « euh » en 18 secondes…
Dans ce corpus, ils représentent 6% des tokens.
j'ai emprunté des livres à la b.u. j'ai déjà reçu le mail comme quoi qu'il faut que je les rende je les ai même pas ouverts @ @ @ c’est clair * je te jure | @ c’est ça @ moi aussi @ c’est pareil j'ai reçu genre mais en plus j'en ai commandé euh quoi peut être huit quoi rien de (en)fin ridicule quoi @ @ d'où j'ai le temps de lire déjà rien que un livre @ j'en ai commandé huit quoi rien à voir (en)fin n’importe quoi du coup euh du coup ouais |
9 rires en 19 secondes…
Dans ce corpus, ils représentent 4% des tokens.
Une convention de transcription simple qui permet à SPPAS de gérer les événements de la parole.
Hésitation : |
Rire : |
Mots inconnus, mots régionaux : |
Hypo-articulation : |
Reprises, répétitions, mots tronqués : |
Autres : élisions, bruits, etc. |
Disponible sur Ortolang : https://hdl.handle.net/11403/clelfpc/
![]() |
Création d'un code visuel permettant de représenter chaque son d'une langue. |
- Donne un accès visuel à la langue orale
- Facilite l'acquisition de compétences en expression orale et en lecture labiale.
![]() |
|
Le projet consiste à co-créer et co-évaluer un système IA codant automatiquement en Langue française Parlée Complétée et en Cued Speech anglais américain.
- quoi ? déterminer les phonèmes => la clé
- quand ? synchronisation main-son
- ou ? définir l'angle et la trajectoire
- comment ? superposer des mains sur une vidéo
5 codeurs, 4143 clés annotées
Les substitutions concernent (87,4 %) la position (voyelles) bien plus souvent que la forme de main (la consonne).
La main précède le son
Face detection:
![]() ![]() ![]() |
Face identity:
![]() |
Face sight:
![]() |
Vowels:
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
|
![]() ![]() ![]() |
Evalués en juillet 2024 avec une tâche de décodage :
- le modèle "quand" est satisfaisant mais doit être amélioré
- les mains dessinées sont nettement préférable aux photos
- un angle variant modérément (ou pas du tout) est préférable
- pas d'ajout d'information sur les mains
Pour suivre l'évolution du projet, rendez-vous à l'adresse :
https://auto-cuedspeech.org
Financement AMIDEX 2025-2028 (4 ans), 183 k€
14, 23, 30, 170, 535, 1400, 106k, 89k
![]() |
Ce document est une œuvre de création, propriété exclusive du LPL, protégé par la législation française et internationale sur le droit de la propriété intellectuelle, sous Licence CC-by-NC-ND (Attribution / Pas d’Utilisation Commerciale / Pas de Modification). Cette licence autorise toute diffusion (partager, copier, reproduire, distribuer, communiquer), sauf à des fins commerciales, par tous moyens et sous tous formats, tant que l'oeuvre est diffusée sans modification et dans son intégralité. Vous êtes libre de copier, distribuer et transmettre ce document, à condition que vous créditiez le projet auto-cuedspeech.org. |