La production de la parole

Samedi 22 juillet 2006, par ph@ln // Parole

1) Les Sons.

La parole se distingue des autres sons par des caractéristiques acoustiques ayant leurs origines dans les mécanismes de production. Les sons de parole sont produits soit par les vibrations des cordes vocales (source de voisement), soit par l’écoulement turbulent de l’air dans le conduit vocal, soit lors du relâchement d’une occlusion de ce conduit (source de bruit).

Dans le processus de communication parlée, pour une langue donnée, les sons permettent de distinguer les différentes unités de signification du langage [CAL 89]. L’unité élémentaire d’un son permettant la distinction des différents mots est le phonème.

La notion de phonème ne tient compte que des caractéristiques acoustiques qui permettent une distinction entre des mots. On ne tient pas compte des phénomènes physiques de production du son, tant que la différence d’articulation (fonction du dialecte, de la cadence d’élocution, du contexte) ne permet pas de distinguer des mots différents. La représentation phonétique d’un texte dépend de la langue dans laquelle il est écrit. Le tableau suivant donne une liste des phonèmes pour le français [BOI 87].

Les phonèmes peuvent êtres rangés en catégories selon des "traits distinctifs" qui indiquent une similitude au niveau articulatoire, acoustique ou perceptif. Les voyelles peuvent être rangées selon [CAL 89] :
- la nasalité ;
- l’ouverture du conduit vocal ;
- la position de la constriction du conduit vocal ;
- l’arrondissement des lèvres.

Les consonnes sont classées selon :
- le voisement ;
- le mode d’articulation (occlusif, nasal, fricatif) ;
- le lieu d’articulation (labiale, dentale, palatale).

D’autres aspects de la parole permettent de distinguer les différentes significations. Des phénomènes comme la prosodie, la durée ou l’intensité des phonèmes, le timbre de la voix permettent à l’auditeur d’identifier le locuteur ou de se faire une idée sur son attitude.

Cette multiplication des informations complique le traitement automatique de la parole, mais l’être humain en tire sans doute des avantages pour percevoir le message, particulièrement lorsque le signal acoustique est bruité.
Retour au début du document

2) La production

.
Le processus de production de la parole présente certaines caractéristiques :
- Continuité ; lorsqu’on écoute parler une personne, on perçoit une suite de mots que l’analyse du signal vocal sépare difficilement. Le même problème de segmentation se retrouve à l’intérieur du mot, perçu comme une suite de sons élémentaires, les phonèmes.
- Variabilité ; à contenu phonétique égal, le signal vocal est très variable, tant pour différents individus que pour un même locuteur, en raison des différences anatomiques.
Le conduit vocal est un tuyau tridimensionnel qui est excité par une ou deux sources acoustiques. La source laryngienne peut être considérée comme quasi périodique, avec une fréquence pouvant évoluer très rapidement. La seconde source génère du bruit de friction ou d’explosion (glotte, lèvres).
- Encodage ; depuis l’idée jusqu’au signal sonore, interviennent plusieurs niveaux successifs de traitement : sémantique (concept), syntaxique (structure du langage), lexical (mots), morphologique, phonétique (phonèmes et leurs interactions).

Le larynx est un lieu important pour les mécanismes phonatoires. Il est situé dans la région moyenne du cou et il est constitué de cartilages, de muscles, de muqueuse et de nerfs. Il contient les "cordes vocales" qui sont un ensemble de muqueuses, de ligaments et de muscles.

La langue joue un rôle dans la phonation, car sa mobilité lui permet d’agir avec précision et rapidité sur la taille du conduit vocalique.

Les lèvres sont situées à l’extrémité du conduit vocal et c’est leur écartement (et les variations de cet écartement ) qui est important du point de vue acoustique.Retour au début du document

3) Modèle de production de la parole.

Une représentation fonctionnelle du modèle de production, séparant sources, conduit et rayonnement aux lèvres, est donnée par la figure 1.

Figure 1. Modèle fonctionnel de production de la parole.

Une phrase est une suite de sons voisés, de sons non voisés et de silences. Pour la générer, il faut connaître pour chaque intervalle de temps dT, intervalle durant lequel le modèle est considéré comme invariant (5 à 25 ms) :
- La fréquence fondamentale F0 ;
- Les amplitudes Av et Ab ;
- Les coefficients des filtres modélisant le conduit vocal, l’impulsion glottale et le rayonnement aux lèvres.


Mots clés