Parole

Dernier ajout : 22 juillet 2006.

Ces documents font partis de l’étude que j’ai réalisé dans le cadre de mon mémoire d’ingénieur CNAM en informatique.

Ils commencent par présenter la structure de la parole en français et ses unités élémentaires, les phonèmes, ainsi que les mécanismes de production de la parole.

Vous trouverez ensuite une description du signal acoustique de la parole et les outils d’analyse et de traitement couramment utilisés.

On s’attachera ensuite aux mécanismes de perception de la parole, avant d’évoquer quelques principes de la reconnaissance automatique. Ces principes sont basés sur les hypothèses simplificatrices retenues pour la mise en application dans la partie réalisation de mon mémoire : monolocuteur, vocabulaire limité, ambiance assez calme.

Enfin vous trouverez une bibliographie, certes datant de 1995, mais dont certains éléments sont des références incontournables pour aborder ce domaine.

Je vous souhaite une bonne lecture, en espérant que ces quelques documents vous seront utiles.

Derniers articles

Bibliographie

Samedi 22 juillet 2006, par ph@ln // Parole

[ALE 92] D’ALESSANDRO C. et DEMARS C., Représentations temps-fréquence du signal de parole, Traitement du signal, Vol 9, n° 2, 1992, pp. 153-172. [AUD 95] D’AUDIGIER P.., Un DSP sur mesure pour une dictée PC sans fautes, Electronique, n° 44, Janvier 1995, pp. 79-85. [BEL 90] BELLANGER M., Traitement numérique du signal, Paris, Collection technique et scientifique des télécommunications, MASSON, 1990. [BIL 92] BILANGE E., Dialogue personne-machine, modélisation et réalisation infor Lire la suite »

La reconnaissance automatique de la parole.

Samedi 22 juillet 2006, par ph@ln // Parole

1) Difficultés de la RAP. Le signal de la parole possède des caractéristiques qui compliquent son interprétation et augmentent le nombre de données à traiter.
Il présente un caractère redondant, c’est à dire qu’il renferme plusieurs types d’informations : les sons, la syntaxe et la sémantique de la phrase, l’identité du locuteur et son état émotionnel. Si cette redondance lui confère une bonne résistance au bruit, elle oblige à extraire du signal les informations pertine Lire la suite »

La perception de la parole

Samedi 22 juillet 2006, par ph@ln // Parole

Le processus de compréhension par l’auditeur d’un message oral peut être décomposé en deux niveaux [CAL 89] :
Une transformation de l’information contenue dans le signal acoustique par l’oreille, qui transmet le résultat au cerveau.
La reconstitution dans le cerveau du message linguistique, séparé en une étape d’interprétation des indices fournis par l’oreille et une étape d’accès à la sémantique du message.
1) Physiologie du système auditif. L’ Lire la suite »

Analyse et traitement du signal acoustique.

Samedi 22 juillet 2006, par ph@ln // Parole

Le traitement du signal vocal s’inscrit dans une succession de procédures, que ce soit pour la reconnaissance automatique ou pour la synthèse de la parole. Analyse et synthèse sont deux activités duales, l’analyse fournissant une description du signal acoustique que la synthèse utilise pour le reproduire.
Le traitement est aussi utilisé pour réduire la redondance du signal vocal, ou en extraire des paramètres pertinents pour la reconnaissance. Cette réduction par traitement permet a Lire la suite »

Le signal acoustique de la parole

Samedi 22 juillet 2006, par ph@ln // Parole

1) Description. La parole est un signal réel, continu, d’énergie finie et non stationnaire. Sa structure est complexe et variable avec le temps. Sa composition, figure 2, est la suivante :
Pseudo-périodique (D) : sons voisés ;
Aléatoire (A) : sons fricatifs ;
Impulsionel (C) : phase explosive des sons occlusifs. (B est du bruit) Figure 2 : Représentation temporelle du signal acoustique de la parole.
Une manière aisée de décrire le signal acoustique est d’utiliser une représentat Lire la suite »

La production de la parole

Samedi 22 juillet 2006, par ph@ln // Parole

1) Les Sons. La parole se distingue des autres sons par des caractéristiques acoustiques ayant leurs origines dans les mécanismes de production. Les sons de parole sont produits soit par les vibrations des cordes vocales (source de voisement), soit par l’écoulement turbulent de l’air dans le conduit vocal, soit lors du relâchement d’une occlusion de ce conduit (source de bruit).
Dans le processus de communication parlée, pour une langue donnée, les sons permettent de distingue Lire la suite »