Tout savoir sur l’alphabet phonétique international (et surtout comment le lire)

Voici un article conçu pour vous apprendre à lire l’alphabet phonétique international (API).

Si vous aimez plonger dans les dictionnaires papier ou dans le Wiktionnaire, vous serez familier de ces lettres bizarres utilisées pour représenter des sons, mais quant à les décrypter, c’est une autre histoire. Voici donc un petit guide.

L’article est long, et si vous ne lisez pas tout, c’est compréhensible. Un conseil : utilisez le zoom de votre navigateur si les caractères sont trop petits, avec « Ctrl molette » ou « Ctrl + » (dézoomez avec « Ctrl – »).

Sommaire et index

1. Avant tout, …
 1.1 …les délimiteurs phonétiques…
1.2 …et les phonèmes
2. L’alphabet phonétique en français
2.1 Les consonnes françaises
2.2 Les voyelles françaises
3. L’API entier
3.1 Les voyelles
3.2 Les consonnes
—— 3.2.1 Les modes d’articulation
—— 3.2.2 Les points d’articulation
3.3 Les altérations consonantales et vocaliques
—— 3.3.1 Avec les lettres en exposant : la coarticulation
—— 3.3.2 Avec les diacritiques
3.4 Les tons
3.5 La ponctuation
4. Conclusion
5. Sources
§accent§accent tonique§affrication – allophonie (§1, §2)– aperture (§1, §2)– §aspiration – arrondissement des lèvres (§1, §2, §3, §4) – case vide (§1, §2) – §clic§diphtongue§distinction de couple§emprunt§graphème – §hiatus –  inventaire phonologique (§1, §2) – §longueur§paire minimale§point constricteur§pulmonique§réduction§schwa – semi-consonne (§1, §2) – §triangle / trapèze – §variation libre – voisement (§1, §2, §3) – §voyelles nasales


Avant tout, …

…les délimiteurs phonétiques…

Avant tout, il est nécessaire de reconnaître trois types de délimiteurs :

  • [§ graphèmes] [§ allophonie] les caractères contenus entre <> (chevrons) sont des graphèmes ; des lettres, pour simplifier (par exemple, la lettre française <a>) ;
  • les caractères contenus entre // (barres obliques) sont des phonèmes ; les sons basiques et porteurs de sens d’une langue (par exemple, le son /a/ de la lettre française <a>) ;
  • les caractères contenus entre [] (crochets) sont les réalisations phonétiques de ces phonèmes, c’est-à-dire les variations que les sons subissent en fonction de leur environnement (par exemple, la lettre <r> en français représente le son /ʁ/ mais ce dernier devient [χ] après un certain type de consonnes – c’est ce qu’on appelle un allophone) ou du locuteur (par exemple, le graphème <o> en français représente le phonème /ɔ/, mais je le réalise personnellement comme un [ɤ̞̹]).

…et les phonèmes

[§ paire minimale] [§ inventaire phonologique] Avant d’aborder l’alphabet phonétique d’une manière que je qualifierais de « sécurisée », il est nécessaire de maîtriser ce qu’est un phonème. Faites bien attention si j’utilise des barres obliques ou des crochets au cours de votre lecture !

Chaque langue dispose d’un inventaire phonologique, c’est-à-dire d’un ensemble de sons porteurs de sens qu’on appelle des phonèmes. Par exemple, les sons /t/ et /d/ sont phonémiques en français ; ils sont respectivement représentés par les lettres <t> et <d> et ils sont porteurs de sens. On peut le prouver avec une paire minimale : « dent » (/dɑ̃/) et « temps » (/tɑ̃/) ne sont distingués que par la différence entre /t/ et /d/ ; par inclusion mutuelle, on peut déterminer que les deux sons sont phonémiques : ils font partie de l’inventaire phonologique du français.

Lister les phonèmes d’une langue permet de délimiter les distinctions pertinentes et celles qui ne le sont pas. La distinction de /t/ et /d/ est clairement pertinente en français ; si on ne la faisait pas, « temps » et « dent » seraient homophones. En revanche, la distinction entre [c] et [k] n’est pas pertinente en français, pourtant il s’agit bien là de consonnes différentes : la première est une consonne palatale, plus avancée dans le palais que la seconde, qui est une consonne vélaire.

Tout cela n’empêche pas le français d’avoir les deux sons : par exemple, la lettre <k> dans « Kosovo » est réalisée [k], mais la lettre <k> dans « kiffer » peut être prononcée [c] sous l’influence de la voyelle /i/. Ce n’est tout simplement pas une différence porteuse de sens en français, c’est pourquoi nous ne savons pas faire la différence entre [c] et [k] sans entraînement. C’est pour cela que je me suis mis à marquer les sons entre crochets ; ce sont des réalisations phonétiques, pas phonémiques. Par contre, il faut marquer les sons /c/ et /k/ entre barres obliques quand on parle du hongrois, car la différence entre les deux est phonémique dans cette langue : elle est porteuse de sens, c’est pourquoi les Hongrois savent faire la différence entre les deux sons. Là aussi, des paires minimales le prouvent, comme : « kuka » /kukɒ/ (« idiot ») et « kutya » /kucɒ/ (« chien »).

Pour le formuler autrement, il faut penser aux réalisations phonétiques comme des objets conditionnels qui répondent globalement à une question de précision ; le phonème est imprécis, la réalisation phonétique est – plus ou moins – précise. Et cette condition peut être :

1. environnementale (/k/ devient [c] devant /i/) ;

2. dialectale (/ɛ̃/ devient [ɛŋ] dans l’accent du Midi) ;

3. idiolectale (/ʁ/ devient [ɰ̠] quand c’est moi, et personne d’autre, qui le prononce – même si, bien sûr, d’autres locuteurs font pareil).

Il est possible que la réalisation phonétique soit égale au phonème qui lui correspond (par exemple, un Français donné peut très bien prononcer le phonème /a/ comme un [a]) mais il s’agit là d’une coïncidence, et cette coïncidence ne s’applique jamais à l’ensemble du standard d’une langue ; personne ne prononce tous les /a/ comme des [a], tous les /t/ comme des [t] etc. Avec les réalisations phonétiques, tout peut arriver, jusqu’à des phénomènes très étranges.

Autre détail important :  ces variations ne constituent en aucun cas des erreurs ! La conformité d’un idiolecte ou d’un dialecte au standard peut être approchée, mais cela ne veut pas dire que c’est « mieux ». Personne n’est exempt de variations involontaires, et rares sont les gens qui en sont conscients !

[§ variation libre] Une autre illustration particulièrement parlante des phonèmes vient de l’hawaïen, qui est une langue avec si peu de consonnes que la différence entre [t] et [k] n’est pas phonémique. Les deux sons, si différents aux oreilles d’un Français, sont confondus pour un Hawaïen au point qu’ils sont en variation libre ; un locuteur de l’hawaïen peut prononcer la lettre <k> de ces deux façons ([t] ou [k]) sans que cela soit considéré comme étrange ou faux, et cette personne aura du mal à faire la différence entre les deux quand elle apprendra qu’elle peut être phonémique dans d’autres langues ! Toutefois, le peuple hawaïen est aujourd’hui entièrement bilingue du fait qu’Hawaï est un État américain.

[§ allophonie] En résumé, les phonèmes ne sont pas tant des « sons justes » que des « sons théoriques » ; ils peuvent varier. Un son n’est jamais fixe ; ses réalisations pratiques peuvent former une petite « bulle » de variations autour du phonème, aussi large que le permettent les sons autour (si un phonème est réalisé en dehors de sa bulle d’acceptance – par exemple si le son /i/ est réalisé trop bas –, l’interlocuteur croira entendre un autre phonème – en l’occurrence /e/ ; c’est pour cela que, plus une langue a de phonèmes, moins ils ont de variations possibles… au fait, les variations d’un son en fonction des sons qui l’entourent s’appellent « allophonie »).

Ainsi les crochets servent-ils à noter une réalisation phonétique spécifique et/ou précise, indépendamment des sons porteurs de sens ; phonémiquement, le mot anglais « cuddle » est prononcé /kʌ.dəl/, mais une transcription phonétique serait plutôt [kʰʌ.ɾɫ̩].

Attention, un phonème peut en cacher un autre !

On a tous un préjugé énorme sur les langues en général, et ce préjugé, c’est notre langue maternelle. Cet article ne prétend même pas gratter la surface de l’ensemble des erreurs qu’on peut commettre, et des présomptions qu’on peut avoir sur une langue étrangère à cause d’elle. On a toutes les raisons de croire que si notre langue fait x chose, n’importe quelle autre langue fait pareil. C’est très faux. Et personne n’est à l’abri de croire des choses de ce genre, même avec un peu d’expérience en linguistique. Par exemple, me croirez-vous si je vous dis que le <r> de « pero » en espagnol est prononcé comme le <dd> de « cuddle » en anglais ? Ou bien si je vous dis que le <â> de « pâte » en français – quand il est réalisé avec application – est prononcé comme le <o> de « pot » en anglais ? Lire ces illustrations vous a peut-être fait sursauter comme elles m’ont fait sursauter la première fois que je les ai vues ; mais si vous y réfléchissez, vous ne pourrez que me donner raison. Puisqu’il est impossible de se débarrasser de ce préjugé sans passer beaucoup de temps dans les langues, je vous demande simplement, dans la mesure du possible, de garder à l’esprit qu’il existe tandis que vous parcourez l’article.

Bonne lecture !


L’alphabet phonétique en français

Les consonnes françaises

[§ inventaire phonologique] Une partie de l’API est allouée à chaque langue pour représenter son inventaire phonologique ; voici celui du français (avec les phonèmes et un graphème pouvant y correspondre) en ce qui concerne les consonnes.

Cliquez sur le tableau s’il est trop petit ou moche.

[§ voisement] Voici quinze consonnes françaises. Il manque des choses, mais commençons par étudier ce que nous avons là : un tableau à triple entrée.

  • La première entrée du tableau (les colonnes) nous indique le point d’articulation des consonnes, c’est-à-dire l’endroit de la bouche, dans le sens de sa longueur, où le son est produit (un son bilabial, comme son nom l’indique, est produit avec les lèvres, tandis qu’un son uvulaire est au contraire produit à l’arrière de la gorge) ;
  • la seconde entrée du tableau (les lignes) nous donne le mode d’articulation des consonnes, c’est-à-dire la manière dont le son est produit (une consonne occlusive est produite par les lettres <t,d,p,k> – relâchement soudain d’un blocage de l’air – etc. tandis que les lettres <s,z,f,r> produisent des consonnes fricatives – flux d’air libre mais modulé – ; la différence est sensible) ;
  • la troisième entrée du tableau trahit sa présence par le fait que certaines cellules du tableau contiennent deux sons ; la différence entre les deux membres d’un tel couple de consonnes est le voisement : les sons /p,k,s,f/ sont dévoisés ou sourds tandis que /b,g,z,v/ sont leurs homologues voisés (c’est-à-dire produits avec vibration des cordes vocales).

Note n° 1 : le mode d’articulation nasal est toujours considéré comme un mode articulatoire à part entière, mais il s’agit en fait d’un sous-type de consonnes occlusives.

[§ semi-consonnes] Maintenant, il faut ajouter deux choses pour en finir avec les consonnes françaises. En effet, j’ai volontairement omis un mode articulatoire spécifique : les consonnes spirantes. C’est un mode ambigu car il contient ce qu’on appelle des « semi-consonnes » comme le son /w/ dans « wah ! » ou /j/ dans « ion ». Les spirantes sont généralement caractérisées par l’absence de contact entre les organes phonateurs, mais les « sons L » sont une exception ; elles sont donc plus rigoureusement définies par le fait qu’elles ne produisent pas de turbulence de l’air. Le français contient aussi le son /l/ et une quatrième semi-consonne très rare dans les langues du monde : /ɥ/, comme dans « pluie ». Ajoutons donc un tableau pour compléter l’inventaire phonologique consonantal du français.

Note n° 2 : dans les deux tableaux, je n’ai indiqué qu’un seul graphème pour chaque phonème, mais /j/ peut être produit par <i> ou <y>, /k/ par <c>, <k> ou <qu> etc. ; voyez-y une simplification.

Note n° 3 : selon les locuteurs ou les environnements, les consonnes peuvent changer de point et de mode d’articulation ; par exemple, le son que je produis pour la lettre <r> n’est pas une consonne fricative [ʁ] comme il se doit, mais une consonne spirante [ɰ̠] ! Et certains locuteurs le prononcent [ʀ], qui tient d’un autre mode encore puisque c’est une consonne roulée. Il ne s’agit d’ailleurs pas là de défauts de prononciation, mais simplement de particularités individuelles.

[§ emprunt] Enfin, le dernier élément manquant à notre tour des consonnes françaises, ce sont les sons d’emprunt. Un cas remarquable en français est la consonne nasale vélaire /ŋ/ qu’on utilise dans « camping » sous l’influence de l’anglais. Mais les Français ont du mal à assimiler les sons étrangers dans leur langue de manière générale, et cela reste un cas à part. En revanche, les Allemands prononcent les mots étrangers de la même façon que dans la langue dont ils proviennent ; aussi les germanophones n’écorchent-ils pas les mots « Orange », « Chance », « Restaurant » comme nous écorchons « chewing-gum » (qui est prononcé /t͡ʃjuwɪŋgːʌm/ en anglais et /ʃwiŋgɔm/ en français).


Les voyelles françaises

Les voyelles françaises sont marquées par un tableau analogue à celui des consonnes.

Note n° 4 : là encore, j’ai simplifié les graphèmes correspondants à chaque phonème ; /ɛ/ peut être représenté par <ais>, <ait>, <è>, <aient>, tandis que /e/ peut être représenté par <é>, <ai> etc. (n’oublions pas le tant moqué <eaux> prononcé /o/), mais les voyelles françaises sont tellement nombreuses qu’il est impossible de résumer leurs variations de manière succinte ; de plus, la distinction de /ɛ/ et /e/ n’existe notamment pas dans le Sud de la France, où le /ɔ/ change aussi puisqu’il est prononcé [ɑ], et tout ça n’est qu’un aperçu très rapide des griefs que vous, lecteur, pouvez me porter parce que je simplifie tellement.

Dans ce tableau, j’ai dû faire deux sacrifices, parce que les voyelles françaises – permettez-moi l’expression – sont un vrai b*rdel. Mais j’y reviendrai plus tard, car ce petit tableau est suffisant pour étudier le fonctionnement d’un tableau vocalique. Car un tableau des voyelles ne se lit pas comme un tableau des consonnes.

Un tableau vocalique, à l’instar d’un tableau consonantal, a trois entrées, mais elles fonctionnent toutes différemment :

  • [§ aperture] [§ arrondissement] la première entrée du tableau (les colonnes) nous indique le point d’articulation des voyelles, c’est-à-dire leur position horizontale comme pour les consonnes, sauf que le point d’articulation des voyelles est beaucoup plus subjectif car il ne se produit pas de contact de la langue avec le palais (cela explique aussi pourquoi les points d’articulation sont moins nombreux) ;
  • la seconde entrée du tableau (les colonnes) nous indique l’aperture des voyelles, c’est-à-dire leur position verticale (plus une voyelle est fermée, plus la langue est proche du palais) ;
  • la troisième entrée du tableau trahit sa présence par le fait que certaines cellules du tableau contiennent deux sons, mais ce n’est plus le voisement qui sert à distinguer les membres d’un couple (toute voyelle est par définition voisée, autrement elle serait inaudible) ; à la place, c’est l’arrondissement des lèvres qui sert de distinction. Toute voyelle ainsi que définie par les deux premières entrées (position horizontale + position verticale) a une version non arrondie et une version arrondie (par exemple, le son /y/ de la lettre <u> est la version arrondie du son /i/ de la lettre <i> ; les deux voyelles ont exactement la même position).

Maintenant, détaillons les sacrifices que j’ai faits dans le tableau.

D’une part, je n’ai pas mis des sons qui ne sont que rarement distingués, par exemple la voyelle /ɑ/ de la lettre <â> (/ɑ/ et /a/ sont souvent confondus en France), ou la variante mi-ouverte de <eu> qu’est le son /œ/ (qui se confond souvent avec /ə/ en France) ;

[§ voyelles nasales] Mais surtout, je n’ai pas mis les voyelles nasales. Les voyelles nasales font partie de l’inventaire phonologique du français, mais elles tiennent d’une quatrième entrée du tableau, car elles peuvent former des couples (la version orale de <è> : /ɛ/, est ainsi distinguée de sa version nasale /ɛ̃/ représentée entre autres par <in>) sans que ce soit une différence d’arrondissement des lèvres.

Aussi les voyelles nasales du français sont-elles les suivantes.

Note n° 5 : derechef un sacrifice… Je n’ai pas mis la voyelle /œ̃/ représentée par <un>, qui n’est distinguée de /ɛ̃/ que dans de rares dialectes à ce jour. C’est toutefois un son intéressant, car quand la distinction entre /ɛ̃/ et /œ̃/ est faite, le locuteur produit jusqu’à quatre voyelles différentes à la même position : /ɛ/ et /œ/ qui sont distingués par l’arrondissement, et leurs homologues nasalisés /ɛ̃/ et /œ̃/ qui sont distingués par l’arrondissement et la nasalisation.

Les principales réalisations des voyelles françaises.

Maintenant que nous avons appris à décrypter le français, prenons du recul et voyons ce qui se passe ailleurs.


L’API entier

Les voyelles


Ce tableau montre un ensemble presque exhaustif des voyelles de base que l’humain est capable de produire. Faisons un petit tour des entrées du tableau :

  • [§ aperture] [§ arrondissement] le point d’articulation des voyelles est la position de la langue dans le sens de la longueur de la bouche ;
  • l’aperture des voyelles est la position de la langue dans le sens de la hauteur de la bouche ;
  • les couples de voyelles sont distingués par l’arrondissement des lèvres (toute voyelle de gauche est non arrondie, et toute voyelle de droite est arrondie ; toute voyelle, quelle que soit son point d’articulation et son aperture, peut avoir ces deux versions).

[§ accent] [§ case vide] Note N° 6 : le point d’articulation des voyelles est beaucoup plus subjectif que celui des consonnes, car il ne se produit pas de contact entre différents organes phonateurs lors de la production d’une voyelle. C’est pour cette raison qu’il est très difficile de prononcer exactement la même voyelle dans tous les cas théoriques où elle s’applique. C’est aussi principalement aux voyelles qu’on doit d’avoir un accent dans les langues étrangères, car reproduire parfaitement une voyelle étrangère tient d’un véritable talent en imitation (et je cite là David J. Peterson). D’autre part, toutes les voyelles du tableau vocalique sont possibles même dans les cases vides, ce qui n’est pas le cas du tableau consonantal.

[§ schwa] Note N° 7 : la voyelle /ə/ est bien spéciale : elle est moyenne et centrale, c’est-à-dire que si l’on fait une voyelle avec la langue tout à fait relâchée, c’est celle-ci. Elle a même un nom : le schwa (prononcé « chva »… enfin, /ʃva/).

Les voyelles sont nommées avec la formule « ”voyelle” + [aperture] + [point d’articulation] + [caractère de rondeur] + {altération(s)} » où les paramètres entre accolades sont facultatifs. Par exemple : « voyelle ouverte postérieure non arrondie nasalisée ».

[§ triangle / trapèze] Ah, autre détail intéressant : vous verrez parfois le tableau vocalique sous forme de trapèze. La raison à cela, c’est la forme de la bouche ; on peut produire une beaucoup plus grande variété de voyelles fermées que de voyelles ouvertes. Ci-dessous, un trapèze vocalique typique ; plus bas, un triangle vocalique, une représentation très rare, mais plus scientifiquement rigoureuse, des voyelles qu’on peut produire en fonction de la forme de la bouche.

Les consonnes

Cliquez sur le tableau s’il est trop petit ou moche.

Ce tableau montre un ensemble presque exhaustif des consonnes de base que l’humain est capable de produire. Bien entendu, aucune langue ne les distingue toutes, d’autant que certains sons sont plus difficiles à distinguer les uns des autres. Par exemple, la différence entre [ɸ] vs [f], [ʃ] vs [ɕ], ou encore [x] vs [χ] est trop faible pour être phonémique ; une langue utilisera l’une ou l’autre, et si elle utilise les deux, il y a des chances que la variation soit involontaire et inconsciente.

Quand le mode est distingué entre la réalisation « centrale » et « latérale », on parle de la façon dont s’écoule l’air ; avec une consonne centrale, l’écoulement de l’air se fait au milieu de la bouche, tandis qu’avec une consonne latérale, il se fait de part et d’autre de la langue.

Maintenant, à quoi est-ce que les intitulés des lignes et des colonnes font réellement référence ? On a déjà dit que les lignes étaient le mode d’articulation et les colonnes les points d’articulation, mais concrètement ? Voici un micro-guide.

Les modes d’articulation

[§ semi-consonnes] Les modes d’articulation sont les façons dont l’air utilisé pour la phonation peut être traité. Un son ne peut avoir qu’un seul mode d’articulation à la fois.

  • Le mode articulatoire occlusif implique un relâchement soudain d’un blocage de l’air entre les organes phonateurs ;
  • le mode articulatoire fricatif implique la modulation du flux d’air par les organes phonateurs, sans le bloquer ;
  • le mode articulatoire nasal est un sous-type de consonnes occlusives laissant échapper une partie de l’air par le nez ;
  • le mode articulatoire battu implique le « catapultage » d’un organe phonateur sur un autre (leur rencontre fugace) ;
  • le mode articulatoire roulé tient beaucoup du mode précédent, sauf que les organes phonateurs sont relâchés et autorisent la répétition prolongée du son produit ;
  • le mode articulatoire spirant regroupe des semi-consonnes, des consonnes qui sont produites sans provoquer de turbulence de l’air (elles sont souvent réalisées par un mouvement mais non par un contact des organes phonateurs, sauf dans le cas des consonnes spirantes latérales – les sons « L »).

Note N° 8 : le R battu de « pero » (« mais ») en espagnol est souvent vu comme un « R roulé », tandis que celui de « perro » (« chien ») est vu comme un « R roulé long ». Cette définition est fausse. « Pero » est réalisé avec un « R battu » /ɾ/ tandis que « perro » est réalisé avec un « R roulé » /r/. Une consonne battue longue n’est pas possible et résulte forcément en une consonne roulée (ou en quelque chose d’autre à côté de la plaque comme /d/).

Note N° 9 : les consonnes affriquées sont parfois considérées comme constituant un autre mode articulatoire ; on en reparle dans la partie « La ponctuation ».

Les points d’articulation

[§ point constricteur] Les points d’articulation sont les endroits de la bouche où sont produits les différents sons. Une consonne est en fait réalisée par le rapprochement (pour les consonnes fricatives notamment) ou par la rencontre (pour les occlusives notamment) d’un point d’articulation situé sur la partie supérieure de l’organe vocal, et d’un point constricteur situé sur sa partie inférieure. Néanmoins, le point constricteur tient plus de la particularité anatomique que phonétique, car le point constricteur dépend souvent du point d’articulation (on ne peut pas faire une consonne 16+10 sur l’image ci-dessous), et les distinctions phonémiques faites entre les points constricteurs sont rarissimes (toutefois certaines langues distinguent les consonnes apicales et laminales par exemple).

  • Le point d’articulation bilabial (1 et 2) indique une consonne produite entre les lèvres ;
  • le point d’articulation labiodental (3+2) indique une rencontre des dents avec la lèvre inférieure ;
  • le point d’articulation dental (3) indique une rencontre de la pointe de la langue avec les dents ;
  • le point d’articulation alvéolaire (4) indique une rencontre de la partie avant de la langue avec la petite « bosse » juste derrière les dents ;
  • le point d’articulation post-alvéolaire (5) indique une rencontre de la partie avant de la langue avec le palais juste derrière cette petite bosse ;
  • le point d’articulation alvéolo-palatal (5+7) indique que la langue est relevée en deux endroits ; à la pointe comme pour une consonne alvéolaire, mais aussi au niveau du dos comme pour une consonne palatale (voir ci-après) ;
  • les consonnes rétroflexes (16+7) impliquent que la langue est retournée vers l’arrière de manière à ce que la pointe touche le milieu du palais ;
  • le point d’articulation palatal (7) indique la rencontre de l’arrière de la langue avec l’arrière du palais, mais loin de la gorge ;
  • le point d’articulation vélaire (8) indique la rencontre de l’arrière de la langue avec l’arrière du palais, au niveau du palais mou ;
  • le point d’articulation uvulaire (9) indique la rencontre de l’arrière de la langue avec la luette ;
  • le point d’articulation pharyngal (10) indique l’articulation d’une consonne dans la gorge, à mi-chemin entre la luette et la glotte (où se situent les cordes vocales) ;
  • le point d’articulation glottal (11) indique l’articulation d’une consonne au fond de la gorge, directement au niveau des cordes vocales.

Les numéros 11 à 18 constituent les points constricteurs. 11 = glottal ; 12 = épiglottal ; 13, 14, 15 : dorsal, 16, 17, 18 : coronal (16 = laminal ; 17 : apical).

[§ pulmonique] Avec cette série de modes et de points, on a déjà un joli inventaire. Mais il manque encore plein de choses. Déjà, il manque une série très importante de consonnes qu’on appelle les consonnes non pulmoniques. Jusqu’ici, toutes les consonnes étaient pulmoniques ; elles nécessitaient que de l’air s’écoule depuis les poumons dans la bouche. Mais les consonnes dont nous allons parler maintenant peuvent être produites avec la respiration retenue, ce qui les rend bien spécifiques.

Cliquez sur le tableau s’il est trop petit ou moche.

[§ clic] Passons ces nouveaux modes d’articulation en revue :

  • le mode articulatoire des clics implique de créer une dépression entre le point d’articulation vélaire et un autre point de la bouche (dont dépend la nature du clic) ainsi qu’un relâchement soudain de ce dernier point d’articulation, produisant un claquement ;
  • le mode articulatoire implosif implique une consonne « inspirée », produite en abaissant la glotte pour créer un appel d’air ;
  • le mode articulatoire éjectif implique une consonne « expirée », produite en relevant brutalement la glotte (à l’inverse d’une implosive, donc) pour augmenter la pression de l’air dans la cavité buccale avant de le relâcher. N’importe quelle consonne fricative ou occlusive sourde peut être éjective.

Note N° 10 : ces sons sont assez rares dans les langues du monde. On ne trouve des clics que dans les langues khoïsannes. Tous ces modes articulatoires obéissent à certaines restrictions : les clics ne se trouvent qu’en début de consonne, et sont plus communs avec des points d’articulation postérieurs (et ce, à l’inverse des implosives qui sont plus communes sur des points d’articulation antérieurs).

Il reste encore quelques sons rares ou controversés que je n’ai pas mis dans les tableaux. Il y a les consonnes fricatives épiglottales (qu’on appellera plus volontiers « consonnes roulées pharyngales » même si ce n’est pas la norme en français) [ʜ ʢ] (sourde et voisée), une consonne battue latérale [ɺ], une consonne spirante labio-vélaire sourde [ʍ], une consonne occlusive pharyngale (ou épiglottale) sourde [ʡ], une consonne spirante labio-palatale [ɥ] (oui, c’est le <u> de « pluie » ; je vous avais dit que c’était un son rare) et toute une série rarement reconnue de consonnes alvéolo-palatales : [ɕ ʑ] (celles-ci sont reconnues) et [ȵ ȶ ȴ]. Ah, sans oublier l’étrange /ɧ/ qui est un phonème en suédois (représenté par le digraphe <sj>) mais qui n’existe pas sous sa forme phonétique ; c’est un phonème qui peut être réalisé de diverses manières, une des plus standards étant [x̞]. Aussi, il est faux d’écrire [ɧ].

Notons enfin que cet article n’est pas forcément exempt d’oubli, et que des caractères rarissimes comme [ꞎ] (consonne fricative latérale rétroflexe sourde) ont pu être omis.

Les consonnes sont nommées avec la formule « ”consonne” + [mode d’articulation] + {écoulement de l’air} + [point d’articulation] + {altération(s)} + [voisement] » où les paramètres entre accolades sont facultatifs. Par exemple : « consonne spirante latérale alvéolaire vélarisée voisée ».

[§ case vide] Si une case d’un des tableaux est vide, c’est que le son qu’elle implique est impossible, ou bien qu’il est possible mais n’a pas de caractère attitré. Que faire dans ce cas-là ? J’ai été obligé d’aller un peu trop vite dans les derniers paragraphes à propos du français ; comme je le mentionnais, les voyelles nasales du français tiennent d’une quatrième entrée du tableau, mais quelle est-elle au juste ? On peut répondre à ces deux questions par une série de modifications applicables aussi bien aux voyelles qu’aux consonnes que je vais appeller « altérations ». Ces altérations, marquées par des caractères en exposant ou des diacritiques, permettent d’affiner la représentation phonétique et de montrer vraiment tous les sons que l’humain est capable de produire. Faisons-en maintenant le tour.


Les altérations consonantales et vocaliques

Vous vous rappelez que dans les tableaux précédents, j’insistais qu’ils représentaient les consonnes et les voyelles de base ? Eh bien les altérations permettent d’étendre ces sons de base. Les altérations sont marquées par des lettres en exposant (comme /ʰ/) et diverse diacritiques (comme /ɑ̃/). Vous pouvez remarquer que j’ai déjà employé des diacritiques dans les tableaux ci-dessus afin de remplir un peu plus les tableaux.

Les altérations dont je vais parler servent le plus souvent à la notation phonétique, pour la rendre plus précise. Mais rien n’empêche d’utiliser lettres en exposant et diacritiques pour une notation phonémique si c’est pertinent (et les distinctions que font certaines langues rendent même cela nécessaire).

Prenez aussi en compte le fait que les diacritiques peuvent s’empiler les uns sur les autres si c’est nécessaire : [o˞̤̽̃], [ɑ̝̹̰], [r̩̠̝̺]… Ces sons n’existent pas, à tout le moins leur notation est-elle inutilement alambiquée en l’état, mais ils pourraient exister et être marqués ainsi.

Avec les lettres en exposant : la coarticulation

[§ aspiration] [§ arrondissement] L’utilisation d’une lettre en exposant exprime la coarticulation. La coarticulation, c’est quand deux sons normalement séparés fusionnent pour n’en former plus qu’un. Par exemple, un /p/ aspiré, marqué /pʰ/, peut être exprimé par la fusion de /p/ avec /h/ (le son de la lettre <h> en anglais), à la différence que /ph/ est constitué de deux sons et /pʰ/ d’un seul. Les principales coarticulations sont listées ci-dessous :

  • [ʰ] est l’aspiration et indique une consonne légèrement soufflée, ou fortement expirée ;
  • [ʷ] est le caractère de rondeur (l’arrondissement des lèvres) et indique une consonne réalisée avec les lèvres arrondies (comme « pois », mais en un seul son) ;
  • [ʲ] est la palatalisation et indique une consonne réalisée avec une « mouillure » (comme « pion », mais en un seul son) ;
  • [ˠ] est la vélarisation et indique une consonne réalisée de façon gutturale (c’est la façon dont certains locuteurs du français peuvent prononcer « prôner »[pˠone]) ;
  • [ˤ] est la pharyngalisation et indique une consonne coarticulée avec le fond de la gorge (sans équivalent proche en français, mais cela existe en arabe).

Note N° 11 : le caractère [ɫ] est une relique du temps où l’API utilisait plus de diacritiques ; c’est la représentation standard de [lˠ], qui constitue une exception à la régularité générale de l’alphabet.

Note N° 12 : il existe aussi la glottalisation marquée [ˀ] mais elle est souvent marquée d’une autre manière… [pʼ], par exemple. Si vous avez fait attention au précédent tableau, vous remarquerez que c’est le diacritique utilisé pour les consonnes éjectives. Car oui, une consonne éjective, c’est une consonne glottalisée.

[§ distinction de couple] [§ voisement] Puisqu’on est sur la coarticulation, je vais parler d’un phénomène intéressant que je vais appeller « distinction de couple » faute d’avoir un terme officiel pour ce phénomène. Ce que j’entends par là, c’est la différence que fait le français entre /t/ et /d/, entre /s/ et /z/, entre /k/ et /g/ etc… Le voisement, vous vous rappelez ? Le voisement, c’est ce qui sert de distinction de couple en français ; si vous remontez pour voir le tableau phonologique des consonnes en français, vous verrez que les sons qui sont par deux sont toujours distingués par le voisement.

Mais d’autres langues, quand elles utilisent une distinction de couple, n’utilisent pas toujours le voisement. Par exemple, le chinois utilise l’aspiration comme distinction de couple. On peut organiser les consonnes voisées, sourdes et aspirées en degrés et concevoir le tableau suivant.

La distinction de couple selon les langues : le français distingue les phonèmes /b,p/, tout comme l’anglais qui les décale toutefois légèrement vers l’aspiration (les consonnes voisées sont plus sourdes et les consonnes sourdes plus aspirées qu’en français). Le mandarin, quant à lui, n’a pas de consonnes voisées, et distingue les consonnes sourdes des consonnes aspirées. Certaines langues comme le romani font la différence entre les trois ou quatre possibilités, mais les langues de ce type sont rares (le hindi distingue par exemple en plus les consonnes voisées aspirées : /b bʱ p pʰ/).

Note N° 13 : rappelons que le tableau parle de phonèmes ; les phonèmes sont susceptibles de changer de nature, et d’être réalisés différemment en fonction de leur environnement.

Avec les diacritiques

[§ arrondissement] [§ réduction] Les diacritiques ont des usages divers. Ils peuvent servir à noter la nature d’un son, à affiner sa position voire à marquer la coarticulation (cf. ci-dessus). Certains ne s’appliquent qu’à des consonnes, d’autres qu’à des voyelles, d’autres aux deux.

Pour les voyelles

  • [ə̹] (plus arrondi) indique une voyelle réalisée avec les lèvres un peu plus arrondies que le caractère de base ne l’exprime, voire pas arrondies dans le cas d’une notation pratique d’un phonème théorique ([ɛ̹] peut donc être équivalent à [œ] mais lui être préféré pour éclairer le processus pratique d’arrondissement) ;
  • [o̜] (moins arrondi) indique une voyelle réalisée avec les lèvres peu ou pas arrondies (idem que ci-dessus mais à l’envers) ;
  • [ö] indique que la voyelle est réalisée un peu plus au centre que le caractère de base ne l’exprime (ce qui équivaut à une voyelle rétractée si elle est frontale, et avancée si elle est postérieure) ;
  • [ɯ̽] (réduit) indique une voyelle réduite, c’est-à-dire rapprochée du schwa [ə] (voyelle centrale et moyenne, donc « neutre ») par le point d’articulation comme par l’aperture (pour illustrer la transformation d’une voyelle sur le tableau vocalique quand elle est réduite, il faut tracer une ligne diagonale qui part du son de base et se dirige – sur une plus ou moins longue distance – vers le centre) ;
  • [ə̯] (non syllabique) indique la voyelle constituant la partie non syllabique d’une diphtongue* ;
  • [ɚ] (rhotacisation) indique une voyelle rhotacisée, ce qu’on peut illustrer par la fusion d’une voyelle avec le <r> anglais américain (purr = /pɜɹ/ = /pɜ˞/) (attention toutefois, l’anglais britannique n’est pas souvent rhotique et prononce « purr » /pɜː/) ;
  • [ə̤] (murmuré) indique une voyelle murmurée, légèrement soufflée ou expirée, comme si le <h> anglais avait fusionné avec elle ;
  • [ə̰] (craqué) indique une voyelle craquée ; pour la réaliser, imaginez (ou imitez) quelqu’un faisant « euh » avec un ton de voix très bas et vous devriez entendre chaque vibration individuelle des cordes vocales (c’est une phonation très étrange mais elle peut être phonémique) ;
  • [ə̃] (nasal) indique une voyelle nasalisée, c’est-à-dire qu’un peu de l’air utilisé pour la réaliser passe par le nez (le français a des consonnes nasales dans « pain », « pont », « pan » etc.)

[§ diphtongue] [§ hiatus] *Note sur les diphtongues : une diphtongue est un couple de voyelles prononcées dans la même syllabe de sorte qu’elles forment un « glissement » d’une voyelle à une autre. L’une des voyelles constituant une diphtongue présente toujours sa pleine nature vocalique et l’autre une qualité semi-consonantale (elle devient « non syllabique »).

Par exemple, le mot anglais « day »se prononce /deɪ̯/ : /e/ est la qualité initiale de la diphtongue, et /ɪ̯/ sa partie non syllabique, prononcée presque comme le son /j/ dans « paille ». On considère que les sons /j w/ sont les versions non syllabiques de /i u/ respectivement, c’est pourquoi /j w/ peuvent être retranscrits [i̯ u̯] – c’est la même chose. Par exemple, dans le mot « roi », <oi> est une diphtongue prononcée /wa/, ou [u̯a].

Quand deux voyelles sont en succession mais prononcées dans deux syllabes différentes, on appelle cela un « hiatus ». Par exemple, « abeille » se prononce /a.bɛj/ (qu’on peut aussi retranscrire [a.bɛi̯]), avec une diphtongue, mais « abbaye » se prononce /a.bɛ.i/, avec un hiatus.

Pour les consonnes

[§ voisement] Outre les caractères en exposant, les consonnes peuvent être dotées des diacritiques suivants.

  • [b̥] (dévoisé) indique une consonne réalisée avec moins de voisement que le caractère de base ne l’exprime, voire pas voisée dans le cas d’une notation pratique d’un phonème théorique ([b̥] peut donc être équivalent à [p] mais lui être préféré pour éclairer le processus pratique de dévoisement) ;
  • [p̬] (voisé) indique une consonne réalisée avec plus de voisement ou entièrement voisée (idem que ci-dessus mais à l’envers) ;
  • [r̩] (syllabique) indique une consonne constituant une syllabe à elle seule (comme « schlagen » /ʃlaːgn̩/ en allemand) ;
  • [p̼] (linguolabial, rare) indique une consonne réalisée avec le contact de la langue avec les lèvres (techniquement, « linguolabial » pourrait être un point d’articulation, mais il est si rarement utilisé dans les langues naturelles qu’on ne le marque que par le biais d’un diacritique) ;
  • [t̪] (dental) indique une consonne réalisée à la base des dents supérieures (souvent utilisé pour les sons dentaux [t̪ d̪ n̪] des langues romanes pour les différencier des sons alvéolaires [t d n] des langues germaniques – et même parfois considéré comme un point d’articulation à part entière) ;
  • [t̻] (laminal) indique une consonne articulée avec le dos de la langue plutôt que la pointe ;
  • [t̺] (apical) indique une consonne articulée avec la pointe de la langue plutôt que le dos ;
  • [p̚] (désocclusion inaudible) indique une consonne occlusive, généralement en fin de mot, dont le relâchement n’est pas audible (comparez l’anglais « lap » [læp̚] et le français « lappe » [lap]) ;
  • [pʼ] (éjectif / glottalisé), vous l’avez déjà vue si vous avez tout lu jusqu’ici (sinon, remontez jusqu’au précédent tableau).

 

Pour les consonnes et les voyelles : les diacritiques de positions

  • [ə̟ k̟] (avancé) indique que le son est réalisé un peu plus en avant que le caractère de base ne l’exprime ;
  • [ə̠ k̠] (rétracté) indique que le son est réalisé un peu plus en arrière que le caractère de base ne l’exprime ;
  • [ə̞ k̞] (abaissé, rare pour une consonne) indique que le son est réalisé un peu plus bas que le caractère de base ne l’exprime (ce qui a pour effet de transformer les consonnes en consonnes fricatives ou spirantes puisque cela annule le contact d’un organe phonateur avec un autre) ;
  • [ə̝ r̝] (élevé, rare pour une consonne) indique que le son est réalisé un peu plus haut que le caractère de base ne l’exprime (dans le cas des consonnes, elles sont de ce fait réalisées avec une plus forte pression d’un organe phonateur sur un autre).

Les tons

Peut-être avez-vous entendu parler des tons (ou tonèmes) du chinois ? Ce sont les plus connus. Les tons sont un système d’accents toniques complexes et modulés. Pour le dire mieux, une langue qui utilise des tons distingue plusieurs hauteurs relatives ; ce sont donc des différences musicales qui sont faites parmi les voyelles (on parle de hauteur relative car les tons ne respectent bien entendu pas des notes musicales données).

Les quatre tons du chinois mandarin.

L’API dispose de signes particuliers pour gérer les tons. En fait, il existe trois systèmes.

  • Le système des chiffres

Ce système n’est pas particulièrement phonétique, mais il est très prisé pour son intuitivité – en revanche, il est un peu encombrant. Il consiste simplement à doter une voyelle d’un chiffre en fonction de sa hauteur. Si elle est modulée ou longue, on met plusieurs chiffres à la suite. Ils sont parfois utilisés en exposant.

  • Le système des barres

Les barres sont un système standard de retranscription des tons. Elles consistent à afficher graphiquement la hauteur des tons. Ces caractères sont magiques, parce qu’ils sont « autocombinatoires ». Par exemple, la barre /˥˩/ résulte de la succession de /˥ ˩/. Malheureusement, ce système n’est pas universel, comme en témoigne WordPress qui refuse d’afficher le troisième ton du mandarin en combinant les barres.

  • Le système des diacritiques

L’API dispose d’une série de diacritiques dévoués à la représentation des tons.

Résumons tout ça avec les tons du chinois de l’image ci-dessus.

/a55 a35 a214 a51/ 
/a˥˥ a˧˥ a˨˩˥ a˥˩/

Les diacritiques ne sont pas aussi souples et ne sont pas utilisés pour noter un système tonal aussi complexe que le chinois – d’autres systèmes existent, en Afrique typiquement, qui ne distinguent que le ton haut et le ton bas, plus un ton modulé combinatoire. Mais en voici quand même la liste.

  • [a̋] : très haut (5) ;
  • [á] : haut (4) ;
  • [ā] : moyen (3) ;
  • [à] : bas (2) ;
  • [ȁ] : très bas (1) ;
  • [ǎ] : montant (15 par ex.) ;
  • [â] : tombant (51 par ex.) ;
  • [a᷄] : haut montant (45 par ex.) ;
  • [a᷅] : bas tombant (21 par ex.) ;
  • [a᷈] : montant descendant (353 par ex.).

Contrairement aux chiffres et aux barres qui peuvent être doublées, les diacritiques ne permettent pas de montrer à la fois le ton et la longueur de la voyelle ; une voyelle très haute et longue, dans le système des diacritiques, serait retranscrite /a̋:/.


La ponctuation

[§ accent tonique] [§ affrication] [§ longueur] Pour finir, l’API a tout un système de ponctuation qu’il est important de maîtriser.

  • [.] est un séparateur syllabique ; il indique la limite entre une syllabe et une autre (« syllabe » /si(l).lab/) ;
  • [ː] indique la longueur d’une voyelle (anglais « bin » /bɪn/ et « bean » /biːn/) ou la quantité d’une consonne (une consonne longue est dite « géminée ») (italien « moto » /moto/ et « motto » /motːo/) ; plus rarement, on emploie [ˑ] pour une voyelle ou une consonne semi-longue (jamais phonémique), [ːː] pour une voyelle extralongue (rarement phonémique), ou le diacritique [ə̆] pour une voyelle amuïe (extra-courte) ;
  • [ˈ] indique l’accent tonique (non phonémique en français) (espagnol « corrí » /ko.ˈri/) ;
  • [ˌ] indique l’accent tonique secondaire (anglais « elevation » /ˌɛ.lɪ.ˈveɪ.ʃən/) ;
  • [◌͡◌] indique une consonne affriquée, c’est-à-dire une combinaison d’une consonne occlusive et d’une consonne fricative prononcées ensemble, comme dans « tchak ! » /t͡ʃak/ ;
  • [‿] indique une liaison, comme le français en raffole (« c’est-à-dire » /s‿ɛ.t‿a diʁ/, remarquez le délimiteur syllabique)
  • [|] marque une pause brève, typiquement au niveau d’une virgule ;
  • [‖] marque une pause longue, typiquement entre deux phrases.

Note N° 14 : quoiqu’une voyelle longue et une consonne géminée soient toutes les deux retranscrites avec /ː/, elles ne sont pas forcément la même chose : une voyelle longue est maintenue, tandis qu’une consonne occlusive longue est retenue pendant une fraction de seconde (en revanche, une consonne fricative longue fonctionne comme une voyelle longue). 


Conclusion

J’ai déployé le maximum de mes capacités pédagogiques pour cet article, mais ce n’est pas pour autant qu’il est parfait ou même suffisant. N’hésitez pas à laisser un commentaire si vous avez une question, car je suis là pour aider.

Je vais finir sur une note importante : de longs articles pleins de théorie, c’est bien gentil mais ce n’est pas ça qui va vous apprendre à les prononcer de façon pratique. Et il n’y a pas trente-six façons de faire : prononcez ! Pas besoin non plus de parler à haute voix ; murmurer suffit. Apprenez à reconnaître les points d’articulation à la force de comparer les sons que vous pouvez produire, puis les trous se boucheront tout seuls.

Je n’ai pas non plus tout couvert dans cet article, mais j’ai jugé que des choses comme les extensions de l’API, le clic sublingual, la désocclusion latérale, la position de la racine de la langue, la prénasalisation, ou encore l’hindi qui fout mes explications en l’air en faisant la distinction entre /k kʰ g gʱ/… tout ça sortait du domaine de l’acceptable pour un article qui est déjà bien long. Là encore, n’hésitez pas à me taper dessus en commentaires si ça ne vous suffit pas.

Ah, au fait, si vous avez besoin d’écrire en alphabet phonétique (d’un clavier, quoi), je vous conseille cet outil en ligne pour ordinateur et cette application pour mobile.

Merci beaucoup de votre lecture !

Sources

Cet article a beaucoup été écrit sur la base de mes propres connaissances, que j’ai abondamment vérifiées à coups de Wikipédia comme toujours. Je peux néanmoins citer l’ouvrage de David J. Peterson, The Art of Language Invention, pour certains éléments d’informations et idées de vulgarisation que le livre m’a transmis, ainsi que Fracademic, qui est une excellente ressource en la matière.


1. Avant tout, …
 1.1 …les délimiteurs phonétiques…
1.2 …et les phonèmes
2. L’alphabet phonétique en français
2.1 Les consonnes françaises
2.2 Les voyelles françaises
3. L’API entier
3.1 Les voyelles
3.2 Les consonnes
—— 3.2.1 Les modes d’articulation
—— 3.2.2 Les points d’articulation
3.3 Les altérations consonantales et vocaliques
—— 3.3.1 Avec les lettres en exposant : la coarticulation
—— 3.3.2 Avec les diacritiques
3.4 Les tons
3.5 La ponctuation
4. Conclusion
5. Sources
§accent§accent tonique§affrication – allophonie (§1, §2)– aperture (§1, §2)– §aspiration – arrondissement des lèvres (§1, §2, §3, §4) – case vide (§1, §2) – §clic§diphtongue§distinction de couple§emprunt§graphème – §hiatus –  inventaire phonologique (§1, §2) – §longueur§paire minimale§point constricteur§pulmonique§réduction§schwa – semi-consonne (§1, §2) – §triangle / trapèze – §variation libre – voisement (§1, §2, §3) – §voyelles nasales

Un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s