Langues

Cognats : ce que les mots apparentés nous apprennent de l’Histoire des langues

Les liens entre les mots sont une manière accessible et pleine de surprises de se plonger dans l’étymologie, et par extension dans la linguistique. Découvrons comment les mots apparentés (ou cognats, prononcé « cog-na ») renferment beaucoup des aléas de l’Histoire des langues.

SOMMAIRE

  1. Définition
  2. Exemples de cognats complexes
  3. Faux amis et faux cognats
  4. Conclusion
  5. Sources

1. Définition

Les mots évoluent. Et d’un espace socioculturel ou géographique à un autre, cette évolution est différente. C’est ainsi qu’un même mot d’origine (on parle d’étymon) finit par changer de prononciation, d’écriture et de sens en fonction des langues. À terme, ces changements produisent des « mots apparentés » entre différentes langues, et participent à l’évolution du vocabulaire au sens large.

Certains cognats dont la divergence est récente, ou bien des mots qui ont peu évolué, sont plutôt transparents et parfois connus du grand public. Aussi la racine latine ferrum, qui a été conservée dans de nombreuses langues descendant du latin, est devenue fer en français, hierro en espagnol et ferro en italien. C’est le même mot à l’origine (le même étymon) mais qui a évolué différemment dans chaque langue, créant des mots qui sont cognats entre eux.

Ce cas plutôt simple nous en dit déjà long sur l’évolution de l’espagnol notamment. Il témoigne en effet de la transformation des F initiaux en un son H qui est à son tour devenu muet (ce que d’autres cognats nous permettent de confirmer, comme faire – hacer ou foyer – hogar), ainsi que du E devenu IE sous l’effet de l’accent tonique.

Étymon latin Vieilles langues romanes
(Xᵉ / XIIᵉ siècles environ)
Langues romanes modernes
ferrum fer fer 🇫🇷
fierro hierro 🇪🇸
ferru ? ferro ? ferro 🇮🇹

Chez ces cognats, c’est la prononciation et l’écriture qui ont divergé. Mais parfois ce n’est que le sens, comme chez l’anglais gift (« cadeau ») et l’allemand Gift (« poison »), qui s’écrivent et se prononcent pareil. Leur ancêtre commun, l’étymon germanique *giftiz, signifiait « don », « chose donnée ».

Étymon proto-
germanique
Vieilles langues germaniques
(Xᵉ / XIIᵉ siècle environ)
Langues germaniques modernes
*giftiz ġift gift 🇬🇧
gift Gift 🇩🇪

Les cognats les plus intéressants sont bien sûr ceux dont à la fois l’écriture, la prononciation et le sens ont changé. C’est ceux-là qui sont les plus « créatifs » et dont les ramifications sont les plus insoupçonnées, souvent même de l’esprit averti. Il y par exemple York et Évreux, qui dérivent tous deux du nom celte d’Eboracum (et qui m’avait inspiré cet article, pour ceux qui voudraient en savoir plus).

Étymon celte Stades intermédiaires Langues modernes
Eboracum Ebrocas Ebroas Ebroys Évreux 🇫🇷
Eoforwic Jórvík York 🇬🇧

Maintenant que vous avez compris le principe de base, et avant d’aller plus loin, je vais laisser quelques tableaux vous faire découvrir des cognats intéressants que j’ai croisés au cours de mes recherches.

1.1 Exemples de cognats simples

Étymon
proto-germanique
Stades
intermédiaires
Langues modernes
*tīdiz tīd tide 🇬🇧
« marée »
tīþ / tíð tid 🇸🇪/🇳🇴/🇩🇰
« temps »
Étymon grec ancien Emprunt en latin Stade
intermédiaire
Langues modernes
σπάθη (spáthē)
« lame »
spatha
« spatule »,
« spatha » (type d’épée)
espe épée 🇫🇷
espada espada 🇪🇸
« épée »
spada spade 🇬🇧
« bêche »
Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*h₁n̥gʷnís
« feu »
ignis ignition, ignifuge 🇫🇷…
*ogňь огонь 🇷🇺 (ogon’)
« feu »
*Hagníṣ अग्नि 🇮🇳 (Agni)
Agni, divinité
hindoue du feu

L’astérisque avant les mots indique des termes reconstruits. Ils ne sont pas attestés (c’est-à-dire qu’on n’a pas la preuve écrite, et encore moins orale qu’ils ont existé, puisqu’ils remontent à plus de 3 000 ans), mais l’existence de mots apparentés dans les langues actuelles nous permet de déduire leur existence et leur forme avec quasi-certitude. En effet, la divergence des mots suppose que, si l’on remonte le cours du temps, on converge vers leur origine commune. C’est le fondement de la linguistique comparative : comparer les langues contemporaines entre elles afin de déduire leur généalogie.

Principe scientifique de détermination des cognats

Le procédé que je schématise ci-dessus est utilisé pour déterminer que des mots sont cognats. Il doit bien sûr être appliqué avec toute la rigueur de la méthode scientifique. Le biais de confirmation n’est jamais loin, et il est facile de voir ce qu’on veut voir dans les mots. On peut facilement croire par exemple que l’anglais “much” et l’espagnol “mucho” sont apparentés (voir la section Faux amis et faux cognats). Une famille de langues entière, les langues altaïques, a même été créée en grande partie sur la base de tels liens étymologiques extravagants. Continuons pour l’instant sur de vrais liens.

Étymon
proto-indo-européen
Stades intermédiaires Langues modernes
*werǵ- *worǵéh₂ ὄργια (órgia) orgia orgie 🇫🇷
*wérǵom *werką weork work 🇬🇧
« travail »

Tous les mots ci-dessous signifient « lait ».

Étymon
proto-indo-européen
Stades intermédiaires Langues modernes
*h₂melǵ *meluks meoluc, meolc milk 🇬🇧
miluh Milch 🇩🇪
mjǫlk mjölk 🇸🇪
*melkò молоко 🇷🇺
(moloko)
mleko 🇵🇱
*mlixtus mlicht bleacht 🇮🇪

Et tous ceux-ci signifient « cinq ».

Étymon
proto-indo-européen
Stades intermédiaires Langues modernes
*pénkʷe *kʷenkʷe quinque cīnque cinq 🇫🇷
cinco 🇪🇸
cinque 🇮🇹
πέντε (pénte) πέντε 🇬🇷
(pénte)
penta- 🇫🇷
(pentagone…)
*fimf fīf five 🇬🇧
fimf vünf fünf 🇩🇪
fimm fem 🇸🇪/🇳🇴/🇩🇰
*kʷenkʷe *pɨmp pimp pump 🏴󠁧󠁢󠁷󠁬󠁳󠁿
cóic cúig 🇮🇪

Un détail intéressant : l’existence d’un son K à l’initiale du mot allemand ci-dessous est un indicateur que le C latin se prononçait également K. Il faut évidemment aller beaucoup plus loin pour s’en assurer (démontrer que c’est une règle et non une exception par exemple), d’où l’important travail de documentation effectué par les linguistes.

Étymon latin Stades intermédiaires Langues modernes
Caesar
(nom de famille
devenu symbole de pouvoir avec Jules César)
Cæsar César 🇫🇷
*kaisaraz keisar Kaiser 🇩🇪
(ancien titre des empereurs
autrichiens et allemands)
cěsařь царь 🇷🇺 (tsar’)
(« tsar », ancien titre des
souverains de Bulgarie,
de Serbie et de Russie)

Il faut également se rappeler que l’évolution des langues est normalement très lente et progressive. Mes tableaux montrent certains stades précis de cette évolution, mais omettent tout un spectre d’étapes intermédiaires : ainsi le son K du latin Caesar n’est pas devenu un S tout à coup, mais est passé par une série de sons transitoires.

2. Exemples de cognats complexes

Jusqu’ici, on a vu des étymons s’éroder : les sont plus difficiles étaient éliminés ou modifiés, et des syllabes se perdaient, le tout plus ou moins régulièrement. Mais ce processus a une fin : lorsqu’un étymon s’est suffisamment érodé, il peut recevoir des suffixes / préfixes (on l’a déjà un peu vu), sans compter bien d’autres types de transformations, toutes plus ou moins aléatoires et chaotiques, qui peuvent renverser son destin et lui donner de nouvelles vies. En voici quelques uns.

2.1 Métaplasmes

Les métaplasmes sont une catégorie de transformations dans la forme et la prononciation des mots. Un métaplasme peut affecter tout le vocabulaire uniformément, et ainsi constituer une règle régulière d’évolution de la langue, mais on en trouve souvent à titre exceptionnel, ce qui a tendance à bien mélanger les cartes.

Mon préféré est la métathèse, qui consiste à permuter deux sons. Celui-ci n’est pas l’ami des dyslexiques.

  • Le vieux français formage est devenu fromage, cognat avec l’italien formaggio sans métathèse.
  • Le mot moustique, emprunté à l’espagnol mosquito, a permuté les sons K et T.
  • Les mots espagnols peligro et milagro sont issus de periculum et miraculum (d’où aussi péril et miracle).
  • Le mot turc bulgur (« boulgour ») vient de l’arabe برغل (burḡul), etc.

Un exemple de métaplasme régulier est la prosthèse du E dans spatha > espada, rencontré un peu partout en espagnol (spīritus > espíritu, species > especia, etc.). Voyez l’article Wikipédia pour d’autres exemples.

2.2 Dérivation (affixation)

La dérivation, c’est quand l’étymon reçoit des affixes (suffixes, préfixes…) qui en modifient la forme et la nature au cours de son histoire. Par exemple :

  • *nébʰos (« nuage ») a donné nebes en latin,
  • puis nebula avec le -ula diminutif,
  • et enfin nebulosus avec le -osus marquant un adjectif.

C’est de nebulosus que le mot français « nébuleux » dérive. Pour autant, « nébuleux » partage la même racine d’origine *nébʰos (étymon) avec l’irlandais neamh (« ciel ») qui n’a pas reçu de suffixes et qui est resté un nom commun : les deux termes sont donc bien des cognats.

Étymon
proto-indo-européen
Stades intermédiaires Langues modernes
*nébʰos
« nuage », « brume »,
« humidité »
nemos nem neamh 🇮🇪
« ciel »
neba nebo небо 🇷🇺
(nebo)
« ciel », « air »
nebula nebuleus nébuleux 🇫🇷
*nibilaz nifl Niflheim
(monde de la
mythologie nordique)
*nebulaz nebul Nebel 🇩🇪
« brouillard »,
« brume »
*n̥bʰel abula avull 🇦🇱
« vapeur »

¹ En moyen français , il y avait aussi « nieble ». S’il en existait un descendant contemporain, ce pourrait être « nièble », et peut-être un adjectif correspondant (« nièbleux » ?).

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*h₂éǵros agros ager agriculture, agricole 🇫🇷…
agriculture, agricultural 🇬🇧…
*akraz
acre 🇬🇧
(unité de surface)
acre 🇫🇷
(unité de surface)
Acker 🇩🇪
« champ »

2.3 Étymologie populaire

Vous vous rappelez d’Eboracum qui est devenu Eoforwic avant d’être York ? Cette transformation ne peut pas s’expliquer seulement par l’évolution de la prononciation. En fait, Eboracum s’est d’abord réduit en quelque chose comme Ever, où les anglophones d’alors ont cru reconnaître le mot eofor signifiant « verrat ». Ils y ont ajouté le suffixe wic signifiant “village”, faisant d’Eoforwic « le village du verrat ». Ce qui est drôle, c’est qu’Eboracum signifiait en réalité « le lieu de l’if » en langue celte. On parle ici d’un phénomène d’étymologie populaire, où l’origine imaginée du mot prend le dessus sur l’origine réelle, et en affecte sa forme.

2.4 Emprunts

Les emprunts, à proprement parler, sont des cognats. Ainsi, les mots français weekend, fun et joystick sont cognats des mots anglais weekend, fun et joystick. Le terme français corrida est cognat du terme espagnol corrida, et ainsi de suite.

Évidemment, on préfère le terme « emprunt » à celui de « cognat » tant que le mot ne s’est pas fondu dans la langue, comme c’est le cas de paquebot et redingote par exemple (qui viennent respectivement de packet boat et riding coat), ou de pedigree en anglais (qui vient de l’ancien français pié de gru : pied-de-grue). On a encore l’arabe مسكين (miskīn), qui a donné lieu à deux cognats en français : mesquin (passé par l’espagnol ou l’italien et emprunté au 17e siècle) et miskine (emprunt récent et directement issu de l’arabe). Le calque est un autre type d’emprunt qui consiste en une traduction littérale (marché aux puces > flea market, skyscraper > gratte-ciel…), ce qui peut rendre plus difficile d’y voir des cognats.

En tout cas, les emprunts ouvrent la porte à de nouvelles mutations. Par exemple, le vieil anglais loc a donné l’anglais moderne lock qui a été emprunté en français pour former loquet (avec le « -et » diminutif). Ce dernier a été réemprunté à son tour en anglais, devenant locket, « médaillon ».

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*lewg- *luką loc lock 🇬🇧
« serrure »
loquet loquet 🇫🇷
locket 🇬🇧
« médaillon »

Même chose, encore une fois, pour Eboracum : une fois que le nom était devenu Eoforwic en vieil anglais, une évolution régulière aurait donné Everwic en moyen anglais, puis Everwich en anglais moderne. Au lieu de ça, Eoforwic a été emprunté en danois sous la forme Jórvík, puis réemprunté plus tard en anglais sous la forme finale de… York.

Il en va bien sûr de même partout dans le monde, même si mon article est francocentré pour permettre des illustrations plus parlantes. Pour une dernière magnifique histoire d’emprunts, voyons deux mots qui sont redevenus synonymes au cours de leur évolution.

2.4.1 Vermeil et kırmızı

Kırmızı signifie « rouge » en turc. Ce mot a été emprunté à l’arabe قرمز (qirmiz), de même sens, mais signifiant aussi « kermes » (un genre de cochenille), car on produisait de la teinture rouge en écrasant cet insecte.

Le mot arabe avait été emprunté au persan کرمست (kermest), qui lui-même dérivait du proto-indo-européen *kʷŕ̥mis signifiant « ver », dont il existait la forme *wr̥mis, possiblement dérivée de *wer-, « tourner ».

Cette racine a aussi donné le proto-germanique *wurmiz (d’où par exemple l’anglais worm et le suédois orm de même sens) mais encore le latin vermis qui a donné le français ver.

Enfin, le mot vermis avait pour diminutif vermiculus signifiant vermisseau et qui a donné vermeil et vermillon pour des sortes de couleurs rouges, toujours à cause de la cochenille.

À quelques milliers de kilomètres et d’années d’écart, alors que les racines ont traversé trois familles de langues différentes (turques, indo-européennes et sémitiques), le français vermeil et le turc kırmızı ont donc non seulement la même origine mais aussi le même sens, et pour la même raison. Ils font partie de mes cognats préférés, car ils montrent le lien très fort entre l’Histoire et les langues, très raccourci dans de tels tableaux.

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*wr̥mis ~ *kʷŕ̥mis vermis vermiculus vermeil, vermillon 🇫🇷
کرمست
(“kermest”)
قرمز
(“qirmiz”)
kırmızı 🇹🇷

3. Faux amis et faux cognats

J’incitais tout à l’heure à la prudence : certains liens sont trompeurs. Les connaître peut aider dans l’apprentissage de langues, mais ils peuvent aussi nous trahir. Combien de fois j’ai buté sur la ressemblance entre l’italien caldo (« chaud ») et l’allemand kalt (« froid ») ?

Vous connaissez sûrement déjà les faux amis, qui sont des mots similaires dans des langues différentes, mais qui sont en fait de sens différent. Par exemple library 🇬🇧 (« bibliothèque ») et librairie, ou lecture 🇬🇧 (« conférence ») et lecture. Cependant les faux amis sont souvent cognats, comme ici : les étymons de ces exemples sont les mots latins libraria et lectura.

Des faux cognats sont des mots dont l’apparence fait croire qu’ils sont apparentés alors qu’ils ne le sont pas. L’anglais “much” et l’espagnol “mucho” en sont d’excellents exemples, d’autant qu’ils signifient tous les deux « beaucoup » (donc à la fois l’apparence et le sens sont trompeurs).

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*méǵh₂s *mikilaz myċel much 🇬🇧
*ml̥tos multus mucho mucho 🇪🇸

Quant aux anglophones, ils seraient étonnés de découvrir que leurs mots isle (« petite île ») et island (« île ») ne sont pas de même origine. En effet, le premier est cognat de île en français (isle et île viennent du latin insula) mais island vient d’ailleurs, à savoir des termes indo-européens *h₂ékʷeh₂-lendʰ, qui sont un peu velus au premier regard, mais en lesquels vous auriez raison de reconnaître « aqualand » (une terre sur l’eau).

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*h₂ékʷeh₂-lendʰ *awjōlandą ieġland island 🇬🇧
? insula isle isle 🇬🇧
« petite île »
île 🇫🇷

→ Et l’Islande ? C’est encore autre chose puisque le nom vient du vieux norrois Ísland, avec íss signifiant « glace » (cognat avec l’anglais “ice”, de même sens) et “land” signifiant « pays ».

Les faux cognats sont un terrain propice à l’étymologie populaire. Ici par exemple, le S muet de island n’est pas étymologique et a été rajouté justement parce qu’on pensait que le mot était apparenté à isle. Autre exemple que j’ai rencontré au cours de l’écriture de l’article : on peut faire l’erreur d’écrire « le cœur d’une Église » en voulant parler du « chœur », croyant qu’il s’agit du même mot. Les deux étaient d’ailleurs orthographiés pareil en ancien français, avant qu’on rajoute un H à l’un d’eux pour rappeler les origines gréco-latines du français.

Étymon
proto-indo-européen
Stades
intermédiaires
Français contemporain
*ḱérd cor cuer cœur
*ǵʰoros χορός
(khorós)
chorus chœur

Il faut donc faire bon usage des cognats : ils ouvrent toutes sortes de fenêtres sur l’histoire des langues, mais ils peuvent nous faire hésiter ou nous tromper. Même si cela reste souvent amusant quand ça arrive.

Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
calidus caldus caldo 🇮🇹
*kald kald kalt 🇩🇪
Étymon
proto-indo-européen
Stades
intermédiaires
Langues modernes
*ken- cinerem cendre cendre 🇫🇷
*sendʰro- *sindraz sinder cinder 🇬🇧

4. Conclusion

Pour voyager dans les langues, rien de tel pour moi que de chercher des cognats sur le Wiktionnaire. De lien en lien, non seulement on parcourt l’espace et le temps, mais on se rapproche aussi de notre passé. Les mots sont un peu le reflet de la société de leur époque, mais leur évolution est plus éloquente encore.

C’est un voyage auquel j’espère vous avoir initié·e. Il peut être agité, voire dangereux : entre la houle des théories, les écueils des faux cognats et les vagues de termes techniques, il vaut mieux s’y préparer correctement. Mais à force, en plus de nous donner des bases de linguistique de manière accessible et souvent surprenante, il nous apprendra beaucoup sur la société de nos ancêtres, les rôles sociopolitiques de la langue, ainsi que sur notre propre fonctionnement. Et vous, quels seront vos cognats préférés ?

5. Sources

S’abonner
Notifier de
guest

2 Commentaires
Inline Feedbacks
Voir tous les commentaires
Sid

Pokorny fait dériver « melior » et « multum » de *mel-4, signifiant « grand », et indique une possible dérivation *mlĝh- signifiant « enfler, gonfler » via l’affixe -ĝh-
Étant donné cet élément et le rapport de sens, je trouve cela audacieux d’affirmer qu’en PIE il n’y avait absolument aucun rapport entre cette racine et
*méǵh₂s. Attention, je ne dis pas haut et fort qu’il y en avait un (de toutes façons, on ne peut rien prouvé avec des mots non-attestés), je dis juste qu’il me semble un peu gratuit d’y voir deux étymons absolument séparés et indépendants.

C’est le gros souci de ce genre de sujets : le PIE est une reconstruction, et nous n’avons que des conjectures très vagues sur les dérivations de sens et rapports sémantiques que les mots entretenaient entre eux… Et bien sûr, nous ne savons absolument rien des divers registres de langue et des sens contextuels ou figurés que pouvaient avoir les différents mots. Je ne suis pas spécialiste, mais je ne sais même pas s’il existe une liste d’affixes proto-indo-européens qui fasse consensus…

Pour « insula », Pokorny y voit une ellipse d’in salo, donc « dans la mer ». Si « isle » et « island » n’ont pas la même origine lexicale, la formation des deux lexèmes d’origine serait donc incidemment la même. Ce qui est plutôt logique !