La divergence des langues : quelle est la langue la plus proche du français ?

Avec cet article, j’essaye de répondre à plusieurs questions : qu’est-ce qu’une langue au juste ? Quelle est la différence entre un dialecte et une langue ? Et surtout : quelle est la langue la plus proche du français ?

En effet, avec mes articles sur les langues les plus faciles, les langues les plus difficiles et la façon de le déterminer, je parlais de comparer des langues, mais je ne faisais que mentionner les langues « nationales » ; que se passe-t-il si on investigue un peu plus loin ?


Qu’est-ce qu’une langue ?

Avant de déterminer quelle langue est la plus proche du français, il faut définir ce qu’on entend vraiment par « langue ».

Chaque personne a un « idiolecte », qui est sa façon de parler propre. Mon idiolecte est différent de celui de mes parents, mais évidemment, nous parlons la même langue et le même dialecte. C’est pourtant bien le niveau 1 de divergence depuis un standard, arbitraire, fixé pour le moment par le dialecte.

divergence1
ⓒ Ywan Cwper

De toute évidence, différents accents ne sont pas non plus des langues différentes ; que ce soit un Parisien, un Genévois ou un Québécois qui parlent français, cela reste la même langue, mais pas le même dialecte. On peut donc faire remonter le repère arbitraire du standard sans risques : on parle toujours du français. Mais si on fait remonter la divergence plus loin, les distinctions deviennent ambiguës.

ⓒ Ywan Cwper

Note : le frioulan n’est pas techniquement « entre » le français et l’italien.

Le français et l’italien sont considérés comme des langues majoritaires par tous, pourtant elles ne sont pas forcément parlées sur l’entièreté du territoire où elles sont officielles (l’italien surtout). La seule raison pour laquelle le frioulan, parmi tant d’autres, est « inférieur » à l’italien, c’est son faible nombre de locuteurs (600 000 contre 90 millions d’italophones) et son absence de reconnaissance nationale. Alors les langues minoritaires sont « rabaissées » au titre de « dialecte », mais c’est une erreur : ce sont des langues à part entière, des langues régionales dérivées directement du latin au même titre que ses cousines plus prestigieuses.

On appelle une langue minoritaire un « dialecte » parce qu’on a tendance à considérer qu’elle s’est « séparée » de la langue nationale (que le frioulan s’est séparé de l’italien par exemple) ; en réalité, toutes les langues romanes ont commencé de diverger de manière égale avec l’éclatement de l’Empire romain. L’aspect « minoritaire » de certaines langues nous aide à forger la fausse croyance (le pléonasme est voulu) qu’elles sont moins importantes, et que leurs propres dialectes (p. ex. les dialectes du frioulan) ne sont qu’une distinction « scientifique ».

Comme l’a dit Henriette Walter :

Le français est un patois qui a réussi.

En fait, on se heurte à l’arbitraire de toute part :

  • la différence entre une langue « normale » et une langue « minoritaire » est arbitraire (600 000 locuteurs, d’accord, c’est peu, mais que dire alors du guugu yalandji, langue aborigène d’Australie qui comptait 323 locuteurs en 2016 ?) ;
  • la différence entre un dialecte et une langue est arbitraire (il s’agit de considérer que la divergence est suffisante ou non).

Car l’évolution des langues est largement comparable à la phylogénétique, l’évolution du vivant : les langues divergent, et par conséquent elles se divisent à partir d’un ancêtre commun. Mais vient alors une question-piège : les dialectes du français dérivent-ils bien du latin, ou alors du français lui-même ? Le diagramme au-dessus tend à le faire croire.

En théorie, toute variété de langue romane descend directement du latin, et le standard d’une langue n’est qu’un dialecte qui a été nationalement reconnu. Dans l’idée où le français est un dialecte, il est à égalité avec tous ses dialectes prétendument « inférieurs », qui sont alors ses « cousins » et non pas ses « descendants ».

N’oublions pas que jusqu’au VIIIème siècle, les langues romanes actuelles (déjà distinctes) étaient encore considérées comme des dialectes du latin.

Toutefois, on peut considérer que le standard, quoique défini artificiellement, chapeaute un ensemble de dialectes jugés suffisamment proches du standard pour lui être asujettis. Dans cette conception, l’on peut dire sans trop se tromper que les dialectes dérivent du standard. Tout est résumé à la considération du prestige d’une langue : le français est prestigieux, on considère donc que toutes les langues cousines parlées sur son territoire sont inférieures. Le frioulan n’est pas prestigieux, donc c’est une « langue minoritaire » inféodée à l’italien. Néanmoins, il ne s‘agit pas là de la réalité linguistique.

C’est notamment sans compter sur la subjectivité de la divergence : aujourd’hui que la langue est bien standardisée, les variantes du français sont presque toutes intelligibles entre elles : un Parisien comprendra un Marseillais, et l’un comme l’autre seront d’accord pour dire que leur « dialecte » varie… mais il ne leur viendrait pas à l’idée de dire qu’ils parlent une langue différente. Et pourtant ?

Pour en revenir à la question « qu’est-ce qu’une langue ? », la réponse est devenue simple : c’est une forme de communication, généralement orale, standardisée de manière tacite ou administrative pour permettre l’intercompréhension au sein d’un groupe défini de personnes.

Mais la question « quelle est la différence entre une langue et un dialecte ? » n’a pas de réponse : les linguistes se déchirent encore pour déterminer les frontières réelles séparant deux dialectes. Les uns défendent l’idée que la notion de « dialecte » doit être abolie *, d’autres disent qu’elle peut se justifier sociologiquement et géographiquement.

Il n’y a rien de scientifiquement rigoureux qui puisse nous guider : la divergence suffisante pour considérer qu’une langue en devient plusieurs distinctes n’est pas définie ni définissable, puisqu’elle n’est pas mesurable. Scientifiquement, toute variante langagière est une langue, mais puisque les variantes les plus petites sont les idiolectes, on devrait pouvoir dire qu’il existe autant de langues que de locuteurs… Une absurdité qui prouve qu’on doit, qu’on le veuille ou non, faire appel à l’arbitraire.

En résumé, cette question est un affreux bazar ne renfermant nulle vérité. Mais cela ne veut pas dire qu’on ne peut pas tirer de conclusions.

* Mon usage du mot « dialecte » entre guillemets tout au long de cet article n’indique pas pour rien l’ironie que j’y glisse moi-même derrière. Mais je suis ennemi des amalgames qu’il cause, pas de ce qu’il définit dans toute sa rigueur scientifique.


L’influence de la culture et de l’administration

La culture joue un rôle énorme dans la considération d’une langue : le catalan est connu pour être « entre le français et l’espagnol », et quand on l’étudie de près, on se rend compte que c’est assez vrai. C’est aussi la langue romane la plus prestigieuse parmi celles qui ne sont officielles dans aucun « grand » pays (c’est tout de même la langue officielle d’Andorre) ; l’identité nationaliste de ses locuteurs ou des artistes qui l’ont colportée, ainsi que l’administration de l’Espagne en communautés autonomes qui sont fertiles pour les idéologies indépendantistes, ont contribué à donner une grand place au catalan, que personne ne se risquerait aujourd’hui à qualifier de « dialecte » de l’espagnol ou du français.

Région catalanophone. ⓒ CC BY-SA 2.5 Ebrenc

Il faut ensuite aller en Italie pour se rendre compte de l’influence de la standardisation (qui résulte immanquablement d’une volonté administrative, que ce soit l’ordonnance de Villers-Cotterêt en France, en parallèle de la Reconquista espagnole ou du Risorgimento italien). En Italie, la standardisation de la langue ne date que du XVIIIème siècle, et son usage est loin d’être homogène (bien moins qu’en Espagne). En Italie, les « dialectes » souffrent moins de la pression du standard, et il est naturel que les régions s’expriment chacune dans leur variante de la langue.

La mosaïque de langues que vous voyez ci-dessous n’est pas différente de celle qu’on pourrait faire pour la France, mais elle est moins homogénéisée par l’intercompréhension (quoiqu’un Romain et un Sicilien peuvent se comprendre en parlant chacun leur langue), et la différence entre deux « dialectes » est si présente au quotidien qu’il ne viendrait pas à l’idée des Italiens de considérer un dialecte comme linguistiquement « inférieur » au standard *.

* Cela n’empêche pas la minorisation, le racisme ou une sorte de xénophobie interne, facilitée justement par l’hétérogénéité du pays, mais c’est une problématique qui sort de la linguistique et qui entre dans la culture à part entière.

Les dialectes italiens. Cliquez sur l’image pour l’agrandir.

Alors, quelle est la langue la plus proche du français ?

Les langues minoritaires de France. Cliquez sur l’image pour l’agrandir. ⓒ CC BY-SA 3.0 Hellotheworld

Comme on l’a vu, c’est une grande question, que la controverse et l’arbitraire rendent difficilement soluble. Mais j’ai tenu à y apporter des réponses claires. En fonction des avertissements que j’ai cités, j’ai pu construire quatre réponses.

  1. La thèse de l’absurde : pour pousser la rigueur jusqu’à l’absurde, il y a 90 millions de langues les plus proches du français (autant que de francophones natifs) : chacun utilise une variante de la langue qui lui est propre et qu’on peut déjà considérer comme une cousine de la vôtre.
  2. La thèse dialectale : pour donner une réponse plus raisonnable, il faut remonter jusqu’au dialecte, mais on a vu que c’est là le royaume des frontières arbitraires. Prenons la carte ci-dessus ; elle présente une quarantaine de langues minoritaires métropolitaines, que l’abus de langage appelle « dialectes » (c’est d’autant plus aberrant que le breton et le basque n’ont rien à voir avec le français et doivent être exclus du raisonnement). Pourrait-on donc dire que toutes ces langues sont les plus proches du français ? De toute évidence, les variantes d’outre-mer doivent être trop éloignées du français standard. Mais il ne faudrait pas oublier que le français métropolitain standard émane de la nationalisation d’une variante en particulier : le francien, qui était parlé à Paris. Dans l’idée que le français standard chapeaute les langues minoritaires, la réponse serait donc « le parisien »… Mais pas dans l’idée ou le français est le produit de toutes les variantes sur cette carte.
  3. Langue d’oc et langue d’oïl.

    La thèse macrodialectale : avant de transitionner entre la carte vue plus haut (40 langues) et une carte homogène de la langue française (1 langue), on peut encore grouper les langues minoritaires en « macrodialectes » (cf. carte ci-contre). On y remarque qu’à l’exception du breton, du basque, de l’alsacien, du flamand et du francique (qui ne sont pas romans) et des langues minoritaires linguistiquement spécifiques que sont le corse et le catalan, la France est dominée par le français et l’occitan. En d’autres termes, la langue d’oïl et la langue d’oc. On tient là ce que je trouve personnellement comme la meilleure réponse : l’occitan serait la langue la plus proche du français. Mais c’est une décision non moins arbitraire que les choix ayant mené à mes autres propositions. De plus, il ne faut pas tomber dans le piège du prestige : je n’ai pas comparé le français, l’occitan et le franco-provençal de manière assez approfondie, mais ce n’est pas du simple fait que le franco-provençal est moins parlé qu’il n’a pas sa place dans la réflexion. C’est peut-être lui, la réponse.

  4. La thèse des langues nationales : dans l’idée simplifiée (fausse, en fait) selon laquelle le français standard est la seule langue de France, la langue la plus proche du français est l’italien standard ; c’est d’ailleurs pour cela que c’est la langue nationale la plus facile pour un francophone. Mais on en revient au sujet de mon article « Les langues les plus faciles pour un francophone ».

Il n’y a pas vraiment de source pour cet article, que j’ai tiré de mes connaissances préalables et d’un long butinage sur Wikipédia ainsi que de l’assistance d’amis plus calés que moi ; je pense avoir suffisamment croisé les recherches pour avoir extrait un matériau fiable, mais je vous invite à mettre ma parole en doute si vous pensez que j’ai dit une bêtise. Je vous conseille notamment de lire ceci si vous voulez approfondir. Merci mille fois pour votre lecture !

6 commentaires

  1. Passionnant, comme à chaque fois.
    J’apprends donc que le catalan est entre le français et l’espagnol, ce qui m’interroge tout de même sur cette incapacité chronique du majorquin Nadal à s’exprimer autrement que comme une vache espagnole. 😄
    Sinon j’ai vu que le Dalmatien descendait du latin. Je vais en parler à mon chien, ça va nous rapprocher. 😉

    Aimé par 1 personne

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s