Une édition posthume de Lucien Tesnière, la table étymologique russe
Introduction
L’œuvre de Lucien Tesnière, connue et citée dans les pays d’Europe centrale, notamment en Tchécoslovaquie (Tesnière 1953 et 1959/1966), semble avoir été relativement peu considérée en France jusque dans les dernières années en dehors de la référence explicite du Centre de Recherche Lucien Tesnière à l’Université de Besançon, de son collègue et ami le germaniste Jean Fourquet (Fourquet 1969) qui a été avec Daumas à l’origine de la publication posthume de Tesnière (1959), du slavisant Paul Garde (russe et serbo-croate) et surtout de Claude Vincenot (russe et slovène), auteur d’une grammaire du slovène dans la lignée directe de Tesnière (Schlamberger Brezar 2020).
J’ai montré (Pognan 2022) que l’œuvre de Lucien Tesnière a été à tort considérée par des linguistes français de premier plan comme « historique », sans « influence décisive » sur les études syntaxiques et d’une « minceur » surprenante, toutes affirmations dont on peut aisément démontrer qu’elles sont inexactes.
Je souhaite m’arrêter un instant sur l’ampleur de l’œuvre que j’ai défendue en ces termes :
Les publications de Tesnière ne sont pas si réduites, très exactement une soixantaine. Elles sont riches, diversifiées, éclectiques. Elles concernent le slovène avec des ouvrages importants pour la communauté slovène (Tesnière 1925a, b, c), les langues slaves en général (1929, 1935, 1952) et le russe en particulier (1939a) (grammaire (1934b), vocabulaire (1957)), des articles afférents à l’Allemagne et à l’Alsace, des articles notamment avec Meillet sur les atlas linguistiques et surtout des articles publiés dans le cadre du Cercle linguistique de Prague qui ont une importance stratégique (Tesnière 1932, 1939b) et des articles préparatoires à la conception et à la réalisation de la syntaxe (1934a, 1953). Comment peut-on parler de minceur de l’œuvre à propos de quelqu’un qui a publié un ouvrage fondamental de quelque 675 pages, même post-mortem (1959/1966) ?
J’ai particulièrement développé les publications dédiées au slovène dans un autre article (Pognan 2020).
Les quelques bibliographies complètes de Lucien Tesnière indiquent généralement deux publications post-mortem (Tesnière 1957 et 1959).
L’ouvrage collectif (Neveu, Roig 2022) apporte de très nombreux éclairages sur l’œuvre de Lucien Tesnière et notamment la citation d’une troisième publication post-mortem (Tesnière 1970), une « Table étymologique » citée par Marie-Hélène Tesnière dans la préface de l’ouvrage (page XI) et dans la bibliographie du chapitre 7 (Bergounioux 2022).
L’influence et la descendance de Tesnière sont évaluées d’après les travaux de syntaxe (Tesnière 1957, 1959/1966 et 2015). La « table sémantique » (Tesnière 1957) et la « table étymologique » (Tesnière 1970) apportent le dessein d’un vaste projet pédagogique en faveur de l’apprentissage du russe.
1. Un projet pédagogique
Dans la préface de l’ouvrage de Neveu et Roig (2022), Marie-Hélène Tesnière souligne que Lucien Tesnière souhaitait faire ‘œuvre de pédagogue, plutôt qu’œuvre scientifique’
. En plus des travaux sur le russe, il avait quasiment achevé en 1935 une Petite grammaire allemande, mais aussi une Grammaire française pour étrangers.
Dans la préface de la « table étymologique », Michel Tesnière, polytechnicien, l’un des deux fils[1] de Lucien Tesnière, présente l’inventaire du projet pédagogique russe élaboré de 1925 à 1947 :
1. une table sémantique où les mots sont rangés d’après le sens (publiée) [Tesnière 1957] ;
2. une table étymologique que voici, où les mots sont groupés d’après la racine [Tesnière 1970] ;
3. une table grammaticale où les mots sont classés d’après leurs caractéristiques grammaticales (non publiée) ;
4. une table fréquentielle où les mots sont ordonnés d’après leur fréquence d’emploi (non publiée) ;
5. une table alphabétique, renvoyant pour chaque mot à chacune des quatre premières tables (non publiée).
Lucien Tesnière a entièrement réalisé à la main ce travail colossal avec l’aide de son épouse. Michel décrit la démarche adoptée :
Il procédait à l’examen critique du matériel rassemblé, éliminait les particularités de détail pour ne retenir que les traits essentiels en vue de l’enseignement, dégageait les règles principales, ordonnait méthodiquement les faits à exposer et finalement rédigeait les paragraphes successifs …
2. La table étymologique
La Table étymologique : les mots russes classés d’après leur racine a été publiée en tant que Document de linguistique quantitative n° 8 en 1970. Cette collection a été créée, puis dirigée par Daniel Hérault qui est, en grande partie, à l’origine de la publication de la table étymologique.
Cet ouvrage comprend, dans l’ordre, une table des matières en tête d’ouvrage, la préface rédigée par Michel Tesnière, la bibliographie de Lucien Tesnière, un avant-propos de Daniel Hérault, un tableau des vocalisations slaves (slavon et russe) des diphtongues indo-européennes (devant consonnes), un avertissement de l’éditeur, puis sur 106 pages la table elle-même classée dans l’ordre alphabétique, les emprunts du russe à différentes langues étrangères et enfin un index.
3. Examen de la table étymologique
La table étymologique (TE) contient environ un millier de racines, ce qui constitue un ensemble important, puisque l’on sait qu’une langue indo-européenne contient de l’ordre de 1200 / 1300 racines (Hérault et al. 1981). En slave, les racines ont majoritairement une forme : entrée consonantique (une ou plusieurs consonnes = « attaque » de la syllabe – support vocalique (pouvant être absent) ou « noyau » – sortie consonantique ou « coda » (une ou plusieurs consonnes).
Les racines de la table correspondent aux quelque 6000 mots du Petit vocabulaire russe, lui-même obtenu par l’étude d’auteurs classiques. La table est organisée alphabétiquement d’après l’ordre des racines transcrites en caractères latins. Sous chaque racine sont notés les mots russes en cyrillique avec leur traduction française. Ces racines sont afférentes à l’ensemble du vocabulaire russe sans distinction de type tel que racine verbo-nominale opposée à racine (uniquement) nominale comme peuvent le faire les grammaires des langues sémitiques. Cette distinction est pourtant importante, car les racines du premier type semblent bien plus intéressantes pour la mécanique de la langue et la création du lexique.
La table est dite « étymologique », ce qui laisse entendre une vision d’apprentissage diachronique. Mais la table étymologique n’est accompagnée ni d’un exposé de grammaire historique ni d’une présentation de la notation des racines et des choix adoptés. Blankoff (1974) fait une critique virulente de la table :
La table mélange allègrement les concepts, les formes slavonnes et russes sont mêlées sans avertissement, elle indique des rapprochements avec le français qui sont quelquefois fort discutables, contient des erreurs, … le concept même de racine, fondamental ici, n'est pas défini et les formes sous lesquelles sont présentées ces racines, parfois assez arbitraires, ne sont pas justifiées.
C’est pourquoi je soumettrai les racines à un examen attentif pour tenter d’appréhender les choix de Lucien Tesnière en gardant à l’esprit que son projet concernait l’enseignement du russe.
Cet examen nécessite que l’on s’arrête quelques instants sur les caractéristiques des écritures en général et des écritures slaves en particulier.
L’écriture d’une langue est un code qui répond plus ou moins bien à la chaîne parlée d’une part et au système linguistique d’autre part. Cet aspect de code se perçoit de manière plus évidente lorsqu’une langue est (ou a été) écrite à l’aide de plusieurs systèmes : les langues turques d’Asie centrale ont été écrites en caractères arabes, en caractères latins et en caractères cyrilliques ; le turc en caractères arabes (osmanlı) et en caractères latins ; le serbe traditionnellement écrit en cyrillique, mais aussi en latin, a été écrit pendant la domination turque en caractères arabes. À l’inverse, dès la Mésopotamie, une écriture a servi à représenter plusieurs langues et même types de langues : indo-européennes, sémitiques ou autres en cunéiforme. L’étendue des caractères latins est planétaire.
La première écriture slave, l’écriture glagolitique, est créée en Grande Moravie dans les années 860 de l’ère chrétienne par Constantin (Cyrille) sur la base de l’onciale grecque. Le grand mérite de Constantin est d’avoir forgé des caractères nouveaux pour les phonèmes propres au slave, maintenant ainsi une relation bi-univoque parfaite entre la chaîne parlée et la chaîne écrite. L’écriture cyrillique conserve cette qualité et notamment le cyrillique russe.
Les termes associés aux racines, écrits en cyrillique, pourront être lus par la transcription entre parenthèses suivant le code donné dans le tableau ci-dessous. C’est l’alphabet tchèque qui sert de référence pour la transcription du cyrillique en latin. Il convient de se souvenir que « j » représente toujours le yod (comme le « ille » de « nouille »). C’est la valeur qu’il a dans toutes les langues slaves écrites en caractères latins. « u » se prononce « ou » comme dans l’immense majorité des langues écrites en caractères latins.
Fig. 1. Table des équivalences alphabet latin / alphabet cyrilique pour les langues slaves.
3.1. Définition de la racine dans la table étymologique
L’examen de la table portera sur la structure des racines choisie par Tesnière et sur la présentation des grandes évolutions phonologiques qui se sont produites jusqu’au Xe siècle, c’est-à-dire celles qui sont communes à toutes les langues slaves. Pour des phénomènes comme la métathèse, la contraction, la disparition et la vocalisation des jers et l’évolution des nasales, il est important de savoir quelle forme a été adoptée pour l’entrée de chaque rubrique :
- la forme résultante en synchronie,
- une forme synchronique dont l’évolution historique est explicitement décrite ou
- une forme en diachronie antérieure aux phénomènes agissant sur la racine qui présuppose une connaissance préalable de la grammaire historique ?
En dehors de ces quatre évolutions historiques, l’attention se portera sur la forme de la racine, consonantique (terminée par une consonne) ou vocalique (terminée par une voyelle). Cette question entrelace la tradition de la grammaire historique et une vision orientée vers la calculabilité des structures morphématiques.
3.2. Forme des racines avec métathèse des liquides
La métathèse est l’un des phénomènes les plus anciens de l’évolution phonologique des langues slaves. La métathèse est double, puisqu’elle peut être réalisée avec une voyelle « o » ou une voyelle « e ». La suite de caractères « (C) {e | o} {l | r} C » représente le patron qui permet la réalisation de la métathèse. « C » désigne une consonne quelconque. La présence, dans cet ordre, d’une voyelle « e » ou « o » suivie d’une consonne liquide « l » ou « r » devant une consonne permet la réalisation de la métathèse si la langue l’autorise (p. ex. en haut-sorabe la métathèse n’est pas systématique). La présence ou non d’une consonne avant ce patron importe peu, d’où la notation d’une consonne facultative entre parenthèses.
3.2a. La métathèse avec « o »
Le russe a une position particulière, puisqu’il duplique la voyelle de chaque côté de la liquide (« l » ou « r »). Dans le cas de « o », le russe a une vocalisation complète en « (C) o {l | r} o C ». Les langues slaves du Nord (polonais, haut et bas-sorabe) ont une métathèse en « o » : « (C) {l | r} o C » alors que le tchèque, le slovaque et les langues slaves du Sud remplacent le « o » par « a » « (C) {l | r} a C ».
Voici quelques exemples de racines issues de la table.
Dans l’en-tête, la racine est écrite en caractères latins majuscules sans distinction entre l’environnement consonantique et la voyelle qui aurait pu être notée en minuscule. Le tiret arrière semble indiquer la présence possible d’éléments suffixaux alors que l’éventualité de préfixations n’est pas signalée, bien que très présentes dans les exemples. La notation de la racine ne tient pas compte de tons éventuels et ne présente pas non plus un jer dur final (GÔRDъ). Par cette formule, Tesnière tient cependant bien compte d’une racine vieux-slave avant métathèse à partir de laquelle il est possible de générer la forme russe standard « город[3] » et une forme slavonne en « грaд » identique aux formes slaves du Sud[4], ce qui vaut également pour les exemples suivants.
(1) GOL- (1) « nu », « tête (chauve) » (TE p. 22)
голый (golyj) : nu
…
головa[5] (golova) : la tête
глaвa (glava) : le chapitre
....
(2) GOL- (2) « voix » (TE p. 22)
голос (golos) : la voix
…
приглашaть (priglašať) : inviter
пригласить (priglasiť) : inviter
приглашeние (priglašenie) : l’invitation
глaгол (glagol) : le verbe
La notation des deux racines « GOL- » est la même que précédemment (« GORD -»). Cependant, il me semble que la consonne suivant la liquide appartient à la racine. J’aurais noté « GOLS -» et « GOLV -». Dans ce dernier cas, la notation de « V » dans la racine empêcherait de prendre « гóлый » (golyj : nu) en compte comme le fait Tesnière. Derksen (2008) va dans mon sens en proposant deux formes différentes : « golvà » pour la tête et « gòlъ » pour nu. En ce qui concerne GOL- (2) « voix[6] », ce choix permet à Tesnière d’inclure la forme « глaгoл » (glagol) issue par métathèse « o vers a » de « golgolъ » identifié en tant que tel chez Derksen.
3.2b. La métathèse avec « e »
Elle est illustrée chez Tesnière, entre autres, par la racine « BERG- (2) ‘rive’ ». Blankoff (1974) fustige les commentaires que Tesnière ajoute de temps à autre sous l’entrée de la racine et que je comprends bien plus comme un moyen de mémoriser la racine que d’en indiquer une étymologie. Il est dommage qu’ici Tesnière n’ait pas pensé au mot français « berge ».
Derksen donne « bêrgъ » et Tesnière :
À partir de la racine « BeRG », nous obtenons bien une forme « BeReG » (« бéрег[7] ») en russe, palatalisée dans « нáбережная (naberežnaja) » conservant la vocalisation totale.
3.3. Forme des racines avec contraction
La contraction est essentiellement un phénomène ayant touché les langues slaves de l’Ouest. Il y a eu plusieurs périodes de contraction. Celle qui nous intéresse est la plus ancienne. Elle est marquée par une suite « voyelle - ‘j’ - voyelle » dans laquelle le yod se perd. Il en résulte une suite « voyelle - voyelle » qui devient une voyelle longue en tchèque et en slovaque qui notent les longueurs dans la graphie. Ainsi, la suite « oja » donne-t-elle « oa », puis « á ».
Marvan a décrit précisément ce phénomène (Marvan 2000) et le présente sous forme tabulaire :
|
|
pol |
b-s |
h-s |
tch |
slk |
slo |
cr/s |
bul |
ukr |
rus |
|
|
1 |
dobrajego |
I |
I |
I |
I |
I |
I |
I |
I |
I |
I |
20 |
1 |
2 |
dobroje |
I |
I |
I |
I |
I |
I |
I |
— |
I |
— |
16 |
2 |
3 |
dělaje |
+ |
I |
I |
I |
I |
I |
+ |
+ |
+ |
— |
14 |
3 |
4 |
pojasъ |
I |
I |
I |
I |
I |
+ |
+ |
— |
— |
— |
12 |
4 |
5 |
sъměje |
I |
— |
I |
I |
I |
+ |
I |
— |
— |
— |
11 |
5 |
6 |
ženojǫ |
I |
I |
I |
I |
+ |
I |
+ |
— |
— |
— |
10 |
6 |
7 |
vějati |
+ |
+ |
I |
I |
I |
+ |
— |
— |
— |
— |
9 |
7 |
8 |
mojego |
+ |
— |
— |
I |
+ |
I |
+ |
— |
— |
— |
7 |
8 |
9 |
stojati |
+ |
— |
— |
I |
I |
+ |
— |
— |
— |
— |
6 |
9 |
10 |
moja |
— |
— |
— |
+ |
+ |
+ |
— |
— |
— |
— |
4 |
10 |
11 |
mojimi |
+ |
— |
— |
I |
— |
— |
— |
— |
— |
— |
3 |
11 |
12 |
vojevoda |
— |
— |
— |
I |
— |
+ |
— |
— |
— |
— |
3 |
12 |
13 |
zajęcь |
— |
— |
— |
— |
— |
+ |
+ |
— |
— |
— |
2 |
13 |
14 |
moji |
— |
— |
— |
— |
— |
— |
— |
— |
— |
— |
0 |
14 |
15 |
směje sę |
— |
— |
— |
— |
— |
— |
— |
— |
— |
— |
0 |
15 |
|
|
14 |
11 |
14 |
19 |
17 |
15 |
10 |
3 |
5 |
2 |
|
|
|
|
15 |
11 |
14 |
23 |
17 |
17 |
11 |
3 |
5 |
2 |
|
|
Fig.2. Le phénomène de contraction dans les langues slaves.
« + » indique une contraction qui n’a pas toujours lieu, « I » une contraction qui se fait toujours et « — » jamais. Des 15 patrons « voyelle - ‘j’ - voyelle » présentés par Marvan, seul le premier concerne le russe. Il s’agit du génitif singulier du masculin et du neutre des adjectifs de type dur : « dobrajego » devient « dobrogo ». Une des particularités du russe est de conserver abondamment les formes longues, développées.
Tesnière donne la racine
(1) STa/o[8] « se tenir debout » (TE p. 78)
(franç. station)
…
où l’on trouve une alternance «ст » (st) / « щ » (ś) et une désinence de l’infinitif en « -ить » (-it’), ce qui me fait d’autant plus douter.
Le tchèque a contracté en « stát » à l’infinitif, même si la flexion conserve la forme développée en « stojím » (première personne du singulier). Les formes de racines terminées en voyelle font partie des descriptions classiques des langues slaves qui, à mon avis, dans bon nombre de cas, ne tiennent pas compte de la mécanique de la langue.
Le verbe стать (stať) : se mettre à, donné comme premier exemple par Tesnière pose également problème, ne serait-ce que par une sémantique très divergente.
De fait, Derksen donne deux racines :
stàti
avec en russe « стать » (stať), « стану » (stanu : 1ère personne du singulier) et « станет » (stanět : 3ème personne du singulier), « stát se » en tchèque, « stat’ sa » en slovaque, « stać się » en polonais.
stojati
avec en russe « стоять » (stojať), « стою » (stoju : 1ère personne du singulier) et « стоит » (stoit : 3ème personne du singulier), « stát » en tchèque, « stát’ » en slovaque, « stać » en polonais, « stajati » en serbo-croate et « stati » en slovène, les langues slaves de l’Ouest et le slovène ayant contracté à l’infinitif.
3.4. Forme des racines avec disparition et vocalisation des jers
Il s’agit d’un phénomène essentiel qui concerne toutes les langues slaves. Les « jers » sont de nature vocalique et sont soumis, comme les voyelles, à une opposition de mouillure (jer dur, représenté par « ъ », opposé à un jer mou, représenté par « ь »). Ils sont brefs, dits de la durée d’une demie voyelle brève. On obtient les oppositions de longueur : jer: 0,5, voyelle brève : 1 et diphtongue / voyelle longue : 2.
La tradition tchèque se réfère à la loi de Havlík qui rend compte de la disparition et de la vocalisation des jers. Elle permet une représentation et une compréhension fiables des phénomènes mis en jeu. Les communautés slaves autres que tchèque et slovaque s’y rapportent beaucoup plus rarement, lorsque cette loi est connue. Je vais montrer ces processus, calculés à partir de la fin du mot, à l’aide du schéma ci-dessous :
Dans une structure de mot supposée en « consonne – voyelle – consonne – voyelle … », les jers peuvent se substituer aux voyelles et venir à leur place. Aux trois voyelles ci-dessus correspondent au-dessus de celles-ci les jers mous et en-dessous les jers durs. L’évolution possible des jers se calcule à partir de la fin du mot en remontant vers l’avant, d’où la flèche rouge.
3.4a. Les jers de rang impair
Les jers de rang impair disparaissent, mais de manière différenciée :
- un jer dur de rang impair disparaît sans laisser de trace. En fin de mot, donc en position 1, cette chute explique qu’un substantif masculin soit terminé par une consonne, parce que le jer, vocalique, qui terminait la chaîne est tombé et a laissé la consonne dure « à nu » qui devient ainsi le dernier caractère du mot. En slave, la forme finale du mot permet, dans un grand nombre de cas, de connaître son genre.
- un jer mou impair disparaît en tant que tel, mais demeure sous une forme combinée avec la consonne précédente dans les langues slaves de l’Ouest. C’est ce qui explique les formes diverses d’infinitif à partir de la suite « t + jer mou », là où l’on a « ть » (t’) en russe :
- « t + jer mou » donne « ś » en bas-sorabe.
- « t + jer mou » donne « ć » en haut-sorabe et en polonais.
- « t + jer mou » donne « ť » en slovaque. En tchèque, le « ť » a fortement dépalatalisé en « t », les formes demeurées en « ť » étant l’exception. Le slovène a totalement dépalatalisé en « t ».
On trouve dans la table étymologique :
3.4b. Les jers de rang pair
Ils sont transformés en voyelle, par exemple le polonais et le tchèque transforment les jers pairs, qu’ils soient durs ou mous, en « e », le serbo-croate en « a ». Par contre, le russe différencie l’évolution du jer dur (en « o ») et du jer mou (en « e »). Le bulgare et le macédonien ont également une évolution différenciée suivant le type de jer.
On trouve par exemple chez Tesnière :
(1) ČЬRV- « vermillon » (TE pp. 8-9)
(la cochenille est un insecte dont on tirait une teinture écarlate)
червь (červ’) : le ver
où le « ь » de rang 2 a été transformé en « e » à partir du mot « чьрвь », le « ь » de rang 1 restant.
(2) BRЪV- (1) « sourcil » (TE p. 6)
(all. Brane « sourcil »
бровь (brov’) : le sourcil
où le « ъ » de rang 2 a été transformé en « o » à partir du mot « бръвь», le « ь » de rang 1 restant.
3.5. Forme des racines avec évolution des nasales
Les nasales du vieux-slave sont « ǫ » et « ę ». Elles semblent avoir disparu dès le milieu du 10ème siècle pour le russe, vers la fin du 10ème siècle pour les langues slaves de l’Ouest à l’exception du polonais où subsistent deux nasales « ą » et « ę » (mais sans correspondance biunivoque entre les deux séries de nasales).
3.5a. Vocalisation de la nasale « ǫ »
Sans la présence du polonais, nous aurions une tendance générale des langues slaves à vocaliser la nasale « ǫ » en « u » en dehors du slovène qui a vocalisé en « o ». Pour le russe, cela semble une régularité et cela évite de devoir considérer les différents tons comme on doit le faire pour le polonais. La nasale montante longue « ǫ́ » et la nasale non accentuée longue « ǭ » donnent « ą » en polonais : « Sǫ́Dъ » a produit « sąd » (tribunal) et « LǭKa » « łąka » (prairie). Par contre, la nasale descendante longue « ǫ̀ » qui est vocalisée en « u » (bref) dans l’ensemble des langues slaves sauf en slovène où elle est « o » pose problème en polonais. Nous avons généralement « ę » en polonais : « Kǫ̀Sъ » fait « kęs » (morceau), mais aussi des alternances avec « ą » ou « ą » / « ę » où les deux formes sont possibles.
Tesnière n’a pas utilisé pour ses entrées une notation de la racine avec une voyelle portant un ogonek (à la polonaise) : « ą », « ę », « ǫ », mais une transcription issue de la graphie française, certainement pour rendre l’approche plus simple, plus naturelle. Alors qu’il écrit « SOND » pour « tribunal », il respecte la loi du « mpb » des écoliers français et écrit « ZOMB » pour la « dent ».
(1) SOND- (1) « juger » (TE p. 77)
суд (sud) : le jugement ; le tribunal
судить (sudiť) : juger
….
(2) ZOMB- « dent » (TE p. 103)
зуб (zub) : la dent
3.5b. Vocalisation de la nasale « ę »
La vocalisation de la nasale « ę » a été accompagnée d’une mouillure derrière labiale. Elle semble se faire en fonction du contexte qui l’entoure et produit deux séries différentes :
La première série peut être représentée par « mę̀so » (viande) qui donnera d’abord une forme mouillée « m’ęso », puis la série « мясо » en russe (forme mouillée), « mięso » en polonais (forme mouillée), « mäso » en slovaque (le « ä » a été une forme intermédiaire en tchèque, transformée ensuite en « a »), « maso » en tchèque, « meso » en slovène et BCMS.
Tesnière note :
(1) MEMS- « viande » (TE p. 44)
(franç. mem-bre)
мясо (mjaso) : la viande
мясистый (mjasistyj) : charnu
мясник (mjasnik) : le boucher
On peut être ici surpris de la graphie « à la française » de la nasale en « em » sans raison apparente (devant « s »).
Un exemple de la seconde série sera « pę̀tь » (cinq) qui donne un ensemble avec « p » mouillé « пять » en russe, « pięć » en polonais, « pět » en tchèque et non mouillé avec « päť » en slovaque et « pet » en slovène et BCMS.
Tesnière présente ainsi l’entrée correspondante :
(1) PENT- « cinq » (TE p. 57)
(franç. pent-agone)
пять (pjat’) : cinq
пятнадцать (pjatnadcat’) : quinze
пятьдесят (pjatdesjat) : cinquante
...
пятый (pjatyj) : cinquième
пятница (pjatnica) : vendredi
3.6. Autres formes de racines
J’examinerai ici la constitution consonantique et vocalique des racines. A priori, deux grandes catégories devraient se dégager :
- une racine consonantique terminée par une consonne, généralement de type « attaque consonantique - noyau vocalique - coda consonantique »,
- une racine vocalique de type « attaque consonantique - noyau vocalique ».
3.6a. Racines consonantiques
Du premier type sont des racines de la table telles que:
(1) GLAD- « plat » (TE p. 21)
(franç. glabre)
гладкий (gladkij): plat
(2) PRYSK- « asperger » (TE p. 64)
прискать (priskať) / прискнуть (prisknuť) : asperger
(3) BЬČ- « bourdonner » (TE p. 6)
(lat. fucus « frelon »)
пчела (pčela) : l’abeille
La racine est donnée par Tesnière en « BЬČ » alors que « пчела » donne « PЬČ », ce qui pourrait suggérer une assimilation régressive de sonorité transcrite dans la graphie actuelle.
Parmi les racines de cette forme, il existe dans la table de nombreuses racines possédant un noyau composé de deux voyelles écrites en minuscules et séparées par un « / » signifiant l‘alternance, notamment « e/o ». En voici un exemple typique :
Tesnière indique la présence de variations vocaliques au sein de la racine par la notation « e/o ». La description n’est pas complète. Une notation en « B{Øei|o}R » serait beaucoup plus précise. On pourrait ainsi indiquer que le support vocalique de la racine peut être absent (Ø: брать (brat’)), se conjugue au présent avec un « e » intercalaire (беру (beru)) et la formation de l’imperfectif est marquée par la voyelle « i » (выбирать (vybirat’)). À droite de la séparation « | », on indique le(s) support (s) vocalique(s) de la dérivation nominale de cette racine verbo-nominale (сбор (sbor)).
Dans la même série de racines, la table contient :
Pe/oK- « cuire (au four), souci » (TE pp. 56-57)
печь / пеку / (peč’ / peku /) : cuire au four
où la coda devrait être représentée en « K/Č » pour indiquer la palatalisation.
3.6b. Racines vocaliques
Ce sont des racines qui se terminent par une voyelle. Ce sont des racines sans coda. On trouve des exemples tels que :
La conjugaison du présent est en « смеюсь » (smejus’ : je ris).
J’interprète la forme de racine (« Sme/oI- ») choisie par Tesnière comme une alternance vocalique, mais aussi une mouillure par la présence du « i » final que l’on retrouve dans le « я » qui suit.
L’immense majorité des slavisants adopte ce type de découpage : « зна|ть » (zna|t’), « зна|ю » (zna|ju), « зна|к » (zna|k) et « сме|яться » (sme|jat’sja), « сме|юсь » (sme|jus’), « сме|х » (sme|x) au nom du principe d’opposition. En russe et dans les langues slaves de l’Est, la non contraction du segment vocalique « voyelle - ‘j’ - voyelle » appuie une segmentation en « voyelle | - ‘j’ - voyelle ». Mais faut-il ensuite se contenter de « к » et de « x » comme suffixes ?
Dans les langues qui ont contracté, la tradition maintient très souvent le découpage précédent. Cependant, une vision plus consonantique des racines où peuvent entrer des schèmes vocaliques en référence aux grammaires des langues sémitiques amène à un découpage qui, dans les exemples ci-dessus, met la voyelle du côté des suffixes. En analyse automatique du tchèque, le découpage morphématique participe à la calculabilité de la langue dans la mesure où il n’apporte ni blocage ni contradiction.
4. Les mots d’origine étrangère
L’indication d’origine étrangère se rapporte aux mots et non aux racines. Les différentes origines sont classées dans un ordre approximativement décroissant du nombre de mots concernés et par groupes de langues ou aires géographiques. C’est le grec et le latin qui viennent en tête avec environ 120 mots. En tête des langues vivantes apparaît l’apport des langues romanes avec italien, français et espagnol. Viennent ensuite les langues germaniques avec les emprunts à l’allemand (environ 80 mots), au néerlandais, puis à l’anglais, aux langues scandinaves et au gotique. Puis on trouvera polonais et lituanien (avec le mot янтарь (jantar‘) désignant l’ambre venu du lituanien ‘gentaras’), hébreu, arabe, persan, turc (par exemple изюм (izjum) les raisins secs du turc ‘üzüm’), kurde, tatar, hongrois et l‘extrême-orient avec mongol, chinois (pour le thé - чай (čaj)) et japonais (pour le soja - соя (soja)).
Il convient de rappeler ici que le corpus est constitué de textes littéraires. Un corpus de nature médicale, scientifique ou technique aurait vraisemblablement fait apparaître un plus grand nombre d’origines grecques et latines.
5. Des prolongements à la table étymologique
Sous le titre « Compréhension automatique et spectre sémantique (russe, bulgare, tchèque, français). Eléments pour la construction d’un automate de compréhension implicite du discours non littéraire » qui peut paraître énigmatique, Daniel Hérault s’est intéressé, à la suite de Tesnière et de Gentilhomme (1964), à l’utilisation des racines que l’on peut faire en lecture et compréhension globale d’un texte scientifique. Celles-ci sont en mesure de fournir un invariant de sens en dehors d’études morphologiques et syntaxiques, notamment en privilégiant les racines verbo-nominales. De plus, l’organisation et la typographie du texte permettent une certaine hiérarchisation des concepts.
Une implémentation informatique de l’essentiel d’un automate de compréhension implicite de textes médicaux a été réalisée pour le tchèque par Pognan (1977). Depuis, les racines jouent un rôle important dans nos analyses automatiques du tchèque, en particulier pour la réalisation d’un module de segmentation morphématique.
Je souhaiterais ici attirer l’attention sur un essai intéressant de génération automatique de mots slaves (langues slaves de l’Ouest et du Sud-Ouest et russe) à partir de racines (supposées) vieux-slaves réalisé en collaboration avec Jarmila Panevová (2013). Cet essai a été basé sur l’inventaire présenté par Derksen (2008). Le fait qu’un grand nombre de racines permet de générer correctement les mots dans un ensemble de langues slaves montre que le système linguistique slave est calculable dans ses diverses variétés par rapport à une origine distante d’une bonne quinzaine de siècles et conserve donc une unité insoupçonnée.
Conclusion
La délimitation des racines d’une langue présuppose une connaissance de la grammaire historique et la définition préalable d’un découpage morphématique cohérent au plan synchronique. Il n’est pas impossible, mais peu vraisemblable, que Lucien Tesnière n’ait pas apporté le même soin que pour la préparation de la syntaxe, ces deux séries de travaux s’étant étalées sur des décennies.
Le jugement sévère de Blankoff doit être relativisé en ce qui concerne un certain nombre de points :
- le concept même de racine, fondamental ici, n'est pas défini et les formes sous lesquelles sont présentées ces racines, parfois assez arbitraires, ne sont pas justifiées
C’est certainement là la critique la plus forte. Le présent article s’est efforcé de montrer que les formes de racine, à la transcription près, sont des formes standard en vieux-slave avant toute transformation historique ;
- elle [la table étymologique] indique des rapprochements avec le français qui sont quelquefois fort discutables, contient des erreurs, même en langue anglaise (p. 75, on sait que « to smile » veut dire « sourire »)
À mon avis, Tesnière vise tout autant des moyens mnémotechniques qu’une étymologie. En ce qui concerne « to smile », la racine commune « SM » est mise en avant. L’origine de « smile » n’est pas tout à fait claire et le Webster’s Ninth New Collegiate Dictionary (1983) fait état du sens de « rire » en vieil anglais. Souvent, dans la table étymologique, les mots liés à une racine surprennent, car ils ont en russe contemporain une sémantique divergente. Tesnière, en spécialiste de l’indo-européen, tient vraisemblablement compte d’états plus anciens que ce qui est connu pour le slave. Il met par exemple « слово » (slovo : mot) sous la racine « SLe/oU » (entendre) qui donne naturellement des mots tels que « слух » (slux : l’ouïe). « SL » est la racine du verbe « slúti » (s’appeler, se nommer) qui donne « Slovan » (le Slave = celui qui possède la parole).
Le jugement porté sur la table étymologique de Lucien Tesnière doit tenir compte du fait qu’il s’agit d’un travail en cours, non achevé et d’un élément faisant partie d’un tout beaucoup plus large : un projet d’enseignement / apprentissage du vocabulaire russe. L’ensemble des quatre tables prévues concerne les mots du russe et leur apprentissage à partir d’angle divers, grammatical (non publié), sémantique, étymologique et statistique (non publié). Cet ensemble convergent, auquel il serait aujourd’hui facile d’ajouter un concordancier pour observer l’usage des mots en situation, est certainement optimal pour l’apprentissage du vocabulaire.
Bibliographie
BERGOUNIOUX Gabriel, Lucien Tesnière (1893-1954) : du slovène à la syntaxe structurale in Neveu F. & Roig A., (eds), L’œuvre de Lucien Tesnière, lectures contemporaines, de Gruyter, Paris, p. 123-134, 2022.
BLANKOFF Jean, Tesnière (Lucien), Table étymologique, les mots russes classés d'après leur racine. In Revue belge de philologie et d'histoire, tome 52, fasc. 1 Antiquité - Oudheid, p. 234-235, 1974. https://www.persee.fr/doc/rbph_0035-0818_1974_num_52_1_5440_t1_0234_0000_3.
BLAŽEK Václav, On the internal classification of Indo-European languages: survey, Linguistica ONLINE, ISSN 1801-5336, 2005. http://www.phil.muni.cz/linguistica/art/blazek/bla-003.pdf.
DERKSEN Rick, Etymological Dictionary of the Slavic Inherited Lexicon. Brill, Leiden, 2008.
FOURQUET Jean, Grammaire de l’allemand, Hachette, Paris, 1969.
GENTILHOMME Yves, Manuel de russe à l’usage des scientifiques. Dunod, Paris, 1964.
HÉRAULT Daniel, LJUDSKANOV Alexandre, POGNAN Patrice, Compréhension automatique et spectre sémantique (russe, bulgare, tchèque, français). Eléments pour la construction d’un automate de compréhension implicite du discours non littéraire. Paris, Dunod - Association Jean-Favard pour le développement de la linguistique quantitative, 1981.
LAMPRECHT Arnošt, ŠLOSAR Dušan et BAUER Jaroslav, Historická mluvnice češtiny. Státní Pedagogické Nakladatelství, Prague, 1986.
MARVAN Jiří, Jazykové milénium. Slovanská kontrakce a její český zdroj. Academia, Prague, 2000.
NEVEU Franck, ROIG Audrey, (eds) : L’œuvre de Lucien Tesnière, lectures contemporaines, de Gruyter, Paris, 2022.
POGNAN Patrice, Analyse automatique du tchèque. Vers un algorithme de "compréhension" implicite des textes scientifiques. Définition d'un module prédicatif général, Thèse d'état ès Lettres sous la direction d’Yves Millet, Université de Paris III Sorbonne nouvelle, 1977. Publication Paris, Champion, 1979.
POGNAN Patrice, PANEVOVÁ Jarmila, Génération automatique de lexèmes slaves à partir de leurs racines historiques. Une des bases de l’enseignement multilingue des langues slaves de l’Ouest (Nord et Sud),: Linguistica n° 52, Ljubljana, p. 59-75, 2013.
POGNAN Patrice, Pourquoi Tesnière est-il Tesnière ? Vie, œuvre et héritage, in Vaupot S., Mezeg A., Perko G., Schlamberger Brezar M. & Zupančič M.(éds.) : Contacts linguistiques, littéraires, culturels : Cent ans d’études du français à l’Université de Ljubljana, Collection Traduction et linguistique appliquée, Université de Ljubljana, p. 132-155, 2020.
POGNAN Patrice, Lucien Tesnière et l’école de Prague, in Neveu F., Roig A., (eds) : L’œuvre de Lucien Tesnière, lectures contemporaines, de Gruyter, Paris, p. 153-173, 2022.
SCHLAMBERGER BREZAR Mojca, Les influences de Lucien Tesnière sur la grammaire du slovène, Essai de grammaire slovène par Claude Vincenot, in Vaupot S., Mezeg A., Perko G., Schlamberger Brezar M. & Zupančič M.(éds.), Contacts linguistiques, littéraires, culturels : Cent ans d’études du français à l’Université de Ljubljana, Collection Traduction et linguistique appliquée, Université de Ljubljana, p. 156-167, 2020.
TESNIÈRE Lucien, Sur le système casuel du slovène, Mélanges linguistiques offerts à M. J. Vendryès par ses amis et ses élèves, Paris, Champion, 1925a.
TESNIÈRE Lucien, Les formes de duel en slovène, Paris, Champion, 1925b, XX + 450 p. Travaux publiés par l’IES, t. III (Prix Volney). Thèse principale de doctorat.
TESNIÈRE Lucien, Atlas linguistique pour servir à l’étude du duel en slovène, Paris, Champion, 1925c. 42p + 70 cartes. Thèse secondaire de doctorat.
TESNIÈRE Lucien, Imparfait et imperfectif, Časopis pro moderní filologii a literatury s částí didaktickou. Ročník XV, sešit 3-4. Prague, 1929.
TESNIÈRE Lucien, Synthétisme et analytisme. Charisteria Guilelmo Mathesio quinquagenario a discipulis et circuli linguistici Pragensis sodalibus oblata. Sumptibus "Pražský linguistický kroužek", Cercle linguistique de Prague, « Mélanges Mathesius », p. 62-64, 1932.
TESNIÈRE Lucien, Comment construire une syntaxe, Bulletin de la Faculté des Lettres de Strasbourg, , 12/7, p. 219-229, 1934a.
TESNIÈRE Lucien, Petite grammaire russe, Paris, Didier, 1934b.
TESNIÈRE Lucien, A propos des temps surcomposés. Bulletin de la Faculté des Lettres de Strasbourg, 1935, 14e année, n° 2.
TESNIÈRE Lucien, L’opposition morphologique de l’accent dans le substantif russe, Mélanges en l’honneur de Jules Legras, Paris, Droz, p. 249-268, 1939a.
TESNIÈRE Lucien, Phonologie et mélanges de langues, Travaux du cercle linguistique de Prague, , 8, p. 83-93, 1939b.
TESNIÈRE Lucien, Le duel sylleptique en français et en slave, Bulletin de la société de linguistique de Paris, , t. 47, 134, p. 57-63,1952.
TESNIÈRE Lucien, Esquisse d’une syntaxe structurale, Paris, Klincksieck, 1953.
TESNIÈRE Lucien, Petit vocabulaire russe : table sémantique, tome I, Paris, Didier, 1957.
TESNIÈRE Lucien, Éléments de syntaxe structurale, 2e éd., Paris, Klincksieck, 1966 [1959].
TESNIÈRE Lucien, Table étymologique : les mots russes classés d’après leur racine, Documents de Linguistique Quantitative, Faculté des sciences de l’Université de Paris, 1970.
TESNIÈRE Lucien, Elements of structural syntax, translation by Osborne T., Kahane S., John Benjamins, Amsterdam, 2015. 780 p. (open edition).
[1] Lucien Tesnière avait 3 enfants : Michel (1924-1980), Bernard (1926-2016) et Yveline (née en 1928). Source : Marie-Hélène Tesnière, Préface de Neveu et Roig (2022), p. XVI.
[2] Je privilégie la forme « ś » (š mouillé) à la forme « šč » qui est une prononciation minoritaire. Les langues slaves de l’Ouest (polonais et sorabes) disposent d’une échelle de mouillures à 3 niveaux : « c č ć », « s š ś » et « z ž ź » en bas-sorabe, « ć, ś et ź » étant les mouillures respectives de « č, š et ž ».
[3] A la forme russe avec vocalisation totale « гóрод » correspondent dans les autres langues slaves une métathèse standard : « gród » (château fort et ville) en polonais, « grod » (château fort) en bas-sorabe, « hród » (château fort) en haut-sorabe, « hrad » (château fort) en slovaque et tchèque, « grad » (château fort) en slovène, « grad » (ville) en BCMS.
[4] Signalons ici l’analogie avec la racine berbère GDR qui a aussi le sens de mur d’enceinte et donne le nom de la ville d’Agadir.
[5] À la forme russe « головá » correspondent les formes « głowa » en polonais et bas-sorabe, « hłowa » en haut-sorabe, « hlava » en tchèque et slovaque et « glava » en slovène, en BCMS, en macédonien et en bulgare. Le balte (lituanien et letton) ne fait pas la métathèse et possède « a » en place de « o » : « galva ».
[6] Au russe « гóлос » correspondent les formes avec métathèse réelle « głos » en polonais et en bas-sorabe, « hłós » en haut-sorabe, « hlas » en slovaque et en tchèque, « glas » dans les langues slaves du Sud.
[7] Au russe « бéрег » correspondent les formes avec métathèse réelle « břeh » en tchèque, « brzeg » en polonais, « breh » en slovaque et « breg » en slovène, « brijeg » en croate. En haut-sorabe, la forme ancienne « brjeh » a été remplacée par « brjóh ».
[8] Tesnière donne toujours les alternances vocaliques en caractères minuscules, sauf la deuxième voyelle d’une diphtongue.