DE LA FLEXION ORTHOGRAPHIQUE À LA FLEXION PHONÉTIQUE
Frédérique Sannier, Véronique Aubergé et Rabia Belrhali
Institut de la Communication Parlée, ESA CNRS 5009
Université Stendhal/INPG, Domaine Universitaire
38040 Grenoble Cedex
Email (sannier,auberge,belrhali)@icp.inpg.fr
Abstract
The aim of this article is to give a few clues about the relations between the inflectional forms in writing and pronunciation. This description was made possible by the elaboration of 2 Hypercard generators for the inflectional orthographical forms of a lexicon of nouns and adjectives, "le 60.000". This lexicon, once phonetized by a phonetization grammar, TOPH, will be submitted to a lexical classification useful to build up a compared analysis of the inflectional written and phonetical morphologies, in order to submit a generator working on phonetical bases.
Introduction
Notre propos est ici de donner quelques repères introductifs sur les relations entre le code écrit et le code oral concernant un champ morphologique bien défini, celui de la flexion. Le système flexionnel des substantifs et adjectifs orthographiques d'un lexique du français a fait l'objet d'une implémentation sur générateurs Hypercard. Les comportements phonétiques des formes flexionnelles ont été décrits à l'occasion de l'intégration de la dimension flexionnelle dans la grammaire-lexique de phonétisation TOPH, élaborée à l'ICP. On mettra enfin en évidence les schémas de conversion des formes canoniques phonétiques aux formes fléchies phonétiques.
1. Le système flexionnel orthographique du français
1.1 Les flexions orthographiques
Afin de dégager formellement les processus linguistiques inhérents au système flexionnel du français, et dans le but d'obtenir un outil opérationnel, un outil Hypercard a été élaboré (Viala, 1995), qui génère automatiquement toutes les formes fléchies d'un lexique de 33 198 substantifs, eux-mêmes extraits du "60 000" de l'ICP. Un deuxième générateur a été créé, destiné celui-là aux 11 698 adjectifs de ce même lexique. Chaque lexie y subit des opérations préalablement mises en évidence dans (Chatti, 1991), qui classe selon les 650 catégories du DELA (Laporte, 1988) le lexique le "60 000" de l'ICP, selon différents paramètres qui seront expliqués plus avant de cet exposé. Notons que les lexiques des adjectifs et des substantifs, dans cette classification catégorielle, se recouvrent parfois : une lexie qui est à la fois déclarée comme nom et adjectif apparaîtra dans les deux générateurs. Cela permet de rendre compte du fonctionnement syntaxique double de certaines unités (sauveur en tant que nom ne connaît pas de flexion féminin, mais en tant qu'adjectif donne salvatrice). Différents paramètres sont pris en compte pour la classification des lexies, en dehors de la nature des modifications orthographiques dues au passage à la forme fléchie : le genre de la forme canonique, son nombre, et la différence de prononciation entre la forme canonique et la forme fléchie (cet aspect sera abordé dans la dernière partie de cet exposé).
Nous reprendrons dans un premier temps exhaustivement les schémas de conversion orthographique à la forme féminin singulier, à la forme féminin pluriel, à la forme masculin pluriel, à la fois pour les noms et les adjectifs.
1.2 Le féminin singulier
Nous présentons ici les étiquettes des lexies concernant la mise sous forme fléchie féminine.
conversions |
Exemples |
conversions |
Exemples |
/ /e /le /ne /se /sque /sse /te /he /hesse(N) /de(N) /ine(N) /esse(N) /que(N) /ue(A) /ë(A) |
critique, critique nain, naine officiel, officielle patron, patronne bas, basse maure, mauresque bêta, bêtasse griot, griotte franc, franche duc, duchesse butor, butorde feuillant, feuillantine quaker, quakeresse grec, grecque oblong, oblongue aigu, aiguë |
au/lle c/que er/ère ès/esse eur/rice f/ve r/se u/lle ur/resse ux/ille x/se x/sse t/se(N) et/ète x/ce ec/èche um/a(A) man/woman |
beau, belle laïc, laïque fier, fière profès, professe moteur, motrice veuf, veuve tueur, tueuse fou, folle chasseur, chasseresse vieux, vieille pieux, pieuse faux, fausse canut, canuse désuet, désuète doux, douce sec, sèche optimum, optima yachtman, yachtwoman |
Tab 1 : Schéma des conversions de la forme canonique au féminin singulier pour noms et adjectifs
Nous avons donc un fonctionnement par substitution noté FY/X, où Y peut être vide. La conversion vide (/) indique que la forme canonique est féminin. Une remarque est à faire concernant les cas où les deux formes graphiques sont identiques. Deux cas se présentent : la forme canonique est également la forme féminine (on a une variante catégorielle), sans changement de sens (proche), la lexie possède les deux genres mais a deux sens distincts (un/une critique).
Notons également que la forme féminine calculée peut également aboutir à une unité possédant deux sens distincts (nu => nue). Certaines unités ont des entrées plurielles (bésicles, ouïes ), d'autres possèdent deux féminins (touareg => touareg, touarègue). D'autres sont morphologiquement plus éloignées de leur forme canonique (empereur => impératrice). D'autres enfin se distinguent par leur signe diacritique (nègre => négresse).
1.3 Le féminin pluriel
Les schémas de conversion au pluriel, toujours pour le féminin, sont dans un nombre plus restreint.
conversions |
Exemples |
conversions |
Exemples |
/s /x |
pupille, pupilles eau, eaux |
y/ies an/en(N) |
nursery, nurseries yachtwoman, yachtwomen |
Tab 2 : Schéma des conversions de la forme féminin singulier à la forme pluriel pour noms et adjectifs
Là encore les conversions ne se limitent pas à ces simples configurations. D'autres cas révèlent des exemples d'agglutination (ladite => lesdites), d'autres encore possèdent deux pluriels co-occurrents (maximum => maximums, maxima). Certaines lexies n'ont pas de forme pluriel (papauté, becquetance ). D'autres n'existent qu'au pluriel (maritimes, graves ).
1.4 Le masculin pluriel
conversions |
Exemples |
conversions |
Exemples |
/s /x /aux (A) /es (N) /e (N) /a (N) /im (N) /m (N) |
aquilin, aquilins chou, choux ammoniac, ammoniacaux rush, rushes leitmotiv, leitmotive lev, leva goy, goyim goy, goym |
l/ux y/ies an/en (N) il/ux (N) o/i (N) ar/our (N) u/i (N) t/s (A) l/us (A) us/a (A) |
amiral, amiraux lobby, lobbies gagman, gagmen bail, baux soprano, soprani ksar, ksour leu, lei tout, tous fol, fous varus, vara |
Tab 3 : Schéma des conversions de la forme masculin singulier à la forme pluriel pour noms et adjectifs
À ajouter à ce tableau sont les lexies qui n'ont pas de forme singulier (quadrijumeaux, opimes ), celles qui ont deux formes pluriel (minimum => minimums, minima ; barman => barmans, barmen ), celles qui n'ont pas de forme pluriel (coûtant), et celles qui, comme dans le paragraphe précédent, révèlent des particularités morphologiques spécifiques (ledit => lesdits ; il => yeux ; monsieur => messieurs).
1.5 Fonctionnement linguistique
Les étiquettes présentées ne sont pas le reflet de modèles linguistiques mis en évidence maintes fois dans la littérature, nous l'avons dit. Les étiquettes attachées à chaque système de conversion ne peuvent refléter la complexité du découpage morphologique des unités qui n'entretiennent pas des rapports morphologiquement "simples" avec leur paradigme flexionnel. Ces conversions ont cependant été bien circonscrites aux quelques exemples présents. Nous trouvons des exemples d'agglutination (monsieur => messieurs) ; plusieurs cas de lexies étrangères pour lesquelles le système flexionnel est particulier à la langue source (touareg => targui ), les lexies pour lesquelles la forme fléchie est morphologiquement toute autre que celle de la forme canonique (il => yeux ; pour des précisions, voir (Curat, 1988)), les cas où la lexie présente deux formes fléchies pour les mêmes genre et nombre (pizzicato => pizzicatos, pizzicati), les lexies qui ont des pluriels différents car sémantiquement distincts (ail => ails, aulx ; travail => travails, travaux).
Il reste qu'un concensus quant aux formes admises pour le pluriel, en particulier, est loin d'être atteint. À citer l'exemple de Pinchon (1967) qui, après avoir souligné l'incohérence dont font preuve les dictionnaires, donne le cas de journal, qui présente, à côté de sa forme "savante", une forme "populaire", journals.
Plus arbitraire encore est le genre : beaucoup d'unités (date, mensonge ) sont passées d'un genre à l'autre dans l'histoire.
Les flexions orthographiques ont donc des modes de fonctionnement spécifiques dont toute une littérature s'est nourrie. Les aspects théoriques ont été mis en évidence par Catach (1986), Berrendonner (1983). Des applications, non moins nombreuses, ont été développées. Citons à titre illustratif le système PILAF (Courtin, 1994), le générateur de l'équipe CRISTAL (Froissard, 1996), le générateur de Laporte (1988).
Le mode de fonctionnement que nous avons adopté consiste simplement en des ajouts ou (retraits + ajout) d'unités non morphémiques, il est essentiel de le souligner. Aucun modèle théorique n'a été posé a priori. La raison d'être de cette approche est d'observer si, appliquée sur des bases phonétiques, elle reste opérationnelle. Ceci dans le but de dégager des fonctionnements phonologiques qui ne seraient pas forcément reliés aux fonctionnements morphématiques de l'orthographe. L'enjeu est de définir si la forme phonique d'une lexie orthographique composée de [base + flexion] est la reproduction de la forme phonétique exacte des unités linguistiques que sont la base et la flexion.
2. Le système flexionnel phonétique du français
2.1 La grammaire de phonétisation TOPH
Une grammaire de phonétisation a pour but premier de décrire les relations existant entre le code orthographique et le code phonétique, et de les systématiser. La grammaire TOPH, bâtie sur une syntaxe bien définie, a été construite sur la méthode du bootstrapping : le point de départ en est un noyau minimal, une grammaire de base. Celle-ci, enrichie des formes canoniques de référence, donc la grammaire-lexique, qui elle-même est adaptée aux formes fléchies (Sannier, 1996) déduites des formes canoniques. Ainsi chaque étape aboutie de la grammaire fonctionne comme un filtre permettant de construire la suivante : les réécritures qui ne sont pas réalisées par les règles en place font l'objet d'une réécriture partielle des règles préexistantes, ou de création de règle dans la grammaire. Chaque étape constitue donc une vérification de la capacité de généralisation de la grammaire filtre. C'est donc le stade ayant permis d'intégrer le traitement des formes fléchies qui nous concerne ici tout particulièrement car elle nous a permis de légitimer des lois phonétiques grâce à un traitement automatique de phonétisation.
2.2 Le comportement phonétique des flexions
2.2.1 Les flexions verbales, le classement par base
La conception traditionnelle de la morphologie du verbe français se fonde sur les variations et les combinaisons des éléments que sont le radical et les désinences. Une autre conception se fonde sur la description des bases phonétiques de la conjugaison. Tous les grammairiens ne retiennent pas le même classement, et c'est jusqu'à la définition de la notion de base qui peut varier. Pinchon et Couté (1981) vont jusqu'à retenir cinq bases pour un seul verbe :
Verbes à une base : courir => [kuR-]
Verbes à deux bases : finir => [fini-], [finis-]
Verbes à trois bases : envoyer => [A$vwa-], [A$vwaj-], [A$ve-]
Verbes à quatre bases : venir => [vjE$-], [v´n-], [vjEn-], [vjE$d-]
Verbes à cinq bases : vouloir => [vØ], [vul-], [v_l-], [vud-], [v_j-]
Sur ces bases (qui posent quand même quelques grosses interrogations : que font Pinchon et Couté de la base [v-] de la conjugaison au passé simple de venir ?) se greffent les morphèmes flexionnels phonétiques : [], [O$], [e], [a] et [E], avec un [R] épenthétique pour le futur.
Les modifications phonétiques qui affectent les bases sont de natures différentes, et se retrouvent dans les principales catégories lexicales.
exemples : - Ouverture / fermeture de la voyelle de la syllabe qui précède le morphème flexionnel => baisse [bEs] /baissons [besO$]
- Alternance voyelle / semi-voyelle => saluez [salúe] / saluerai [saluRE]
- Resyllabation => appeler [aple] / appellent [apEl]
- Introduction d'une mouillure => prient [pRi] / priant [pRijA$]
Ces phénomènes sont simplement des ajustements morphophonétiques des formes fléchies aux lois du système phonétique de la langue française.
2.2.2 Les flexions nominales et adjectivales
L'enjeu du présent travail est de mettre en évidence les rapports entre processus flexionnels orthographiques et phonétiques. En d'autres mots, peut-on parvenir, à partir d'un fonctionnement non morphémique, à une mise en correspondance des classes morphologiques orthographiques et phonétiques, et ainsi à une classification orthographique et phonétique de la morphologie flexionnelle. À cet égard, la définition du graphone (unité minimale de fonctionnement de la phonétisation du français) nous paraît essentielle (Belrhali, 1995).
Il apparaît, en première réponse, au vu des tableaux qui sont exposés en 2-2-2-2, qu'il n'y a correspondance ni en nombre ni en nature. On constate également la diversité prépondérante de la différenciation masculin/singulier au détriment du nombre.
2.2.2.1 La notion de sous-systèmes
La grande majorité des flexions nominales et adjectivales ont une phonétisation régulière par rapport aux processus internes à la phonétisation des formes canoniques. Tel n'est pas le cas de lady [lEdi] qui donne au pluriel ladies [lEdiz], ce qui ne respecte pas la règle générale des finales, canoniques ou flexionnelles, en -ies [i] du français.
Cette dernière flexion est orthographiquement celle de la langue source, ce qui signifie que la lexie s'est déposée dans la langue cible, en l'occurrence le français, avec son paradigme flexionnel. On garde donc une trace, phonique, de la langue source. Cette trace est fonction du degré d'intégration de la lexie dans la langue cible, et n'est donc pas systématique.
exemple : lobbies, pluriel de lobby, se prononce [lObi] et non [lObiz] comme on l'attendrait de la part d'une lexie d'origine anglo-saxonne. Précisons que nous donnons ici la prononciation française, donc résultat d'un transfert phonologique de la prononciation source.
Notons que le degré d'intégration n'est parfois pas fonction de la date d'introduction de la lexie dans la langue cible : Le Petit Robert date la première apparition de la lexie lady de 1669, et lobby de 1954. Or rien ne nous permet d'avancer que l'introduction de la forme canonique est préalable à celle des formes fléchies.
On trouve des degrés intermédiaires :
exemple : rushes, pluriel de rush [R_S] se prononce [R_S] : le morphème flexionnel est réalisé "à la française", c'est-à-dire qu'il n'est pas phonétiquement différent de la finale de chambre [SA$bR], par exemple. On retrouve néanmoins le transfert phonologique sur la base lexicale rush, puisque /u/ ne se prononce pas [y] comme la règle générale de la prononciation du français, mais [_], suivant un transfert de la prononciation anglo-saxonne.
Ces lexies sont l'image d'un transfert phonologique suivi d'une recatégorisation d'items empruntés à la langue source et disposés en français à travers un processus diachronique. Elles s'organisent en sous-systèmes, cohérents selon la langue source, dont elles gardent une trace dans la langue cible. On assiste à une projection de la prononciation originelle (Sannier, 1997).
2.2.2.2 Les conversions
2.2.2.2.1 Le féminin singulier
conversions |
Exemples |
conversions |
Exemples |
/[] /[s] /[z] /[S] /[d] /[tin] /[Esk] /[t] /[g] |
[klak], [klak] [fo], [fos] [gØ], [gØz] [fRE], [fRES] [bytOR], [bytORd] [f_jA$], [f_jA$tin] [mOR], [mOREsk] [R´plE], [R´plEt] [lO$], [lO$g] |
[_R]/[REs] [_R]/[OREs] [_R]/[Ris] [k]/[SEs] [k]/[S] [o]/[Ot] [o]/[El] [e]/[ER] [u]/[Ol] [Ø]/[Ej] [E$]/[En] [O$]/[On] [f]/[v] [s]/[z] |
[kwEk_R], [kwEkREs] [dOkt_R], [dOktOREs] [akt_R], [aktRis] [dyk], [dySEs] [sEk], [sES] [gRijo], [gRijOt] [makRo], [makREl] [masje], [masjER] [fu], [fOl] [vjØ], [vjEj] [vE$], [vEn] [bO$], [bOn] [kaptif], [kaptiv] [balEs], [balEz] |
Tab 4 : Schéma des conversions de la forme masculin singulier à la forme féminin sg pour noms et adjectifs
2.2.2.2.2 Le féminin pluriel
conversions |
Exemples |
[]/[] [an]/[En] |
[pypi(j/l)], [pypi(j/l)] [jOtwOman], [jOtwOmEn] |
Tab 5 : Schéma des conversions de la forme féminin singulier à la forme pluriel pour noms et adjectifs
2.2.2.2.2 Le masculin pluriel
conversions |
Exemples |
conversions |
Exemples |
/[] /[s] |
[syspA$], [syspA$] [tu], [tus] |
[al]>[O] [ys]>[i] [Om]>[a] [aj]>[O] [o]>[i] [Ø]>[E] [_l]>[Ø] |
[amiRal], [amiRo] [Okylus], [Okyli] [eRatOm], [eRata] [baj], [bo] [sOpRano], [sOpRani] [lØ], [lE] [aj_l], [ajØ] |
Tab 6 : Schéma des conversions de la forme masculin singulier à la forme pluriel pour noms et adjectifs
On observe que les cas de substitution se divisent en deux parties : le cas des lexies étrangères, et celui des lexies qui présentent la configuration Voyelle + (/l/ final) et qui ont un historique similaire.
Conclusion
Ce travail est une première piste vers une étude plus approfondie des relations entre flexions orthographiques et phonétiques à travers la génération phonétique à partir de bases phonétiques. Notre méthodologie consiste à partir de la modalité graphique pour aller vers la modalité phonétique dans le but de définir si la forme phonétique des lexies fléchies a un comportement régulier ou non en regard des phénomènes internes aux formes canoniques.
Références
Aubergé, V. (1991). La Synthèse de la Parole : Des Règles aux Lexiques, Thèse de l'Université Stendhal, Grenoble.
Belrhali, R. (1995). Phonétisation Automatique d'un Lexique Général du Français : systémique et émergence linguistique, Thèse de l'Université Stendhal, Grenoble.
Berrendonner, A. (1983). Grammaire pour un analyseur. Aspects morphologiques. Les cahiers du CRISS, n°15, Grenoble.
Catach, N. (1986). L'orthographe française, traité théorique et pratique. Paris : Editions Nathan.
Chatti, C. (1991). Catégories Lexicales du Français, T.E.R. de Maîtrise.
Courtin, J. (1994). Analyse et génération morphologique avec le système PILAF, in T.A.L, vol 35, n°2, pp. 93-109.
Curat, H. (1988). Pluriel interne et système morphologique du nombre en français. In Revue Québecoise de linguistique, vol 17. Université du Québec, Montréal.
Froissard, C., Lallich-Boidin, G. (1996). Morphologie robuste et analyse automatique de la langue, étude réalisée à partir des corpus de l'évaluation GRACE. Actes du séminaire lexique, pp. 88-96, Grenoble.
Laporte, E. (1988). Méthodes algorithmiques et lexicales de phonétisation de textes. Thèse de doctorat en informatique.
Pinchon, J. & Couté, B. (1981). Le Système Verbal du Français. Paris : Nathan Université.
Sannier, F. (1996). La Phonétisation des Flexions en Français : Description dans une Grammaire TOPH, DEA Sciences du Langage, Université Stendhal, Grenoble.
Sannier, F. (1997). La phonétisation des morphèmes flexionnels du français dans le système TOPH, actes des les journées FRANCIL 1997, pp. 463-468, Avignon.
Viala, F. (1995). Première Étape vers la Génération Phonétique des Formes Fléchies du Français, DEA des Science du Langage.