Nouveautés
Appels à communication
Comités
JADT
Soumission
Articles
Thèmes
Archives
Carnet d'adresses
Index des auteurs
La page CORPORA
JADT (1998-2008) et GADT
La page des liens
Comptes-rendus d'ouvrages
La page Forum

Accueil Contact

Lexicometrica
Numéro 4, 2003

 

Les textes grecs des origines à nos jours

(Ve siècle av. J.-C. - XXIe siècle)

Codage, outils et méthodes de travail

 

 

 

Patricia GUILPIN

Paris III Sorbonne Nouvelle - INALCO

guilpingr@yahoo.fr

 

 

 

Résumé

Dans cette présentation[1], nous posons les jalons préalables à un traitement automatique des textes grecs de la période classique à nos jours.

            Ce travail tente d’apporter un éclairage sur la question essentielle du codage des caractères grecs. Il traite donc de l’évolution des conventions d’écriture du grec, et en particulier de ses signes diacritiques autour desquels est axée notre problématique. En effet, il existe deux modes d’accentuation des données textuelles grecques quelle que soit l’époque concernée : le polytonique dénote d’anciens principes d’accentuation et le monotonique correspond aux réalités phonétiques du grec moderne.

            En second lieu, nous présentons quelques données textuelles fondamentales en grec ancien, tardif, byzantin et moderne, ainsi que d’éventuels outils de traitement associés, mis à disposition sur le Web.

Nous souhaitons d’une part diffuser des informations méconnues, d’autre part fournir l’accès à l’outil informatique (édition, supports pédagogiques, catalogues, corpus, logiciels) recherché par tout hellénisant qu’il soit linguiste, philologue, enseignant, documentaliste…

 

            Introduction

 

En grec ancien, langue issue de l’indo-européen, l’accent de la phrase est musical : à la voyelle de la syllabe accentuée correspond l’élévation de la voix d’une quinte, sans qu’a priori la prononciation ne soit très intense. Au IIIe siècle avant J.-C., les grammairiens alexandrins inventent un système de signes diacritiques afin d’indiquer à leurs contemporains les principes de l’accentuation ancienne qui commence à tomber en désuétude : c’est la naissance du « système polytonique ». Dès l’origine, ce système n’est pas conçu pour dénoter les réalités phonétiques ou l’intonation du grec contemporain. Il se révèle en grande partie caduque 600 ans plus tard (IIIe siècle après J.-C.), époque à laquelle l’accent devient intense. Pourtant, la notation de ces signes se systématise entre les VIIe et IXe siècles et perdure jusqu’à nos jours.

Le 29 avril 1982, par un décret présidentiel, le système monotonique, c’est-à-dire à un seul accent, en l’occurrence l’aigu[2], est adopté. Il constitue une simplification du système polytonique, et correspond aux réalités phonétiques du grec moderne : l’accent aigu indique la voyelle accentuée (accent d’intensité). Cependant, dans la pratique éditoriale, le système polytonique est toujours en usage. De plus, les lettrés qui en ont eu connaissance depuis leur plus tendre enfance continuent à s’en servir. Bref, dans les faits, il est difficile de s’en passer, ne serait-ce que par soucis d’exactitude lorsque l’on cite un document original : l’immense majorité des ouvrages grecs est imprimée selon les normes du système polytonique.

Ce décret a influé sur le choix d’un codage en faveur du système monotonique officiel pour lequel une norme internationale a immédiatement été adoptée. La norme internationale du grec polytonique, quant à elle, n’a que trop tardé à exister car chacun a tenté de pallier isolément le problème de son absence avec des moyens de fortune. Dans ces conditions, les corpus et outils créés sont pratiquement inutilisables.

 

Nous tentons de dresser un bilan sur la question du codage des caractères grecs. Aussi avons-nous au préalable pris soin de poser le problème et de définir exactement ce que l’on entend par les expressions grec polytonique et grec monotonique en nous référant brièvement à l’histoire de la langue grecque et de son écriture. Par la suite, nous mentionnons les normes informatiques utilisées sous Windows et Linux pour transcrire les caractères grecs et leur éventuelle évolution. Enfin, à la fois pour illustrer notre problématique et à titre d’information, nous faisons référence aux principales ressources textuelles et outils disponibles sur les Web pour la restitution des textes grecs des origines à nos jours.

 

 

 

Différentes écritures du grec : linéaire B, majuscules, grec polytonique, grec monotonique

 

 

1.      Grec monotonique, grec polytonique : histoire et définitions

 

La question du codage des caractères grecs et de ses signes diacritiques est intimement liée à l’histoire de la langue grecque et à ses traditions d’écriture. Nous faisons ici un bref historique de la dénotation des signes diacritiques pour aboutir à une définition complète des termes grec monotonique et polytonique.

 

Historiquement, le grec ancien possédait un accent tonal : à la différence de l’accent indo-européen, il ne pouvait porter que sur les trois dernières syllabes d’un mot[3] et à la voyelle accentuée correspondait l’élévation de la voix d’une quinte. Un système de signes diacritiques marquant l’intonation et la phonétique du grec ancien fut inventé autour des IIIe‑IIe siècles avant J.-C.

 

Il est composé de deux esprits (rude et doux), trois accents (aigu, grave et circonflexe), de l’iota souscrit et du tréma, dont les valeurs respectives sont les suivantes :

 

a) l’esprit rude (gr. δασεα, daseia) note une aspiration lors de l’émission de la voyelle initiale (ex. πτά, hepta « sept ») ou de la consonne rho initiale (ex. μα, rhêma « mot, parole »)[4] et l’esprit doux (gr. ψιλή, psilê) l’absence d’aspiration lors de l’émission de la voyelle initiale (ex. ννέα, ennea « neuf ») [5],

 

b) l’accent aigu (gr. ὀξεα, oxeia) correspond à une élévation de la voix d’une quinte, comme le résultat d’une tension des cordes vocales (ex. πόλις, polis « cité »), alors que l’accent grave (gr. βαρεα, bareia) consiste en un relâchement des cordes vocales, et par suite en un abaissement de la voix (ex. τν θεόν, ton theon « le dieu » à l’accusatif)[6]. L’accent circonflexe ou périspomène  (gr. περισπωμένη, perispomenê), issu de la combinaison des accents aigu et grave, indique une élévation et une baisse successive de la voix.

 

Par ailleurs, c) un iota souscrit sous les voyelles finales anciennement longues α, η, ω[7] signale la chute de l’iota dans les diphtongues à premier élément long αι, ηι, ωι (ex. σμα, asma « chant »).

 

Enfin, d) un tréma (gr. anc. διαίρεσις, diairesis « division » et gr. mod. διαλυτικά, dialytika) est placé sur un ι ou un υ précédé d’un groupe vocalique, généralement une voyelle, avec lequel il ne forme pas une diphtongue (ex. ϋλος, a-ulos «immatériel »).

 

Deux diacritiques servent occasionnellement à marquer les quantités de voyelles du grec ancien : une voyelle longue (gr. μακρά, makra) s’écrit, si l’on choisit arbitrairement l’iota, « ῑ », et une brève (gr. βραχεα, bracheia) « ῐ ».

 

Mentionnons enfin les deux emplois remarquables de la crase et de l’apostrophe :

 

i) la crase, qui correspond à la contraction de la voyelle ou de la diphtongue finale d’un mot avec la voyelle ou la diphtongue initiale du mot suivant, est notée au moyen d’un signe semblable à l’esprit doux, très rarement à l’esprit rude, nommé coronis (ex. κἀγώ < κα ἐγω, kago <kai ego, litt. « et moi »),

 

ii) lorsqu’une voyelle tombe lors de la prononciation, on marque par l’apostrophe la place de la voyelle disparue en fin de mot (ex. π < ἀπο, apo « de »).

 

En bref, ce système de diacritiques indique pleinement la prosodie et la prononciation du grec ancien : les accents et les signes marquant les quantités de voyelle ont des valeurs prosodiques, tandis que les esprits, l’iota souscrit, le tréma, la crase et l’apostrophe ont des valeurs phonétiques.

 

Le grec polytonique désigne communément « [l’]ancien grec écrit à l’aide de plusieurs accents distincts et d’autres diacritiques »[8].

Pour notre part, nous nuançons cette définition en disant qu’il s’agit de façon générale du grec (ancien, tardif, byzantin ou moderne) écrit à l’aide du système de signes diacritiques sans doute conçu par Aristophane de Byzance (265 ?-185 ?) et qui historiquement dénotait, comme nous l’avons vu, l’intonation du grec ancien et sa prononciation. Nous continuons à indiquer la dénotation des diacritiques au cours des temps et les contextes d’emploi du polytonique sans chercher à juger de sa légitimité.

 

En pratique, le polytonique, initialement conçu pour indiquer la manière dont se prononçait le grec classique, faisait l’objet d’une utilisation très restreinte, notamment pour lever les ambiguïtés des mots.

 

Vers le IIIe siècle après J.-C., en koinè romaine, langue commune et forme simplifiée du dialecte attique, l’accent est non seulement musical, mais devient intense. Les voyelles n’ont alors plus de quantités propres indépendantes de leur accentuation : on observe un allongement relatif de toutes les voyelles accentuées et un abrègement relatif de toutes les voyelles atones. De plus, la liaison fonctionnelle entre la quantité de la voyelle finale et l’étendue de la zone accentuable n’étant plus perçue, l’accent est voué à se figer au cours de la flexion. Par ailleurs, à cette époque, l’aspiration initiale disparaît[9].

 

Au IIIe siècle après J.-C., les principes d’accentuation du grec diffèrent nettement de ceux du grec ancien : a) l’accent est intense, b) l’aspiration initiale a disparu, et c) les quantités de voyelles sont égalisées. Par conséquent, l’utilisation de la plupart des signes diacritiques du polytonique est en toute rigueur caduque.

 

Pourtant entre les VIIe et IXe siècles après J.-C., leur notation se généralise avec l’apparition des lettres minuscules. A titre d’exemple, le polytonique est appliqué aux manuscrits du Nouveau Testament vers le VIIe siècle par Euthalius. Comme l’écriture est en général le reflet d’une tradition savante, et que dans les milieux cultivés l’attique de l’époque classique constitue le modèle à imiter[10], le grec contemporain s’accentue de la même manière que le grec ancien.

 

A l’époque byzantine, période du grec dit « médiéval »[11], l’accent devient fixe pour certaines catégories grammaticales[12] et on observe une tendance à l’oxytonaison[13]. Les manuscrits grecs, toujours par tradition et non par nécessité, continuent à être accentués dans le système polytonique, que la langue de l’auteur soit savante, ou « mixte » c’est-à-dire plus proche de la langue vulgaire. Perpétué par une tradition d’écriture archaïsante, le polytonique sert non seulement à transcrire le grec savant, mais aussi un grec plus vulgaire à caractère dialectal. Il apparaît ainsi comme le mode de transcription conventionnel du grec.

 

Au XVIIIe siècle, pour faire suite aux idées du grammairien Sophianos (XVIe siècle) et conformément aux idées des Lumières, les réformateurs de la langue, parmi lesquels Katardzis et Coray, tentent de créer une langue écrite commune, fondée sur l’usage oral. Ils se heurtent à la réalité complexe du grec : l’attique est trop éloigné de la langue parlée pour permettre la diffusion de la culture littéraire ou scientifique, tandis que le grec vulgaire, ne se prête guère à l’expression des idées abstraites. On envisage alors soit une systématisation de la langue parlée, soit une « archaïsation » partielle de la langue, qualifiée d’embellissement (gr. καλλωπισμός, kallopismos)[14].

 

En 1830, l’Etat grec libre tranche et adopte comme langue officielle la katharevoussa (gr. καθαρεύουσα « purifiée »), une variété puriste et archaïsante du grec : la « question de la langue » (gr. γλωσσικό ζήτημα, glossiko zitima), vaste débat centré sur le conflit diglossique entre langues populaire et puriste, prend alors toute son ampleur. En résumé, on assiste à un phénomène de différentiation entre la katharevoussa, utilisée dans tous les domaines de la vie publique (administration, enseignement, politique, religion) en littérature et en science, et la démotique (gr. δημοτική, dêmotikê) qui, procédant par évolution naturelle de l’ancienne koinè, reste le plus souvent réservée aux usages familiers de la vie quotidienne, bien qu’elle connaisse un essor littéraire tout au long du XIXe siècle[15]. Quoi qu’il en soit, ces deux variétés de langue sont transcrites dans le système polytonique conventionnel.

 

Au XXe siècle, un revirement s’opère en faveur du grec démotique. Nous en mentionnons les étapes majeures. En 1917, une réforme partielle accorde une place au grec démotique dans l’enseignement primaire. Codifié en 1941 dans la Grammaire néo-hellénique de Manolis Triantaphyllidis, il est finalement reconnu comme langue officielle de l’Etat grec en 1976[16].

 

Suit un décret présidentiel le 29 avril 1982, par lequel la République grecque adopte un système d’accentuation en accord avec la réalité phonétique du grec démotique : le monotonique.

 

Il est composé de l’accent aigu qui indique la voyelle accentuée, et du tréma qui surmonte un ι ou un υ précédés d’une voyelle (ou d’une combinaison vocalique) pour indiquer que ceux-ci doivent être articulés séparément (ex. θεϊκός, theïkos « divin »). Pour adapter le polytonique au grec moderne, tous les autres signes diacritiques, à savoir les esprits, les accents grave et circonflexe, l’iota souscrit, la coronis et les notations pour les voyelles longues et brèves sont supprimés.

Le grec monotonique désigne donc le grec, généralement le grec démotique, écrit à l’aide de l’accent aigu, et par extension du tréma.

 

Mais, la pratique réelle des Grecs, vingt ans après ce décret, mérite d’être évoquée en quelques lignes. Si récemment encore, les diacritiques étaient prisés par des auteurs littéraires[17], la quasi-totalité des Grecs, y compris les hommes de lettres, écrivent aujourd’hui le grec moderne dans le système monotonique. Cependant, les livres sont majoritairement édités, voire réédités, en polytonique a) à des fins esthétiques, lorsque leur auteur pratique un grec démotique, en partie dialectal, b) à toutes fins utiles, pour transcrire en premier lieu le grec ancien, mais aussi le grec savant, et souvent le grec byzantin selon le choix délibéré de l’édition critique. C’est ainsi que l’accentuation polytonique demeure en usage.

 

Pour conclure sur nos définitions, le grec polytonique désigne le grec ancien, tardif, byzantin ou moderne écrit au moyen des accents et diacritiques dénotant historiquement le mode d’accentuation de l’ancien grec. Peu importe que ces signes aient perdu leur dénotation avant même qu’il en soit fait usage, ils font partie de l’orthographe historique[18] à partir des VIIe et IXe siècles après J.-C. où ils sont systématiquement utilisés. Contrairement à ce que l’on pourrait être porté à croire, jusqu’à la réforme de 1982, ce mode d’écriture du grec n’est pas strictement réservé à la langue savante : il sert également à transcrire le grec vulgaire, mixte ou dialectal. Cependant, depuis l’adoption du système monotonique particulièrement adapté au grec moderne, le polytonique est devenu à juste titre le système de prédilection du grec ancien et du grec savant qui s’en rapproche, et par la même occasion une connaissance de spécialistes de la langue et d’imprimeurs.

 

La tradition orthographique d’une langue comme le français se fixe à un certain stade de son évolution, si bien que l’écriture correspond parfois à la prononciation ancienne d’un mot, comme dans l’exemple du mot « roi » [rwa], qui initialement se prononçait [roj]. Ce phénomène est d’autant plus frappant en grec où, malgré de timides réformes, l’orthographe historique actuelle continue à transcrire la prononciation du grec attique de la fin du Ve siècle avant J.-C.

 

2- De l’écrit au numérique

 

L’utilisation des deux systèmes d’accentuation monotonique et polytonique est à l’origine de diverses questions si l’on envisage un traitement automatique des textes grecs, de quelque époque qu’ils soient. La première étape dans la normalisation d’un corpus est le codage des caractères. C’est ce dont nous traitons dans cette partie.

 

a)         Que doit-on coder ?

 

L’unification de l’écriture grecque s’est réalisée en 403 avant J.‑C. avec l’adoption officielle de l’alphabet de la cité ionienne de Milet en Asie Mineure. Composé de vingt‑quatre lettres, l’alphabet grec est en usage jusqu’à aujourd’hui.

 

Les minuscules apparaissent entre les VIIe et IXe siècles et trois innovations s’ensuivent : l’espacement entre les mots, l’introduction de signes de ponctuation et la notation progressive des accents[19].

 

Nous avons déjà examiné avec attention le problème des accents. La ponctuation des textes grecs imprimés imite pour l’essentiel les habitudes de la typographie occidentale, exception faite du point médian (point central ou point au milieu) qui équivaut à notre point‑virgule, et du point‑virgule qui remplace notre point d’interrogation.

 

Par ailleurs, des lettres archaïques sont utilisées a) pour transcrire d’anciens phonèmes dans le cas des deux semi-voyelles yot (J) et digamma (Ϝ)[20], ou b) ont une valeur numérale dans le cas du sampi (Ϡ), du koppa (ϳ ou mod. Ϟ) et du stigma (Ϛ)[21]. L’utilisation numérale des lettres donne lieu à l’adjonction d’une sorte d’apostrophe, souscrite ou non : dans la terminologie officielle, il s’agit du signe numéral grec et du signe numéral souscrit grec[22]. Mentionnons enfin le cas rare de la ligature de και (kai, « et »).

 

Il s’agit donc de coder les vingt-quatre lettres de l’alphabet[23], les caractères accentués, les diacritiques, les combinaisons de diacritiques[24], les signes de ponctuation, les lettres archaïques, et en toute rigueur les chiffres arabes, les caractères de contrôle[25] etc.

 

b)        Codages des caractères grecs, normes associées

 

Les indicatifs de la langue grecque, utilisés en information et documentation, sont définis par la norme ISO 639[26].

Le code à deux lettres el (ISO 639‑1) s’utilise en terminologie, lexicographie et linguistique ; le code à trois lettres (ISO 6392) établit une scission entre le grec ancien grc jusqu’à 1453, et le grec moderne gre/ell à partir de 1453[27].

Etant donné les problèmes que pose l’usage des accents en grec jusqu’à aujourd’hui, les catalogues informatisés d’ouvrages grecs en France[28] sont établis en translittération[29]. La norme fréquemment utilisée est alors l’ISO 843 : 1997 (E).

 

Soumis aux normes ISO, le codage des caractères est étudié de façon à faciliter leur traitement, en particulier les tris. La relation d’ordre établie suit donc les sens arithmétiques et lexicographiques.

 

L’ASCII (American Standard Code for Information Interchange), créé en 1963 aux Etats-Unis et adopté comme norme ISO 646, code 128 caractères alphanumériques (sur 7 bits) et représente les caractères de l’anglais[30], y compris un certain nombre de caractères de contrôle. Il s’agit du seul sous-ensemble commun aux codages ultérieurs.

 

Pour représenter toutes les langues européennes, c’est-à-dire ses diacritiques et l’alphabet grec, l’ASCII est étendu à un octet et code ainsi 256 caractères selon la norme ISO 8859. L’ISO 8859‑7, correspondant à la norme ELOT 928[31], désigne la table de codes conçue pour les caractères grecs monotoniques. Elle comprend les lettres majuscules et minuscules, toute lettre susceptible d’être accentuée à l’aide de l’aigu et/ou du tréma, les deux diacritiques et leur combinaison[32]. Aucune norme ne peut se créer pour le polytonique car cela supposerait de disposer de 233 places supplémentaires[33].

 

Avec les performances des systèmes de traitement et de transmission, entre 1988 et 1991, l’organisation internationale de standardisation et le consortium W3C introduisent le codage Unicode sur 16 bits[34] (norme ISO 10646) : toutes les langues écrites du monde peuvent être représentées à partir d’un jeu de caractères unique.

 

En ce qui concerne Unicode pour le grec, la norme ISO 8859‑7 est reprise des positions 0370 à 03FF avec en sus quatre signes[35], des symboles grecs[36] et les lettres archaïques courantes.

Par ailleurs, un grec étendu, c’est-à-dire « précomposé » avec les signes diacritiques déjà répertoriés, est introduit de 1F00 à 1FFF : on trouve à ces positions toutes les accentuations possibles des caractères grecs à l’aide du polytonique[37].  Ces deux positions non contiguës codent donc le grec polytonique.

 

Eu égard à la taille du corpus antérieur à l’institution du grec monotonique et comme le met en évidence la pratique éditoriale actuelle, il est certain qu’il était difficile de faire l’omission d’un codage pour le grec polytonique.

 

Remarque : Ecritures non alphabétiques du grec

Les syllabaires qui ont précédé l’écriture alphabétique du grec, en particulier le linéaire B (IIe millénaire avant J.‑C.) et le syllabaire chypriote (VIIe au IIIe siècle avant J.‑C.), feront prochainement l’objet d’un codage Unicode[38].

 

c)         Lire et écrire du grec sous PC‑Windows et Linux

 

Cette section est rédigée dans une optique pédagogique. Afin de mettre l’outil informatique à la portée de tout hellénisant, nous mentionnons les configurations requises pour lire, écrire et traiter du grec sous Windows et Linux, puis nous développons un exemple simple sous Linux.

 

Partie 1 : Monotonique et polytonique sous PC-Windows

 

i)      Polices de caractères grecs pour PC‑Windows

 

Toute information sur les polices grecques figure sur le site de Denis Liégeois à l’adresse :

 

http://club.euronet.be/frederique.bouras/polices.htm

 

La gestion des polices TrueType[39] sous Windows se fait via le répertoire Polices du Panneau de configuration[40].

 

Deux types de polices TrueType (fichiers .ttf) sont adaptés au grec :

-      les polices ISO 8859‑7

-      les polices Unicode.

 

Les polices ISO 8859‑7 associent des glyphes aux codes informatiques définis pour les caractères grecs monotoniques (cf. Tableau 1).

 

Arial Greek

156 Ko

Courier New Greek

210 Ko

Greek

55 Ko

Hellas Arial Greek

122 Ko

Hellas Courier Greek

80 Ko

Hellas Fun Greek

103 Ko

Hellas Times Greek

153 Ko

IsminiPC

78 Ko

SPIonic

22 Ko

Superismini

72 Ko

Times New Roman Greek

190 Ko

 

Tableau 1 : Polices True Type ISO 8859‑7 pour PC‑Windows

 

Les polices Unicode, quant à elles, contiennent à la fois :

-          les glyphes correspondant au grec dérivé de l’ISO 8859‑7 pour le grec monotonique,

-          les glyphes correspondant au grec étendu pour les caractères grecs  polytoniques.

 

Certaines polices Unicode sont livrées par Microsoft (Tableau 2), d’autres avec des logiciels spécifiques (Tableau 3).

 

Arial Unicode MS

Livrée avec Word 2000/Office 2000

Installation via le programme d’installation de MS Office

13 Mo

Palatino Linotype

Livrée avec Win 2000 et XP

Installation automatique sous Win 2000 ou XP

13 Mo

Inconvénient : Le rhô majuscule avec esprit rude est remplacé par un rhô majuscule avec esprit doux

Tahoma

Livrée avec Win XP Service Pack1

 

Tableau 2 : Polices de caractères Unicode livrées par Microsoft pour PC‑Windows

 

MgOldTimes UC Pol

Livrée avec Polytonistis de la société « Magenta » :

http://www.magenta.gr

Inconvénient : Son utilisation par défaut n’est pas toujours possible car le polytonique n’est pas déclaré

Vusillus Old Face Italic

Livrée avec Antioch :

http://www.users.dircon.co.uk/~hancock/antioch.htm

Version italique gratuite

Silver Humana

Livrée avec le logiciel de consultation du TLG (Thesaurus Linguae Graecae) de la « Silver Montain Software » :

http://www.silvermnt.com/tlgdemo.htm

Athena Unicode

http://www.greekkeys.cornell.edu/#AthenaUnicode

Avertissement : Il faut veiller à ne pas la confondre avec des polices au nom similaire

Code 2000

http://home.att.net/~jameskass

1,2 Mo

Titus Cyberbit Basic

Livrée par la société « Bitstream » qui s’occupe du projet « Titus » à l’Université de Francfort, Allemagne : http://titus.fkidg1.unifrankfurt.de/unicode/tituut.asp

 

Tableau 3 : Polices de caractères Unicode pour PC‑Windows

 

Nous avons indiqué des polices d’utilisation courante, d’autres ont une vocation plus spécifique, par exemple[41] :

-               Porson est adaptée au grec ancien

-               Cardo est utilisée par les hellénistes et en particulier les médiévistes

-               Gentium est restreinte aux caractères latins et grecs

-               Caslon est disponible sous différentes versions pour divers types d’ordinateur

-               Monospace est une police à chasse fixe, de style Courier

 

De façon générale, il existe une correspondance biunivoque entre le glyphe d’une police et son codage informatique. Ainsi, afin d’homogénéiser les données téléchargées à partir d’Internet, certains logiciels proposent des conversions de polices[42].

 

j)      Claviers grecs monotonique et polytonique

 

Sous Windows, les pages de codes[43] prennent en charge les jeux de caractères de différents pays en y associant un clavier et un mode d’affichage spécifiques[44]. Elles sont automatiquement sélectionnées lors de l’installation d’une langue[45].

 

A partir de Windows 95, l’installation de la langue grecque, c’est-à-dire de la page de codes du grec monotonique, donne accès au clavier grec monotonique standard qui fonctionnant avec une police ISO 8859‑7 (Tableau 4).

 

En sus, à partir de Windows NT, il est possible d’activer la page de codes du grec étendu[46] moyennant l’installation du grec polytonique. Le clavier grec polytonique standard[47] permet d’afficher les caractères grecs polytoniques d’une police Unicode (Tableau 4).

 

Windows 95/98

Grec monotonique

Installation de la langue grecque

Dans le fichier Ajout / Suppression de programmes du Panneau de configuration, afficher l’onglet Installation de Windows et cocher la Prise en charge multilingue. Puis, cliquer sur Détails, cocher la case en regard du grec. Redémarrer le système.

Clavier grec monotonique

Dans le dossier Clavier du Panneau de configuration afficher l’onglet Langues. Cliquer sur le bouton Ajouter et sélectionner le Grec. L’installation fait apparaître dans la barre des tâches, en bas à droite de l’écran, un menu déroulant avec les icônes Fr et Gr, qui permet de basculer d’un clavier à l’autre. Sous Combinaison pour basculer entre les langues, on peut choisir parmi deux combinaisons de touches : ALT + Maj. Gauche ou Ctrl + Maj.

Windows 2000

Grec monotonique

Grec polytonique

Installation de la langue grecque

Dans les Options régionales du Panneau de configuration, afficher l’onglet Général, puis sous Paramètres de langue pour le système, activer la case à cocher en regard du grec.

Installation du clavier grec polytonique

Dans le dossier Clavier du Panneau de configuration, afficher l’onglet Paramètres régionaux d’entrée. Cliquer sur le bouton Ajouter et sélectionner le Grec polytonique. Définir les combinaisons de touches souhaitées pour basculer entre les langues. L’icône El s’ajoute dans la barre des tâches et permet également de basculer vers le clavier installé.

Remarque : On procède de la même manière pour installer le clavier grec monotonique, également symbolisé par l’icône El dans la barre des tâches. Pour éviter toute confusion entre les deux claviers, leur nom respectif figure à droite de chaque icône.

 

Tableau 4 : Principes généraux d’installation de la langue grecque et des claviers grecs sous PC‑Windows

 

Remarques :

Le clavier monotonique permet d’écrire tous les caractères attendus sauf le point médian[48].

Denis Liégeois propose des pilotes AZERTY facilitant grandement la frappe des accents du système polytonique à l’adresse suivante :

 

http://club.euronet.be/frederique.bouras/polices.htm

 

k)     Edition sous PC‑Windows

 

L’édition du grec monotonique est aisée, une fois le clavier Windows installé.

Signalons qu’une liste de correction orthographique du grec moderne pour Word est disponible à l’adresse :

 

http://www.info-grece.com/download.php?op=geninfo&did=4

 

Ses caractéristiques sont les suivantes :

 

Word97grec.zip

1,42 Mo

Versions pour Win 95 et Word 97 ou Win Me/2000 et Word 2000

Installation dans  C :\Fichiers programmes\Fichiers communs\MicrosoftShared\Proof

 

A partir de Windows  NT, l’édition du grec polytonique ne pose pas plus de difficultés moyennant l’installation du clavier grec polytonique et du pilote AZERTY de Denis Liégeois.

 

Pour information, sous Windows 95/98, avant que la norme Unicode n’ait cours, le polytonique s’obtenait à l’aide de macros ou d’utilitaires. Par la suite, des programmes ont permis l’utilisation de polices Unicode (Tableau 5).

 

Sous Windows 2000, l’affichage d’un caractère non accessible par le clavier dans un logiciel actif s’obtient par la pression simultanée de la touche ALT et du code décimal de celui-ci. Cette manipulation dépend des paramètres régionaux d’entrée en cours.

 

Avant Unicode

Modèle de document Word grec_msm (75 Ko)

Programme dans lequel sont enregistrées des macros et qui permet d’alterner entre les claviers grec et français à l’aide d’un bouton.

Site : Académie de Toulouse

http://www.ac‑toulouse.fr

Police : Greek.ttf

 

Grekedit (48 Ko)

Editeur pratique pour les débutants qui permet la sélection des caractères grecs de visu et le transcodage entre trois polices.

Site : Académie de Toulouse

http://www.ac‑toulouse.fr/lettres/eulalie/grekedit.htm

Polices : SPIonic, Greek et Athenian

 

clavgrec.exe (437 Ko)

Utilitaire faisant usage de Keyman (société « Tavultesoft  »).

Site : Facultés Universitaires Notre-Dame de la Paix

http://www.fundp.ac.be/~ppietqui/clavgrec.htm

Polices : IsminiPC, et Wingreek

Remarques :

Keyman est distribué gratuitement par le SIL (Summer Institute of Linguistics).

Une version récente de ce programme pour Win NT/2000/XP, clavgrec2.exe (547 Ko), est adaptée aux polices Unicode.

Avec Unicode

inputter2.chm

Utilitaire qui permet de frapper les caractères grecs polytoniques à partir d’un tableau.

Site :

http://users.ox.ac.uk/~tayl0010/html_help.html

Police : Titus Cyberbit Basic etc.

 

Antioch

Utilitaire conçu par Ralph Hancock

Site :

http://www.users.dircon.co.uk/~hancock/antiochg.htm

Police : Vusillus Old Face

Remarque – Réglage des macros :

Sélectionner le niveau de sécurité Moyen ou Haut.

 

Tableau 5 : Moyens d’édition du polytonique sous Windows 95/98

 

Partie 2 : Monotonique et polytonique sous Linux

 

i)      Polices de caractères grecs, impression

 

Sous les systèmes Unix, en particulier les plate-formes X11, tout utilisateur peut installer des polices grecques. Plusieurs sites en proposent, parmi lesquels les trois suivants :

 

a)         Hr-Net (Hellenic Resources Network) : http://www.hri.org

b)         Graphis, projet d’Hellug : http ://graphis.hellug.gr[49]

c)          GNU enscript par Manolis Lourakis : http://www.csd.uch.gr/~lourakis/genscript

 

Pour manipuler les polices, voici quelques commandes utiles sous Unix :

 

oddo

Copie par séquence chaque fichier d’entrée vers la sortie standard en transformant la donnée d’entrée selon le type de sortie spécifié par les options

xlsfonts

 

Pour lister les polices de caractères disponibles

xfd –fn font

Pour visualiser une police de caractère complète

xfontsel

Pour choisir une police par étapes successives en cliquant avec la souris sur les différents champs composant le nom de la police[50]

xdpyinfo

Affiche toutes les informations connues, en particulier la définition en point par pouce

 

  Les caractéristiques d’un client X11 sont représentables par un arbre dans lequel chaque feuille, appelée ressource, est paramétrable au gré de l’utilisateur.

 

a) La collection de polices d’Hr-Net est recommandée pour Mosaïc et Netscape.

En outre, le site d’HR-Net liste d’autres polices (GreekXfonts, polices postscripts etc.).

 

Nous détaillons maintenant l’installation des polices de Graphis.

 

b) Graphis

 

Au préalable, signalons que Perl et les commandes usuelles (dirname, expr) doivent être installés.

 

Après avoir téléchargé le package .rpm ou sa version compressée .tar.gz, installer les package à partir du répertoire sauvé :

 

rpm –Uvh xfntgr-*.rpm

 

Le cas échéant, on peut procéder manuellement :

 

1. Décompresser le fichier xfntgr-xx-xx.tar.gz, renommer le fichier xfntgr‑xx en hellas, et le déplacer vers : 

 

/usr/X11R6/libX11/fonts/

                                                                                     

2. Dans le répertoire hellas, exécuter le fichier graphis. Les polices sont alors installées dans le path d’XF86Config.

 

Polices TrueType

 

Remarques préliminaires :

 

-        A moins de disposer de la version 4.0.x d’X-Window, il faut se procurer un serveur de polices TrueType, en l’occurrence xfsft :

 

http://www.dcs.ed.ac.uk/home/jec/programs/xfsft/

 

-        De même, l’application ttmkdir doit être installée.

 

Pour installer les polices TrueType usuelles de Windows, on procède comme suit :

 

1.      Dans /usr/X11R6/lib/X11/fonts, créer un dossier destiné au rangement des polices TrueType[51]. Arbitrairement nous l’appelons ttf.

 

2.      Exécuter la commande ttmkdir –o fonts.dir, se créera le fichier fonts.dir qui contiendra toutes les polices installées.

 

3.      Maintenant, il s’agit d’ajouter le répertoire /usr/X11R6/lib/X11/fonts/ttf dans le Fontpath d’X-Window.

 

De deux choses l’une :

 

a)             Si le serveur X de polices (xfs) est installé :

-        Ouvrir le fichier config qui se situe dans le répertoire /etc/X11/fs à l’aide d’un éditeur de texte.

-        Dans "catalogue =", ajouter le chemin du répertoire.

-        Puis, redémarrer le système.

 

b)             Si xfs n’est pas installé :

-        Ouvrir la version XF86Config adéquate (ex. /etc/X11/XF86Config ou /etc/X11/XF86Config-4)

-        Dans Files, ajouter la ligne suivante :

 

Fontpath /usr/X11R6/lib/X11/fonts/ttf 

 

Les polices de caractères installées, l’ajout des paramètres suivants dans la ligne de commande permet généralement un affichage correct des polices grecques sous X :

 

-fn ou –font sc-elot14

 

Remarques :

 

-        Si la commande xset fp+ donne un message d’erreur comme parameter out of range ou opcodes of failed request alors que le pathname et les droits de l’utilisateur sont corrects, c’est que les polices sont chargées dans le terminal par un autre serveur.

-        L’utilisation d’AFS (Andrew File System), remote login et NIS pose de problèmes similaires

-        Pour les stations Sun anciennes, il faut recourir au manuel d’openwindows.

 

c) GNU enscript (version 1.5.6) par Manolis Lourakis

 

GNU enscript permet l’impression des caractères ISO 8859-7 : il convertit les fichiers ASCII en fichiers PostScript. Il contient les fichiers AFM (Adobe Font Metrics). Les polices à installer (dans /usr/local/share/enscript/greek/) se trouvent à l’adresse suivante :

 

http://www.csd.uch.gr/~lourakis/genscript/fonts.tgz

 

Pour indiquer à GNU où se trouvent les polices, de deux choses l’une :

 

1- Editer le fichier enscript.cfg et aller dans la ressource AFMPath. Ajouter le path entier dans le répertoire dans lequel les polices ont été décompactées :

 

AFMPath: usr/local/share/enscript:/usr/local/lib/ps:/usr/lib/ps:/usr/local

 

2- Pour une utilisation personnelle, éditer le fichier ~/.enscriptrc et ajouter dans AFMPath, le path de polices :

 

AFMPath:/home/grads/lourakis/morefonts:/usr/local/share/

enscript/greek

 

Pour imprimer un texte grec, par exemple ~/greek.txt, on utilise alors la commande :

 

Enscript –v –X 88597 ~/greek.txt –f TimesNewRoman-ISOLatinGreek10 –o /tmp/greek

 

Dans laquelle :

      -X indique l’encodage du document

-f spécifie le nom et la taille de la police

88597 peut être remplacé par greek

 

Cette commande a pour effet de convertir le fichier texte en fichier PostScript : /tmp/greek.ps.

 

j)      Versions grecques d’outils unixiens

 

Emulateur de terminal

 

gterm

Edition grecque d’xterm

rxvt

Solution recommandée

 

vi en grec

 

L’éditeur standard vi, commun à tous les systèmes Unix, se présente sous diverses répliques sous Linux dont les plus courantes sont :

- nvi : imitation fidèle de vi

- elvis : version améliorée de vi qui peut afficher les textes HTML

- vim (vi improved) : comporte des possibilités de programmation

 

Il existe un vi en grec (cf. guide d’utilisation dans le fichier viH.1 man page), et aussi un viH de A. Moschovou fondé sur vim.

 

 

            emacs

 

Greek-mode de

S. Kapidakis pour emacs 19.34 : greek-mode.el

-      Le clavier bascule à l’aide de la combinaison de touches ESC-G

-      Indiquer standard-display-european

La commande suivante charge automatiquement le fichier : load « /yourpath/greek-mode » nil t    

 

Sous Xemacs, qui du reste intègre des polices Unicode, il faut ajouter à la suite de provide ‘greek-mode, du prg greek-mode.el (à renommer xgreek-mode.el) la ligne de cmd suivante :

defvar standard-display-table nil " "

CGreek

Voir l’exemple traité en k)

 

            GreekTeX[52]

 

            On pourra consulter le site du CTAN (Comprehensive TeX Archive Network), qui comprend toutes les informations sur TeX (polices, documentation).

 

            Sous (La)TeX, il est possible de composer du grec polytonique à l’aide de l’option greek du package Babel dont l’utilisation est détaillée par A. Syropoulos.

           

k)     Un exemple de traitement sous emacs

 

emacs propose un langage de programmation dérivé de Lisp pour la programmation d’extensions qui permet une personnalisation de l’éditeur en fonction des besoins des utilisateurs. Il existe ainsi des options qui facilitent le traitement du grec ancien en libre accès. Nous présentons ici une utilisation de l’outil CGreek.

 

Description, mode d’installation

 

CGreek et son manuel de référence[53] se trouvent à l’adresse suivante :

 

http://m17n.org/cgreek/

 

Le but du projet CGreek est de créer un environnement pour traiter des documents en grec ancien. Il sert à afficher, saisir et modifier des textes.

Il est possible de lire et d’enregistrer des fichiers codés au format TeX grec ancien (ex. Ibycus4 par Pierre A. MacKay) et de lire les fichiers provenant du site TLG (Thesaurus Linguae Graecae).

 

Remarque : Comme GNU Emacs en soi est multilingue, toutes les langues qui sont prises en charge par GNU Emacs peuvent coexister avec le grec ancien.

 

Utilisation du CD-ROM du TLG

 

Une des fonctions essentielles de CGreek consiste à rapatrier et rendre exploitables les corpus issus du CD-ROM du TLG ( Thesaurus Linguae Graecae).

 

1- Principe de fonctionnement et installation des options

 

Le cédérom du TLG utilise la méthode de translittération beta code. Le programme tlg2emacs convertit le beta code en représentation interne. Pour ouvrir un fichier issu du TLG, emacs appelle tlg2emacs et ouvre dans une fenêtre le texte converti. Pour extraire des citations, il utilise tlg2cit.

Installer et compiler tlg2emacs et tlg2cit avec make, ou lex[54].

 

N.B. : tlg2emacs ne tient pas compte de certaines informations comme la taille des caractères, symboles non usuels etc.

Il est alors possible d’élaborer son propre outil (cf. customising TLG).

 

2- Lecture des fichiers du TLG

Le cédérom doit être monté dans le répertoire /cdrom et être accessible à l’aide de pathname comme /cdrom/authtab.dir. Si nécessaire, ajouter dans ~/.emacs la ligne suivante :

 

setq cgreek-tlg-directory "/your/tlg/cdrom/directory/"

 

Le volume utilisé par défaut est E, pour utiliser le volume D, ajouter la ligne de commande :

 

                        setq cgreek-tlg-cdrom-version "D"

 

Sélectionner le menu CGreek &rarr ; Open File &rarr ; TLG Format qui ouvre une liste d’auteurs dans le buffer *TLG authtab* (Figure 1).

 

Sélectionner la liste des œuvres d’un auteur avec la souris ou en utilisant la touche entrée. Celle-ci apparaît dans *tlg????.idt*, où ???? sont les chiffres attribués à un auteur (Figure 2).

 

Sélectionner un titre à l’aide de la touche ou avec la souris.

            Il est possible de travailler à l’aide de plusieurs buffers. Dans le mini buffer *TLG citation* est indiquée la position du curseur (Figure 3).

 

            Remarque :

 

            Indiquons les fonctions de trois touches :

 

-        a permet de retourner à la liste d’auteurs *TLG authtab*

-        w permet de retourner à la liste d’ouvrage de l’auteur en cours de consultation *tlg ????.idt*.

-        q dans le *TLG authtab* tue le buffer en cours.

 

3- Saut à l’aide d’un index

           

La touche j, pour l’anglais « jump », est programmée à cet effet.

            emacs demande de spécifier une position de page, de section ou de ligne selon la manière dont le texte se présente. A la suite de quoi, il se positionne automatiquement au début du texte spécifié (Figure 4).

Pour quitter, faire  C-g.

 

4- Conversion manuelle de beta code dans le buffer

 

            Si celle-ci n’est pas automatique, aller dans Cgreek &rarr ; Convert Region &rarr ; TLG to CGreek à partir de la barre des menus. Pour convertir tout le buffer, sélectionner la région pour tout le buffer.

 

 

 

            Figure 1 : Liste d’auteurs du TLG dans le buffer *TLG authtab*

 

 

Figure 2 : Liste des œuvres de Platon dans le buffer *tlg0059.idt*

 

 

Figure 3 : La position du curseur dans le texte est indiquée dans le buffer *TLG citation*

 

           

Figure 4 : Saut demandé avec la touche j

 

3-     Corpus et outils sur Internet

 

L’objectif de cette partie est de présenter quelques sites publics présentant de riches ressources concernant le grec ancien, byzantin ou moderne (corpus téléchargeables, outils de traitement automatique en ligne etc.).

 

a)     Affichage du grec sous Internet

 

L’échange des données textuelles repose sur des représentations logiques fondées sur la norme SGML : c’est la cas de HTML qui sert aux documents diffusés sur le Web[55]

 

Bien que la norme Unicode intègre un système de codage complet pour le grec, celle-ci n’est que rarement utilisée, et les sites en grec sont souvent créés à l’aide de polices non Unicode.

 

L’affichage des pages Internet en grec monotonique se déroule généralement sans difficultés majeures, notamment sous les versions récentes d’Internet Explorer.

 

L’affichage du grec polytonique est moins aisé dans la mesure où bien souvent les sites sont confectionnés à l’aide d’une police non Unicode.

Leur téléchargement est proposé. Généralement, les polices sont directement utilisées par le navigateur.

Néanmoins, un réglage est parfois nécessaire. Globalement, on procède comme suit :

 

 

Internet Explorer 5.5

Netscape 4.5

Police ISO 8859-7

Aller dans Affichage, puis dans Options et Codage/Plus/grec (ISO) ou Grec (Windows)

Choisir le menu Options, puis Grec (Iso) dans Encodage du document

N.B. : Avec Netscape 2.0, il est conseillé de travailler avec une police à chasse fixe (Sgfixed.ttf) en allant dans Options/Préférences Générales/Polices et sélectionner  Sgfixed.ttf

Police Unicode

Aller dans Affichage/Codage/Unicode (UTF-8), puis dans Outil/Options/Général/Polices, sélectionner :

- Jeu de caractères : alphabets dérivés du latin

- Police de pages Web : choisir une police Unicode (cf. Tableau 2)

 

 

            Tableau 5 : Paramètres d’affichage des pages Internet en grec sous PC-Windows

 

Netscape

-        Ajout de l’un des paramètres suivants à la ligne de commande :

–fn ou –font sc-elot14

- Ajouter dans le fichier de ressources netscape.rsrc, les lignes du type *documentsFonts.latin1.fixed*family : hrtt, puis le charger dans le serveur X à l’aide de la fonction xrdb :

 

xrdb –merge netscape.rsrc

(Pour éviter de réécrire cette ligne de commande à chaque opération, on peut l’intégrer dans .xinitrc ou dans app-defaults)

 

            Remarque : Courrier électronique

 

Outlook Express (version 5.5)

Pour taper du grec, on peut se servir d’un clavier virtuel (ex. inputter2.chm). Dans le cas de plusieurs identités, il faut choisir l’identité sous laquelle on souhaite envoyer le message en grec ancien.

Choisir alphabet international, alphabet universel, Unicode, UTF-8. Dans Outils/Options, choisir l’onglet Envoyer, décocher la case répondre aux messages dans le format d’origine. Cliquer sur paramètres internationaux, choisir Alphabet occidental (ISO).

Attention : Ne pas modifier l’encodage par défaut.

A la rubrique format d’envoi des news, sélectionner texte brut, puis cliquer sur paramètres de textes bruts. Cocher MIME et, très important, à la rubrique coder le texte en utilisant, choisir Aucun. Cliquer sur Envoyer comme message Unicode.

Nestcape Messenger

Aller dans les rubriques Aspect/Police dans Pour l’encodage, sélectionner Unicode. Dans Courrier et forums, choisir une police vectorielle, puis dans Formatage, sélectionner Utiliser un éditeur HTML. Dans le cadre lorsque j’envoie en message au format HTML, choisir me demander ce qu’il faut faire.

Dans le message lui-même, on a recours à Affichage/Encodage/Unicode (UTF-8) ou Occidental (ISO-8859-1)

Unix

            Pour lire ou écrire du courrier en grec dans un terminal xterm ou xrvt de Linux, les programmes usuels utilisés sont pine, elm, mail.

La combinaison de touche Alt Gr permet d’écrire en grec.

Lorsque les programmes ouvrent leur propre X-Window, par exemple mail, tool ou exmh, l’écriture des accents peut poser des difficultés sous X11R6.

Pour définir des correspondances entre les caractères et le clavier, on utilise la fonction Xmodmap. Deux fichiers, l’un pour l’alphabet latin, l’autre pour l’alphabet grec, sont nécessaires.

Ensuite, il s’agit de faire fonctionner xmodmap avec le clavier adéquat sous windows manager – ou définir une combinaison de touches pour changer d’alphabet.

Le cas de fvwm peut être résolu en ajoutant deux fichiers pour Xmodmap et le clavier PC.

            Pine semble être le programme qui fonctionne le mieux.

Note : En raison de l’origine américaine du réseau, les places inutiles pour la langue anglaise (128 places dans la table de chars anglaise), sont utilisées comme chars de contrôle. Ainsi, bien souvent, les « portails » transforment le 8e bit en 0 et transmettent le message avec un stripped high bit.

C’est pourquoi il existe un uuencode plus ancien et désormais MIME, qui transforme les messages de chars de 8 bits dans une représentation que les gateways ne peuvent modifier.

Tous les programmes actuels font cette opération (pine, elm) tant à l’envoi qu’à la réception du message (ce n’est pas le cas de mail ; elm appelle un prg extérieur appelé metamail qui exploite des fichiers codés par MIMEpine a intégré cette possibilité et serait le meilleur programme à cette heure.

 

 

b)     Moteurs de recherche

 

Les moteurs de recherche à vocation internationale permettent la recherche de lemmes en grec moderne. Seul le monotonique est accepté.

 

Pour effectuer une recherche plus spécifique, il est conseillé de se connecter à un moteur de recherche couvrant le réseau grec. Dans le tableau ci-dessous, nous mentionnons les moteurs et annuaires les plus fréquemment usités.

 

Arachne

Moteur chypriote : http://search.kypros.org

 

Ariadne

Sur le site Hellenic Greek N.A.O.S. (Network Acquisition Online Service) : http://hellas.ariadne-t.gr

Fantis

Basé aux Etats-Unis, présente en grec ou en anglais un annuaire des sites grecs dans le monde, ainsi que des dépêches d’actualité. Son adresse est http://www.phantis.gr

FindLink

annuaire grec accessible en grec ou en anglais. On le trouve à l’adresse http://www.findlink.gr

FORTHNET

http://www.forthnet.gr », est un moteur de recherche que l’on peut utiliser pour le grec + carte interactive de la Grèce

GoGreece

basé en Californie, il présente un annuaire grec, ainsi que des dépêches d’actualité. Son adresse est « http://www.gogreece.com 

Greek Indexer

annuaire grec accessible en grec ou en anglais

Greek Spider

moteur greco-chypriote

HellasYellow

L’annuaire téléphonique du réseau des télécommunications grec

HRI

est un moteur de recherche présentant des liens vers de nombreuses ressources Internet en grec

LinkHellas

dont la présentation est en anglais, donne accès à un annuaire

WebIndexer

est basé sur la région d’Athènes et présente un annuaire grec et international.

 

c)      Les corpus en ligne[56]

 

Nous présentons un site caractéristique de chaque période historique de la langue grecque.

 

Le grec ancien : Perseus

Le site Perseus est le site actuel présentant les ressources les plus riches pour le grec ancien (dictionnaire, corpus etc.). Il fut lancé en 1987 sur l’initiative de la Tufts University. Son adresse est la suivante « http://www.perseus.tufts.edu ».

La police de caractères utilisée sous Perseus est Sgreek, une police à chasses fixes.

Il permet de lire et d’imprimer tout texte grec ancien de sa base de données.

La section Primary Text Index : Greek  met à disposition environ 280 textes grecs classiques, avec l’analyse morphologique de certains mots et une traduction anglaise. De nombreux outils de traitement sont disponibles en ligne : à titre d’exemple, les données sont indexées et structurées de telle manière que des recherches d’occurrence sont réalisables sur l’ensemble du corpus. L’entrée du mot doit être écrite en « Beta Code » (la liste des correspondances grec / Beta Code est fournie) et les résultats sont donnés en grec. Une recherche au nominatif donne les occurrences pour tous les cas.

Il est facile de récupérer les textes sous Perseus par Copier/Coller. Pour une appréciation sur la variation de qualité des caractères voir http://perso.wanadoo.fr/jacques.mauger/langanc.html. 

N.B. : De nombreux sites français, dont celui de l’Académie de Toulouse (http://www.ac-rouen.fr/pedagogie/equipes/lettres/articles/edigrec.html ), fournissent des informations sur l’utilisation de Perseus.

 

N.B. : Le Thesaurus de la langue grecque de l’Université d’Irvine est un site extrêmement riche.

 

Le grec tardif : Bible Windows Software

Ce site spécialisé dans les éditions de la Bible, se trouve à l’adresse http://www.silvermnt.com/bwinfo.htm/.

Il fournit des outils de recherche a) sur le Nouveau Testament (analyses grammaticales et syntaxiques, indications lexicologiques, concordances etc.), b) sur le texte des Septantes (dictionnaire, analyse grammaticale) et met à disposition deux dictionnaires de langue grecque : le Liddell-Scott tronqué[57] et un dictionnaire grec / anglais de 1 200 pages organisé selon 90 domaines. Un lien vers la librairie grecque classique (Silver Classical Library) est également accessible.

 

Remarques utiles :

- Le logiciel « Logos » permet de travailler sur trois niveaux et de visualiser toutes les définitions d’un mot figurant sur le site (recherche dans tous les dictionnaires).

- Les résultats des concordances sont fournis dans le format texte, et sont lisibles sous un éditeur de textes quelconque.

- Ce site utilise la norme Unicode 2.

 

Le grec moderne : Thesaurus de la langue grecque moderne

 

 

 

L’Institut de Traitement des Langues d’Athènes met à disposition une collection de textes en langue grecque moderne constituée à partir de différentes sources (journaux, périodiques, livres etc.) et classée par genre et par thème[58].

Il est possible de rechercher un lemme sous toutes ses formes déclinées ou conjuguées parmi celles qui sont référencées (20 000 000 en tout).

Les résultats apparaissent dans leur contexte et la fréquence d’apparition du lemme est indiquée pour chaque texte.

 

N.B. : En ce qui concerne les ressources sur la langue grecque moderne, on pourra consulter les signets de la Bibliothèque Nationale de France à l’adresse http://www.bnf.fr/web-bnf/liens/d4/sle/grecmod-sle-d4.html.

 

d)     Les dictionnaires

 

Nous présentons ici des dictionnaires à vocations très diverses (historiques, synchroniques, lexiques etc.).

 

Dictionnaire historique

 

Le Liddell-Scott est disponible en ligne sur le site Perseus.

Si les dictionnaires de grec ancien se font rares, le Liddell-Scott est néanmoins le dictionnaire le plus sûr et le plus complet dont on dispose pour le grec puisque les éditions critiques modernes y sont intégrées, de même que les textes papyrologiques et épigraphiques récemment découverts[59]. Les termes répertoriés émanent des textes les plus anciens au texte du Nouveau Testament.

Dictionnaires à vocation générale

Eurodicautum et DictSearch permetttent de traduire des termes de plusieurs langues sources vers différentes langues cibles (dont le grec et le français).

Dictionnaire multilingue de termes spécialisés (économiques, scientifiques, juridiques etc.)

Eurodicautum

service de traduction de la Commission européenne  http://eurodic.ip.lu/cgi-bin/edicbin/EurodicWWW.pl 

(allemand, anglais, danois, espagnol, finois, français, grec, hollandais, italien, portugais et suédois) et le latin.

Dictionnaire, moteur de recherche

DictSearch

http://foreignword.com/Tools/dictsrch.htm 

En outre ce site, créé par Stephan Böhmig et Alberto Fontaneda, contient un moteur de recherche dans 132 dictionnaires de langues (56 langues sources et 58 langues cibles).

Lexique, outils pédagogiques

1- Freelang : dictionnaire grec (321 Ko) fonctionne sous une plate-forme Windows 1995/1998 avec une liste de 2316 mots grec / français et 3150 mots français/grec

http://www.freelang.com/freelang/dictionnaire/grec.html 

2- Eulalie : Le logiciel Eulalie peut être téléchargé à l’adresse « http://www.ac-toulouse.fr/lettres/eulalie/eulalie.htm ». Réalisé sous Toolbook, il présente des fiches de vocabulaire classées (environ trente fiches de vingt mots) ; on peut créer des fiches personnelles, ou modifier les fiches fournies. On y trouve enfin la traduction instantanée de 1 000 mots grecs.

 

Bases de données : Systran et Intertran

Systran Babelfis et Intertran ™ constituent les bases de données les plus utilisées dans la traduction automatique des textes grecs.

 

Les corpus ou les dictionnaires pour le grec ancien et moderne abondent, ainsi que les outils les accompagnant (analyses morphologiques, statistiques, corrections orthographiques, traductions). Seuls les textes byzantins en langue démotique ne sont pas représentés sur la toile.

 

            Conclusion

 

Ce parcours des ressources et des outils informatiques nous montre que de la même manière que le polytonique a perduré plus par tradition que par nécessité, les habitudes liées à l’utilisation des polices anciennes n’ont pas encore disparu.

La généralisation que nous espérons imminente de la norme Unicode, devrait permettre de résoudre un bon nombre de problèmes.

Pour ce qui concerne les ressources en ligne, nous constatons une richesse de données pour le grec ancien, tardif et moderne, mais qu’un corpus de textes byzantins fait cruellement défaut.

L’obtention d’un codage uniforme permettra de mener à bien une étude en diachronie. Pour étudier un stade particulier de la langue dans l’optique d’une édition critique, des outils de plus en plus efficaces devraient apparaître. Bien sûr, l’intervention de l’utilisateur sera nécessaire pour choisir une position face à certains problèmes de querelles linguistiques.

Ainsi, pour un traitement statistique d’un corpus de données en langue démotique, nous sommes d’avis qu’un seul accent suffit, du moins à partir du grec byzantin, dans la mesure où l’utilisateur connaît les données, les formes, et sait les interpréter en contexte.

 

Remerciements

 

Ce travail a été réalisé sous la direction de M. André Salem et M. Serge Fleury à qui nous exprimons notre plus vive reconnaissance.

 

Références bibliographiques

 

BALLY C., Manuel d’accentuation grecque, Berne, A. Francke, 1945, 129p.

DREGGER-CAPPEL E., ESSER H. G., GUTMAN M., LANNERT D., SOWA F.,  Linux, Micro Application : Grand Livre, 1997

GARDE P., L’Accent, Paris, P.U.F., 1968

HABERT B., FABRE C., ISSAC F., De l’écrit au numérique (constituer, normaliser et exploiter les corpus électroniques), Paris, InterEditions, 1998

HABERT B., NAZARENKO A. et SALEM A., Les linguistiques de corpus, Paris, Armand Colin, 240p.

JANNARIS A.N., An Historical Greek Grammar, chiefly of the Attic dialect, Londres, éd. Macmillan, 1897, 737p. (reprint 1987, Georg Olms : Hidelsheim, Zürich and New York)

LEJEUNE M., Précis d’accentuation grecque, Paris, Hachette, 1945

LIDDELL H.G., SCOTT R., A Greek-English Lexicon, 9e éd. Revue par JONES H.S., 1940, 2111p., Oxford, 1996, 2378 p

MIRAMBEL A., La langue grecque moderne. Description et analyse, Paris, Klincksieck, 1959, « L’Accent », pp. 25-38

TONNET H., Histoire de la langue grecque, L’Asiathèque, Paris, 1993, 189p.

TONNET H., Manuel d’accentuation grecque moderne (démotique), Paris, Klincksieck, 1984, 111p.

VENDRYES J., Traité d’accentuation grecque, Paris, Klincksieck, 1929, 275p.

        

         Notes



[1] Dans cet article, il est fait usage de la police Unicode Palatino Linotype qui permet de transcrire aussi bien le français que le grec ancien, tardif, byzantin ou moderne de nos exemples.

[2] Le tréma (gr. trêma « trou, points sur un dé »), trop souvent oublié, fait également partie intégrante du système d’accentuation grecque.

[3] On trouve les lois d’accentuation du grec ancien dans M. Lejeune (1945), J. Vendryes (1929) et P. Garde (1968) et celles du grec moderne dans H. Tonnet (1984).

[4] A l’intérieur d’un mot, un groupe de deux ρ s’écrit sous la forme «ῤῥ» ou plus simplement « ρρ ». Concernant l’aspect historique de cette notation voir Jannaris (1897), §64.

[5] En ionien, l’aspiration initiale s’étant amuïe, le heth (H) de l’alphabet cananéen notait un [ε] ouvert long. Après l’adoption de l’alphabet ionien en 403 av. J.-C., comme l’aspiration initiale avait toujours cours en attique, la partie gauche du H a finalement été utilisée pour indiquer une aspiration (esprit rude) et sa partie droite l’absence d’aspiration (esprit doux).

[6] Avec l’usage, il remplace uniquement l’aigu sur la dernière syllabe d’un mot, sauf lorsque le mot est suivi d’un signe de ponctuation ou qu’il est cité isolément.

[7] Pour les majuscules, l’iota est de préférence adscrit.

[8] Cf. glossaire Unicode 3.2.

[9] Ce phénomène (ψίλωσις, psilosis) avait déjà eu lieu à l’époque classique pour l’ionien (cf. note 5).

[10] Dès le IIe siècle naît le courant atticiste qui  touche les intellectuels païens, puis les Pères de l’Eglise au IVe siècle. L’Empire Romain d’Orient adopte le grec atticiste comme langue administrative.

[11] On entend par « grec médiéval » la langue vulgaire de l’époque byzantine au XVIIe siècle.

[12] C’est le cas pour l’adjectif et certains génitifs pluriels dont l’accent descendait d’une syllabe en attique, et aussi pour quelques génitifs singuliers de la deuxième déclinaison. Par analogie avec les autres personnes, les formes passées du verbes tendent également à se figer.

[13] Elle est sensible dans les subjonctifs à aoristes seconds qui tendent à s’accentuer sur la finale probablement sous l’influence analogique des infinitifs correspondants. De même, les proclitiques sont paroxytons avant de devenir monosyllabiques. Enfin, dans des paroxytons comportant une diphtongue descendante, une synizèse se produit occasionnellement, ce qui entraîne l’oxytonaison. Ce type de synizèse devient régulier au XVIIe siècle.

[14] Cf. Tonnet (1993), chapitre VIII.

[15] Cf. Tonnet (1993), chapitre VIII.

[16] Le résultat de la coexistence de deux niveaux de langue est aujourd’hui la constitution d’une langue naturellement mixte.

[17] Nous pensons à Odysseas Elytis, prix Nobel de Littérature.

[18] L’orthographe historique désigne la façon d’écrire une langue correspondant à un état ancien de sa prononciation.

[19] Les conventions se fixeront  davantage avec le début de l’impression.

[20] Si le digamma est attesté dans des documents grecs archaïques et dialectaux, ce n’est pas le cas du yot, qui n’apparaît que dans les reconstitutions de racines indo-européennes.

[21] Pour l’histoire de ces signes et de leur dénotation, on pourra consulter Jannaris (1897), pp. 168-169, §616‑618. Ils existent aussi en minuscule.

[22] Le signe numéral grec se place en haut à droite d’un groupement de lettre dont la valeur est inférieure à mille, tandis que le signe numéral souscrit grec se note en bas à gauche de la première lettre d’un groupement dont la valeur est supérieure à mille.

[23] Bien entendu, les majuscules et les minuscules.

[24] Les diacritiques apparaissent isolément lorsqu’ils précèdent une majuscule initiale.

[25] Dans la suite, nous n’insisterons pas sur les codages qui relèvent de l’ASCII classique (chiffres, espaces, caractères de contrôle).

[26] L’International Organization for Standardization, dont le nom de la norme ISO est calqué sur le grec ἴσος (isos, « égal »), est une fédération mondiale d’organismes nationaux de normalisation dont font partie l’Association Française de NORmalisation (AFNOR), l’American National Standard Institut (ANSI) et l’organisme grec de standardisation ELOT (Ελληνικός Οργανισμός Τυποποίησης, Ellinikos organismos typopoiisis).

[27] Du point de vue linguistique, la date choisie est arbitraire. A cette norme correspondent les fichiers LANG_GREEK sous Windows, langGreek (monotonic) et langGreekPoly sous Macintosh.

[28] Nous pensons en particulier à la Bibliothèque Nationale de France et à la Bibliothèque Universitaire des Langues Orientales à Paris.

[29] L’inconvénient majeur de la translittération tient à ce qu’elle ne peut rendre compte des évolutions phonétiques du grec.  A titre d’exemple, la lettre « Η, η » translittérée en i long, dénotait un e long ouvert en attique, et un i à partir du IIIe siècle lorsque les quantités de voyelles ont disparu (voir Lejeune (1945)). Ce genre d’ambiguïté peut poser des problèmes aux néophytes dans la recherche d’un titre.

[30] Si des variantes nationales sont apparues, la norme s’est fixée sur le standard américain en 1988.

[31] L’ELOT (Ελληνικός Οργανισμός Τυποποίησης, Ellinikos organismos typopoiisis) est l’organisme grec de standardisation (cf. http://www.elot.gr).

[32] Il ne manque que le point d’interrogation grec (;).

[33] En l’occurrence, les lettres accentuées, les diacritiques et leur combinaison.

[34] Parmi les 65 536 codes de caractères Unicode disponibles, environ 39 000 ont été affectés dont 21 000 pour les idéogrammes chinois. Les combinaisons restantes demeurent disponibles pour les extensions futures (voir le Plan Multilingue Complémentaire d’Unicode).

[35] Il s’agit du signe numéral grec, du signe numéral souscrit grec, de l’iota souscrit et du point d’interrogation grec.

[36] Il s’agit des variantes de formes des les lettres utilisées comme symboles mathématiques.

[37] Les diacritiques des langues sont tous regroupés de 0300 à 036F. Pour le grec, on  trouve séparément les dix diacritiques de la partie 1 et la combinaison de l’aigu et du tréma (onze codes au total).

[38] Unicode 4.0 devrait intégrer le linéaire B et ses idéogrammes, le syllabaire chypriote, ainsi que les nombres égéens (cf. Plan Multilingue Complémentaire (PMC)).

[39] La technologie Acrobat permet à des réseaux hétérogènes ou des machines distantes de partager les mêmes documents électroniques. Nous n’entrerons pas ici dans les détails des polices PostScript.

[40] Pour des indications sur leur mode d’installation, voir l’aide de Windows.

[41] On pourra se référer au site de Denis Liégeois pour les descriptions et adresses de téléchargement de ces polices.

[42] Tel est le cas de l’éditeur de textes Grekedit que nous évoquerons par la suite.

[43] Une page de code est une table qui met en correspondance les codes de caractères binaires utilisés par un programme avec les touches du clavier ou les caractères affichés.

[44] Nous n’entrons pas dans les détails techniques des modes d’affichage EGA/VGA etc.

[45] L’installation d’une langue consiste à configurer le système de sorte qu’il puisse lire et écrire les caractères de la langue installée.

[46] Rappelons que celle-ci fut créée suite à l’apparition de la norme Unicode (cf. 2-b).

[47] Notons que ce nouveau standard s’est imposé en Grèce au cours de l’année 2002.

[48] On a alors recours à la Table de caractères de Windows ou à l’option Caractères spéciaux du menu Insertion de Word.

[49] Il s’agit d’un projet d’Hellug qui regroupe un ensemble de polices déjà existantes (cf. http://graphis.hellug.gr).

[50] Pour le choix de la police, il est parfois utile de connaître la définition de l’écran utilisé.

[51] Il convient de s’assurer que seules les polices d’extension .ttf ont été copiées et que leur nom ne comporte pas d’espace.

[52] Des informations mises à jour sur (La)TeX se trouvent à l’adresse : http://ocena1.ee.duth.gr/greekingf/Greekinf2.html.

[53] On pourra s’y référer pour l’installation de cet outil et la description de quelques opérations de base (utilisation du clavier, impression, entrées et sorties).

[54] Pour Solaris ou Windows, utiliser flex.

[55] C’est aussi le cas des normes pour les corpus, TEI (Text Encoding Initiative) et CES (Corpus Encoding Standard).

[56] Consulter également les signets de la Bibliothèque Nationale de France.

[57] Le Liddel Scott est entièrement disponible sur le site Perseus (cf. 4) a) de cette partie).

[58] L’adresse Internet du site est http://hnc.ilsp.gr.

[59] Jusqu’à 1991 pour le Supplement.


LEXICOMETRICA (ISSN 1773-0570)
Coordinateurs de la rédaction : André Salem, Serge Fleury
Contacts:  lexicometrica@univ-paris3.fr
ILPGA, 19 rue des Bernardins, 75005 Paris France



Site Meter