Lexicometrica
Numéro 4, 2003
Les
textes grecs des origines à nos jours
(Ve
siècle av. J.-C. - XXIe siècle)
Codage, outils et méthodes de travail
Patricia
GUILPIN
Paris
III Sorbonne Nouvelle - INALCO
guilpingr@yahoo.fr
Résumé
Dans
cette présentation[1], nous posons
les jalons préalables à un traitement automatique des textes grecs de la
période classique à nos jours.
Ce travail tente d’apporter un
éclairage sur la question essentielle du codage des caractères grecs. Il traite
donc de l’évolution des conventions d’écriture du grec, et en particulier de
ses signes diacritiques autour desquels est axée notre problématique. En effet,
il existe deux modes d’accentuation des données textuelles grecques quelle que
soit l’époque concernée : le polytonique dénote d’anciens principes
d’accentuation et le monotonique correspond aux réalités phonétiques du grec
moderne.
En second lieu, nous présentons
quelques données textuelles fondamentales en grec ancien, tardif, byzantin et
moderne, ainsi que d’éventuels outils de traitement associés, mis à disposition
sur le Web.
Nous
souhaitons d’une part diffuser des informations méconnues, d’autre part fournir
l’accès à l’outil informatique (édition, supports pédagogiques, catalogues,
corpus, logiciels) recherché par tout hellénisant qu’il soit linguiste,
philologue, enseignant, documentaliste…
Introduction
En
grec ancien, langue issue de l’indo-européen, l’accent de la phrase est
musical : à la voyelle de la syllabe accentuée correspond l’élévation de
la voix d’une quinte, sans qu’a priori la prononciation ne soit très
intense. Au IIIe siècle avant J.-C., les grammairiens alexandrins
inventent un système de signes diacritiques afin d’indiquer à leurs
contemporains les principes de l’accentuation ancienne qui commence à tomber en
désuétude : c’est la naissance du « système polytonique ». Dès
l’origine, ce système n’est pas conçu pour dénoter les réalités phonétiques ou
l’intonation du grec contemporain. Il se révèle en grande partie caduque 600
ans plus tard (IIIe siècle après J.-C.), époque à laquelle l’accent
devient intense. Pourtant, la notation de ces signes se systématise entre les
VIIe et IXe siècles et perdure jusqu’à nos jours.
Le
29 avril 1982, par un décret présidentiel, le système monotonique, c’est-à-dire
à un seul accent, en l’occurrence l’aigu[2],
est adopté. Il constitue une simplification du système polytonique, et
correspond aux réalités phonétiques du grec moderne : l’accent aigu
indique la voyelle accentuée (accent d’intensité). Cependant, dans la pratique
éditoriale, le système polytonique est toujours en usage. De plus, les lettrés
qui en ont eu connaissance depuis leur plus tendre enfance continuent à s’en
servir. Bref, dans les faits, il est difficile de s’en passer, ne serait-ce que
par soucis d’exactitude lorsque l’on cite un document original : l’immense
majorité des ouvrages grecs est imprimée selon les normes du système
polytonique.
Ce
décret a influé sur le choix d’un codage en faveur du système monotonique
officiel pour lequel une norme internationale a immédiatement été adoptée. La
norme internationale du grec polytonique, quant à elle, n’a que trop tardé à
exister car chacun a tenté de pallier isolément le problème de son absence avec
des moyens de fortune. Dans ces conditions, les corpus et outils créés sont
pratiquement inutilisables.
Nous
tentons de dresser un bilan sur la question du codage des caractères grecs.
Aussi avons-nous au préalable pris soin de poser le problème et de définir
exactement ce que l’on entend par les expressions grec polytonique et grec
monotonique en nous référant brièvement à l’histoire de la langue grecque et de
son écriture. Par la suite, nous mentionnons les normes informatiques utilisées
sous Windows et Linux pour transcrire les caractères grecs et leur éventuelle
évolution. Enfin, à la fois pour illustrer notre problématique et à titre
d’information, nous faisons référence aux principales ressources textuelles et
outils disponibles sur les Web pour la restitution des textes grecs des
origines à nos jours.
Différentes écritures du grec : linéaire B,
majuscules, grec polytonique, grec monotonique
1. Grec
monotonique, grec polytonique : histoire et définitions
La
question du codage des caractères grecs et de ses signes diacritiques est
intimement liée à l’histoire de la langue grecque et à ses traditions
d’écriture. Nous faisons ici un bref historique de la dénotation des signes
diacritiques pour aboutir à une définition complète des termes grec monotonique
et polytonique.
Historiquement, le grec ancien
possédait un accent tonal : à la différence de l’accent indo-européen, il
ne pouvait porter que sur les trois dernières syllabes d’un mot[3]
et à la voyelle accentuée correspondait l’élévation de la voix d’une quinte. Un
système de signes diacritiques marquant l’intonation et la phonétique du grec
ancien fut inventé autour des IIIe‑IIe siècles
avant J.-C.
Il est composé de deux esprits (rude et
doux), trois accents (aigu, grave et circonflexe), de l’iota souscrit et du
tréma, dont les valeurs respectives sont les suivantes :
a) l’esprit rude (gr. δασεῖα, daseia)
note une aspiration lors de l’émission de la voyelle initiale (ex. ἑπτά, hepta
« sept ») ou de la consonne rho initiale (ex. ῥῆμα, rhêma
« mot, parole »)[4]
et l’esprit doux (gr. ψιλή, psilê) l’absence d’aspiration
lors de l’émission de la voyelle initiale (ex. ἐννέα, ennea
« neuf ») [5],
b) l’accent aigu (gr. ὀξεῖα, oxeia) correspond à une
élévation de la voix d’une quinte, comme le résultat d’une tension des cordes
vocales (ex. πόλις,
polis « cité »), alors que l’accent grave (gr. βαρεῖα, bareia) consiste en un
relâchement des cordes vocales, et par suite en un abaissement de la voix (ex. τὸν θεόν, ton theon « le
dieu » à l’accusatif)[6].
L’accent circonflexe ou périspomène (gr. περισπωμένη,
perispomenê), issu de la combinaison des accents aigu et grave, indique
une élévation et une baisse successive de la voix.
Par ailleurs, c) un iota souscrit
sous les voyelles finales anciennement longues α, η, ω[7] signale
la chute de l’iota dans les diphtongues à premier élément long αι, ηι, ωι (ex. ᾄσμα, asma
« chant »).
Enfin, d) un
tréma (gr. anc. διαίρεσις,
diairesis « division » et gr. mod. διαλυτικά,
dialytika) est placé sur un ι ou un υ précédé d’un groupe vocalique, généralement
une voyelle, avec lequel il ne forme pas une diphtongue (ex. ἄϋλος, a-ulos
«immatériel »).
Deux diacritiques servent
occasionnellement à marquer les quantités de voyelles du grec ancien : une
voyelle longue (gr. μακρά,
makra) s’écrit, si l’on choisit arbitrairement l’iota,
« ῑ », et une brève (gr. βραχεῖα, bracheia)
« ῐ ».
Mentionnons enfin les deux emplois
remarquables de la crase et de l’apostrophe :
i) la crase, qui correspond
à la contraction de la voyelle ou de la diphtongue finale d’un mot avec la
voyelle ou la diphtongue initiale du mot suivant, est notée au moyen d’un signe
semblable à l’esprit doux, très rarement à l’esprit rude, nommé coronis
(ex. κἀγώ
< καὶ ἐγω, kago <kai ego, litt.
« et moi »),
ii) lorsqu’une voyelle tombe lors de la
prononciation, on marque par l’apostrophe la place de la voyelle disparue en
fin de mot (ex. ἀπ’ < ἀπο, apo « de »).
En bref, ce système de diacritiques
indique pleinement la prosodie et la prononciation du grec ancien : les
accents et les signes marquant les quantités de voyelle ont des valeurs
prosodiques, tandis que les esprits, l’iota souscrit, le tréma, la crase et
l’apostrophe ont des valeurs phonétiques.
Le grec polytonique désigne
communément « [l’]ancien grec écrit à l’aide de plusieurs accents distincts
et d’autres diacritiques »[8].
Pour notre part, nous nuançons cette
définition en disant qu’il s’agit de façon générale du grec (ancien, tardif,
byzantin ou moderne) écrit à l’aide du système de signes diacritiques sans
doute conçu par Aristophane de Byzance (265 ?-185 ?) et qui
historiquement dénotait, comme nous l’avons vu, l’intonation du grec ancien et
sa prononciation. Nous continuons à indiquer la dénotation des diacritiques au
cours des temps et les contextes d’emploi du polytonique sans chercher à juger
de sa légitimité.
En
pratique, le polytonique, initialement conçu pour indiquer la manière dont se
prononçait le grec classique, faisait l’objet d’une utilisation très
restreinte, notamment pour lever les ambiguïtés des mots.
Vers
le IIIe siècle après J.-C., en koinè romaine, langue commune et
forme simplifiée du dialecte attique, l’accent est non seulement musical, mais
devient intense. Les voyelles n’ont alors plus de quantités propres
indépendantes de leur accentuation : on observe un allongement relatif de
toutes les voyelles accentuées et un abrègement relatif de toutes les voyelles
atones. De plus, la liaison fonctionnelle entre la quantité de la voyelle
finale et l’étendue de la zone accentuable n’étant plus perçue, l’accent
est voué à se figer au cours de la flexion. Par ailleurs, à cette époque,
l’aspiration initiale disparaît[9].
Au
IIIe siècle après J.-C., les principes d’accentuation du grec
diffèrent nettement de ceux du grec ancien : a) l’accent est intense, b)
l’aspiration initiale a disparu, et c) les quantités de voyelles sont
égalisées. Par conséquent, l’utilisation de la plupart des signes diacritiques
du polytonique est en toute rigueur caduque.
Pourtant
entre les VIIe et IXe siècles après J.-C., leur notation
se généralise avec l’apparition des lettres minuscules. A titre d’exemple, le
polytonique est appliqué aux manuscrits du Nouveau Testament vers le VIIe
siècle par Euthalius. Comme l’écriture est en général le reflet d’une tradition
savante, et que dans les milieux cultivés l’attique de l’époque classique
constitue le modèle à imiter[10],
le grec contemporain s’accentue de la même manière que le grec ancien.
A
l’époque byzantine, période du grec dit « médiéval »[11],
l’accent devient fixe pour certaines catégories grammaticales[12]
et on observe une tendance à l’oxytonaison[13].
Les manuscrits grecs, toujours par tradition et non par nécessité, continuent à
être accentués dans le système polytonique, que la langue de l’auteur soit
savante, ou « mixte » c’est-à-dire plus proche de la langue vulgaire.
Perpétué par une tradition d’écriture archaïsante, le polytonique sert non
seulement à transcrire le grec savant, mais aussi un grec plus vulgaire à
caractère dialectal. Il apparaît ainsi comme le mode de transcription
conventionnel du grec.
Au
XVIIIe siècle, pour faire suite aux idées du grammairien Sophianos
(XVIe siècle) et conformément aux idées des Lumières, les
réformateurs de la langue, parmi lesquels Katardzis et Coray, tentent de créer
une langue écrite commune, fondée sur l’usage oral. Ils se heurtent à la
réalité complexe du grec : l’attique est trop éloigné de la langue parlée
pour permettre la diffusion de la culture littéraire ou scientifique, tandis
que le grec vulgaire, ne se prête guère à l’expression des idées abstraites. On
envisage alors soit une systématisation de la langue parlée, soit une
« archaïsation » partielle de la langue, qualifiée d’embellissement
(gr. καλλωπισμός,
kallopismos)[14].
En
1830, l’Etat grec libre tranche et adopte comme langue officielle la katharevoussa
(gr. καθαρεύουσα
« purifiée »), une variété puriste et archaïsante du grec : la
« question de la langue » (gr. γλωσσικό
ζήτημα, glossiko zitima),
vaste débat centré sur le conflit diglossique entre langues populaire et
puriste, prend alors toute son ampleur. En résumé, on assiste à un phénomène de
différentiation entre la katharevoussa, utilisée dans tous les domaines
de la vie publique (administration, enseignement, politique, religion) en
littérature et en science, et la démotique (gr. δημοτική,
dêmotikê) qui, procédant par évolution naturelle de l’ancienne koinè,
reste le plus souvent réservée aux usages familiers de la vie quotidienne, bien
qu’elle connaisse un essor littéraire tout au long du XIXe siècle[15].
Quoi qu’il en soit, ces deux variétés de langue sont transcrites dans le
système polytonique conventionnel.
Au
XXe siècle, un revirement s’opère en faveur du grec démotique. Nous
en mentionnons les étapes majeures. En 1917, une réforme partielle accorde une
place au grec démotique dans l’enseignement primaire. Codifié en 1941 dans la Grammaire
néo-hellénique de Manolis Triantaphyllidis, il est finalement reconnu comme
langue officielle de l’Etat grec en 1976[16].
Suit
un décret présidentiel le 29 avril 1982, par lequel la République grecque
adopte un système d’accentuation en accord avec la réalité phonétique du grec
démotique : le monotonique.
Il
est composé de l’accent aigu qui indique la voyelle accentuée, et du tréma qui
surmonte un ι
ou un υ
précédés d’une voyelle (ou d’une combinaison vocalique) pour indiquer que
ceux-ci doivent être articulés séparément (ex. θεϊκός, theïkos
« divin »). Pour adapter le polytonique au grec moderne, tous les
autres signes diacritiques, à savoir les esprits, les accents grave et
circonflexe, l’iota souscrit, la coronis et les notations pour les voyelles
longues et brèves sont supprimés.
Le
grec monotonique désigne donc le grec, généralement le grec démotique,
écrit à l’aide de l’accent aigu, et par extension du tréma.
Mais,
la pratique réelle des Grecs, vingt ans après ce décret, mérite d’être
évoquée en quelques lignes. Si récemment encore, les diacritiques étaient
prisés par des auteurs littéraires[17],
la quasi-totalité des Grecs, y compris les hommes de lettres, écrivent
aujourd’hui le grec moderne dans le système monotonique. Cependant, les livres
sont majoritairement édités, voire réédités, en polytonique a) à des fins
esthétiques, lorsque leur auteur pratique un grec démotique, en partie
dialectal, b) à toutes fins utiles, pour transcrire en premier lieu le grec
ancien, mais aussi le grec savant, et souvent le grec byzantin selon le choix
délibéré de l’édition critique. C’est ainsi que l’accentuation polytonique
demeure en usage.
Pour
conclure sur nos définitions, le grec polytonique désigne le grec
ancien, tardif, byzantin ou moderne écrit au moyen des accents et diacritiques
dénotant historiquement le mode d’accentuation de l’ancien grec. Peu importe
que ces signes aient perdu leur dénotation avant même qu’il en soit fait usage,
ils font partie de l’orthographe historique[18]
à partir des VIIe et IXe siècles après J.-C. où ils sont
systématiquement utilisés. Contrairement à ce que l’on pourrait être porté à
croire, jusqu’à la réforme de 1982, ce mode d’écriture du grec n’est pas
strictement réservé à la langue savante : il sert également à transcrire
le grec vulgaire, mixte ou dialectal. Cependant, depuis l’adoption du système
monotonique particulièrement adapté au grec moderne, le polytonique est devenu
à juste titre le système de prédilection du grec ancien et du grec savant qui
s’en rapproche, et par la même occasion une connaissance de spécialistes de la
langue et d’imprimeurs.
La
tradition orthographique d’une langue comme le français se fixe à un certain
stade de son évolution, si bien que l’écriture correspond parfois à la
prononciation ancienne d’un mot, comme dans l’exemple du mot « roi »
[rwa], qui initialement se prononçait [roj]. Ce phénomène est d’autant plus
frappant en grec où, malgré de timides réformes, l’orthographe historique
actuelle continue à transcrire la prononciation du grec attique de la fin du Ve
siècle avant J.-C.
2- De l’écrit au numérique
L’utilisation
des deux systèmes d’accentuation monotonique et polytonique est à l’origine de
diverses questions si l’on envisage un traitement automatique des textes grecs,
de quelque époque qu’ils soient. La première étape dans la normalisation d’un
corpus est le codage des caractères. C’est ce dont nous traitons dans cette
partie.
a)
Que doit-on coder ?
L’unification
de l’écriture grecque s’est réalisée en 403 avant J.‑C. avec
l’adoption officielle de l’alphabet de la cité ionienne de Milet en Asie
Mineure. Composé de vingt‑quatre lettres, l’alphabet grec est en usage
jusqu’à aujourd’hui.
Les
minuscules apparaissent entre les VIIe et IXe siècles
et trois innovations s’ensuivent : l’espacement entre les mots,
l’introduction de signes de ponctuation et la notation progressive des accents[19].
Nous
avons déjà examiné avec attention le problème des accents. La ponctuation des
textes grecs imprimés imite pour l’essentiel les habitudes de la typographie
occidentale, exception faite du point médian (point central ou point au milieu)
qui équivaut à notre point‑virgule, et du point‑virgule qui
remplace notre point d’interrogation.
Par
ailleurs, des lettres archaïques sont utilisées a) pour transcrire d’anciens
phonèmes dans le cas des deux semi-voyelles yot (J) et digamma (Ϝ)[20],
ou b) ont une valeur numérale dans le cas du sampi (Ϡ), du koppa (ϳ ou mod. Ϟ) et du stigma (Ϛ)[21].
L’utilisation numérale des lettres donne lieu à l’adjonction d’une sorte
d’apostrophe, souscrite ou non : dans la terminologie officielle, il
s’agit du signe numéral grec et du signe numéral souscrit grec[22].
Mentionnons enfin le cas rare de la ligature de και (kai,
« et »).
Il
s’agit donc de coder les vingt-quatre lettres de l’alphabet[23],
les caractères accentués, les diacritiques, les combinaisons de diacritiques[24],
les signes de ponctuation, les lettres archaïques, et en toute rigueur les
chiffres arabes, les caractères de contrôle[25]
etc.
b)
Codages des caractères grecs, normes
associées
Les
indicatifs de la langue grecque, utilisés en information et documentation, sont
définis par la norme ISO 639[26].
Le
code à deux lettres el (ISO 639‑1) s’utilise en terminologie,
lexicographie et linguistique ; le code à trois lettres (ISO 639‑2)
établit une scission entre le grec ancien grc jusqu’à 1453, et le grec
moderne gre/ell à partir de 1453[27].
Etant
donné les problèmes que pose l’usage des accents en grec jusqu’à aujourd’hui,
les catalogues informatisés d’ouvrages grecs en France[28]
sont établis en translittération[29].
La norme fréquemment utilisée est alors l’ISO 843 : 1997 (E).
Soumis
aux normes ISO, le codage des caractères est étudié de façon à faciliter leur
traitement, en particulier les tris. La relation d’ordre établie suit donc les
sens arithmétiques et lexicographiques.
L’ASCII
(American Standard Code for Information Interchange), créé en 1963 aux
Etats-Unis et adopté comme norme ISO 646, code 128 caractères
alphanumériques (sur 7 bits) et représente les caractères de l’anglais[30],
y compris un certain nombre de caractères de contrôle. Il s’agit du seul
sous-ensemble commun aux codages ultérieurs.
Pour
représenter toutes les langues européennes, c’est-à-dire ses diacritiques et
l’alphabet grec, l’ASCII est étendu à un octet et code ainsi
256 caractères selon la norme ISO 8859. L’ISO 8859‑7,
correspondant à la norme ELOT 928[31],
désigne la table de codes conçue pour les caractères grecs monotoniques. Elle
comprend les lettres majuscules et minuscules, toute lettre susceptible d’être
accentuée à l’aide de l’aigu et/ou du tréma, les deux diacritiques et leur
combinaison[32]. Aucune
norme ne peut se créer pour le polytonique car cela supposerait de disposer de
233 places supplémentaires[33].
Avec
les performances des systèmes de traitement et de transmission, entre 1988 et
1991, l’organisation internationale de standardisation et le consortium W3C
introduisent le codage Unicode sur 16 bits[34] (norme
ISO 10646) : toutes les langues écrites du monde peuvent être représentées
à partir d’un jeu de caractères unique.
En
ce qui concerne Unicode pour le grec, la norme ISO 8859‑7 est
reprise des positions 0370 à 03FF avec en sus quatre signes[35],
des symboles grecs[36]
et les lettres archaïques courantes.
Par
ailleurs, un grec étendu, c’est-à-dire « précomposé » avec les signes
diacritiques déjà répertoriés, est introduit de 1F00 à 1FFF : on trouve à
ces positions toutes les accentuations possibles des caractères grecs à l’aide
du polytonique[37]. Ces deux positions non contiguës codent donc
le grec polytonique.
Eu
égard à la taille du corpus antérieur à l’institution du grec monotonique et
comme le met en évidence la pratique éditoriale actuelle, il est certain qu’il
était difficile de faire l’omission d’un codage pour le grec polytonique.
Remarque :
Ecritures non alphabétiques du grec
Les
syllabaires qui ont précédé l’écriture alphabétique du grec, en particulier le
linéaire B (IIe millénaire avant J.‑C.) et le
syllabaire chypriote (VIIe au IIIe siècle
avant J.‑C.), feront prochainement l’objet d’un codage Unicode[38].
c)
Lire et écrire du grec sous PC‑Windows
et Linux
Cette
section est rédigée dans une optique pédagogique. Afin de mettre l’outil
informatique à la portée de tout hellénisant, nous mentionnons les
configurations requises pour lire, écrire et traiter du grec sous Windows et
Linux, puis nous développons un exemple simple sous Linux.
Partie 1 : Monotonique et polytonique sous PC-Windows
i) Polices
de caractères grecs pour PC‑Windows
Toute
information sur les polices grecques figure sur le site de Denis Liégeois à
l’adresse :
http://club.euronet.be/frederique.bouras/polices.htm
La
gestion des polices TrueType[39]
sous Windows se fait via le répertoire Polices
du Panneau de configuration[40].
Deux
types de polices TrueType (fichiers .ttf) sont adaptés au grec :
-
les polices ISO 8859‑7
-
les polices Unicode.
Les
polices ISO 8859‑7 associent des glyphes aux codes informatiques
définis pour les caractères grecs monotoniques (cf. Tableau 1).
Arial Greek
|
156 Ko
|
Courier New Greek
|
210 Ko
|
Greek
|
55 Ko
|
Hellas Arial Greek
|
122 Ko
|
Hellas Courier Greek
|
80 Ko
|
Hellas Fun Greek
|
103 Ko
|
Hellas Times Greek
|
153 Ko
|
IsminiPC
|
78 Ko
|
SPIonic
|
22 Ko
|
Superismini
|
72 Ko
|
Times New Roman Greek
|
190 Ko
|
Tableau 1
: Polices True Type ISO 8859‑7
pour PC‑Windows
Les
polices Unicode, quant à elles, contiennent à la fois :
-
les glyphes correspondant au grec dérivé de
l’ISO 8859‑7 pour le grec monotonique,
-
les glyphes correspondant au grec étendu pour
les caractères grecs polytoniques.
Certaines
polices Unicode sont livrées par Microsoft (Tableau 2), d’autres avec des
logiciels spécifiques (Tableau 3).
Arial Unicode MS
|
Livrée avec
Word 2000/Office 2000
Installation via
le programme d’installation de MS Office
13 Mo
|
Palatino Linotype
|
Livrée avec
Win 2000 et XP
Installation
automatique sous Win 2000 ou XP
13 Mo
Inconvénient :
Le rhô majuscule avec esprit rude est remplacé par un rhô majuscule avec
esprit doux
|
Tahoma
|
Livrée avec Win XP
Service Pack1
|
Tableau 2 :
Polices de caractères Unicode livrées par Microsoft pour PC‑Windows
MgOldTimes UC Pol
|
Livrée avec Polytonistis
de la société « Magenta » :
http://www.magenta.gr
Inconvénient :
Son utilisation par défaut n’est pas toujours possible car le polytonique
n’est pas déclaré
|
Vusillus Old Face Italic
|
Livrée avec
Antioch :
http://www.users.dircon.co.uk/~hancock/antioch.htm
Version italique
gratuite
|
Silver Humana
|
Livrée avec le
logiciel de consultation du TLG (Thesaurus Linguae Graecae) de la
« Silver Montain Software » :
http://www.silvermnt.com/tlgdemo.htm
|
Athena Unicode
|
http://www.greekkeys.cornell.edu/#AthenaUnicode
Avertissement :
Il faut veiller à ne pas la confondre avec des polices au nom similaire
|
Code 2000
|
http://home.att.net/~jameskass
1,2 Mo
|
Titus Cyberbit
Basic
|
Livrée par la
société « Bitstream » qui s’occupe du projet « Titus » à
l’Université de Francfort, Allemagne : http://titus.fkidg1.uni‑frankfurt.de/unicode/tituut.asp
|
Tableau 3 :
Polices de caractères Unicode pour PC‑Windows
Nous
avons indiqué des polices d’utilisation courante, d’autres ont une vocation
plus spécifique, par exemple[41] :
-
Porson est adaptée au grec ancien
-
Cardo est utilisée par les hellénistes et en
particulier les médiévistes
-
Gentium est restreinte aux caractères latins
et grecs
-
Caslon est disponible sous différentes
versions pour divers types d’ordinateur
-
Monospace est une police à chasse fixe, de style
Courier
De
façon générale, il existe une correspondance biunivoque entre le glyphe d’une
police et son codage informatique. Ainsi, afin d’homogénéiser les données
téléchargées à partir d’Internet, certains logiciels proposent des conversions
de polices[42].
j) Claviers
grecs monotonique et polytonique
Sous
Windows, les pages de codes[43]
prennent en charge les jeux de caractères de différents pays en y associant un
clavier et un mode d’affichage spécifiques[44]. Elles sont automatiquement sélectionnées
lors de l’installation d’une langue[45].
A
partir de Windows 95, l’installation de la langue grecque, c’est-à-dire de la
page de codes du grec monotonique, donne accès au clavier grec monotonique
standard qui fonctionnant avec une police ISO 8859‑7
(Tableau 4).
En
sus, à partir de Windows NT, il est possible d’activer la page de codes du grec
étendu[46]
moyennant l’installation du grec polytonique. Le clavier grec polytonique
standard[47]
permet d’afficher les caractères grecs polytoniques d’une police Unicode
(Tableau 4).
Windows 95/98
Grec monotonique
|
Installation
de la langue grecque
Dans
le fichier Ajout / Suppression
de programmes du Panneau de configuration, afficher l’onglet Installation de Windows et cocher la Prise en charge multilingue. Puis, cliquer sur Détails, cocher la case en regard du grec. Redémarrer le système.
Clavier grec monotonique
Dans le dossier Clavier
du Panneau de configuration afficher l’onglet
Langues. Cliquer sur le bouton Ajouter
et sélectionner le Grec. L’installation
fait apparaître dans la barre des tâches, en bas à droite de l’écran, un menu
déroulant avec les icônes Fr et Gr,
qui permet de basculer d’un clavier à l’autre. Sous Combinaison
pour basculer entre les langues, on peut choisir
parmi deux combinaisons de touches : ALT + Maj. Gauche
ou Ctrl + Maj.
|
Windows 2000
Grec
monotonique
Grec
polytonique
|
Installation de la langue grecque
Dans les Options régionales du Panneau de
configuration,
afficher l’onglet Général, puis sous Paramètres de langue pour le système, activer la case à cocher en regard du
grec.
Installation du clavier grec polytonique
Dans le dossier Clavier
du Panneau de configuration, afficher
l’onglet Paramètres régionaux d’entrée.
Cliquer sur le bouton Ajouter et sélectionner
le Grec polytonique. Définir les
combinaisons de touches souhaitées pour basculer entre les langues. L’icône El
s’ajoute dans la barre des tâches et permet également de basculer vers le
clavier installé.
Remarque :
On procède de la même manière pour installer le clavier grec monotonique,
également symbolisé par l’icône El
dans la barre des tâches. Pour éviter toute confusion entre les deux
claviers, leur nom respectif figure à droite de chaque icône.
|
Tableau 4 :
Principes généraux d’installation de la langue grecque et des claviers grecs
sous PC‑Windows
Remarques :
Le
clavier monotonique permet d’écrire tous les caractères attendus sauf le point
médian[48].
Denis
Liégeois propose des pilotes AZERTY facilitant grandement la frappe des accents
du système polytonique à l’adresse suivante :
http://club.euronet.be/frederique.bouras/polices.htm
k)
Edition sous PC‑Windows
L’édition
du grec monotonique est aisée, une fois le clavier Windows installé.
Signalons
qu’une liste de correction orthographique du grec moderne pour Word est
disponible à l’adresse :
http://www.info-grece.com/download.php?op=geninfo&did=4
Ses
caractéristiques sont les suivantes :
Word97grec.zip
|
1,42 Mo
Versions pour Win 95 et
Word 97 ou Win Me/2000 et Word 2000
Installation
dans C :\Fichiers programmes\Fichiers communs\MicrosoftShared\Proof
|
A
partir de Windows NT, l’édition du grec polytonique ne pose pas plus de
difficultés moyennant l’installation du clavier grec polytonique et du pilote
AZERTY de Denis Liégeois.
Pour
information, sous Windows 95/98, avant que la norme Unicode n’ait cours,
le polytonique s’obtenait à l’aide de macros ou d’utilitaires. Par la suite,
des programmes ont permis l’utilisation de polices Unicode (Tableau 5).
Sous
Windows 2000, l’affichage d’un caractère non accessible par le clavier
dans un logiciel actif s’obtient par la pression simultanée de la touche ALT et
du code décimal de celui-ci. Cette manipulation dépend des paramètres régionaux
d’entrée en cours.
Avant Unicode
|
Modèle
de document Word grec_msm (75 Ko)
Programme
dans lequel sont enregistrées des macros et qui permet d’alterner entre les
claviers grec et français à l’aide d’un bouton.
Site :
Académie de Toulouse
http://www.ac‑toulouse.fr
Police : Greek.ttf
Grekedit (48 Ko)
Editeur
pratique pour les débutants qui permet la sélection des caractères grecs de
visu et le transcodage entre trois polices.
Site : Académie de Toulouse
http://www.ac‑toulouse.fr/lettres/eulalie/grekedit.htm
Polices : SPIonic, Greek et Athenian
clavgrec.exe (437 Ko)
Utilitaire
faisant usage de Keyman (société
« Tavultesoft »).
Site :
Facultés Universitaires Notre-Dame de la Paix
http://www.fundp.ac.be/~ppietqui/clavgrec.htm
Polices
: IsminiPC,
et Wingreek
Remarques :
Keyman est distribué gratuitement par le SIL
(Summer Institute of Linguistics).
Une version récente de ce programme pour
Win NT/2000/XP, clavgrec2.exe (547 Ko), est adaptée aux
polices Unicode.
|
Avec Unicode
|
inputter2.chm
Utilitaire qui permet de frapper les
caractères grecs polytoniques à partir d’un tableau.
Site :
http://users.ox.ac.uk/~tayl0010/html_help.html
Police : Titus Cyberbit Basic
etc.
Antioch
Utilitaire
conçu par Ralph Hancock
Site :
http://www.users.dircon.co.uk/~hancock/antiochg.htm
Police : Vusillus Old Face
Remarque – Réglage des macros :
Sélectionner le niveau de sécurité Moyen ou Haut.
|
Tableau 5 : Moyens d’édition du
polytonique sous Windows 95/98
Partie 2 : Monotonique et polytonique sous Linux
i) Polices
de caractères grecs, impression
Sous
les systèmes Unix, en particulier les plate-formes X11,
tout utilisateur peut installer des polices grecques. Plusieurs sites en
proposent, parmi lesquels les trois suivants :
a)
Hr-Net (Hellenic Resources Network) : http://www.hri.org
b)
Graphis, projet d’Hellug : http ://graphis.hellug.gr[49]
c)
GNU enscript par Manolis Lourakis : http://www.csd.uch.gr/~lourakis/genscript
Pour
manipuler les polices, voici quelques commandes utiles sous Unix :
oddo
|
Copie
par séquence chaque fichier d’entrée vers la sortie standard en transformant
la donnée d’entrée selon le type de sortie spécifié par les options
|
xlsfonts
|
Pour
lister les polices de caractères disponibles
|
xfd –fn font
|
Pour
visualiser une police de caractère complète
|
xfontsel
|
Pour
choisir une police par étapes successives en cliquant avec la souris sur les
différents champs composant le nom de la police[50]
|
xdpyinfo
|
Affiche
toutes les informations connues, en particulier la définition en point par
pouce
|
Les caractéristiques d’un client X11 sont
représentables par un arbre dans lequel chaque feuille, appelée ressource, est
paramétrable au gré de l’utilisateur.
a) La collection de polices d’Hr-Net
est recommandée pour Mosaïc et Netscape.
En outre, le site d’HR-Net liste
d’autres polices (GreekXfonts, polices postscripts etc.).
Nous détaillons maintenant
l’installation des polices de Graphis.
b) Graphis
Au préalable, signalons que Perl
et les commandes usuelles (dirname, expr)
doivent être installés.
Après avoir téléchargé le package .rpm
ou sa version compressée .tar.gz, installer les package
à partir du répertoire sauvé :
rpm
–Uvh xfntgr-*.rpm
Le
cas échéant, on peut procéder manuellement :
1.
Décompresser le fichier xfntgr-xx-xx.tar.gz,
renommer le fichier xfntgr‑xx
en hellas,
et le déplacer vers :
/usr/X11R6/libX11/fonts/
2. Dans le répertoire hellas,
exécuter le fichier graphis. Les polices sont
alors installées dans le path d’XF86Config.
Polices TrueType
Remarques préliminaires :
-
A moins de disposer de la version 4.0.x
d’X-Window, il faut se procurer un serveur de polices TrueType, en
l’occurrence xfsft :
http://www.dcs.ed.ac.uk/home/jec/programs/xfsft/
-
De même, l’application ttmkdir
doit être installée.
Pour installer les polices TrueType
usuelles de Windows, on procède comme suit :
1. Dans
/usr/X11R6/lib/X11/fonts,
créer un dossier destiné au rangement des polices TrueType[51].
Arbitrairement nous l’appelons ttf.
2. Exécuter
la commande ttmkdir –o fonts.dir, se créera le
fichier fonts.dir qui contiendra toutes les polices
installées.
3. Maintenant,
il s’agit d’ajouter le répertoire /usr/X11R6/lib/X11/fonts/ttf
dans le Fontpath d’X-Window.
De deux choses l’une :
a)
Si le serveur X de polices (xfs)
est installé :
-
Ouvrir le fichier config
qui se situe dans le répertoire /etc/X11/fs
à l’aide d’un éditeur de texte.
-
Dans "catalogue
=", ajouter le chemin du répertoire.
-
Puis, redémarrer le système.
b)
Si xfs n’est pas installé :
-
Ouvrir la version XF86Config
adéquate (ex. /etc/X11/XF86Config ou /etc/X11/XF86Config-4)
-
Dans Files,
ajouter la ligne suivante :
Fontpath /usr/X11R6/lib/X11/fonts/ttf
Les polices de caractères installées,
l’ajout des paramètres suivants dans la ligne de commande permet généralement
un affichage correct des polices grecques sous X :
-fn
ou
–font sc-elot14
Remarques :
-
Si la commande xset fp+
donne un message d’erreur comme parameter out of range
ou opcodes of failed request alors que le pathname
et les droits de l’utilisateur sont corrects, c’est que les polices sont
chargées dans le terminal par un autre serveur.
-
L’utilisation d’AFS
(Andrew File System), remote login et NIS pose
de problèmes similaires
-
Pour les stations Sun anciennes, il faut
recourir au manuel d’openwindows.
c)
GNU enscript (version 1.5.6)
par Manolis Lourakis
GNU
enscript permet l’impression des caractères ISO 8859-7 : il convertit les
fichiers ASCII en fichiers PostScript. Il contient les fichiers AFM (Adobe Font
Metrics). Les polices à installer (dans /usr/local/share/enscript/greek/)
se trouvent à l’adresse suivante :
http://www.csd.uch.gr/~lourakis/genscript/fonts.tgz
Pour
indiquer à GNU où se trouvent les polices, de deux choses l’une :
1- Editer le fichier enscript.cfg
et aller dans la ressource AFMPath. Ajouter le path
entier dans le répertoire dans lequel les polices ont été décompactées :
AFMPath:
usr/local/share/enscript:/usr/local/lib/ps:/usr/lib/ps:/usr/local
2- Pour une utilisation personnelle,
éditer le fichier ~/.enscriptrc et ajouter dans
AFMPath, le path de polices :
AFMPath:/home/grads/lourakis/morefonts:/usr/local/share/
enscript/greek
Pour imprimer un texte grec, par
exemple ~/greek.txt, on utilise alors la commande :
Enscript
–v –X 88597 ~/greek.txt –f TimesNewRoman-ISOLatinGreek10 –o /tmp/greek
Dans
laquelle :
-X indique l’encodage du document
-f
spécifie le nom et la taille de la police
88597
peut être remplacé par greek
Cette commande a pour effet de convertir
le fichier texte en fichier PostScript : /tmp/greek.ps.
j) Versions
grecques d’outils unixiens
Emulateur de terminal
gterm
|
Edition
grecque d’xterm
|
rxvt
|
Solution
recommandée
|
vi en grec
L’éditeur
standard vi, commun à tous les systèmes Unix, se présente
sous diverses répliques sous Linux dont les plus courantes sont :
- nvi :
imitation fidèle de vi
- elvis :
version améliorée de vi qui peut afficher les textes HTML
- vim (vi
improved) : comporte des possibilités de programmation
Il
existe un vi en grec (cf. guide d’utilisation dans
le fichier viH.1 man page), et aussi un viH de A. Moschovou fondé sur vim.
emacs
Greek-mode
de
S. Kapidakis pour emacs
19.34 : greek-mode.el
|
-
Le clavier bascule à l’aide de la
combinaison de touches ESC-G
-
Indiquer standard-display-european
La commande suivante charge
automatiquement le fichier : load
« /yourpath/greek-mode » nil t
Sous Xemacs, qui du reste intègre des polices Unicode,
il faut ajouter à la suite de provide ‘greek-mode, du prg greek-mode.el (à
renommer xgreek-mode.el) la ligne de cmd suivante :
defvar
standard-display-table nil " "
|
CGreek
|
Voir
l’exemple traité en k)
|
GreekTeX[52]
On
pourra consulter le site du CTAN (Comprehensive TeX Archive Network), qui
comprend toutes les informations sur TeX (polices, documentation).
Sous
(La)TeX, il est possible de composer du grec polytonique à l’aide de l’option greek
du package Babel dont l’utilisation est détaillée par
A. Syropoulos.
k) Un
exemple de traitement sous emacs
emacs
propose un langage de programmation dérivé de Lisp pour la programmation
d’extensions qui permet une personnalisation de l’éditeur en fonction des
besoins des utilisateurs. Il existe ainsi des options qui facilitent le
traitement du grec ancien en libre accès. Nous présentons ici une utilisation
de l’outil CGreek.
Description,
mode d’installation
CGreek et
son manuel de référence[53]
se trouvent à l’adresse suivante :
http://m17n.org/cgreek/
Le
but du projet CGreek est de créer un environnement pour
traiter des documents en grec ancien. Il sert à afficher,
saisir et modifier des textes.
Il est possible de lire et d’enregistrer des fichiers codés au
format TeX grec
ancien (ex. Ibycus4 par
Pierre A. MacKay) et de lire les fichiers provenant du site TLG (Thesaurus
Linguae Graecae).
Remarque : Comme GNU Emacs en soi est multilingue, toutes les
langues qui sont prises en charge par GNU Emacs peuvent coexister avec le grec
ancien.
Utilisation
du CD-ROM du TLG
Une
des fonctions essentielles de CGreek consiste à
rapatrier et rendre exploitables les corpus issus du CD-ROM du TLG ( Thesaurus
Linguae Graecae).
1-
Principe de fonctionnement et installation des options
Le
cédérom du TLG utilise la méthode de translittération beta
code. Le programme tlg2emacs
convertit le beta code en représentation interne. Pour ouvrir
un fichier issu du TLG, emacs appelle tlg2emacs
et ouvre dans une fenêtre le texte converti. Pour extraire des citations, il
utilise tlg2cit.
Installer
et compiler tlg2emacs et tlg2cit
avec make, ou lex[54].
N.B. :
tlg2emacs ne tient pas compte de certaines informations
comme la taille des caractères, symboles non usuels etc.
Il
est alors possible d’élaborer son propre outil (cf. customising TLG).
2-
Lecture des fichiers du TLG
Le
cédérom doit être monté dans le répertoire /cdrom
et être accessible à l’aide de pathname comme /cdrom/authtab.dir.
Si nécessaire, ajouter dans ~/.emacs la ligne
suivante :
setq cgreek-tlg-directory
"/your/tlg/cdrom/directory/"
Le
volume utilisé par défaut est E, pour utiliser le volume D, ajouter la ligne de
commande :
setq
cgreek-tlg-cdrom-version "D"
Sélectionner
le menu CGreek &rarr ; Open File &rarr ; TLG
Format qui ouvre une liste d’auteurs dans le buffer
*TLG authtab* (Figure 1).
Sélectionner
la liste des œuvres d’un auteur avec la souris ou en utilisant la touche
entrée. Celle-ci apparaît dans *tlg????.idt*, où
???? sont les chiffres attribués à un auteur (Figure 2).
Sélectionner
un titre à l’aide de la touche ou avec la souris.
Il est possible de travailler à
l’aide de plusieurs buffers. Dans le mini buffer *TLG
citation* est indiquée la position du curseur (Figure
3).
Remarque :
Indiquons les fonctions de trois
touches :
-
a permet de retourner à la liste
d’auteurs *TLG authtab*
-
w permet de retourner à la liste
d’ouvrage de l’auteur en cours de consultation *tlg ????.idt*.
-
q dans le *TLG authtab*
tue le buffer en cours.
3-
Saut à l’aide d’un index
La
touche j, pour l’anglais « jump »,
est programmée à cet effet.
emacs
demande de spécifier une position de page, de section ou de ligne selon la
manière dont le texte se présente. A la suite de quoi, il se positionne
automatiquement au début du texte spécifié (Figure 4).
Pour
quitter, faire C-g.
4-
Conversion manuelle de beta code dans le buffer
Si celle-ci n’est pas automatique,
aller dans Cgreek &rarr ; Convert Region &rarr ;
TLG to CGreek à partir de la barre des menus. Pour convertir
tout le buffer, sélectionner la région pour tout le buffer.
Figure 1 : Liste d’auteurs du
TLG dans le buffer *TLG authtab*
Figure
2 : Liste des œuvres de Platon dans le buffer *tlg0059.idt*
Figure
3 : La position du curseur dans le texte est indiquée dans le buffer *TLG
citation*
Figure
4 : Saut demandé avec la touche j
3- Corpus
et outils sur Internet
L’objectif
de cette partie est de présenter quelques sites publics présentant de riches
ressources concernant le grec ancien, byzantin ou moderne (corpus
téléchargeables, outils de traitement automatique en ligne etc.).
a) Affichage
du grec sous Internet
L’échange
des données textuelles repose sur des représentations logiques fondées sur la
norme SGML : c’est la cas de HTML qui sert aux documents diffusés sur le
Web[55]
Bien
que la norme Unicode intègre un système de codage complet pour le grec,
celle-ci n’est que rarement utilisée, et les sites en grec sont souvent créés à
l’aide de polices non Unicode.
L’affichage
des pages Internet en grec monotonique se déroule généralement sans difficultés
majeures, notamment sous les versions récentes d’Internet Explorer.
L’affichage
du grec polytonique est moins aisé dans la mesure où bien souvent les sites
sont confectionnés à l’aide d’une police non Unicode.
Leur
téléchargement est proposé. Généralement, les polices sont directement
utilisées par le navigateur.
Néanmoins,
un réglage est parfois nécessaire. Globalement, on procède comme suit :
|
Internet
Explorer 5.5
|
Netscape
4.5
|
Police ISO 8859-7
|
Aller dans Affichage,
puis dans Options et Codage/Plus/grec
(ISO) ou Grec (Windows)
|
Choisir
le menu Options, puis Grec
(Iso) dans Encodage du document
N.B. :
Avec
Netscape 2.0, il est conseillé de travailler avec une police à chasse fixe (Sgfixed.ttf)
en allant dans Options/Préférences Générales/Polices
et sélectionner Sgfixed.ttf
|
Police Unicode
|
Aller
dans Affichage/Codage/Unicode (UTF-8),
puis dans Outil/Options/Général/Polices,
sélectionner :
- Jeu de caractères : alphabets dérivés du latin
-
Police de pages Web : choisir une police Unicode (cf.
Tableau 2)
|
|
Tableau 5 : Paramètres
d’affichage des pages Internet en grec sous PC-Windows
Netscape
|
-
Ajout de l’un des paramètres suivants
à la ligne de commande :
–fn
ou –font sc-elot14
-
Ajouter dans le fichier de ressources netscape.rsrc,
les lignes du type *documentsFonts.latin1.fixed*family :
hrtt, puis le charger
dans le serveur X à l’aide de la fonction xrdb :
xrdb –merge netscape.rsrc
(Pour
éviter de réécrire cette ligne de commande à chaque opération, on peut
l’intégrer dans .xinitrc ou dans app-defaults)
|
Remarque : Courrier
électronique
Outlook Express
(version 5.5)
|
Pour
taper du grec, on peut se servir d’un clavier virtuel (ex. inputter2.chm).
Dans le cas de plusieurs identités, il faut choisir l’identité sous laquelle
on souhaite envoyer le message en grec ancien.
Choisir alphabet international,
alphabet universel, Unicode,
UTF-8. Dans Outils/Options,
choisir l’onglet Envoyer, décocher la case
répondre aux messages dans le format d’origine.
Cliquer sur paramètres internationaux, choisir Alphabet
occidental (ISO).
Attention : Ne pas modifier l’encodage par défaut.
A
la rubrique format d’envoi des news,
sélectionner texte brut, puis cliquer sur
paramètres de textes bruts. Cocher MIME
et, très important, à la rubrique coder le texte en utilisant,
choisir Aucun. Cliquer sur Envoyer
comme message Unicode.
|
Nestcape Messenger
|
Aller
dans les rubriques Aspect/Police dans Pour
l’encodage, sélectionner Unicode.
Dans Courrier et forums, choisir
une police vectorielle, puis dans Formatage,
sélectionner Utiliser un éditeur HTML. Dans le
cadre lorsque j’envoie en message au format HTML,
choisir me demander ce qu’il faut faire.
Dans
le message lui-même, on a recours à Affichage/Encodage/Unicode (UTF-8)
ou Occidental (ISO-8859-1)
|
Unix
|
Pour
lire ou écrire du courrier en grec dans un terminal xterm
ou xrvt de Linux, les programmes usuels utilisés
sont pine, elm,
mail.
La combinaison de touche Alt Gr
permet d’écrire en grec.
Lorsque les programmes ouvrent leur propre X-Window,
par exemple mail, tool
ou exmh, l’écriture des accents peut poser des
difficultés sous X11R6.
Pour définir des correspondances entre les caractères et
le clavier, on utilise la fonction Xmodmap.
Deux fichiers, l’un pour l’alphabet latin, l’autre pour l’alphabet grec, sont
nécessaires.
Ensuite, il s’agit de faire fonctionner xmodmap
avec le clavier adéquat sous windows manager – ou définir une combinaison de
touches pour changer d’alphabet.
Le cas de fvwm
peut être résolu en ajoutant deux fichiers pour Xmodmap
et le clavier PC.
Pine
semble être le programme qui fonctionne le mieux.
Note : En raison de l’origine américaine du réseau,
les places inutiles pour la langue anglaise (128 places dans la table de
chars anglaise), sont utilisées comme chars de contrôle. Ainsi, bien souvent,
les « portails » transforment le 8e bit en 0 et
transmettent le message avec un stripped high bit.
C’est pourquoi il existe un uuencode
plus ancien et désormais MIME, qui transforme
les messages de chars de 8 bits dans une représentation que les gateways
ne peuvent modifier.
Tous les programmes actuels font cette opération (pine,
elm) tant à l’envoi qu’à la réception du
message (ce n’est pas le cas de mail ; elm
appelle un prg extérieur appelé metamail
qui exploite des fichiers codés par MIME
– pine a intégré cette possibilité et serait le
meilleur programme à cette heure.
|
b) Moteurs
de recherche
Les
moteurs de recherche à vocation internationale permettent la recherche de
lemmes en grec moderne. Seul le monotonique est accepté.
Pour
effectuer une recherche plus spécifique, il est conseillé de se connecter à un
moteur de recherche couvrant le réseau grec. Dans le tableau ci-dessous, nous
mentionnons les moteurs et annuaires les plus fréquemment usités.
Arachne
|
Moteur
chypriote : http://search.kypros.org
|
Ariadne
|
Sur le site
Hellenic Greek N.A.O.S. (Network Acquisition Online Service) : http://hellas.ariadne-t.gr
|
Fantis
|
Basé aux
Etats-Unis, présente en grec ou en anglais un annuaire des sites grecs dans
le monde, ainsi que des dépêches d’actualité. Son adresse est http://www.phantis.gr
|
FindLink
|
annuaire grec
accessible en grec ou en anglais. On le trouve à l’adresse http://www.findlink.gr
|
FORTHNET
|
http://www.forthnet.gr »,
est un moteur de recherche que l’on peut utiliser pour le grec + carte
interactive de la Grèce
|
GoGreece
|
basé en
Californie, il présente un annuaire grec, ainsi que des dépêches d’actualité.
Son adresse est « http://www.gogreece.com
|
Greek Indexer
|
annuaire grec
accessible en grec ou en anglais
|
Greek Spider
|
moteur greco-chypriote
|
HellasYellow
|
L’annuaire
téléphonique du réseau des télécommunications grec
|
HRI
|
est un moteur de
recherche présentant des liens vers de nombreuses ressources Internet en grec
|
LinkHellas
|
dont la présentation
est en anglais, donne accès à un annuaire
|
WebIndexer
|
est basé sur la
région d’Athènes et présente un annuaire grec et international.
|
c) Les
corpus en ligne[56]
Nous
présentons un site caractéristique de chaque période historique de la langue
grecque.
Le grec
ancien : Perseus
|
Le site Perseus est le site actuel présentant les
ressources les plus riches pour le grec ancien (dictionnaire, corpus etc.).
Il fut lancé en 1987 sur l’initiative de la Tufts University. Son adresse est
la suivante « http://www.perseus.tufts.edu ».
La police de caractères utilisée sous Perseus est Sgreek,
une police à chasses fixes.
Il permet de lire et d’imprimer tout texte grec ancien
de sa base de données.
La section Primary Text Index : Greek
met à disposition environ 280 textes grecs classiques, avec l’analyse
morphologique de certains mots et une traduction anglaise. De nombreux outils
de traitement sont disponibles en ligne : à titre d’exemple, les données
sont indexées et structurées de telle manière que des recherches d’occurrence
sont réalisables sur l’ensemble du corpus. L’entrée du mot doit être écrite
en « Beta Code » (la liste des correspondances grec / Beta Code est
fournie) et les résultats sont donnés en grec. Une recherche au nominatif
donne les occurrences pour tous les cas.
Il est facile de récupérer les textes sous Perseus par
Copier/Coller. Pour une appréciation sur la variation de qualité des
caractères voir http://perso.wanadoo.fr/jacques.mauger/langanc.html.
N.B. :
De nombreux sites français, dont celui de l’Académie de Toulouse (http://www.ac-rouen.fr/pedagogie/equipes/lettres/articles/edigrec.html ),
fournissent des informations sur l’utilisation de Perseus.
N.B. :
Le Thesaurus de la langue grecque de l’Université d’Irvine est un site
extrêmement riche.
|
Le grec tardif : Bible Windows Software
|
Ce site spécialisé dans les éditions de la Bible, se
trouve à l’adresse http://www.silvermnt.com/bwinfo.htm/.
Il fournit des outils de recherche a) sur le Nouveau
Testament (analyses grammaticales et syntaxiques, indications
lexicologiques, concordances etc.), b) sur le texte des Septantes
(dictionnaire, analyse grammaticale) et met à disposition deux dictionnaires
de langue grecque : le Liddell-Scott tronqué[57]
et un dictionnaire grec / anglais de 1 200 pages organisé selon 90 domaines.
Un lien vers la librairie grecque classique (Silver Classical Library) est
également accessible.
Remarques utiles :
-
Le logiciel « Logos » permet de travailler sur trois niveaux et de
visualiser toutes les définitions d’un mot figurant sur le site (recherche
dans tous les dictionnaires).
-
Les résultats des concordances sont fournis dans le format texte, et sont
lisibles sous un éditeur de textes quelconque.
-
Ce site utilise la norme Unicode 2.
|
Le grec
moderne : Thesaurus de la langue grecque moderne
|
L’Institut de Traitement des Langues d’Athènes met à
disposition une collection de textes en langue grecque moderne constituée à
partir de différentes sources (journaux, périodiques, livres etc.) et classée
par genre et par thème[58].
Il est possible de rechercher un lemme sous toutes ses
formes déclinées ou conjuguées parmi celles qui sont référencées (20 000 000
en tout).
Les
résultats apparaissent dans leur contexte et la fréquence d’apparition du
lemme est indiquée pour chaque texte.
N.B. :
En ce qui concerne les ressources sur la langue grecque moderne, on pourra
consulter les signets de la Bibliothèque Nationale de France à l’adresse http://www.bnf.fr/web-bnf/liens/d4/sle/grecmod-sle-d4.html.
|
d) Les
dictionnaires
Nous
présentons ici des dictionnaires à vocations très diverses (historiques,
synchroniques, lexiques etc.).
Dictionnaire
historique
|
Le
Liddell-Scott est disponible en ligne sur le site Perseus.
Si
les dictionnaires de grec ancien se font rares, le Liddell-Scott est néanmoins
le dictionnaire le plus sûr et le plus complet dont on dispose pour le grec
puisque les éditions critiques modernes y sont intégrées, de même que les
textes papyrologiques et épigraphiques récemment découverts[59].
Les termes répertoriés émanent des textes les plus anciens au texte du
Nouveau Testament.
|
Dictionnaires à
vocation générale
|
Eurodicautum
et DictSearch permetttent de traduire des termes de plusieurs langues
sources vers différentes langues cibles (dont le grec et le français).
|
Dictionnaire multilingue
de termes spécialisés (économiques, scientifiques, juridiques etc.)
|
Eurodicautum
service
de traduction de la Commission européenne
http://eurodic.ip.lu/cgi-bin/edicbin/EurodicWWW.pl
(allemand,
anglais, danois, espagnol, finois, français, grec, hollandais, italien,
portugais et suédois) et le latin.
|
Dictionnaire,
moteur de recherche
|
DictSearch
http://foreignword.com/Tools/dictsrch.htm
En
outre ce site, créé par Stephan Böhmig et Alberto Fontaneda, contient un
moteur de recherche dans 132 dictionnaires de langues (56 langues sources et
58 langues cibles).
|
Lexique, outils
pédagogiques
|
1-
Freelang : dictionnaire grec (321 Ko) fonctionne sous une plate-forme
Windows 1995/1998 avec une liste de 2316 mots grec / français et 3150 mots
français/grec
http://www.freelang.com/freelang/dictionnaire/grec.html
2-
Eulalie : Le logiciel Eulalie peut être téléchargé à l’adresse
« http://www.ac-toulouse.fr/lettres/eulalie/eulalie.htm ». Réalisé
sous Toolbook, il présente des fiches de vocabulaire classées (environ trente
fiches de vingt mots) ; on peut créer des fiches personnelles, ou
modifier les fiches fournies. On y trouve enfin la traduction instantanée de
1 000 mots grecs.
|
Bases
de données : Systran et Intertran
Systran
Babelfis et Intertran ™ constituent les bases de données les plus utilisées
dans la traduction automatique des textes grecs.
Les
corpus ou les dictionnaires pour le grec ancien et moderne abondent, ainsi que
les outils les accompagnant (analyses morphologiques, statistiques, corrections
orthographiques, traductions). Seuls les textes byzantins en langue démotique
ne sont pas représentés sur la toile.
Conclusion
Ce parcours des ressources et des outils
informatiques nous montre que de la même manière que le polytonique a perduré
plus par tradition que par nécessité, les habitudes liées à l’utilisation des
polices anciennes n’ont pas encore disparu.
La généralisation que nous espérons imminente
de la norme Unicode, devrait permettre de résoudre un bon nombre de problèmes.
Pour ce qui concerne les ressources en ligne,
nous constatons une richesse de données pour le grec ancien, tardif et moderne,
mais qu’un corpus de textes byzantins fait cruellement défaut.
L’obtention d’un codage uniforme permettra de
mener à bien une étude en diachronie. Pour étudier un stade particulier de la
langue dans l’optique d’une édition critique, des outils de plus en plus
efficaces devraient apparaître. Bien sûr, l’intervention de l’utilisateur sera
nécessaire pour choisir une position face à certains problèmes de querelles
linguistiques.
Ainsi, pour un traitement statistique d’un
corpus de données en langue démotique, nous sommes d’avis qu’un seul accent
suffit, du moins à partir du grec byzantin, dans la mesure où l’utilisateur
connaît les données, les formes, et sait les interpréter en contexte.
Remerciements
Ce
travail a été réalisé sous la direction de M. André Salem et M. Serge Fleury à
qui nous exprimons notre plus vive reconnaissance.
Références
bibliographiques
BALLY
C., Manuel d’accentuation grecque, Berne, A. Francke, 1945, 129p.
DREGGER-CAPPEL
E., ESSER H. G., GUTMAN M., LANNERT D., SOWA F., Linux, Micro Application : Grand Livre, 1997
GARDE
P., L’Accent, Paris, P.U.F., 1968
HABERT B., FABRE C., ISSAC
F., De l’écrit au numérique (constituer, normaliser et exploiter les corpus
électroniques), Paris, InterEditions, 1998
HABERT B., NAZARENKO A. et
SALEM A., Les linguistiques de corpus, Paris, Armand Colin, 240p.
JANNARIS A.N., An
Historical Greek Grammar, chiefly of the Attic dialect, Londres, éd. Macmillan,
1897, 737p. (reprint 1987, Georg Olms : Hidelsheim, Zürich and New York)
LEJEUNE M., Précis d’accentuation grecque, Paris,
Hachette, 1945
LIDDELL H.G., SCOTT R., A Greek-English Lexicon,
9e éd. Revue par JONES H.S., 1940, 2111p., Oxford,
1996, 2378 p
MIRAMBEL
A., La langue grecque moderne. Description et analyse, Paris,
Klincksieck, 1959, « L’Accent », pp. 25-38
TONNET
H., Histoire de la langue grecque, L’Asiathèque, Paris, 1993, 189p.
TONNET
H., Manuel d’accentuation grecque moderne (démotique), Paris,
Klincksieck, 1984, 111p.
VENDRYES
J., Traité d’accentuation grecque, Paris, Klincksieck, 1929, 275p.
Notes
[1]
Dans cet article, il est fait usage de la police Unicode Palatino
Linotype qui permet de transcrire aussi bien le
français que le grec ancien, tardif, byzantin ou moderne de nos exemples.
[2]
Le tréma (gr. trêma « trou, points sur un dé »), trop
souvent oublié, fait également partie intégrante du système d’accentuation
grecque.
[3]
On trouve les lois d’accentuation du grec ancien dans M. Lejeune (1945), J.
Vendryes (1929) et P. Garde (1968) et celles du grec moderne dans H.
Tonnet (1984).
[4]
A l’intérieur d’un mot, un groupe de deux ρ s’écrit sous la forme «ῤῥ»
ou plus simplement « ρρ ». Concernant l’aspect historique de
cette notation voir Jannaris (1897), §64.
[5]
En ionien, l’aspiration initiale s’étant amuïe, le heth (H) de l’alphabet
cananéen notait un [ε]
ouvert long. Après l’adoption de l’alphabet ionien en 403 av. J.-C., comme
l’aspiration initiale avait toujours cours en attique, la partie gauche du H a
finalement été utilisée pour indiquer une aspiration (esprit rude) et sa partie
droite l’absence d’aspiration (esprit doux).
[6]
Avec l’usage, il remplace uniquement l’aigu sur la dernière syllabe d’un mot,
sauf lorsque le mot est suivi d’un signe de ponctuation ou qu’il est cité
isolément.
[7]
Pour les majuscules, l’iota est de préférence adscrit.
[8]
Cf. glossaire Unicode 3.2.
[9]
Ce phénomène (ψίλωσις,
psilosis) avait
déjà eu lieu à l’époque classique pour l’ionien (cf. note 5).
[10]
Dès le IIe siècle naît le courant atticiste qui touche les intellectuels païens, puis les
Pères de l’Eglise au IVe siècle. L’Empire Romain d’Orient adopte le
grec atticiste comme langue administrative.
[11]
On entend par « grec médiéval » la langue vulgaire de l’époque
byzantine au XVIIe siècle.
[12]
C’est le cas pour l’adjectif et certains génitifs pluriels dont l’accent
descendait d’une syllabe en attique, et aussi pour quelques génitifs singuliers
de la deuxième déclinaison. Par analogie avec les autres personnes, les formes
passées du verbes tendent également à se figer.
[13]
Elle est sensible dans les subjonctifs à aoristes seconds qui tendent à
s’accentuer sur la finale probablement sous l’influence analogique des
infinitifs correspondants. De même, les proclitiques sont paroxytons avant de
devenir monosyllabiques. Enfin, dans des paroxytons comportant une diphtongue
descendante, une synizèse se produit occasionnellement, ce qui entraîne
l’oxytonaison. Ce type de synizèse devient régulier au XVIIe siècle.
[14]
Cf. Tonnet (1993), chapitre VIII.
[15]
Cf. Tonnet (1993), chapitre VIII.
[16]
Le résultat de la coexistence de deux niveaux de langue est aujourd’hui la
constitution d’une langue naturellement mixte.
[17]
Nous pensons à Odysseas Elytis, prix Nobel de Littérature.
[18]
L’orthographe historique désigne la façon d’écrire une langue correspondant à
un état ancien de sa prononciation.
[19]
Les conventions se fixeront davantage
avec le début de l’impression.
[20]
Si le digamma est attesté dans des documents grecs archaïques et dialectaux, ce
n’est pas le cas du yot, qui n’apparaît que dans les reconstitutions de racines
indo-européennes.
[21]
Pour l’histoire de ces signes et de leur dénotation, on pourra consulter
Jannaris (1897), pp. 168-169, §616‑618. Ils existent aussi en
minuscule.
[22]
Le signe numéral grec se place en haut à droite d’un groupement de lettre dont
la valeur est inférieure à mille, tandis que le signe numéral souscrit grec se
note en bas à gauche de la première lettre d’un groupement dont la valeur est
supérieure à mille.
[23]
Bien entendu, les majuscules et les minuscules.
[24]
Les diacritiques apparaissent isolément lorsqu’ils précèdent une majuscule
initiale.
[25]
Dans la suite, nous n’insisterons pas sur les codages qui relèvent de l’ASCII
classique (chiffres, espaces, caractères de contrôle).
[26]
L’International Organization for Standardization, dont le
nom de la norme ISO est calqué sur le grec ἴσος (isos,
« égal »), est une fédération mondiale
d’organismes nationaux de normalisation dont font partie l’Association
Française de NORmalisation (AFNOR), l’American National Standard Institut
(ANSI) et l’organisme grec de standardisation ELOT (Ελληνικός
Οργανισμός
Τυποποίησης,
Ellinikos organismos typopoiisis).
[27]
Du point de vue linguistique, la date choisie est arbitraire. A cette norme
correspondent les fichiers LANG_GREEK sous Windows, langGreek (monotonic) et
langGreekPoly sous Macintosh.
[28]
Nous pensons en particulier à la Bibliothèque Nationale de France et à la
Bibliothèque Universitaire des Langues Orientales à Paris.
[29]
L’inconvénient majeur de la translittération tient à ce qu’elle ne peut rendre
compte des évolutions phonétiques du grec.
A titre d’exemple, la lettre « Η, η » translittérée en i long,
dénotait un e long ouvert en attique, et un i à partir du IIIe
siècle lorsque les quantités de voyelles ont disparu (voir Lejeune (1945)). Ce
genre d’ambiguïté peut poser des problèmes aux néophytes dans la recherche d’un
titre.
[30]
Si des variantes nationales sont apparues, la norme s’est fixée sur le standard
américain en 1988.
[31]
L’ELOT (Ελληνικός
Οργανισμός
Τυποποίησης,
Ellinikos organismos typopoiisis) est l’organisme grec de
standardisation (cf. http://www.elot.gr).
[32]
Il ne manque que le point d’interrogation grec (;).
[33]
En l’occurrence, les lettres accentuées, les diacritiques et leur combinaison.
[34]
Parmi les 65 536 codes de caractères Unicode disponibles, environ
39 000 ont été affectés dont 21 000 pour les idéogrammes chinois. Les
combinaisons restantes demeurent disponibles pour les extensions futures (voir
le Plan Multilingue Complémentaire d’Unicode).
[35]
Il s’agit du signe numéral grec, du signe numéral souscrit grec, de l’iota
souscrit et du point d’interrogation grec.
[36]
Il s’agit des variantes de formes des les lettres utilisées comme symboles
mathématiques.
[37]
Les diacritiques des langues sont tous regroupés de 0300 à 036F. Pour le grec,
on trouve séparément les dix
diacritiques de la partie 1 et la combinaison de l’aigu et du tréma (onze codes
au total).
[38]
Unicode 4.0 devrait intégrer le linéaire B et ses idéogrammes, le syllabaire
chypriote, ainsi que les nombres égéens (cf. Plan Multilingue Complémentaire
(PMC)).
[39]
La technologie Acrobat permet à des réseaux hétérogènes ou des machines
distantes de partager les mêmes documents électroniques. Nous n’entrerons
pas ici dans les détails des polices PostScript.
[40]
Pour des indications sur leur mode d’installation, voir l’aide de Windows.
[41]
On pourra se référer au site de Denis Liégeois pour les descriptions et
adresses de téléchargement de ces polices.
[42]
Tel est le cas de l’éditeur de textes Grekedit
que nous évoquerons par la suite.
[43]
Une page de code est une table qui met en correspondance les codes de
caractères binaires utilisés par un programme avec les touches du clavier ou
les caractères affichés.
[44]
Nous n’entrons pas dans les détails techniques des modes d’affichage EGA/VGA
etc.
[45]
L’installation d’une langue consiste à configurer le système de sorte qu’il
puisse lire et écrire les caractères de la langue installée.
[46]
Rappelons que celle-ci fut créée suite à l’apparition de la norme Unicode (cf.
2-b).
[47]
Notons que ce nouveau standard s’est imposé en Grèce au cours de l’année 2002.
[48]
On a alors recours à la Table de caractères de Windows ou
à l’option Caractères spéciaux du menu Insertion
de Word.
[49]
Il s’agit d’un projet d’Hellug qui regroupe un ensemble de polices déjà
existantes (cf. http://graphis.hellug.gr).
[50]
Pour le choix de la police, il est parfois utile de connaître la définition de
l’écran utilisé.
[51]
Il convient de s’assurer que seules les polices d’extension .ttf
ont été copiées et que leur nom ne comporte pas d’espace.
[52]
Des informations mises à jour sur (La)TeX se trouvent à l’adresse : http://ocena1.ee.duth.gr/greekingf/Greekinf2.html.
[53]
On pourra s’y référer pour l’installation de cet outil et la description de
quelques opérations de base (utilisation du clavier, impression, entrées et
sorties).
[54]
Pour Solaris ou Windows, utiliser flex.
[55]
C’est aussi le cas des normes pour les corpus, TEI (Text Encoding Initiative)
et CES (Corpus Encoding Standard).
[56]
Consulter également les signets de la Bibliothèque Nationale de France.
[57]
Le Liddel Scott est entièrement disponible sur le site Perseus (cf. 4) a) de
cette partie).
[58]
L’adresse Internet du site est http://hnc.ilsp.gr.
[59]
Jusqu’à 1991 pour le Supplement.
|