Sommaire des JADT 1998   

SI LA BIBLE M'ÉTAIT COMPTÉE...

 

R.-Ferdinand Poswick, osb

Centre : Informatique et Bible

B - 5537 Denée, Belgique

Abstract

A "Tale" of the Bible ...

A status questionis on how counting is made in the Bible and on the Biblical Corpus. Serious, comprehensive and critical statistical works (or tools) are not yet available on this Corpus. The difficulties are not so much on the side of statistical tools, but on the side of the users and of the specific nature of the data.

Introduction

Si le Dictionnaire Encyclopédique de la Bible qui fait autorité dans le domaine francophone possède un long et excellent article sur la "métrologie" biblique, aucune entrée ne concerne les chiffres, les nombres, le calcul dans la Bible et les cultures de référence.

La présente communication voudrait, au moins en partie, combler cette lacune en faisant le point sur les connaissances (et sources de connaissances) que nous avons actuellement à ce sujet.

Nous tenterons d'aborder de façon succincte les deux aspects de cette question : 1) le chiffre et le nombre dans la Bible et la culture biblique ; 2) l'application du calcul au donné biblique (principalement textuel).

Pour la bibliographie du sujet, on peut se référer aux importants articles de l'Anchor Bible Dictionary (ABD, 1992) que nous compléterons autant que possible.

Chiffres, nombres, calcul dans la Bible

Cette partie sera la plus courte, car, si la négociation d'Abraham avec Dieu (Gen. 18.23-33) ou avec les fils de Heth (Gen. 23.1-20), si l'astuce du patriarche Jacob pour augmenter ses troupeaux quand il était au service de son beau-père Laban (Gen. 30.25-43) ou encore la gestion économique de Joseph en Egypte (Gen. 41.47-57 ; 47.13-27) sont le prototype d'une lignée d'esprits qui savent ce que compter veut dire, il faut se ranger à l'avis de Jens Hyrup, selon lequel "ni l'Ancien ni le Nouveau Testament ne sont le produit de cultures qui aient une tradition mathématique propre supérieure au niveau normal des mathématiques populaires. Mais l'un et l'autre Testaments furent le produit de cultures en contact avec des traditions mathématiques éprouvées et savantes". Ces cultures sont celles de la tradition Suméro-Babylonienne, de l'Egypte et de la Grèce.

Des traces de ces trois cultures se retrouvent à différents stades littéraires ou historiques de la Bible.

Mais la nature même de la Bible comme texte religieux, littéraire et historique n'appelle pas vraiment un discours sur les nombres.

Les plus vieilles attestations d'usage de nombres dans les cultures qui ont généré la Bible sont liées aux pratiques mésopotamiennes dans lesquelles les grands nombres sont exprimés sur une base de 60.

Cette base s'écrivait, dans les plus anciens textes sumériens (tablettes d'Uruk, vers 3.000 av. J.C.), par la répétition de signes : un petit ovale = 1, un petit rond = 10, un grand ovale = 60, un petit rond dans un grand ovale = 600. Un système décimal se trouve parfois plus à l'Est (Elam) et servait pour compter le bétail, semble-t-il.

L'écriture hieroglyphique égyptienne qui se développe durant les mêmes périodes possède d'entrée de jeu un système de numération plus complet et permettant de compter jusqu'au million. Ce système est décimal : un trait = 1, un arc = 10, un lotus = 100, un doigt = 1.000, un têtard = 10.000. Mais la cursive hiératique a un signe pour chaque unité, chaque dizaine et chaque centaine. Un système permet aussi d'écrire des fractions.

Plus tard, les "papyri" égypto-grecs utilisent la notation grecque donnant une valeur aux lettres alpha à thèta = 1 à 9, iota à koppa pour les dizaines, rho à san pour les centaines. Un signe spécial à côté des unités fait passer aux milliers.

Les 22 lettres de l'alphabet linéaire phénicien sur le modèle duquel seront bâtis les alphabets hébreu, araméen, protoarabique, grec, étrusque, romain, etc... ne sont pas antérieures au 14ème siècle av. J.C..

Les hébreux emprunteront d'abord le système de notation araméen (signes distincts pour 1, 10, 100, 1.000 et 10.000 et principe d'addition, par exemple 70 = 7 dix écrit par groupement : 20 + 20 + 20 + 10).

Les lettres alphabétiques hébraïques semblent cependant n'avoir été utilisées qu'à partir du 2ième siècle av. J.C. pour le calcul ou la numération et cet usage a probablement été acquis sous l'influence du mode grec de numération. La diaspora juive des mêmes époques utilise d'ailleurs la numération alphabétique grecque pour représenter les chiffres.

Tout comme la fonction scribale qui la développe, la numération est liée au sacré et le nombre a, dès les temps les plus anciens, une relation au divin. La valeur symbolique du nombre 7 se retrouve dans les textes suméro-accadien comme l'Epopée de Gilgamesh ou l'Histoire du Déluge babylonienne et donne à ce chiffre le sens de "totalité". Mais les nombres sont également des cryptogrammes, par exemple, le cunéiforme 3.20 est un cryptogramme du mot "roi" parce que 20, le nombre du dieu solaire, est l'idéogramme habituel pour sarru (= ri) et 20 x 10 = 200, soit 3.20 en base 60 ; on retrouve le même type de "jeu de chiffre et de mot" dans une inscription de Sargon II décrivant les murs de Korsabad (= Dur Sharrukin) indiquant qu'il s'agit du "nombre de son nom" (ce qui évoque déjà le "nombre de la bête" d'Apocalypse 13.18 qui est "le nombre d'un homme, et ce nombre est 666").

C'est sur ces bases et dans cette ligne que se développera la "gématrie" dans le Talmud, les Midrashim et, finalement, les littératures kabbalistiques dont les fondements historique et mystique peuvent être attribués au Sefer Yezirah ( Livre de la création) que l'on date d'entre le 3ième et le 6ième siècle de notre ère, mais qui s'épanouira surtout après la Renaissance.

Ce type de spéculation dont les pythagoriciens étaient friands et que l'on retrouvera dans tous les courants allégoriques et mystiques de commentaire de la Bible, se retrouve très explicitement dans l'usage de la Bible grecque des LXX (Septante) traduite à Alexandrie à partir du 2ième siècle av. J.C..

Ces spéculations seront reprises jusqu'à nos jours. Mais elles peuvent mener à des aberrations d'autant plus perverses qu'elles sont présentées avec l'apparence d'une rigueur mathématique d'instrumentation dont le profane peut difficilement percevoir les failles.

Tel est le cas pour le best-seller récent de Michael Drosnin, La Bible : le code secret qui prétend trouver dans le "texte" hébraïque de la Bible des révélations explicites sur des événements contemporains.

Il s'agit donc bien d'une grande escroquerie intellectuelle d'autant plus difficile à dénoncer qu'elle se voile derrière l'objectivité apparente du "chiffre".

Bien plus sérieuse est l'observation patiente d'une utilisation des nombres dans la structure de certaines unités littéraires limitées à l'intérieur du texte biblique. Le P. Langlamet montre que certains textes ont été structurés de façon numérique et qu'ils peuvent représenter, à ce titre, un "exercice scribal". La délimitation précis de ces unités littéraires rend peu probable une généralisation de la technique à des ensembles plus larges.

On peut donc conclure que la structure numérico-alphabétique de la langue écrite des hébreux, d'abord développée dans une culture orale possédant ses clefs mnémotechniques, a marqué la rédaction de nombreux passages de la Bible. Elle pourrait avoir incité certains scribes d'époques tardives (notamment ceux de la tradition massorétique - massorah = compte, dénombrement) à améliorer la cohérence numérique de certains blocs de texte pour en mieux contrôler la copie minutieuse. Certaines compositions académiques ou savantes ont joué avec le chiffre (comme dans certaines traditions littéraires appliquant des principes pythagoriciens de rigueur mathématique dans la composition). Mais il serait illusoire de pousser plus loin l'interprétation de phénomènes numériques pour capter un contenu textuel non-apparent.

La Bible comptée

Si l'on fait abstraction de recherches sur l'histoire des nombres et de la numération dans la Bible ainsi que des interprétations numériques des phénomènes d'écriture, la Bible reste un Corpus "compté" depuis les temps les plus anciens.

L'école des scribes "massorètes" (compteurs, dénombreurs) a été l'une des premières, dans un souci de fidélité de la transmission, à effectuer des comptes minutieux des mots et des lettres de toutes les unités littéraires rassemblées dans la Bible hébraïque.

Gérard-E. Weil a étudié leur travail tout au long de sa vie. Il nous apprend que les vieilles listes de décompte de versets de la Torah (Pentateuque) se trouve dans un manuscrit des Prophètes du Caire vers 875-900 de notre ère. L'auteur-compteur y note un total de 5.843 versets. D'autres décomptes donnent : 5.845 (ms.B19a Leningrad) ; 5.844 (division palestinienne) ; 5.841 (division babylonienne) ; 5.855 (division des soph-pasuq, marques de séparation).

Pour le décompte des mots de la Torah, on trouve des variantes analogues : 79.856 mots d'après les colophons des Scribes massorètes du ms B19a de Leningrad ou 81.404 d'après les colophons du texte utilisé par Ginsburg ; 79.638 mots selon les sommes du Ms n° 1 de la Bibliothèque de Madrid ; 79.977 d'après le décompte fait sur l'enregistrement électronique du CATAB. Les différences de comptage sont expliquées par des différences orthographiques, notamment dans les noms propres.

Les lettres elles-mêmes ont été dénombrées : selon les décomptes de l'ordinateur, on en trouve 304.848 (alors que les colophons des scribes massorètes en annoncent 400.945) ; selon les décomptes de Ginsburg en 1894, on en trouve 304.945 ; on en trouverait 304.799 d'après les colophons du ms. n° 1 de Madrid.

Une somme du comptage sur le texte massorétique de la Bible a été publiée en 1989 par Francis I. Andersen et A. Dean Forbes sous le titre The Vocabulary of the Old Testament.

Les statistiques et comptages présentés là sont également basés sur un enregistrement du codex B19a de Leningrad. Non seulement les mots sont comptés, mais également tous les types d'éléments de la langue qu'une grammaire classique peut suggérer (particules, verbes, noms, pronoms).

Un premier type d'affichage en Table donne les totaux des faits observés par ensemble (ainsi l'on voit que si toute la Bible hébraïque comporte 305.500 mots, la Torah en comporte 79.983 se rapprochant à 6 unités près du décompte du CATAB).

Vient ensuite une Concordance de tous les mots en ordre alphabétique avec le compte pour chaque unité et toutes les références des occurrences (pp.33-263) ; une Table de répartition des mots qui adviennent plus de 20 fois dans le texte (pp.267-2447), cet outil permet de se rendre compte d'un coup d'œil de la situation d'un vocabulaire spécifique. Chaque Table présente, à côté du nombre absolu d'occurrences, ce que les auteurs nomment une "mesure d'incidence" soit le nombre d'occurences par 10.000 mots que représente le chiffre relevé (par exemple, si dans la Bible hébraïque il y a 153.511 noms sur les 305.500 mots, cela représente 5.025 noms sur 10.000 mots,ce qui signifie "qu'on peut s'attendre à ce que les noms constituent la moitié de presque tous les textes".

Une quatrième partie présente la statistique des formes verbales (pp. 451-472). Enfin des notes, des références au grand dictionnaire de Brown-Driver-Briggs, et des Index (divinités, noms de personnes, noms de lieux, Index général avec regroupement de mots d'un même champ sémantique, par exemple : tous les types d'instruments de musique mentionnés dans le TM sont regroupés sous "musical instruments") complètent cette somme de références.

Comme l'annoncent les auteurs dans leur Introduction très pédagogique (pp.1-19), les Notes (pp. 473-504) mettent en évidence quelques "incertitudes et limites qui obèrent tout travail" de ce type sur la Bible : 1) incertitude sur la lecture du manuscrit de référence ; 2) incertitude sur des variantes textuelles (notamment les Ketib-Qere dont la tradition est flottante selon les manuscrits) ; 3) erreurs manifestes de scribe dans le texte de référence ; 4) problème des homographies qui permettent une répartition différente dès lors que l'on groupe des formes sous des lemmes ; et encore 8 autres types de variantes d'interprétation morpho-syntaxiques des données qui peuvent influencer le résultat des comptages.

Comme telle, cette présentation montre bien les limites de tout instrument de comptage sur un Corpus littéraire dont la masse, pourtant, devrait permettre des observations statistiques. Dans tous les cas, il s'agit plutôt d'un outil heuristique dont la validité est d'autant meilleure que les phénomènes observés le sont à une plus grande échelle ou sur des éléments que ne peuvent toucher les "incertitudes" relevées plus haut.

Dans sa grande Concordance du TM, Even-Shoshan donnait aussi des comptages du texte dans un Tableau synthétique en tête du premier volume. Il y repère 1.159.705 lettres (environ...!) pour 304.901 mots, 23.191 versets et 929 chapitres (dont 304.805 lettres, 79.847 mots, 5.845 versets et 187 chapitres pour la Torah).

Malgré l'importance de cette version pour l'étude actuelle de la Bible, nous ne possédons pas encore d'outils comparables pour le texte de la Septante (LXX) dont on sait aujourd'hui qu'il reflète souvent un état du texte hébreu de la Bible antérieur aux fixations massorétiques et dont on a retrouvé des témoins à Qumrân.

Il faut chercher ces comptages dans les outils électroniques disponibles : l'enregistrement de la LXX dans la Base de données du Thesaurus Linguae Graecae (TLG) de l'université de Irvine ou dans la forme que lui a donné l'alignement avec l'hébreu masorétique dans la Base de données du CATSS (Computer Assisted Tools for the Study of the Septuagint).

Pour le Nouveau Testament, depuis les comptages minutieux (et non-informatisés) de R. Morgenthaler on a bénéficié des travaux de J.B. Smith qui donne des tableaux de répartition des 5.524 mots (lemmes) différents qu'il compte dans ce corpus ; puis surtout de K. Aland à compléter par les remarques et comptages de F. Neirynck et F. van Segbroeck.

K. Aland, outre une répartition pour chaque mot-lemme (p. 2-305), donne une liste de ces mots par ordre décroissant de fréquence (p. 407-446) et une liste des hapax par document différent du Nouveau Testament.

Plus intéressants sont aujourd'hui les outils électroniques.Presque tous en effet présentent d'une façon ou d'une autre des moyens de compter les éléments traités.

Mais les résultats demandent un regard critique, car trois paramètres peuvent varier, à la base : a) le texte enregistré peut être différent ; b) la façon d'isoler des unités peut varier selon la conception linguistique ou grammaticale ; c) les fonctions de recherche ou de calcul peuvent être conçue sur des principes différents. Dès lors les résultats, pour un même ensemble peuvent diverger et doivent être pris avec précaution.

Un type de comptage bilingue est présenté par la Concordance de la TOB, de façon partielle dans sa version imprimée et de façon exhaustive dans sa version électronique. Cet outil donne les résultats bruts de tous les éléments inclus dans la Base de données : nombre d'occurrences des formes, des lemmes, nombre de versets et/ou des chapitres de la Bible dans lesquels ces occurrences se retrouvent, etc...

Mais, comme la plupart des outils de comptage présentés jusqu'ici, on ne peut pas dire qu'il s'agit de "statistiques" au sens où cette science appliquée, partie des mathématiques, a été développée plus particulièrement en notre siècle, puis appliquée de façon plus ou moins étendue aux textes du Corpus biblique.

L'importante synthèse de A. Dean Forbes rappelle que l'histoire de l'application de méthodes statistiques à des textes bibliques commence par une recherche sur l'authenticité des Epîtres de Paul à partir de méthodes proposées dès 1939 par G.U. Yule pour déterminer si l'auteur de l' Imitation de Jésus Christ était Thomas a Kempis ou Jean Gerson.

La principale méthode utilisée est celle d'une évaluation de la longueur des phrases et de leur distribution dans une œuvre ou encore celle d'une mesure des habitudes inconscientes d'un auteur quand il écrit (particules, morphologie, syntaxe). L'auteur critique longuement le travail de A.Q. Morton sur les Epîtres de Paul, et tout aussi longuement les travaux de Y.T. Radday qui veulent prouver l'unité littéraire de la Torah (Pentateuque) et du livre d'Isaïe. Il présente enfin quelques travaux réalisés sur base de l'orthographe biblique par Anderson et par lui-même.

En tête de son article, il donne quelques critères pour un travail de statistique valable sur un corpus littéraire, qu'il résume en cinq questions : 1) Les données sont-elles correctes ? 2) Le volume des données est-il suffisant pour y appliquer un outil statistique ? (Ce point est pour lui capital. Mais il ne dit pas quel est, à son avis, le niveau de volume en-dessous duquel les informations statistiques sont insignifiantes). 3) La méthode statistique utilisée a-t-elle été expérimentée et prouvée sur des échantillons valables dans le contexte des données à examiner ? Il insiste pour que les principes d'une méthode statistique utilisée soient toujours clairement explicités. 4) La méthode est-elle utilisée avec des garanties et contrôles (notamment quand il s'agit de programmes d'ordinateur) ? 5) Les conclusions sont-elles garanties ? "Lorsqu'il a obtenu des résultats par une méthode appropriée et validée appliquée à un volume de données contrôlées et suffisantes, le chercheur ne peut jamais interpréter ces résultats statistiques sur le mode de la causalité".

Nous avons nous-mêmes proposé, directement ou indirectement, quelques pistes d'utilisation statistique du matériau biblique. L'édition de la Concordance de la Bible de Jérusalem proposait en Appendice quelques listes résultant de tris exclusifs avec le vocabulaire qui constituait un écart significatif d'usage dans l'Ancien et le Nouveau Testament pour 75 lemmes les plus fréquents présentés en ordre de fréquence décroissante. Cette méthode, appliquée à la comparaison d'autres ensembles à l'intérieur du Corpus, permettrait des observations de champs sémantiques caractéristiques et spécifiques.

Les Colloques de l'Association Internationale Bible et Informatique ont présenté régulièrement des pistes de recherche : l'analyse des correspondances, l'utilisation de statistiques sur des grands corpus diachroniques ,l'ordre de dépendance d'écrits littérairement proches, la détermination d'un auteur, la statistique inférentielle, les calculs de probabilités .

Des piles de listings sont disponibles au CIB-Maredsous qui donnent les statistiques d'usage de tous les livres de la Bible hébraïque (BHS) et de la Bible grecque (LXX, Rahlfs) : nombre d'occurrences, proportions dans le livre, dans l'ensemble (A.T. ou N.T.), dans le corpus, écarts réduits pour tous les mots d'occurrence supérieure à 20 et pour tous les livres de la Bible, fonctions grammaticales, etc..

Plusieurs tentatives de publication ont échoué devant le caractère limité du public qui peut s'intéresser et utiliser avec fruit ces outils.La seule solution viendra de la création d'un outil statistique électronique suffisamment puissant et bien adapté aux recherches sur la Bible. Cette masse impressionnante de données a néanmoins permis quelques observations intéressantes sur les grands corpus bibliques.

Conclusion

Il ne faut pas cacher que l'application de la statistique à la Bible vient seulement de commencer de par l'association possible du texte avec les puissances de calcul de l'ordinateur. Ce petit bilan permet de mesurer les efforts et essais déjà réalisés ; mais il révèle le manque d'un outil majeur encore à proposer dans le domaine biblique et pour lequel certains principes et d'autres expériences d'application des statistiques au domaine littéraire ont donné des bases solides.

Une chose est certaine, la statistique restera avant tout un outil heuristique permettant de faire surgir des phénomènes. Elle servira d'autant mieux le chercheur que celui-ci connaîtra avec précision, sous d'autres modalités de connaissance, l'objet de sa recherche.

Sommaire des JADT 1998