Mesurer l’information et la connaissance, rêve scientiste ou possibilité ?

Dossier : ExpressionsMagazine N°600 Décembre 2004Par Jean-Noël LHUILLIER (58)

L’insaisissable information contenue

Depuis de longues années la plu­part des per­son­nes, des entre­pris­es, et des groupes humains, au moins dans les sociétés dévelop­pées, manip­u­lent en pri­or­ité de ” l’in­for­ma­tion “, et acces­soire­ment des pro­duits. Cela donne lieu à d’in­nom­brables efforts et con­trats pour la maîtris­er, c’est-à-dire pour la créer, l’ac­quérir, la stock­er, la met­tre en forme, la trans­met­tre, la ven­dre, l’a­cheter, l’utiliser… 

Mais l’in­for­ma­tion des uns n’est pas l’in­for­ma­tion des autres. Autant l’in­for­ma­tion des infor­mati­ciens et spé­cial­istes des télé­com­mu­ni­ca­tions est bien définie et mesurable, depuis en par­ti­c­uli­er les travaux de C. E. Shan­non1, autant celle des pro­fes­sion­nels d’autres domaines, par exem­ple des médias, des com­mu­ni­ca­teurs, de mon­sieur Tout-le-monde, l’est mal, et ne peut que car­i­cat­u­rale­ment être mesurée en bits. Ceci parce que leur intérêt est bien sûr ailleurs, dans le con­tenu infor­ma­tion­nel. . Nous pou­vons sou­vent con­naître le nom­bre de bits d’un mes­sage, mais pour beau­coup de créa­teurs et util­isa­teurs de l’in­for­ma­tion il représente très mal la quan­tité d’informations. 

Y a‑t-il vrai­ment la même quan­tité d’in­for­ma­tions dans ces 5 images que dans ces 50 pages de texte ou dans cette base de don­nées de 500 enreg­istrements, qui nous ren­seignent sur le même sujet ? Un dessin ou une pho­to con­ti­en­nent-ils plus ou moins qu’un long dis­cours ? Ce pro­gramme de français des class­es de sec­onde est-il trois fois plus copieux que celui des cinquièmes ? Ce jour­nal télévisé en dit-il plus que ce jour­nal quo­ti­di­en imprimé ? Les con­nais­sances de cette entre­prise valent-elles deux, ou cent fois, celles de telle autre ? 

Dans tous ces cas et bien d’autres, on ne sait en fait pas définir ce qu’est l’in­for­ma­tion con­tenue en jeu, et on sait donc encore moins en estimer la quan­tité. Des esti­ma­tions même à 10 % près seraient un pro­grès con­sid­érable. Il n’est de sci­ence et d’é­conomie que du mesurable, peut-on mesur­er l’in­for­ma­tion con­tenue ? Pas le nom­bre de bits, mais la con­nais­sance trans­mise qui est pro­pre aux humains util­isa­teurs de l’in­for­ma­tion, par oppo­si­tion aux machines courantes et même peut-être aux sys­tèmes experts. 

Mon ambi­tion est de pro­pos­er une approche de solu­tion, de méthode d’es­ti­ma­tion. Elle peut appa­raître insen­sée, sci­en­tiste, voire sac­rilège — si j’en juge par l’ac­cueil fait à ma propo­si­tion par divers inter­locu­teurs. La con­nais­sance est dite insai­siss­able, c’est le pro­pre des cerveaux humains, voire des dieux, et l’in­tel­li­gence arti­fi­cielle échoue à vouloir la codifier. 

C’est bien vrai. Je ne pré­tends donc pas théoris­er et décom­pos­er l’in­for­ma­tion con­tenue ou la con­nais­sance en élé­ments dénom­brables, inaltérables, objec­tifs, et absol­u­ment mesurables. La con­nais­sance reçue est en par­tie pro­pre à la per­son­ne qui la reçoit, elle est donc sub­jec­tive, dépend de ce que cette per­son­ne sait déjà, de son état physique et men­tal, et même de ses affects et sen­ti­ments. Mais je pro­pose de réduire nos ambi­tions. Dans beau­coup de cas pra­tiques de trans­mis­sion d’in­for­ma­tions et con­nais­sances, on peut juguler cette diver­sité, sché­ma­tis­er l’ensem­ble des récep­teurs et les con­di­tions de trans­mis­sion du mes­sage, définir des restric­tions d’usage, qui per­me­t­tront de ren­dre objec­tives sous con­di­tions les infor­ma­tions con­tenues et d’en estimer les quan­tités. Cela tout en lais­sant au cas infor­ma­tion­nel (cas pra­tique ain­si sché­ma­tisé) suff­isam­ment de représen­ta­tiv­ité pour que la mesure de ces quan­tités d’in­for­ma­tions soit utile et assez fiable pour sat­is­faire les intéressés à ce cas pratique. 

Quelques conditions de la transmission de l’information numérisée

Par volon­té délibérée, Shan­non ne se préoc­cupe pas du con­tenu séman­tique des mes­sages, sa théorie traite de ce que nous appellerons le niveau 1, niveau numérisé de l’in­for­ma­tion.

Rap­pelons que cette théorie, que la tra­di­tion a retenue sous le nom de ” théorie de l’in­for­ma­tion “, con­sid­ère l’in­for­ma­tion comme ce qui ren­seigne un récep­teur au sujet d’un émet­teur-source2. Dis­tin­guons-en cer­tains principes ou con­di­tions que nous allons pou­voir réu­tilis­er ensuite pour l’in­for­ma­tion contenue. 

Shan­non a sig­nalé que la quan­tité d’in­for­ma­tions reçues dépend certes beau­coup du mes­sage que l’émet­teur a envoyé vers le récep­teur, mais aus­si des per­for­mances du canal de trans­mis­sion qui les relie, et de ce que le récep­teur sait déjà avant que la trans­mis­sion ne com­mence. Il sait peut-être déjà le mes­sage (auquel cas il n’y a pas d’in­for­ma­tion trans­mise car il n’ap­prend rien sur la source). Il doit aus­si con­naître cer­tains des codes que l’émet­teur et le canal de trans­mis­sion ont employés pour coder le mes­sage (s’il ne les sait pas, le mes­sage est pour lui incom­préhen­si­ble ou irrecev­able, il n’y pas non plus d’in­for­ma­tion transmise). 

Ces trois con­di­tions de la trans­mis­sion (codes partagés, niveau d’ig­no­rance préal­able du mes­sage par le récep­teur, per­for­mances du canal) nous guideront dans notre analyse aux niveaux de sens plus élevés que le niveau 1 traité par Shannon. 

Le contenu et l’échelle du sens

L’in­for­ma­tion numérisée est tout à fait insuff­isante pour la plu­part de nos prob­lèmes pra­tiques, non essen­tielle­ment techniques. 

Ce qui compte pour M. Dupont au tra­vail, c’est ce qu’il lit et com­prend du tableau de ges­tion qu’il reçoit, pas les bits qui ont per­mis de le coder, trans­met­tre et recevoir. Si on veut com­par­er les quan­tités d’in­for­ma­tions d’un jour­nal imprimé et du jour­nal télévisé, il est tout à fait insuff­isant de com­par­er le nom­bre de bits du fichi­er du jour­nal tel qu’il peut exis­ter chez l’im­primeur, et le nom­bre de bits du fichi­er de la bande vidéo numérique du 20 heures de TF N. Le fichi­er vidéo est beau­coup plus lourd en bits et pour­tant M. Dupont sait peut-être déjà tout ce que le jour­nal télévisé mon­tre ou dit, par con­tre le jour­nal imprimé est éventuelle­ment plein pour lui d’autres révéla­tions sur le moral de l’équipe de foot. 

Mais com­ment définir le con­tenu ? Les bits sont bien un genre de con­tenu, mais de niveau de sens élé­men­taire, le niveau numérisé. Le moral de l’équipe de foot ne peut être appré­cié que si on utilise des codes, des référen­tiels, beau­coup plus sub­tils. Cela va être la base de notre méthode : le con­tenu infor­ma­tion­nel d’un mes­sage doit être appré­cié par nous, qui cher­chons à mesur­er la quan­tité d’in­for­ma­tions, simul­tané­ment à divers niveaux de sens, du plus sim­ple (le 1er niveau, niveau numérisé) aux plus com­plex­es (que nous appellerons niveau 4, des con­nais­sances, et niveau 5, des savoirs). À chaque niveau cor­re­spon­dent des codes partagés entre récep­teur et émet­teur, ou par­fois avec le canal. 

Les trois con­di­tions de Shan­non, citées plus haut pour le niveau numérisé, sont si rich­es que nous allons pou­voir les trans­pos­er à des niveaux de sens qu’il s’é­tait inter­dit de traiter3, mais notre but est pra­tique. Notre échelle du sens et une vision d’ingénieur, habitué aux approx­i­ma­tions, vont nous per­me­t­tre de l’approcher. 

Un mes­sage sera por­teur simul­tané­ment d’in­for­ma­tions de plusieurs niveaux de sens, et donc de plusieurs quan­tités d’in­for­ma­tions, une par niveau. Mais nous n’es­saierons pas de mesur­er la quan­tité d’in­for­ma­tions glob­ale ou de sens4 d’un mes­sage (ou d’un sup­port) sur une sorte d’échelle uni­verselle. Il faudrait pour cela dis­pos­er d’une équiv­a­lence entre nos unités de mesure à chaque niveau (une infor­ma­tion de niveau élevé vaut n infor­ma­tions de niveau plus faible), ce qui n’a aucun sens, c’est le cas de le dire. 

Pour définir ces niveaux de sens, pour­suiv­ons dans l’ex­em­ple du jour­nal imprimé.

Nom­bre d’informations de l’article lu par M. Dupont

Déjà, pour lire le jour­nal, il faut savoir lire. M. Dupont utilise donc les codes de la langue française écrite, et en pre­mier l’al­pha­bet des let­tres français­es (avec des accents), en majus­cules, minus­cules, italiques… 

Mais les car­ac­tères sont des signes qui n’ap­por­tent par eux-mêmes guère de sens à M. Dupont. Il faut mon­ter un peu plus haut en sens pour définir un niveau 2 utile. M. Dupont utilise aus­si le vocab­u­laire des mots français, tels que listés dans le dic­tio­n­naire (ou une par­tie de celui-ci, et il fait des erreurs) ; et un peu de vocab­u­laire anglo-améri­cain car le jour­nal en utilise, et pas mal de jar­gon sportif. Ce sera notre deux­ième niveau, que nous bap­tis­erons niveau des don­nées. Pour déter­min­er com­bi­en un texte con­tient de don­nées, nous comp­tons ses mots. Les nom­bres, si nom­breux dans les bases de don­nées de ges­tion par exem­ple, sont des sortes de mots. 

C’est un niveau facile­ment mesurable, car on compte facile­ment les mots, à con­di­tion que les con­ven­tions soient claires (par exem­ple, un mot com­posé compte-t-il pour deux ou pour un ?). 

Remar­quons que M. Dupont ne reçoit comme infor­ma­tions ces mots5 que s’ils lui évo­quent quelque chose. Et s’il ne savait pas déjà qu’il allait les trou­ver là : si par erreur un arti­cle répète deux fois de suite le même mot ou la même phrase, la deux­ième occur­rence ne lui apporte rien (sauf un éventuel ren­force­ment). Et il ne reçoit les mots que si le canal est bon, ce qu’il ne serait pas si des mots étaient mal imprimés, ou si M. Dupont per­dait une page avant de la lire. Les trois con­di­tions nous ser­vent donc aus­si à ce niveau de sens, comme à tous les niveaux, pour analyser la quan­tité d’informations. 

Au-delà des car­ac­tères et des mots, la langue française sup­pose encore l’emploi de sa gram­maire, que M. Dupont doit partager au moins en par­tie avec l’émet­teur et le canal (en par­ti­c­uli­er le jour­nal­iste et l’im­primeur). Ils n’en n’ont sûre­ment pas la même con­nais­sance, et ils font cha­cun des erreurs, mais pas les mêmes. La gram­maire con­cerne un peu le niveau 2 et beau­coup le niveau 3. 

Il faut en effet qu’émet­teur et récep­teur parta­gent aus­si la séman­tique du texte, au sens de la lin­guis­tique6. Nous appellerons ce 3e niveau (de la séman­tique) celui des infor­ma­tions élé­men­taires7 (i. e.). Dans cet exem­ple, c’est ce qu’une phrase8 lue com­mu­nique à un lecteur par­lant bien le français journalistique. 

Ces quan­tités d’in­for­ma­tions élé­men­taires auront un cer­tain car­ac­tère objec­tif, si nous sché­ma­ti­sons le cas et restreignons suff­isam­ment les con­di­tions de leur décompte :

  • d’abord en sim­pli­fi­ant la grande diver­sité des récepteurs/lecteurs poten­tiels. Dans le cas pra­tique du jour­nal, nous ne nous intéresserons sou­vent qu’au lecteur moyen, ou en tout cas à des types de lecteurs assez fréquents. On va faire des hypothès­es en par­ti­c­uli­er sur ce que les lecteurs-types savent ou pas. Pour les cas infor­ma­tion­nels dits par­faits au niveau N, ils sont réputés savoir les codes de ce niveau (ici au niveau 3, par exem­ple la gram­maire), mais pas à l’a­vance le con­tenu du mes­sage à ce niveau ;
  • ensuite en faisant des hypothès­es sim­pli­fi­ca­tri­ces sur la diver­sité des mes­sages et des canaux : nous ignorerons sans doute — à moins que cela ne soit essen­tiel pour le cas — le numéro spé­cial annuel, le cas de grève de l’im­primerie qui force à réduire la taille du jour­nal, la pho­to qui a été tron­quée par erreur, etc. ; 
  • enfin en con­venant, nous les mesureurs, ou plutôt les esti­ma­teurs de quan­tités d’in­for­ma­tions pour ce cas, de cer­taines façons de les décompter qui sim­pli­fient l’es­ti­ma­tion sans trop ris­quer de déna­tur­er le cas. 


Les trois finale­ment sont des con­ven­tions de mod­éli­sa­tion. Tout notre art va être de définir et adopter celles qu’il faut pour sim­pli­fi­er sans déna­tur­er le cas pra­tique, le mod­élisant ain­si en cas infor­ma­tion­nel pour lequel nous par­venons à des quan­tités d’in­for­ma­tions utiles et fiables pour le cas pratique. 

On ne peut pas sou­vent exprimer sim­ple­ment les con­ven­tions de décompte par des règles écrites, il vau­dra mieux en don­ner des exem­ples pour des phras­es typ­iques ren­con­trées dans le cor­pus à considérer. 

Par exem­ple une phrase telle que ” Le min­istre de l’In­térieur, qui por­tait un cos­tume noir, a décoré Zanut­ti de l’Or­dre du Mérite sportif ” comptera (en cas par­fait) pour trois infor­ma­tions élé­men­taires plutôt qu’une. Les trois raisonnable­ment pos­si­bles sont : 

  • le min­istre de l’In­térieur por­tait un cos­tume noir, 
  • il a décoré Zanutti, 
  • la déco­ra­tion était le Mérite sportif. 


On pour­rait en compter beau­coup plus (le min­istre était celui de l’In­térieur. Il a agi. L’acte était de remet­tre quelque chose. Ce quelque chose était une déco­ra­tion. Il n’y a qu’un min­istre de l’In­térieur en France. Il a le pou­voir de décor­er, etc.), mais ce serait con­traire au bon sens, et notre M. Dupont moyen en fait ne les reçoit pas. 

Ce niveau 3 sera sou­vent celui qui per­met une analyse effi­cace du cas infor­ma­tion­nel pra­tique : il est déjà bien séman­tique (niveau de sens assez élevé), tout en per­me­t­tant des éval­u­a­tions assez repro­ductibles et pas trop com­plex­es de quan­tités d’informations. 

Mais on ne lit pas les phras­es indépen­dam­ment les unes des autres, et l’ensem­ble d’un arti­cle com­mu­nique un ou quelques mes­sages prin­ci­paux, inten­tion­nels ou par­fois non recher­chés. Pour les émet­tre et les recevoir, on utilise des codes sub­tils, por­tant par exem­ple sur le monde du foot­ball. Le moral de l’équipe de foot est à zéro, et on va per­dre le prochain match, ce sont les deux infor­ma­tions de haut niveau de sens que M. Dupont va infér­er, faire émerg­er, retir­er de l’ensem­ble de l’ar­ti­cle, même si ce n’est pas lit­térale­ment exprimé ain­si. Appelons ce 4e niveau le niveau des con­nais­sances. Pour com­mu­ni­quer ce mes­sage, il a fal­lu que le jour­nal­iste et M. Dupont parta­gent des con­nais­sances générales sur le foot, et d’autres, par exem­ple la logique (si le jour­nal­iste a fait un syl­lo­gisme, il faut que M. Dupont ait com­pris), etc. 

Au fur et à mesure que le niveau de sens con­sid­éré monte, il est évidem­ment de plus en plus dif­fi­cile d’i­den­ti­fi­er les codes mis en jeu et de mesur­er ” objec­tive­ment ” la quan­tité d’in­for­ma­tions de ce niveau. L’art d’ex­traire les infor­ma­tions de niveau 4 d’un texte s’ap­par­ente à celui de faire des résumés. Pour pou­voir mesur­er les quan­tités d’in­for­ma­tions de ce niveau, nous devrons sché­ma­tis­er le cas et avoir recours à des esti­ma­teurs représen­tat­ifs de la pop­u­la­tion de récep­teurs. Mais si nous arrivons à des esti­ma­tions plau­si­bles partage­ables par les divers esti­ma­teurs et util­isa­teurs de cette esti­ma­tion, per­me­t­tant d’é­clair­er des déci­sions à pren­dre avec un degré de con­fi­ance cor­rect, cela nous suffira. 

Alors, un mes­sage élaboré tel un arti­cle de jour­nal imprimé peut être analysé dans un cas infor­ma­tion­nel par­fait sur 4 niveaux de sens, pour lesquels il présente un ” Pro­fil infor­ma­tion­nel “. À chaque niveau de sens cor­re­spond une quan­tité d’in­for­ma­tions dans des con­di­tions mod­élisées d’émet­teur, canal et récep­teur. Un infor­mati­cien ou un télé­com­mu­ni­ca­teur qui voudrait dimen­sion­ner les réseaux per­me­t­tant de trans­met­tre des arti­cles s’in­téressera aux niveaux 1 et 2. Un patron de média qui cherche pourquoi son jour­nal est en perte de vitesse s’in­téressera surtout aux niveaux 3 et 4 (voir graphique ci-dessus). 

Cette analyse par niveau de sens per­met d’i­den­ti­fi­er des car­ac­téris­tiques intéres­santes d’un texte. Sa den­sité infor­ma­tion­nelle, sa con­ci­sion peu­vent être repérées par le rap­port nom­bre d’in­for­ma­tions élémentaires/nombre de mots ou par le nom­bre de connaissances/nombre de mots (ou d’in­for­ma­tions élé­men­taires). Pour une trans­mis­sion effi­cace, par exem­ple pour un enseigne­ment, on a intérêt à ce que les débits de mots, d’in­for­ma­tions élé­men­taires et de con­nais­sances (mesurés par exem­ple sur chaque para­graphe en divisant la quan­tité par le temps que prend sa lec­ture ou présen­ta­tion orale) soient à peu près con­stants au cours de la trans­mis­sion9, avec peut-être une diminu­tion en début d’après-midi et fin de journée car les récep­teurs devi­en­nent alors moins récep­tifs, ce qu’on peut essay­er de con­tre­bal­ancer en dimin­u­ant la con­ci­sion, etc. 

Pour faire cette analyse, nous avons util­isé une struc­ture d’analyse du mes­sage, sur les élé­ments de laque­lle à chaque niveau nous avons décomp­té les infor­ma­tions : posi­tions binaires, emplace­ments de mots, phras­es, arti­cle entier. On devra ain­si pour chaque cas et chaque niveau non seule­ment définir l’u­nité employée, mais aus­si l’élé­ment de la struc­ture d’analyse sur lequel on va compter élé­ment par élé­ment les infor­ma­tions, c’est-à-dire la gran­u­lométrie de l’analyse. 

Exam­inons la suite de l’his­toire du jour­nal lu par M. Dupont. Au cours de cette lec­ture, celui-ci s’ap­pro­prie les con­nais­sances, en les défor­mant peut-être, et elles rejoignent et aug­mentent ses savoirs (ensem­bles de con­nais­sances sur un domaine sans trou impor­tant), sa cul­ture, elles con­tribuent à ses com­pé­tences (savoirs organ­isés en vue de l’ac­tion). Nous sommes là au 5e niveau de l’in­for­ma­tion, celui des savoirs.

Ce niveau pose des prob­lèmes déli­cats. L’in­ter­ac­tion avec le cerveau de M. Dupont y est dom­i­nante. L’ap­port de savoir que lui pro­cure un mes­sage ne peut plus être mesuré sur le mes­sage, c’est une mod­i­fi­ca­tion du récep­teur qui se pro­duit, et celui-ci est très com­plexe et unique. On ne peut guère définir et estimer cet apport que par dif­férence entre les savoirs de M. Dupont avant et après arrivée du mes­sage. De nom­breux tests cherchent à mesur­er les savoirs d’une per­son­ne dans un domaine, et si pour des cas pra­tiques on a besoin de mesur­er ce niveau, on ne pour­ra qu’avoir recours à de tels tests. Pour les com­pé­tences, l’es­ti­ma­tion est basée en général sur le cur­sus de l’in­di­vidu : il a fait telles études, il a telle expéri­ence pro­fes­sion­nelle et on en con­naît telles preuves par ses réalisations… 

L’échelle du sens que nous venons d’esquiss­er pour un arti­cle de jour­nal peut être définie pour d’autres cas infor­ma­tion­nels. On peut presque tou­jours mod­élis­er le cas, définir les con­ven­tions, iden­ti­fi­er les qua­tre pre­miers niveaux de sens, des unités de mesure de quan­tités d’in­for­ma­tions pour cha­cun, et la struc­ture d’analyse pour les estimer. 

Par exem­ple, un cas intéres­sant est celui du jour­nal télévisé regardé par le même M. Dupont. 

Son niveau 1 (numérisé) peut être défi­ni comme celui des bits de la bande son, et celui des pix­els portés par les ban­des des vidéos, qui arrivent plus ou moins dans le poste de télévi­sion de M. Dupont. Son niveau 2 (don­nées) pour­rait être celui des phonèmes ou plus sim­ple­ment des mots de la parole, et des images (assez faciles à compter) ou des formes mon­trées par la vidéo. Par exem­ple, il voit une forme humaine qui pose un objet sur une autre forme humaine. Au niveau 3 (infor­ma­tions élé­men­taires), celui porté par les phras­es dites et les plans filmés, la même séquence visuelle lui mon­tre le min­istre de l’In­térieur qui décore le joueur Zanut­ti que M. Dupont reconnaît. 

Ce niveau 3 per­me­t­tra des com­para­isons de cas assez dif­férents, en par­ti­c­uli­er des com­para­isons des nom­bres d’in­for­ma­tions élé­men­taires portées par une image ou une séquence filmée et par un texte. 

Le niveau 4 (con­nais­sances) du jour­nal télévisé est celui des enseigne­ments et con­clu­sions que M. Dupont en tire : Zanut­ti est vrai­ment bon, donc il a été décoré. Il per­me­t­tra des com­para­isons de cas très dif­férents, mais les éval­u­a­tions de quan­tités seront moins fiables. 

Autre exem­ple, les for­ma­tions prodiguées à des élèves et apprenants sont des cas dont l’analyse par niveau de sens est spé­ciale­ment intéressante. 

Le for­ma­teur veut en général trans­met­tre des infor­ma­tions de niveaux 3, 4 et 5. Il envoie pour ce faire des mes­sages et sup­ports rich­es en niveaux 2 et 3 (textes, sché­mas, exposés). L’ap­prenant manque un cer­tain nom­bre de ces infor­ma­tions, et recon­stitue plus ou moins bien les infor­ma­tions de niveau élevé. Le for­ma­teur s’en aperçoit, et prodigue des mes­sages com­plé­men­taires qui ten­tent d’ex­pliciter au niveau 3 des infor­ma­tions de niveau 4, etc.

Bien sûr, les présen­ta­tions de cas ci-dessus sont sim­pli­fi­ca­tri­ces, de nom­breuses ques­tions vont se pos­er à chaque étape. Sou­vent les cas ne sont pas par­faits : les codes ne sont qu’in­com­plète­ment partagés, le récep­teur n’ig­nore pas totale­ment les infor­ma­tions d’un cer­tain niveau avant de les recevoir, le canal déforme.

La place manque pour en dis­cuter ici. Mais je serai heureux d’en­voy­er des com­plé­ments et de dis­cuter de cette méthode avec tout lecteur intéressé. Un tra­vail con­sid­érable reste à faire pour l’adapter à des cas infor­ma­tion­nels var­iés. Mais le jeu ne vaut-il pas la chandelle ?

_____________________________________________
1. Claude E. Shan­non ” The math­e­mat­i­cal The­o­ry of Com­mu­ni­ca­tion ” (Univ. of Illi­nois Press, 1949) (réédi­tion d’ar­ti­cles parus dans Bell Sys­tem Tech­ni­cal Jour­nal, 1948). Tra­duc­tion française : ” Théorie math­é­ma­tique de la com­mu­ni­ca­tion “, par W. Weaver et C. E. Shan­non (Retz-CEPL, 1975).
2. L’in­for­ma­tion est une notion pre­mière, que la théorie de l’in­for­ma­tion ne définit pas rigoureuse­ment. Elle définit plutôt la quan­tité d’in­for­ma­tions, comme la réduc­tion du nom­bre de pos­si­bil­ités d’é­tats de la source que le mes­sage per­met au récep­teur de décompter en bits. Le mes­sage peut être tout à fait involon­taire. Par exem­ple, nous voyons la lumière réfléchie sur un objet, ce qui nous informe sur lui.
3. Shan­non a dit que les aspects séman­tiques de la com­mu­ni­ca­tion ne con­cer­naient pas le prob­lème traité par sa théorie de l’information.
4. Fred I. Dretske (Knowl­edge and the flow of infor­ma­tion, MIT Press 1981, réédité CSLI Pub­li­ca­tions, 1999) présente une exten­sion des idées de Shan­non en vue de mesur­er la quan­tité d’in­for­ma­tions et de con­nais­sances à par­tir des prob­a­bil­ités de mes­sages. Mais il mon­tre que le sens d’un mes­sage ne peut être mesuré par sa prob­a­bil­ité a pri­ori. Si votre voisin en région parisi­enne vous dit ” il y a un gnou dans mon jardin ” vous serez plus sur­pris que s’il vous dit ” il y a un chat dans mon jardin “, les prob­a­bil­ités a pri­ori sont très dif­férentes, et pour­tant ces phras­es n’ont pas plus de sens l’une que l’autre — à con­di­tion que vous sachiez ce qu’est un gnou.
5. M. Dupont sait déjà les mots du dic­tio­n­naire, mais le mes­sage au niveau 2 est dans leur sélection.
6. La lin­guis­tique dis­tingue sou­vent 4 niveaux d’analyse du dis­cours : lex­i­cal (ou mor­phologique, qui n’est pas équiv­a­lent), syn­tax­ique, séman­tique, prag­ma­tique. Le prag­ma­tique, qui s’in­téresse au sens de l’ensem­ble d’un texte, sera proche de notre niveau 4, alors que le séman­tique est proche de notre niveau 3, et le lex­i­cal de notre niveau 2. ” Séman­tique ” a aus­si assez sou­vent une accep­tion plus large qui relève à la fois de nos niveaux 2, 3, 4 et 5.
7. Ce niveau peut être appelé celui de la sig­ni­fi­ca­tion, du sens lit­téral, du sens lin­guis­tique, réser­vant alors le ” sens ” pour désign­er le 4e niveau, ” inter­pré­ta­tion faite par un sujet don­né dans un con­texte ” (Jean-Marie Pier­rel, Ingénierie des langues, Her­mès, 2000). Nous util­isons plutôt ” sens ” pour désign­er toute l’échelle des sens crois­sants, de tous niveaux.
8. On pour­rait choisir d’autres élé­ments sup­ports de notre analyse d’in­for­ma­tion pour ce niveau que les phras­es ; par exem­ple les propo­si­tions qui les con­stituent. Ou des élé­ments sig­nifi­ants de types var­iés, tels les prédi­cats. La phrase a le mérite d’être une struc­ture évi­dente du texte. Il y a certes des infor­ma­tions élé­men­taires qui sont portées par plusieurs phras­es à la fois, on pour­ra les décompter aus­si, ou les nég­liger. Notre comp­tage peut en effet rester approximatif.
9. On retrou­ve ain­si aux niveaux de sens élevés des car­ac­téris­tiques bien con­nues au niveau numérisé.

Poster un commentaire