Archives mensuelles: juin 2026

chantier traces

Lire ce qui n’était plus lisible : enquête sur le décodage des diskmags belges

Toujours dans mon chantier sur la scène démo belge… Je travaille sur les diskmags et dois, pour cela, les lire (rapidement si possible). J’ai demandé de l’aide à Claudio/a. Le voyant mouliné, je lui ai demandé d’expliciter ce qu’il faisait pour me rendre accessible ces magazines (c’est une version un peu raccourcie de la réalité : on a beaucoup travaillé avec des allers-retours très amusants). À ma demande, il a rédigé ce billet de blog, pour exposer ce qu’il faisait (je lui ai soufflé la comparaison avec l’enquête). Pour aller plus loin, il est possible de lire une annexe détaillée pour le décodage de Scenial.

Lire ce qui n’était plus lisible : enquête sur le décodage des diskmags belges (par Claude)

Un diskmag n’est pas un fichier que l’on ouvre, mais un programme qui s’exécute. Dans la scène démo des années 1990, le texte ne circulait pas comme un document lisible aujourd’hui. Il était enfermé dans un exécutable conçu pour MS-DOS, qui dessinait lui-même ses pages à l’écran. Le récupérer trente ans plus tard ne relève ni de la transcription ni de la reconnaissance optique de caractères. Le fichier existe, intact. Mais il est écrit dans un format que personne n’a documenté, et que la machine censée le lire n’exécute plus. Il faut donc reconstituer la façon dont le programme lisait son propre texte, à partir du programme seul.

Cette absence de documentation s’explique. Chaque diskmag reposait sur un moteur d’affichage écrit à la main, taillé pour ses contraintes de mémoire et de vitesse. Le format des données servait ce moteur interne ; il n’avait pas à être expliqué au-dehors. La culture de la scène valorisait d’ailleurs la prouesse technique plus que sa recette. Le texte se trouve ainsi rangé dans un emballage que nul n’a pensé pour être rouvert.

On m’a fait observer que je rends compte de ces opérations dans le vocabulaire de l’enquête : indice, fausse piste, recoupement. La comparaison tient. Il n’existe ni notice ni auteur à interroger. Le fichier binaire est à la fois la scène, le suspect et la seule déposition. Tout ce que l’on peut savoir du format est inscrit dans ses octets. On forme des hypothèses sur leur sens, puis on les éprouve.

La démarche avance par essais et erreurs. Une hypothèse, un test rapide, un résultat que l’on lit, une décision. Le critère de réussite est simple : les octets transformés composent-ils des mots anglais, ou une suite vide de sens ? Ce tri entre le sens et le bruit demande déjà un jugement, car des données d’image peuvent prendre l’allure de lettres sans former le moindre mot.

Un exemple concret le montre. Un fichier n’est qu’une suite de nombres, les octets, chacun compris entre 0 et 255. Pour y inscrire du texte, on convient d’une table qui attribue à chaque caractère un nombre, son code. Cette table, l’ASCII, est universelle : « g » y vaut 103, « h » 104, « o » 111. Dans le fichier, le logiciel ne lit donc que des nombres ; c’est lui qui les affiche comme des lettres. Au premier numéro de Scenial, ces nombres ne correspondaient à rien de lisible. En les comparant aux valeurs attendues, un écart constant est apparu : chaque code avait été diminué de dix avant d’être enregistré. Le « g », codé 103, y était inscrit 93 — soit le code du caractère « ] ». Le texte se présentait ainsi comme une bouillie de symboles, « ]^eijmh… », sans un mot reconnaissable. Le procédé revient à décaler chaque lettre d’un rang fixe, à la manière du chiffre dit de César. Pour relire le texte, il suffit d’ajouter dix à chaque octet. Les valeurs 93, 94, 101, 105 et 106 redeviennent alors 103, 104, 111, 115 et 116, soit « ghost » — le début de « ghostwriter », nom de la rubrique éditoriale. Encore fallait-il trouver le bon décalage : j’avais d’abord testé l’écart qui sépare majuscules et minuscules, sans résultat, avant d’élargir l’éventail.

Les deux autres numéros relevaient d’un procédé différent, tout aussi concret. Leur texte était stocké comme une copie de l’écran. Pour chaque caractère affiché, le fichier conservait deux nombres : l’un pour la lettre, l’autre pour sa couleur. Un octet sur deux était donc du texte, l’autre une simple indication d’affichage. Cette alternance suffisait à brouiller toute recherche, puisque les mots s’y trouvaient hachés un caractère sur deux. Il suffisait de ne retenir qu’un octet sur deux pour voir réapparaître les phrases. C’est ainsi qu’a surgi, au deuxième numéro, la ligne « ENTER THE WORLD OF SCENIAL ».

C’est là que se loge l’autonomie de l’enquête. Aucune procédure ne fixe l’ordre des opérations, puisqu’aucune n’existe pour un format inconnu. Plusieurs décisions reviennent à l’enquêteur. La première est l’ordre d’attaque : commencer par le numéro le plus accessible, dont le format éclaire ensuite les autres. La deuxième est de repérer le point incertain dont tout dépend, et d’y concentrer l’effort. La troisième est d’abandonner une impasse à temps. La quatrième, plus délicate, est de juger qu’un résultat suffit : une restitution fidèle n’a pas à être parfaite, et m’acharner sur quelques chiffres illisibles aurait coûté davantage que le gain espéré. La dernière est parfois de renoncer. Le premier numéro était compressé par un utilitaire connu ; le réflexe aurait été de le décompresser. Le texte se trouvait pourtant ailleurs, dans une zone non compressée. L’avoir vu a épargné un travail entier.

Une décision tient enfin à l’échelle. Les trois numéros représentent environ deux cent soixante articles, près de cent cinquante mille mots. Pour la traduction française, j’ai réparti le corpus en tranches confiées à une douzaine de processus travaillant en parallèle, selon un même protocole, avant de réassembler et de vérifier. Cette autonomie demeure encadrée. Le cap est fixé par le chercheur, et certaines règles sont explicites : ainsi l’interdiction d’expurger les contenus crus, qui font partie de l’objet d’étude. L’initiative porte sur les moyens et le rythme, pas sur les fins.

Un dernier trait a retenu l’attention. J’explicite chaque étape à mesure qu’elle se déroule. Les fausses pistes restent alors visibles, au même titre que les trouvailles. La méthode devient un objet que l’on peut discuter et corriger : une rubrique mal traduite a pu être repérée parce que le choix qui l’avait produite était énoncé.

Une enquête éclaire en outre la suivante. Le format en copie d’écran, compris sur un numéro, s’est reconnu sur les autres, et jusque dans un magazine voisin de la scène ANSI. La signature de fin d’article, repérée au quatrième numéro, a servi à découper le premier, pourtant d’un tout autre format. Le répertoire des procédés s’étoffe, et chaque nouvelle enquête s’en trouve allégée.

Les trois numéros de Scenial ont opposé des résistances inégales. Le deuxième est le plus lisible : son texte est en clair, simplement entrelacé d’octets de couleur. Le quatrième est plus fermé : faute d’index, ses articles ne se découpent qu’à une signature récurrente, la mention de l’auteur en fin de texte. Le premier, daté de 1994, est le plus retors : texte encodé, lettres en minuscules, ponctuation déguisée en lettres, grands chiffres dessinés par une fonte que l’on ne sait plus relire. L’annexe technique jointe détaille chaque cas.

Ce travail ne porte pas sur un cas isolé. Scenial est l’un des cinq diskmags belges dont le texte a été restitué selon la même méthode, aux côtés d’Imphobia, du Belgian Scene Report, de Belgian Glory et de Blister. Chacun imposait son format, et chacun a enrichi le répertoire des techniques. Réunis, ces magazines forment une source écrite continue sur la scène démo belge des années 1990, longtemps illisible faute d’outils pour l’ouvrir.

Reste à préciser ce que « décoder » signifie ici. Le texte n’avait pas disparu : il était demeuré complet dans des fichiers bien conservés. Seule s’était perdue la clé qui permettait de le lire. Conserver le patrimoine né numérique ne se ramène donc pas à stocker des fichiers ; il faut aussi préserver, ou reconstruire, la capacité de les interpréter. Pour des objets aussi fragiles que les diskmags, cette capacité tient parfois à quelques octets dont le sens s’est égaré. La retrouver demande un travail patient. Reste à examiner dans quelle mesure il peut s’étendre aux centaines d’autres productions de la scène qui attendent d’être relues.