Note · Extraction vs préservation

Le jour où le modèle a avoué

J'ai posé la même question à mon LLM préféré et à (Urs), sur le même document. Le modèle a inventé des chiffres. Avec assurance. De façon convaincante. Quand je l'ai mis au défi, il a admis :

Le modèle de langage

« J'ai inventé ces chiffres. C'est une erreur de ma part. »

(Urs)

« Je ne trouve pas cette donnée : elle n'existe pas dans le document. »

Toute la différence entre l'extraction et la préservation tient dans ces deux phrases. Les modèles de langage synthétisent brillamment — mais quand ils ne savent pas, ils comblent le vide. Une infrastructure cognitive ne devine pas. Elle dit « je ne sais pas », parce que la provenance compte plus que la réponse.

Notez la formulation exacte. (Urs) ne dit pas « cette donnée n'existe pas » — un énoncé sur le monde, invérifiable. Il dit : elle n'existe pas dans le document — un énoncé sur un périmètre défini, vérifiable, rejouable. C'est toute notre doctrine des verdicts : jamais de négation absolue, toujours un verdict au périmètre des sources mobilisées, avec l'empreinte pour le prouver.

Un système de confiance ne se reconnaît pas à ce qu'il sait. Il se reconnaît à la manière dont il dit ce qu'il ne sait pas.

C'est ce que nous construisons. Pas à la place des modèles — au-dessus d'eux. Chaque affirmation typée, sourcée, scorée ; chaque « je ne sais pas » documenté et remis à l'expert. Voir Evidence →