La super-résolution : un problème “impossible” vu par la théorie de l’information

Dans l’article précédent, on a vu que l’interpolation et la convolution ne font que redistribuer l’information déjà présente dans l’image basse résolution. Elles ne créent rien de nouveau.

Dès qu’on parle de super-résolution (SR), on passe à un autre niveau : on veut reconstruire une image haute résolution à partir d’une version basse résolution, en faisant apparaître des détails qui n’ont jamais été capturés par le capteur.

Mathématiquement, c’est un problème inverse mal posé. Et la théorie de l’information nous explique exactement pourquoi : l’information manquante ne peut pas être récupérée, elle peut seulement être estimée.

1. Qu’est-ce qu’un problème inverse mal posé ?

Un problème est dit « bien posé » (au sens d’Hadamard) s’il vérifie trois conditions :

il a une solution,

cette solution est unique,

elle dépend de façon continue des données d’entrée.

La super-résolution échoue sur les trois points.

Prenons un exemple simple : une photo 512 × 512 que l’on veut passer en 2048 × 2048 (facteur ×4).

Des milliers d’images différentes en 2048 × 2048, une fois réduites à 512 × 512 (par sous-échantillonnage et flou), donneront exactement la même image basse résolution.

Il n’y a donc pas de solution unique. C’est le cœur du problème : on est face à une infinité de solutions possibles.

2. La théorie de l’information entre en scène

Claude Shannon a formalisé tout ça avec l’entropie.

L’entropie mesure la quantité d’information (ou l’incertitude) contenue dans une image.

Quand on passe d’une image haute résolution \(X\) à une image basse résolution \(Y\), on perd forcément de l’information. Cette quantité d’information perdue (c’est-à-dire l’incertitude qui reste sur l’image haute résolution une fois qu’on a vu l’image basse résolution) est donnée par l’entropie conditionnelle :

H(X \mid Y) = H(X) - I(X; Y)

En français simple :

\(H(X)\) = quantité totale d’information contenue dans l’image haute résolution parfaite.

\(I(X; Y)\) = quantité d’information que l’image basse résolution \(Y\) nous donne réellement sur l’image haute résolution \(X\).

\(H(X \mid Y)\) = ce qui reste d’incertitude = l’information qui a été perdue et qu’on ne peut plus récupérer.

Et donc ?

Dans la pratique, \(I(X; Y)\) est très faible par rapport à \(H(X)\). Autrement dit : l’image basse résolution nous donne très peu d’information sur les détails fins (pores de peau, cheveux, textures…). Le reste, c’est de l’incertitude pure.

C’est pour ça que l’interpolation classique échoue : elle ne fait que redistribuer l’information existante sans avoir accès à cette information manquante. On ne peut pas la récupérer, on peut seulement l’estimer de la manière la plus intelligente possible.

3. Pourquoi on ne peut pas « récupérer » mais seulement « deviner »

Imaginez une photo de visage prise à basse résolution. Les pores de la peau, les cils fins, les micro-textures des vêtements n’ont jamais été enregistrés.

Aucune formule mathématique ne peut les faire réapparaître à partir de rien, car ils correspondent à des fréquences spatiales au-delà de la fréquence de Nyquist de l’image basse résolution.

La super-résolution devient donc un problème d’estimation statistique : parmi toutes les images haute résolution possibles qui correspondent à l’image basse résolution observée, laquelle est la plus probable ?

4. Exemples concrets où ça se voit tout de suite

Restauration de films anciens : un plan 2K restauré en 4K ou 8K avec des méthodes classiques reste souvent mou.

Imagerie médicale (IRM, scanner) : on ne peut pas multiplier les doses de rayons.

Jeux vidéo et streaming : passer du 1080p au 4K en temps réel sans que ça ait l’air « peint ».

Remarque

Si vous avez étudié le traitement du signal ou de l’information, vous savez qu’on peut quantifier précisément cette perte avec la divergence de Kullback-Leibler entre la distribution réelle de l’image haute résolution et celle estimée. Plus la divergence est grande, plus l’estimation est incertaine. C’est le point de départ des approches bayésiennes que nous verrons juste après.

En résumé

La super-résolution n’est pas une simple interpolation améliorée : c’est un problème fondamentalement sous-déterminé et mal posé. La théorie de l’information nous donne le vocabulaire et les outils pour mesurer cette impossibilité : entropie, information mutuelle, incertitude.

On ne récupère pas ce qui n’a jamais été capturé… mais on peut apprendre à deviner de façon extrêmement intelligente.

Et c’est précisément ce que permet l’approche bayésienne : transformer ce problème « impossible » en un pari probabiliste bien calibré.

Dans le prochain article, on passe aux probabilités à la rescousse : l’approche bayésienne expliquée simplement, avec priors, maximum a posteriori (MAP) et les premières vraies solutions qui vont bien au-delà de l’interpolation.

[2/10] - La super-résolution : un problème “impossible” vu par la théorie de l’information

La super-résolution : un problème “impossible” vu par la théorie de l’information

1. Qu’est-ce qu’un problème inverse mal posé ?

2. La théorie de l’information entre en scène

3. Pourquoi on ne peut pas « récupérer » mais seulement « deviner »

4. Exemples concrets où ça se voit tout de suite

Remarque

En résumé

Teste maintenant ton propre rendu

Continuer la lecture

[1/10] - L’Upscaling de Base : Interpolation, Convolution et Pourquoi Ça Ne Suffit Jamais

[3/10] - Les probabilités à la rescousse : l’approche bayésienne expliquée simplement

[4/10] - L’arrivée des réseaux de neurones : quand les CNN remplacent les priors faits-main