Les probabilités à la rescousse : l’approche bayésienne expliquée simplement

Dans les deux premiers articles, on a vu que l’upscaling classique bute sur un mur : l’information manquante ne peut pas être récupérée. La théorie de l’information nous l’a confirmé.

Alors comment fait-on quand même pour trouver une bonne image haute résolution ? On arrête de chercher la solution exacte (qui n’existe pas) et on passe aux probabilités. L’approche bayésienne transforme le problème en un pari intelligent : « parmi toutes les images haute résolution possibles, laquelle est la plus probable ? »

1. Le raisonnement bayésien en une phrase

On veut calculer la probabilité qu’une image haute résolution (HR) soit la bonne, étant donné l’image basse résolution (LR) qu’on observe.

Cette probabilité s’appelle la probabilité a posteriori. Elle s’écrit avec la formule de Bayes :

P(\text{HR} \mid \text{LR}) = \frac{P(\text{LR} \mid \text{HR}) \cdot P(\text{HR})}{P(\text{LR})}

En mots simples : ce qu’on veut = (ce que les données nous disent) × (ce qu’on savait déjà du monde) / une constante.

2. Les deux ingrédients magiques

Pour calculer cette probabilité, on a besoin de deux choses très concrètes :

a) La vraisemblance

C’est la partie « fidélité aux données ».

On se pose la question suivante :

« Si cette image haute résolution HR était la vraie image originale, quelle est la probabilité que, après l’avoir dégradée, j’obtienne exactement l’image basse résolution LR que j’observe ? »

La dégradation réelle comprend trois étapes : flou, sous-échantillonnage et ajout de bruit.

On appelle A l’opérateur mathématique qui représente tout ce processus de dégradation (flou + réduction de taille).

On suppose souvent que le bruit est gaussien (c’est le cas le plus courant en imagerie). Cela donne la formule :

P(\text{LR} \mid \text{HR}) \propto \exp\left( -\frac{1}{2\sigma^2} \| \text{LR} - A \cdot \text{HR} \|^2 \right)

En clair : plus l’image HR, une fois passée par l’opérateur A, ressemble à la LR observée, plus cette vraisemblance est grande.

b) Le prior

C’est la partie « connaissance du monde réel ».

Avant même de regarder l’image basse résolution, on sait à quoi ressemble une photo naturelle haute résolution : contours nets, textures cohérentes, peu de bruit, etc.

Le prior exprime cette connaissance : il dit quelles images HR sont plausibles dans la réalité.

3. Du prior au MAP : la solution la plus probable

On cherche l’image HR qui maximise la probabilité a posteriori. En pratique, on maximise le logarithme (plus simple à calculer) :

\text{HR}^* = \arg\max_{\text{HR}} \left[ \log P(\text{LR} \mid \text{HR}) + \log P(\text{HR}) \right]

C’est le Maximum A Posteriori (MAP) : le meilleur compromis entre rester fidèle à l’image basse résolution observée et ressembler à une vraie image naturelle.

Remarque

Si vous avez étudié le traitement du signal, vous savez qu’on peut aller bien plus loin que le MAP (inférence variationnelle, MCMC, etc.) pour estimer non seulement la meilleure image, mais aussi l’incertitude autour d’elle.

En résumé

L’approche bayésienne ne crée pas d’information ex nihilo. Elle dit simplement :

« Étant donné ce que je vois (l’image basse résolution) et ce que je sais du monde (le prior), voici l’image haute résolution la plus probable. »

Le prior est le vrai game-changer.

Dans le prochain article, on passe à l’arrivée des réseaux de neurones : quand les CNN remplacent les priors faits-main par des priors appris automatiquement sur des millions d’images.

[3/10] - Les probabilités à la rescousse : l’approche bayésienne expliquée simplement

Les probabilités à la rescousse : l’approche bayésienne expliquée simplement

1. Le raisonnement bayésien en une phrase

2. Les deux ingrédients magiques

a) La vraisemblance

b) Le prior

3. Du prior au MAP : la solution la plus probable

Remarque

En résumé

Teste maintenant ton propre rendu

Continuer la lecture

[1/10] - L’Upscaling de Base : Interpolation, Convolution et Pourquoi Ça Ne Suffit Jamais

[2/10] - La super-résolution : un problème “impossible” vu par la théorie de l’information

[4/10] - L’arrivée des réseaux de neurones : quand les CNN remplacent les priors faits-main