Statistiques de formes et variétés anatomiques

L'anatomie computationelle est une discipline émergente à l'interface de la géométrie, des statistiques, de l'analyse d'images et de la médecine dont l'objectif est de modéliser la variabilité biologique des organes. On s'intéresse par exemple à la forme moyenne et à ses variations dans une population, de manière à décrire et à quantifier les variations ou les évolutions normales et pathologies. Cet exposé met l'accent sur la dimension statistique de l'anatomie algorithmique et décrit les bases géométriques qui ont permis de faire des avancées algorithmiques notables au cours de ces dernières années.

Pour analyser la variabilité des formes, on identifie en général des primitives géométriques décrivant localement l'anatomie (courbes, surfaces, déformations) et on cherche à modéliser leur distribution statistique dans la population. Une difficulté importante est que ces objets géométriques appartiennent en général à des espaces non-linéaires alors que les statistiques ont été essentiellement développées dans un cadre vectoriel. Par exemple, additionner ou soustraire deux courbes n'a pas vraiment de sens. On ne peut donc pas facilement parler de leur moyenne ! II convient donc de redéfinir le cadre mathématique dans lequel nous devons développer nos algorithmes.

Les espaces dans lesquels vivent les formes sont toutefois souvent localement Euclidiens, et une mesure de distance infinitésimale (une métrique) permet de les munir d'une structure de variété Riemannienne. Celle-ci permet de mesurer des directions, des angles, des distances intrinsèques et les plus courts chemins géodésiques, généralisant ainsi la géométrie de l'espace à des espaces courbes dont la sphère ou la selle de cheval sont les exemples les plus simples. Sur cette base, on peut redéfinir des notions statistiques consistantes. Par exemple, la moyenne de Fréchet est l'ensemble des points minimisant la somme du carré des distances aux observations. Lorsque la moyenne est calculée, on peut ensuite développer la variété linéairement autour de ce point et revenir aux notions statistiques classiques pour les moments d'ordre supérieur. On a, en quelques sortes, corrigé la non-linéarité de notre espace.

Cette reformulation de la notion de moyenne permet également d'étendre de nombreux algorithmes de traitement d'image à des images à valeur dans une variété. C'est le cas de l'imagerie de diffusion dont chaque voxel mesure l'anisotropie de la diffusion de l'eau dans les tissus par exemple grâce à une matrice de covariance (imagerie du tenseur de diffusion ou DTI). On peut ainsi établir des algorithmes bien posés d'interpolation, de filtrage, de diffusion et de restauration de données manquantes par l'utilisation de moyennes pondérées. Ces algorithmes sont très utilisés dans les logiciels de visualisation et d'analyse des images DTI.

Le cadre Riemannien peut également être utilisé aussi pour l'analyse des déformations grâce à l'introduction de métriques invariantes à droite, ce qui a notamment donné naissance au cadre LDDMM (Large Deformation Diffeomorphic Metric Mapping) sur les difféomorphismes. L'invariance n'est toutefois que partielle, car la métrique ne peut pas être à la fois invariante à droite et à gauche, ce qui induit un défaut de symétrie : la moyenne de l'inverse d'un ensemble de déformations n'est pas l'inverse de la moyenne de ces déformations. En changeant la structure Riemannienne pour une structure plus faible (on parle d'espace à connexion affine), on peut toutefois continuer à définir des géodésiques même en l'absence d'une distance. Ces géodésiques sont toutefois maintenant des lignes droites et non plus des plus courts chemins mais on peut encore définir une moyenne locale. Dans un groupe de transformation, la structure la plus invariante est donnée par la connexion de Cartan-Schouten, et ses géodésiques sont les translations des sous-groupes à un paramètre. On justifie ainsi l'usage des champs de vecteurs stationnaires si efficaces en pratique pour paramétrer des difféomorphismes. Grâce à cette linéarisation, on peut envisager des modèles de déformations combinant des transformations simples (affines) mais à des échelles multiples, de manière à mieux identifier la variabilité des formes. Ainsi, une analyse statistique de la mandibule révèle à chaque échelle des modes de déformation qui ont un sens anatomique.