Résumé
Nous considérons un problème de contrôle stochastique avec méconnaissances, inspiré par les neurosciences. Dans ce modèle, un neurone est caractérisé par son potentiel de membrane et émet des décharges de manière aléatoire, avec un taux qui dépend de son potentiel et d’un paramètre inconnu. Il n’est observé que les instants des décharges du neurone. Le contrôle agit sur le potentiel de membrane comme un terme de dérive. On se demande comment le choisir de manière optimale afin d’estimer au mieux le paramètre inconnu. On montrera comment reformuler le problème en utilisant le théorème de Girsanov et comment établir un principe de programmation dynamique en prenant un point de vue Bayesien. On verra que dans certains cas, la fonction valeur peut être obtenue comme l’unique solution de viscosité d’une équation d’Hamilton-Jacobi-Bellman de dimension finie.
Travail en commun avec Nicolas Baradel.