17 jan 2018
11:15 - 12:30
Salle 5, Site Marcelin Berthelot
En libre accès, dans la limite des places disponibles

Les challenges sont présentés dans la rubrique Challenges de données des pages de Stéphane Mallat.

Le site web Challenge data met à disposition des challenges de traitement de données par apprentissage supervisé. Ce séminaire introduit une première partie des challenges qui sont utilisés dans le cadre du cours. Ces challenges sont proposés par des entreprises ou des scientifiques, et sont issus de problématiques concrètes qu’ils rencontrent dans leur activité. Ils s’inscrivent dans un esprit d’échange scientifique, avec un partage de données et d’algorithmes. Les données mises à disposition sont non confidentielles et les rapports algorithmiques des participants peuvent être mis à la disposition de tous, s’ils le souhaitent, après la clôture de la saison.

Les challenges couvrent un large spectre d’applications, sur des images, sons, textes, données médicales, mesures physiques, données d’Internet. Chaque challenge fournit des données labélisées, ainsi que des données de test. Les participants soumettent sur le site web leurs prédictions calculées sur les données de test. Le site calcule un score avec une métrique d’erreur qui est spécifiée. Il fournit un classement aux participants, ce qui permet d’évaluer leurs résultats dans une large communauté. Les challenges commencent le 1er janvier 2018. Une clôture intermédiaire a lieu en juin par une évaluation des prédictions sur de nouvelles données de test. La clôture finale est en décembre, avec une remise des prix en janvier 2019.

Cette année, les challenges ont été organisés et supervisés à l’ENS par Mathieu Andreux, Tomas Anglès, Georgios Exarcharkis, Louis Thiry, John Zarka et Sixin Zhang. L’organisation de ces challenges de données est soutenue par la chaire CFM de l’École normale supérieure, et par la Fondation des sciences mathématiques de Paris.

Lors de cette première session, les six challenges suivants ont été présentés :

  • « Prédiction de la volatilité sur des marchés financiers », présenté par Éric Lebigot de la société Capital Fund Management. L’objectif du challenge est de prédire la volatilité de fin de journée d’actions américaines à partir de leur historique de rendements de début de journée.
  • « Identification de célébrités », présenté par Antoine Chassang de la société Reminiz. L’objectif est d’identifier les visages apparaissant dans des vidéos à partir d’un dictionnaire de référence de visages de célébrités.
  • « Prédiction de la production électrique horaire par unité de production en France », présenté par Alexi Bergès de la société Wattstrat. L’objectif est de prédire la production électrique horaire de chaque unité de production en France, à partir des courbes de demandes et de productions renouvelables régionales ainsi que de la disponibilité horaire des unités de production.
  • « Prédiction de réclamations lors de transactions e-commerce », présenté par Vincent Michel de la société PriceMinister  Rakuten France. L’objectif est de prédire si une transaction e-commerce donnera lieu à une réclamation ou non, et si oui, de quel type, à partir des caractéristiques de la transaction.
  • « Prédiction de la réponse attendue à des questions de pharmaceutique », présenté par Emmanuel Bilbault de la société Posos. L’objectif est de catégoriser des questions de pharmaceutique selon le type de réponse attendu.
  • « Prédiction des performances énergétiques de bâtiments », présenté par Sylvain Le Corff de la société Oze-Energies. L’objectif est de prédire les consommations énergétiques ainsi que les températures intérieures de bâtiments à partir des températures extérieures et d’un nombre réduit de paramètres décrivant la structure et les réglages des bâtiments.