Challenges de données

Challenges 2024

Les challenges sont proposés par des services publics, des entreprises ou des laboratoires scientifiques, et sont issus de problématiques concrètes. Les participants soumettent les résultats de leurs algorithmes de classification ou de prédiction, qui sont mis en compétition par le site web. Les challenges sont intégrés dans le cours du Pr Stéphane Mallat au Collège de France, et proposés dans de nombreux enseignements de sciences des données en France et dans le monde francophone.

L’édition 2024 est désormais lancée avec sept nouveaux challenges aux thématiques variées, organisés en partenariat avec l’École normale supérieure et l'Institut Louis Bachelier.

Les challenges

Prédire de manière séquentielle l’évolution d’une carrière

Présenté par HrFlow (le 24/01/2024)
Présentateur : Mouhidine Seiv
L’objectif est d’utiliser des méthodes de prise de décision séquentielle pour prédire l’étape à laquelle un employé est susceptible de cesser de progresser à travers les positions dans la hiérarchie de l’entreprise, le tout à partir de données sur l’employé et sur l’entreprise.

Apprentissage de l’anatomie radiologique et oncologique grâce au few shots learning

Présenté par Raidium (le 17/01/2024)
Présentateur : Corentin Dancette
L’objectif est de segmenter des structures sur des images de CT-Scan en utilisant leur forme, mais sans annotations exhaustives. Une des difficultés réside dans le fait que seules certaines images d’entraînement sont segmentées.

Anticipez l’affluence au sein des gares SNCF-Transilien

Présenté par Transilien-SNCF (le 17/01/2024)
Présentateur : Rémi Coulaud
Le but de ce challenge est de prédire à moyen-long terme le nombre de validations par jour et par gare. Il s’agit donc là d’un problème de prévision de séries temporelles, avec une complexité provenant de la multiplicité des séries. Ce challenge permettra à l’entreprise de proposer des services plus adaptés et à améliorer la performance de leur exploitation.

Données de marché haute fréquence : saurez-vous identifier l’action ?

Présenté par CFM (le 17/01/2024)
Présentateur : Stephen Hardiman
L’objectif de ce challenge est d’essayer d’identifier, à partir d’une séquence de données boursières, quelle est l’action correspondante, le tout à partir de données extraites du carnet d’ordres. Beaucoup d’informations sont présentes pour aider les participants à trouver des indices permettant de déterminer le titre correspondant.

Détection de corrosion dans les conduites en acier

Présenté par SLB (le 24/01/2024)
Présentatrice : Ana Escobar
À partir d’extraits d’images topographiques de conduites en acier, le but sera de réussir à segmenter de nouvelles images pour y identifier d’éventuelles traces de corrosion.

Football : qui va gagner ?

Présenté par QRT (le 24/01/2024)
Présentateur : Wissem Braham
Le challenge consistera à prédire le résultat de matchs de football. À partir de données historiques réelles extraites de nombreuses ligues, à l’échelle des matchs mais également des joueurs, le but sera de construire un modèle prédictif qui peut fonctionner pour n’importe quelle ligue, niveau et situation géographique.

Prédiction de prix de l’électricité

Présenté par Elmy (le 17/01/2024)
Présentateur : Anthony Galtier
L’exercice consiste à modéliser de façon supervisée l’écart de prix d’électricité entre le marché Intraday (le jour-même) et le marché SPOT (la veille). Il importera surtout de prédire si le prix Intraday sera supérieur ou inférieur au prix SPOT.