Méthodologie
Algo Quinté est un modèle de classement supervisé entraîné sur les données des courses Plat publiées par France Galop d'avril 2023 à mars 2025.
Données
- Chronométrie McLloyd : capteur GPS sur chaque cheval, 10 mesures par seconde, temps de passage tous les 200 m. Couverture nationale depuis février 2021.
- Cotes PMU : récupérées via l'API TurfInfo publique pour la validation et le backtest.
- Métadonnées de course : distance, terrain (going), hippodrome, prix de la course, conditions, équipement.
Features
Le modèle utilise ~20 features par cheval, toutes strictement antérieures à la course :
- Indice de vitesse (résidu OLS time ~ distance + terrain + hippodrome)
- Indice de fin de course (Last 600m z-scoré par course)
- Moyennes glissantes sur 3 et 5 sorties
- Taux de victoire 365 jours : entraîneur, jockey, étalon, mère, grand-père maternel
- Structurel : poids porté, corde, taille du peloton, âge, distance
Modèle
LightGBM en mode lambdarank, groupé par
race_id. Pertinence : 4 pour le vainqueur, puis
dégressive jusqu'à la 4ᵉ place. Probabilités calibrées par régression isotonique sur les
20 % derniers jours d'entraînement.
Validation temporelle
Coupure stricte : entraînement sur les courses antérieures au 1ᵉʳ octobre 2024, validation sur les 6 mois suivants (1 181 courses Quinté+). Aucune contamination — les statistiques glissantes excluent rigoureusement les courses du jour même.
Limites connues
- La période de validation est principalement hivernale (Chantilly PSF, Cagnes, Deauville). Le modèle reste à valider sur la saison estivale gazon.
- La marge brute est concentrée sur les longshots (cotes 8/1 à 15/1) sous-évalués par le marché PMU. Hors longshots, la marge se réduit fortement.
- Les cotes PMU étant pari-mutuelles, les paris de gros volumes modifient la cagnotte et réduisent la marge effective.