Backtest : valider une stratégie de paris sur 10 ans de données
Avant de risquer son argent, tester une stratégie sur l'historique est essentiel. Méthodes de backtest, biais à éviter, métriques à surveiller : le guide technique pour valider scientifiquement une approche de paris.
Pourquoi backtester ?
Tout parieur sérieux a une croyance : "ma stratégie marche". Mais comment savoir si c'est vrai, ou si c'est juste de la chance sur quelques mois ?
La réponse : le backtest. C'est la simulation de ta stratégie sur des données historiques pour voir comment elle aurait performé dans le passé. Si elle aurait gagné de l'argent sur 10 ans incluant différents contextes (saisons, blessures, surprises), il y a une chance qu'elle marche en réel.
Sans backtest sérieux, tu ne sais pas si ta stratégie est solide ou si tu as juste eu de la chance.
Le piège mortel : le sur-apprentissage (overfitting)
Le problème principal du backtest, c'est qu'on peut toujours trouver une stratégie qui aurait été rentable dans le passé. Quelques exemples absurdes mais réels :
Stratégie A : "Miser sur l'équipe à domicile en Bundesliga si la lune est croissante." → Backtest sur 2010-2015 : ROI +12%. → Backtest sur 2016-2023 : ROI -3%.
Stratégie B : "Miser tous les matchs des équipes commençant par M le mardi." → Marche par hasard sur 2018-2020.
Ces stratégies sont overfittées : elles capturent du bruit, pas un vrai pattern. Sur de nouvelles données, elles s'effondrent.
Les 5 règles du backtest honnête
Règle 1 : Out-of-sample validation
Divise tes données en deux blocs dans le temps:
- Training set : 2014-2021 (où tu construis et tunes ta stratégie)
- Test set : 2022-2024 (où tu vérifies sans jamais y avoir touché)
Si ton backtest est positif sur le training mais négatif sur le test, ta stratégie est bidon. C'est de l'overfitting pur.
PROLIFICK utilise systématiquement cette séparation : nos modèles sont entraînés sur 5 saisons et validés sur la dernière, en complète isolation.
Règle 2 : Walk-forward analysis
Encore mieux que out-of-sample : la walk-forward. Tu re-entraînes ton modèle chaque mois (ou semaine) et tu paries seulement le mois suivant. Cela simule exactement comment tu utiliseras la stratégie en réel.
Implémentation :
Mois 1 : entraîner sur 2014-2021, parier janvier 2022
Mois 2 : entraîner sur 2014-Jan 2022, parier février 2022
Mois 3 : entraîner sur 2014-Fév 2022, parier mars 2022
...
Les résultats sont nettement moins flatteurs que un backtest classique, mais beaucoup plus réalistes.
Règle 3 : Inclure les frais
Une stratégie peut sembler positive sur les cotes brutes mais devenir négative avec :
Marges bookmakers : déjà intégrées dans les cotes utilisées, OK.
Fluctuations des cotes : parfois la cote affichée 5 minutes avant est différente de celle où tu paries. Soustrait 0.5-1% en sécurité.
Comptes limités : si tu es bon, ton compte sera limité à 5-10€ max. Reflète cette contrainte dans le backtest pour les volumes futurs.
Timing : tu ne peux pas parier 100 matchs simultanément en pratique.
Règle 4 : Tester la robustesse
Une stratégie solide doit être robuste à des petites perturbations :
- Et si tu utilisais une cote 1% inférieure ?
- Et si tu pariais 1 jour plus tard ?
- Et si tu ignorais 10% des matchs aléatoirement ?
Si ces variations cassent la profitabilité, ta stratégie est fragile et ne survivra pas en réel.
Règle 5 : Volume statistique suffisant
Sur 50 paris, n'importe quelle stratégie peut sembler gagnante par chance. Pour avoir une vraie significativité statistique, il faut au moins 1000 paris dans le test set, idéalement 5000+.
La règle empirique : ROI de +5% sur 200 paris = pas de garantie. ROI de +5% sur 5000 paris = très probable que c'est réel.
Les métriques essentielles
Au-delà du ROI brut, voici ce que tu dois calculer :
ROI (Return On Investment)
ROI = (Profit total / Total misé) × 100
Cible : +3% à +10% pour une stratégie réaliste sur le long terme. Au-delà de +15%, méfiance — c'est probablement de l'overfitting.
Yield
Synonyme de ROI dans le monde des paris. Yield > 0 = stratégie gagnante.
Win rate
Pourcentage de paris gagnants. Trompeur seul : 80% de win rate avec cotes 1.10 = perdant. 30% de win rate avec cotes 4.00 = gagnant.
Sharpe ratio (adapté)
Sharpe = ROI moyen / écart-type des ROIs mensuels
Mesure la régularité. Un Sharpe > 1.5 est excellent en paris sportifs.
Maximum drawdown
La pire baisse cumulative. Si ta stratégie perd 30% de bankroll au pire, peux-tu psychologiquement supporter ça ? La réponse est souvent non.
CLV moyen (Closing Line Value)
Battre la cote de fermeture en moyenne = avoir un edge réel. CLV > 0% = bon signal long terme.
La variance : ton ennemi caché
Même une stratégie positive avec ROI +5% peut subir des séries noires de 100+ paris perdants. C'est mathématique.
Imaginons : tu paries cotes 2.00 avec 53% de précision (edge +6%). Probabilité de perdre 10 paris d'affilée = 0.13%. Sur 5000 paris, ça arrive plusieurs fois.
Si tu mises 5% de bankroll par pari (Kelly trop agressif), 10 pertes consécutives = -40% de bankroll. Pas surprenant que les parieurs abandonnent en plein streak négatif, alors que la stratégie est bonne.
Solution : mises faibles (1-3% du bankroll, Half-Kelly), patience, et focus sur le long terme.
Le backtest chez PROLIFICK
Voici comment nous validons nos modèles :
Étape 1 — Données. 10 saisons NBA (12 000+ matchs), 8 saisons football (5 ligues majeures, 30 000+ matchs), 6 saisons tennis (50 000+ matchs).
Étape 2 — Walk-forward strict. Modèle entraîné chaque mois, prédictions du mois suivant.
Étape 3 — Métriques par sport.
- NBA : ROI, win rate, CLV par catégorie de pari (h2h, spread, total).
- Football : idem + Poisson calibration error.
- Tennis : idem + accuracy sur sets.
Étape 4 — Stress tests. Performance pendant Covid (calendriers chamboulés), All-Star breaks, finales.
Étape 5 — Calibration des probabilités. Vérifier que quand on dit "70%", l'événement arrive bien 70% du temps. Si calibration mauvaise, on corrige avec Platt scaling.
Résultats publiables : ROI moyen +4-7% sur les paris classés "Quasi Certains" et "Solides", sur l'ensemble de 2022-2024 en out-of-sample.
Les biais à reconnaître
1. Survival bias. "J'ai trouvé 10 stratégies gagnantes sur 100 testées." Sur 100 stratégies aléatoires, 5-10 paraissent gagnantes par hasard. Méfiance.
2. Look-ahead bias. Utiliser des données qui n'étaient pas disponibles au moment du pari (ex: classement final de saison pour parier en début de saison). Le backtest devient artificiellement positif.
3. Data snooping. Tester 1000 stratégies sur les mêmes données et garder la "meilleure". Cette meilleure est probablement chanceuse, pas réellement bonne.
4. Backtesting bias. Connaissance des résultats futurs influence le design des features. Solution : freeze les features avant de regarder les performances.
Comment faire ton propre backtest
Si tu veux tester ta stratégie :
- Collecte des données historiques (cotes + résultats). Sources : Pinnacle archives, Football-Data.co.uk, Basketball-Reference.
- Code en Python la logique de ta stratégie (pour 5 ans, ça devrait prendre 30-60 min de calcul).
- Sépare training (70%) et test (30%) en respectant le temps.
- Calcule ROI, win rate, drawdown, CLV.
- Sois honnête : si ton ROI test est < 50% du ROI training, ta stratégie a sur-appris.
- Itère plusieurs mois avant de risquer de l'argent réel.
Conclusion
Backtester correctement est ce qui distingue un parieur qui croit avoir une méthode d'un parieur qui sait qu'il en a une. C'est exigeant, frustrant, et souvent décevant — la plupart de tes idées ne survivront pas à un backtest honnête.
Mais c'est la seule façon de construire des stratégies durables. Sans backtest, tu fais juste des paris aléatoires et tu te racontes des histoires.
Chez PROLIFICK, nos modèles ont été backtestés sur des dizaines de milliers de matchs, avec walk-forward strict et calibration des probabilités. Ce n'est pas une promesse de gain — la variance reste réelle — mais c'est l'assurance que la méthodologie tient la route.
Découvrez les prédictions du jour pour voir nos modèles en action.