Vous souhaitez partager votre contenu sur R-bloggers ? cliquez ici si vous avez un blog, ou ici si vous n’en avez pas.
En tant que fans de football, nous entendons constamment des experts faire des prédictions audacieuses. Mais à quelle fréquence atteignent-ils réellement leurs cibles ? Vérifions les antécédents de trois experts populaires du football russe.
Vadim Lukomskiy, Denis Alkhazov et Vladimir Grabchak diffusent un fantastique podcast La Liga Preview sur YouTube. Chaque semaine, ils discutent de la journée à venir et proposent leurs paris, un par match. La semaine prochaine, ils commencent par examiner les résultats. Pendant longtemps, je me suis demandé comment les pronostics hebdomadaires s’additionnaient à long terme. Je voulais voir si une connaissance approfondie d’un championnat spécifique et une profonde implication pouvaient permettre aux experts de rester dans la zone rentable tout en pariant sur tous les matchs de la saison.
J’ai donc décidé de le vérifier. Dans la saison 2025-2026 actuelle, nous disposons de données jusqu’à la 28e journée, et les journées 6 et 18 ont été jouées en milieu de semaine, donc les gars ont sauté les pronostics. Au total, 26 tours, 10 jeux chacun – pas mal de données avec lesquelles jouer.
La collecte de données était un curieux flux de travail en soi. J’ai pris des captures d’écran des prédictions directement à partir des vidéos YouTube et j’ai utilisé des LLM (Gemini et Claude) pour analyser les images et les compiler dans un ensemble de données propre. Pourtant, il y avait un défi en cours de route. Les LLM ont eu du mal avec les noms d’équipe représentés par de petits logos. Voici à quoi ressemblait une capture d’écran typique :

Parfois, ils parvenaient à retrouver les noms des équipes participantes à partir de la description textuelle du pari. Mais dans d’autres cas, ils ont dû laisser des marques fictives « Équipe A » / « Équipe B ». Pour combler les lacunes, je l’ai croisé avec un dump de tous les matchs joués en Liga cette saison. Cela a permis de déterminer tous les noms d’équipes pour lesquelles les LLM ont échoué lors de la première manche. 1.
1 Lors du test, Gemini m’a donné un décodage parfait d’une capture d’écran. Je pensais qu’il utilisait la vision par ordinateur pour lire les noms des équipes à partir des logos, mais il s’est avéré qu’il utilisait simplement la transcription textuelle de la vidéo YouTube que j’avais liée dans l’invite initiale.
Quoi qu’il en soit, avec moins d’efforts qu’il n’en aurait fallu pour transcrire manuellement les pronostics, je me suis retrouvé avec un ensemble de données bien rangé de 259 pronostics, y compris le vainqueur prédit, les cotes et les résultats réels du match.
Naturellement, j’ai lancé R pour répondre à deux questions brûlantes : l’un de nos trois experts était-il rentable à long terme et s’il était systématiquement meilleur pour prédire les résultats de certaines équipes spécifiques qu’il connaissait et comprenait le mieux ?
Le tableau de bord global
Tout d’abord, regardons les performances globales. L’évaluation d’un expert ne se limite pas au nombre de fois où il gagne ; il s’agit de la valeur des chances qu’ils réussissent à prédire.


J’ai été amusé de voir les résultats. Deux des trois experts ont réussi à remporter 44 % de leurs paris, l’effet cumulatif les ramenant ainsi à un équilibre presque parfaitement neutre. Ainsi, même une connaissance extrêmement approfondie du domaine et une forte implication dans la ligue ne se traduisent pas par une stratégie de paris rentable. Pas de véritable surprise ici, mais juste un rappel supplémentaire qu’on ne trompe pas le système conçu pour le tromper.
Pariez simplement sur XXX – vous ne pouvez pas manquer
Eh bien, peut-être que nos experts connaissent si bien certaines équipes qu’ils peuvent bien mieux prédire les résultats de ces équipes ? Vous savez, le football est très contextuel. Un expert peut avoir du mal à prédire la forme volatile d’une équipe, mais il peut parfaitement lire les configurations tactiques d’une autre. Je voulais voir si les experts avaient des équipes « spécialisées ».
Pour ce faire, j’ai remodelé les données afin que chaque match compte à la fois pour les équipes à domicile et à l’extérieur impliquées, en calculant le taux de réussite pour chaque combinaison expert-équipe.


Ouah! Certains modèles fascinants émergent :
- Le sous-marin jaune de Lukomskiy : Vadim a une lecture incroyable Villarréal. Sur 21 prédictions les impliquant, il en a obtenu 14, soit un taux de réussite massif de 66,7 % sur un large échantillon. Il lit également régulièrement l’Athletic Bilbao et la Real Sociedad.
- Le Levante d’Alkhazov : Denis connaît un certain succès (chance ?) avec Levantprédisant avec précision 14 matchs sur 26 (53,8%). Fait intéressant, bien qu’il ait globalement du mal par rapport à Vadim, sa lecture des affrontements entre les tables moyennes et inférieures semble être son pain et son beurre.
- L’Osasuna impeccable de Grabchak : Bien que la taille de son échantillon soit plus petite, Vladimir a parfaitement réussi 7 pour 7 sur les matchs impliquant Osasuna.
- Les trois experts ont constamment échoué face au grand trio Réal Madrid, Barceloneet Atlético Madridce qui est assez surprenant compte tenu de l’attention perpétuelle portée à ces clubs et de leurs performances souvent constantes.
Les experts savent-ils vraiment quelque chose de spécifique sur certaines équipes, ou est-ce juste une question de chance ?
En rapport
PakarPBN
A Private Blog Network (PBN) is a collection of websites that are controlled by a single individual or organization and used primarily to build backlinks to a “money site” in order to influence its ranking in search engines such as Google. The core idea behind a PBN is based on the importance of backlinks in Google’s ranking algorithm. Since Google views backlinks as signals of authority and trust, some website owners attempt to artificially create these signals through a controlled network of sites.
In a typical PBN setup, the owner acquires expired or aged domains that already have existing authority, backlinks, and history. These domains are rebuilt with new content and hosted separately, often using different IP addresses, hosting providers, themes, and ownership details to make them appear unrelated. Within the content published on these sites, links are strategically placed that point to the main website the owner wants to rank higher. By doing this, the owner attempts to pass link equity (also known as “link juice”) from the PBN sites to the target website.
The purpose of a PBN is to give the impression that the target website is naturally earning links from multiple independent sources. If done effectively, this can temporarily improve keyword rankings, increase organic visibility, and drive more traffic from search results.