Dans un précédent article [ Petites tromperies des statistiques: pronostiques et paris sportifs ] sur les confusions souvent faites dans entre statistiques et pronostics. Dans les commentaires de cet article, vous pourrez voir que la confusion entre ces différents concepts demeure toujours forte, même après lecture, aussi repartons nous pour un tour, avec le présent article qui se veut plus pédagogique. Nous allons procéder étape par étape.

 

 

1) Evaluer les chances de survenue d'un évènement revient il à faire un pronostic?

 

          La définition du dictionnaire d'un pronostic est la prédiction de ce qui va arriver. Par exemple, entre Tyson et Hollyfield, dire que Tyson va gagner est un pronostic. Dire que Marseille battra le PSG est un pronostic. Dire que Biya gagnera les élections en 2011 est un pronostic.

          Evaluer les chances de survenue d'un évènement revient à en évaluer la probabilité d'occurence. Par exemple, si je dis "à mon avis, Marseille a 70% de chances de battre le PSG", c'est une évaluation de chances.Si je dis " Tyson a 95% de chances de battre Botha", c'est aussi une évaluation de chances.

 

          Ces deux notions étant comprises, posons nous la question de savoir si elles sont différentes.

 

          Prenons le cas du pronostic. Si je dis qu'à mon avis l'OM battra le pSG et que l'on me demande "En est tu sûr? Penses tu qu'il est réellement absolument impossible que le PSG ne perde pas ce match?", est il possible (ou plutôt, n'est il pas obligatoire) que je réponde "en fait, je veux dire, que bien sûr le PSG peut accrocher le nul ou même gagner, mais c'est l'OM qui a plus de chances de gagner". De même si je devais me prononcer aujourd'hui sur le vainqueur des élections d'octobre 2011 au Cameroun, mon pronostic ne pourrait correspondre qu'à une évaluation de chances, car Biya peut très bien mourir avant cette date, et s'il meurt, aucun dauphin désigné n'existe, personne de l'opposition ne se détache donc on ne peut pas dire avec certitude qui gagnera. Donc là aussi, donner un pronostic revient à faire une évaluation de chances. Si d'aventure, je devais répondre à une telle question "Je suis sûr à 100%" (par exemple si on me demande alors que Contador est dans le dernier kilomètre d'un col avec 3mn d'avance sur le second), cela signifie simplement que j'évalue les chances à 100%. Ce qui correspond en probabilité à un évènement certain. De même si je répondais "C'est absolument impossible que le PSG batte Marseille", cela revient à dire que j'évalue à 0% les chances du PSG (ce qui en proba revient à un évènement impossible). Quand la météo dit qu'il pleuvra aujourd'hui (pronostic), ce qui n'est pas toujours dit est qu'il s'agit de probabilités (évaluation de chances), puisque les météorologues eux mêmes annoncent leurs marges d'erreur. idem pour les sondeurs.

 

          De même, celui qui fait une évaluation de chances fait un pronostic. Si je dis que je pense que Tyson a 60% de chances de gagner, et que l'on me demande de mettre le nom du vainqueur sur un papier (ie de faire un pronostic), c'est forcément le nom de Tyson que j'écrirais. 

 

          Dans tous les cas donc, Pronostiquer revient à évaluer les chances.

 

 

2) Les statistiques équivalent elles à un pronostic?

 

          Comme nous l'avons déjà dit dans l'article cité plus haut, la réponse est non. Nous étions partis du fait qu'en football notamment, lors des matches aller_retour, les journalistes font trop souvent de confondre les deux notions. Ainsi ils regardent ce qui s'est passé dans l'histoire de la compétition pour savoir le poucentage d'équipes s'étant qualifié dans la même situation. Il s'agit là de statistiques (compilations d'évènements passés). Le problème intervient quand ils en font un pronostic. Ainsi l'Inter par exemple avait selon certains seulement 10% de chances de se qualifier, puisque 89,7% des équipes ayant gagné à l'extérieur 1-0 à l'aller s'étaient qualifié au retour. L'histoire a montré qu'il s'est quand même qualifié, mais cela n'est pas le plus important. L'important est de comprendre pourquoi cette confusion est une confusion (ie est erronnée).

 

- Egalité des chances?

          Si l'on prend toutes les équipes ayant obtenu un résultat identique au match aller le même jour, les statistiques sont les mêmes pour toutes ces équipes. Mais l'observateur averti aurait il donné les mêmes chances à Milan (leader de serié A) qui se déplaçait à Tottenham qu'à l'Inter qui se déplaçait chez un Bayern qui retrouvait Ribéry et Robben? Ce même observateur averti dira t'il que les chances de l'Inter étaient les mêmes avec Milito, Sneijder, Eto'o, Cesar, etc. que sans eux (on a vu l'Inter évoluer sans 80% de l'effectif titulaire de l'an dernier cette saison)? Non bien sûr.

          Un exemple encore plus fragrant. les statistiques disent que sur 20 ans, 65% des élèves s'étant présenté au baccalauréat (et ils sont des millions) ont réussi l'examen. Cela signifie t'il que l'élève qui se présente aujourd'hui à l'examen a 65% de chances de réussite? Cela signifie t'il que le premier d'une classe et le dernier de la même classe ont la même probabilité de réussite? Non bien sûr dans les deux cas.

 

 

- On a toujours fait comme ça, ou encore, on n'a jamais vu ça.

           Partir sur cette logique revient aussi à suivre la logique du "on n'a jamais vu ça" ou "on a toujours fait comme ça". En effet, si un évènement ne s'est jamais produit dans l'histoire, on peut dire, que statistiquement, il est arrivé dans 0% des cas. Par exemple qu'en championnat de France, une équipe qui mène 4-0 à la mi-temps se fasse battre 5-4 (OM Montpellier fin des années 90). Et s'il a 0% de chances, cela revient à dire qu'il est impossible. Pourtant les exemples sont légion de choses que l'on avait jamais vues. Que ce soit dans le sport ou dans autre chose (survie après une catastrophe, etc.). Et si un évènement arrive, cela veut dire que sa probabilité n'était pas de 0, elle pouvait être faible, mais elle n'était pas de 0, ce qui indique bien que les statistiques ne sont pas des probabilités directes.

           Le "On a toujours fait comme ça" correspond donc au cas où les statistiques indiquent 100 %, ce qui, on l'aura compris ne correspond pas toujours à 100% de chances.

 

 

- Choix de la bonne statistique

          Si on part sur cette logique, on est tout de suite ramené à une contradiction de logiques. Parce que chaque sujet pourra choisir la statistique qu'il trouve le plus intéressante. Par exemple des scientifiques indiquent que les équipes en rouge gagnent plus souvent (http://www.paperblog.fr/542536/les-equipes-de-football-au-maillot-rouge-gagnent-plus-souvent-selon-une-etude/), il existe des statistiques dans les confrontations directes entre équipes de divers pays, il existe des statistiques de confrontations directes entre les deux équipes, bref une pleïade de statistiques sur les sujets que l'on veut. Si l'on décide que pronostic = statistiques, comment pronostiquer Tottenham Milan AC si 60% des matches entre anglais et Italiens sont gagnés par des clubs anglais, alors 70% des matches opposant une équipe en rouge (Milan) et une autre sans rouge (Tottenham) sont gagnés par des équipes en rouge, et que de plus le Milan a battu Tottenham lors de 80% de leurs derniers matches, alors que les statistiques de l'UEFA indiquent que 89.7% des équipes ayant gagné 1-0 à l'extérieur à l'aller (Tottenham) se sont qualifié ensuite. Quelle statistiques choisir? et donc quel pronostic ( et évaluation de chances) si pronostic = statistiques?

 

            C'est bel et bien le sujet qui construit son évaluation des chances en s'appuyant sur ce qu'il veut (voir plus bas probabilité subjective). A tort ou à raison. On pourrait rétorquer  "mais pourquoi tu ne laisses donc pas ces journalistes prendre les statistiques et en faire des pronostics" je répondrais alors que je le ferais quand ils comprendront l'erreur qu'ils font. Ce qui n'est pas encore le cas.

 

 

3) Différents types de probabilité.


            Nous avons trouvé un excellent lien explicatif ( http://brouillondepoulet.blogspot.com/2010/06/probabilites.html ). Il existe en gros, trois types de proba.

 

- Probabilité théorique 
            Probabilité qui peut être calculée sans avoir recours à une expérimentation. Par exemple, dans un paquet de cartes de 52 cartes, j'ai 1 chance sur 52 de tomber sur une carte. Si je lance un dé, j'ai une chance sur six de tomber sur mon chiffre. Cela veut dire que si on lance le dé suffisamment de fois, le chiffre trois sortira autant de fois que tout autre chiffre (pronostic).

 

- Probabilité empirique
            Probabilité qui ne peut être établie qu'en répétant une expérience plusieurs fois. Par exemple, si je lance mon dé un million de fois, et je constate que le chiffre trois tombe 10 fois moins de temps que les autres, c'est qu'il y a un problème. La probabilité de tomber sur trois n'est plus de Un sur six. Le dé est pipé. C'est cette logique qui est appliquée sur des bancs d'essai. On teste la résistance d'une pièce en la testant sur des bancs d'essai, et selon les résultats, on établit le pronostic. C'est pour cela que l'on vous demande de passer faire la révision des 20 000 par exemple. Votre pièce peut casser avant, ou après, mais le constructeur pronostique que la limite de vie de la pièce (basée sur les milliers de pièces) est celle là. C''est aussi pour cela que quand un défaut est repéré dans une pièce, on rappelle toutes les autres pièces même si les utilisateurs n'ont pas rencontré ce défaut.

 


- Probabilité subjective
            Probabilité qu'on ne peut pas calculer théoriquement et dont on n'a pas fait (ou ne peut pas faire) l'expérimentation. Elle est basée sur le "feeling", l'impression, l'expérience. C'est le cas des probabilités dont il est questions dans notre article. L'observateur de football, le scientifique, le météorologue, pour faire son pronostic se basera sur son expérience, sur ce qui s'est déjà produit, sur son évaluation des forces en présence, bref sur ce qu'il veut, pour établir son pronostic. Il ne s'agit pas d'empirisme ici.

 

 

 

 

          En espérant qu'il y ait un peu moins de confusion maintenant.

Retour à l'accueil