vendredi 28 avril 2017 - par sleeping-zombie

La Magie s’explique toujours

...Même quand elle s'applique aux estimations particulièrement louches de précision lors des soirées électorales.

Bonjour à tous,

J'écris cet article en réponse à un autre article paru sur Avox ce mercredi, de Jean Mohamed De La Bastille, "Des résultats comme par magie ?".

Je vous invite à le lire, mais pour les plus pressés, l'auteur s'y étonne de la précision des estimations des résultats du 1er tour données dès 20h, alors beaucoup de bureau de vote ne ferment qu'a 20h et n'ont donc pas pu procéder au dépouillement. En toute honnêteté, l'auteur y fourni un lien vers les explications "officielles" qui, même s'il est pertinent, ne fournit pas l'explication centrale de ce tour de magie.

Et c'est normal, l'explication est mathématique, et personne n'aime les maths.
Je me propose ici de vous expliquer ce qu'est le "théorème central limite", en termes accessibles aux allergiques des équations.

Qu'est-ce que c'est que ce théorème ?
D'abord, c'est un truc de matheux connu depuis plus de 200 ans, et qu'on enseigne (ou du moins "enseignait à mon époque") en classe de terminale S. Bref, c'est pas un secret d'état.

Pour faire simple, c'est une loi d'approximation, démontrée, qui s'applique dans le cas suivant :
Supposons que vous ayez un phénomène A, totalement arbitraire et inconnu. Dans notre cas, A est "ce que vote un individu donné".


Supposons qu'a partir de ce phénomène A, on construise un phénomène B, qui ne soit jamais qu'une somme répétée de ce phénomène A. Dans notre cas, B est "le résultat de l'élection, qui n'est jamais que la somme de 40 millions de vote d'individus donnés".
Le théorème central limite nous dit que quelle que soit la règle que suit A, connue ou pas, régulière ou pas, la règle que suit B obéit à des caractéristiques très facilement identifiées et très facilement calculées, pour peu que B soit la somme de suffisamment d'occurences de A.

Concrètement, comment ça se matérialise ?
D'abord on pose un postulat : les bureaux de vote qui ferment à 20h n'ont pas de raison d'avoir des résultats différents des bureaux qui ferment à 18h.
Ensuite, on réalise que, au coeur d'un même bureau de vote, le vote dépouillé à 19h n'a pas de raison d'être différent de celui qui est dépouillé à 18h.

La méthode s'ensuit est simple : on disperse des observateurs dans les bureaux de vote qui commencent le dépouillement assez tôt, et ces observateurs remontent les résultats alors que le dépouillement n'est pas encore fini. Au niveau national, on récupère les 10 000 ou 100 000 premiers bulletins dépouillés, et on voit déjà s'il se dégage un vainqueur. Le théorème central limite permet d'évaluer la marge d'erreur de l'estimation. Si la marge d'erreur est inférieure aux écarts entre les candidats, on peut, qualitativement, donner les vainqueurs de l'élection sans attendre la fin.

A titre d'exemple, j'ai fait un petit programme qui simule l'élection qui a eut lieu (avec les résultats officiels, fournis par le ministère de l'intérieur, pas par la SOFRES), puis j'ai comparé avec un dépouillage partiel de cette élection simulée, sur des bulletins pris au hasard.
Les résultats sont assez bluffant :
En ne prenant qu'un échantillon de 10 000 bulletins :
  Sur 100 essais, la simulation n'a rendu qu'une seule fois une erreur sur les 2 gagnants, ordre compris.


  Sur les 3eme et 4eme place, rien de clair ne se dégage (ce qui est normal, vu que Fillon et Mélenchon ont eu des scores finaux très proches).
  Quelque soit le candidat, la marge d'erreur du dépouillement partiel atteint très rarement 1%.
  
En ne prenant qu'un échantillon de 100 000 bulletins :
  Sur 100 essais, la simulation rend toujours les 4 premiers dans le bon ordre. Avec un écart de score final qui ne dépasse jamais 0.4%

Ces résultats, que j'ai mesuré empiriquement, peuvent se calculer précisemment à l'avance par des statisticiens plus doués que moi (je l'avoue, mes années de matheux sont trop loin, mais mes années d'informatique sont plus proches :).

Le tour de magie de la Sofres (ou Ipsos, ou je ne sais quel institut de sondage) consiste juste à avoir mis la main sur les 100 000 premiers bulletins dépouillés et remarqué qu'avec juste ces 100 000, on avait déjà 2 candidats qui devançaient les autres de plus d'1 point. Quand on sait que, sur un tel échantillon, la marge d'erreur est inférieure à 0.4%, on peut claironner à 20h sur un résultat extrèmement précis sans crainte de se tromper.

En espérant n'avoir pas été trop indigeste,

Bonne continuation à vous



17 réactions


  • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 30 avril 2017 20:09

    Heu...Alcyon , tu fais chou blanc..Mort de lol !



    Agoravox sait-il que Mr Sleeping-zombie a deux comptes ?

    Au moins, moi je serai venu te lire !!!

    Je suis devant mon écran et je m’esclaffe !

    • sleeping-zombie 30 avril 2017 23:52

      @Jean Mohamed De La Bastille
      euh... Mauvais numéro ?

      Mais je suis au moins content que l’inspirateur de cet article soit passé faire un coucou :D


  • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 30 avril 2017 20:11

    Ah oui puis je viens de me taper tes stats...Ta grande intelligence ne semble pas faire son effet...Surement, un problème de magie...


    Je m’esclaffe !

  • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 30 avril 2017 20:15

    ¨lus sérieusement, Je suis content si cela t’a inspiré un article. Ca aura toujours eu cela de bénéfique..Et je trouve ca cool qu’on parle de math même si je ne suis pas d’accord avec ce que tu écris. Car on a un vrai problème avec les mathématiques dans la compréhension de l’économie et de la politique de la part de trop de citoyens français.


    Merci pour l’article, @Alcyon 
     Même si je ne suis pas d’accord avec ce que tu écris....

  • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 30 avril 2017 20:22

    Heu...Et @pemile, c’est aussi toi ?


  • sleeping-zombie 30 avril 2017 23:54

    @Jean
    Je n’ai pas suivi l’échange avec Alcyon dont tu as l’air de faire référence, mais s’il y a un point contestable dans ce que j’ai écris, je serai ravi d’y apporter des précisions.


    • pemile pemile 1er mai 2017 00:09

      @sleeping-zombie « Je n’ai pas suivi l’échange avec Alcyon dont tu as l’air de faire référence »

      Persuadé que Alcyon est un multi-compte regroupant vous mêmes, sleeping-zombie, pipiou et moi-même, Jean a demandé la suppression de votre compte ! smiley


    • sleeping-zombie 1er mai 2017 08:41

      @pemile
      Dans la mesure où je n’ai été contacté par personne du staff d’Avox, j’imagine que sa demande n’a pas eu le moindre effet.

      (...) en tout cas, merci, j’ai pu récupérer le fil de la conversation, je comprends mieux les commentaires de Jean-Mohammed sur mon article.

      C’est quand même aberrant jusqu’où peut mener une simple conversation quand on a épuisé tous les arguments mais que personne n’accepte de lâcher l’affaire :/


    • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 1er mai 2017 11:38

      @sleeping-zombie
      Agoravox mets toujours un peu de temps mais en général, ils sont assez ferme des ces cas là...Adios !


    • pemile pemile 1er mai 2017 12:12

      @charlie cui banni « pemile, tout particulièrement, est THE spécialiste pour faire tourner en bourrique quiconque sur Agoravox »

      Non, uniquement les personnes de mauvaise foi partant dans l’insulte !


  • Remosra 1er mai 2017 00:12

    Vous allez pas continuer !
    sur le précédent article il y a plus de 400 réactions dont la moitié voir même les trois quart vous sont imputés. Et à chaque fois que je me fais avoir en cliquant sur un de vos commentaires, mon pc et le site rame pour me ramener sur vos commentaires qui ne sont que ridicules !
    Alors, prenez rdv tout les deux et foutez vous sur la gueule.
    Comme ça la loi du plus fort aura raison même s’il a tort !


  • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 1er mai 2017 01:04

    Tiens @Remosra et @pemile, quel hasard !


    Manque plus qu’@Alcyon...Ce doit être difficile de se diviser en 5...

    • Remosra 1er mai 2017 01:12

      @Jean Mohamed De La Bastille

      Non vous vous trompez, je sais que vous vous êtes bien pris le choux avec l’un ou l’autre mais par pitié ne me prenez pas pour quelqu’un d’autre !
      D’ailleurs votre article qui parle des sondages a été pour moi qu’une évidence énoncée et loin des propos de matheux qui vous a engagé dans votre dispute.
      Et puis comme je l’ai déjà dit, ma petite formation en compta ne me permet pas de débattre sur ce sujet !
      Bref, j’ai une considération pour votre pertinence sur ces sondages bidonnés mais je ne vous comprend toujours pas pourquoi vous avez autant insisté à vous défendre sur l’avis d’une personne que vous ne connaissez pas, et dont personne ne sait si elle dit vrai ou pas sur sa formation, et aussi sur ces propos qui un moment donné tendaient plus de la philosophie que des mathématiques !
      En gros, je vous apprécie mais ne devenez pas parano, je ne suis pas votre votre bourreau ! :)


    • pemile pemile 1er mai 2017 01:33

      @Jean Mohamed De La Bastille « Tiens @Remosra et @pemile, quel hasard ! »

      Va falloir vous calmer, peut être présenter vos excuses à sleeping-zombie et sur cet article, parler du fond, les faibles marges que déclare obtenir sleeping-zombie avec un échantillon de 100.000 bulletins pris au hasard ?


    • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 1er mai 2017 02:34

      @pemile
      Oui tu as raison parlons de l’article ...Comment se fait-il que lui le grand spécialiste des math ne ramène pas sa fraise ?



    • Jean Mohamed De La Bastille Jean Mohamed De La Bastille 1er mai 2017 02:35

      @Jean Mohamed De La Bastille
      Je Parle d’@Alcyon, ce génie des math ? Il devrait se sentir concerné par cet article ?


  • sleeping-zombie 1er mai 2017 08:53

    @Jean Mohamed De La Bastille

    Bonjour Jean,

    Tu vas peut-être pas me croire, mais je ne suis ni Alcyon, ni Pemile, ni Remosra. Je peux pas te le prouver directement, mais si tu as du temps libre et que tu passes en région parisienne, je t’invite un après-midi de week-end à discuter sondages ou maths.

    Merci de ne pas importer ici une conversation qui a dépassé son point de stérilité dans ton article et a viré à l’aigre.

    Après, si collectivement vous voulez discuter du sujet lui-même qui nous a tous amené ici, je serai ravi d’aborder les points suivants :
    -la méthodologie (j’admet qu’il m’arrive de faire des erreurs de logique)
    -les calculs théoriques (j’ai pas manipulé d’écart-type depuis 15 ans)
    -la modélisation et la vérification
    - ou tout autre point lié au sujet, et non aux auteurs...

    Merci :)


Réagir