Dimanche soir à 20h, la France attendait fébrilement les résultats du premier tour de l’élection présidentielle. Or, à 20h, les résultats diffusés ne sont pas les résultats réels de l’élection mais des estimations fournies par les instituts de sondage. Ces estimations ne sont pas des sondages : elles ne se basent pas sur l’interrogation d’un échantillon représentatif pour déterminer les résultats du vote. Elles sont construites à partir des premiers résultats du vote, à savoir les 200 premiers bulletins dépouillés dans des bureaux de vote fermant à 18h. L’institut réalisant le dispositif reçoit ces résultats d’un échantillon de bureaux de vote, construit pour être représentatif du vote national. Tout au long de la soirée, les estimations seront affinées avec l’arrivée des résultats complets, c’est-à-dire l’ensemble des bulletins dépouillés (1).
Cette année, quatre instituts ont conduit des estimations pour différentes médias :
- TNS Sofres pour TF1, LCI et RTL
- Ipsos pour France télévisions, Radio France et Le Monde
- CSA pour BFM TV, Canal + , I-télé, RMC et 20 minutes
- Harris interactive pour M6
Ces estimations ont-elles été correctes et dans quelle mesure ? L’estimation d’Ipsos pour France télévisions fait notamment parler : à 20h, l’institut a annoncé Marine Le Pen à 20,0%, un seuil symbolique que la candidate a été pourtant assez loin d’atteindre, les résultats définitifs du ministère de l’Intérieur attribuant 17,9% des suffrages à la candidate du Front national.
Voici un résumé des estimations données à 20h par les différents instituts, classés par justesse (2). Harris interactive est l’institut qui se rapproche le plus, à 20h des résultats finaux, suivi de la TNS Sofres, puis de CSA. Ipsos est, de loin, l’institut qui présente les écarts les plus grands avec les résultats réels du scrutin.

Tous les instituts ont, à 20h, surrestimé Marine Le Pen, de manière plus ou moins importante (l’écart maximal étant donc de 2,1 points pour Ipsos). Néanmoins, comme le montre ce tableau, les écarts restent réduits et l’ordre d’arrivée des candidats a bien été estimé par tous les instituts. Revenons en détail sur leurs estimations :
L’estimation Harris interactive
L’estimation des résultats à 20h par Harris interactive ont donc été les plus proches du résultat réel. Voici les différentes estimations que l’institut a présenté tout au long de la soirée électorale :
Petit nouveau dans le monde des études d’opinion et donc dans les estimations électorales, l’institut Harris interactive a réalisé une très bonne estimation pour la chaîne M6. L’écart le plus grand concerne Marine Le Pen, dont, comme tous les instituts, Harris interactive va surestimer le score en début de soiré. Mais l’écart reste réduit (18,5% à 20 heures, soit 0,6 point d’écart avec son score réel). Pour les autres candidats les écarts ne dépasseront pas 0,4 point.
Tout au long de la soirée, l’institut va se rapprocher des scores finaux et notamment gommer la légère surestimation de Marine Le Pen
L’estimation TNS Sofres
TNS Sofres se targue d’avoir fourni les estimations les plus correctes. C’est effectivement le cas pour ces estimations affinées à 22h, indéniablement très performantes : aucun écart avec les résultats réels ne dépasse 0,2 point.
En revanche, comme nous l’avons vu, à 20h, TNS Sofres fait légèrement moins bien qu’Harris interactive. Cependant, l’estimation de cet institut se révèle aussi très fiable. L’écart le plus grand avec la réalité concerne Marine Le Pen, estimée à 19% en début de soirée (soit 1,1 points d’écart avec son résultat réel). Les autres écarts sont au maximum de 0,3 point.

L’estimation CSA
A 20h, CSA annonce sur Canal +, I-télé et BFM TV un écart relativement important entre François Hollande et Nicolas Sarkozy : les deux favoris seraient séparés de plus de 3 points. Cet écart est surestimé par deux phénomènes : le score du candidat en tête est légèrement plus important que la réalité et celui du candidat en deuxième position est sous-estimé. Ainsi, le candidat socialiste est crédité de 29,3% des voix (0,7 point de plus que son score réel) et le candidat de l’UMP de 26,0% (1,2 points de moins). L’écart se réduira au cours de la soirée. Il ne sera plus que de 2,2 points dans l’estimation affinée de 22h, soit encore faiblement supérieur à celui qu’il est en réalité (1,5 points).

Sur les autres candidats, les écarts entre l’estimation de 20h et le résultat réel sont minimes. Remarquons notamment que c’est CSA qui estime le plus justement le score de Marine Le Pen à 20h (0,3 point d’écart). Les autres écarts sont de moins de 0,2 point.
Étrangement, les écarts avec la réalité sont un peu plus forts dans l’estimation de 22h, notamment pour Marine Le Pen, François Bayrou et Jean-Luc Mélenchon, mais ils demeurent faibles (0,6 point au plus pour Marine Le Pen).
L’estimation Ipsos
Ipsos a produit les estimations les plus éloignées de la réalité. Le plus fort écart entre score effectif et estimation de 20h sera de 2,1 points pour la candidate du Front national, ce qui demeure somme toute relativement réduit, mais constitue une erreur remarquée et la plus importante de la soirée. Celle-ci n’a modifié en rien la hiérarchie d’arrivée, la candidate du Front national disposant, par chance, d’un score éloigné de ces adversaires.
L’écart le plus important va donc à Marine Le Pen, annoncée à 20,0% en début de soirée, un score symbolique encore gravé dans beaucoup d’esprits.Tout au long de la soirée, l’estimation d’Ipsos va s’affiner pour la candidate du Front national et, à 21h45, l’institut annonce 18,5% pour la candidate du Front national (soit toujours 0,6 point d’écart avec son score réel).
En parallèle, Ipsos sous-estime Nicolas Sarkozy de 1,7 points. Annoncé à 25,5% à 20h, puis 25,8% à 21h30 et 26,1% à 21h45, le président sortant rassembla en réalité 27,2% des suffrages.
Enfin, nous relèverons deux autres écarts, qui apparaissent également élevé eu égard à la performance des autres instituts : l’un concerne François Bayrou, sous-estimé de 0,6 points ; et l’autre Jean-Luc Mélenchon, surestimé dans les mêmes proportions.
Pour les autres candidats, les écarts seront au plus de 0,3 point entre l’estimation de 20h et le score réel.
(1) : Pour une explication plus complète de la méthodologie des estimations, cf notamment ce très bon article sur le site de TNS Sofres : http://www.lelab2012.com/interview.php?id=778
(2) : Nous avons mesuré cette justesse en faisant la somme des écarts (en valeur absolue) aux résultats définitifs.