Les derniers sondages pour le second tour prévoyaient un écart légèrement plus important entre les deux candidats

Sans exception, tous les sondages ont donné, tout au long de la campagne, François en tête du second tour de l’élection présidentielle. Mais comment ces sondages résistent-ils à la confrontation avec les résultats réels du vote ?

Pour conduire cette comparaison, il faut d’intéresser aux derniers sondages publiés avant l’interdiction courant durant le week-end du scrutin. Rappelons en effet que les sondages ne sont pas une prédiction du résultat mais mesurent un rapport de force à un instant donné. La confrontation doit donc se faire avec les sondages conduits au plus près de l’échéance électorale, d’autant plus qu’il existe toujours une proportion d’électeurs décidant de leur vote au dernier instant. Si ceux-ci sont nettement minoritaires, d’autant plus pour un second tour où l’offre est restreinte et donc le choix plus aisé, ils représentent tout de même une part conséquente du corps électoral. Selon le sondage "jour du vote" de CSA, 10% des électeurs ont fait leur choix le jour-même et 17% dans l’entre-deux tours.

Les derniers sondages réalisés par les instituts donnaient les scores suivants aux deux candidats (clic pour agrandir) :

Ainsi, en moyenne, le résultat annoncé pour le candidat socialiste était de 53%, variant entre 52% et 53,5%. C’est donc le dernier sondage de l’Ifop qui se rapprochait le plus du résultat réel et donnait même le résultat effectif de dimanche quand on applique la règle de l’arrondi. A l’inverse, c’est le sondage de la TNS Sofres qui se révèle le plus éloigné des résultats réels, avec 53,5% accordés au nouveau président de la République.

Il est important de constater que le sondage de l’Ifop est celui qui a été réalisé le plus près du jour du scrutin puisque c’est le seul effectué en partie vendredi. Et il semble en effet que l’écart entre les derniers sondages parus et les résultats réels résulte d’un resserrement du rapport de force dans les derniers jours avant le scrutin, plus que d’une erreur de mesure des instituts. En effet, toutes les études ont montré un rapprochement des courbes dans l’entre-deux tours, comme le montre par exemple le baromètre de l’Ifop présenté ci-dessous :

Malgré ce resserrement des courbes, le croisement apparaissait très improbable, comme nous l’avions souligné à plusieurs reprises. En effet, les gains de Nicolas Sarkozy, certes réels (3 points entre l’après premier tour et la dernière vague d’enquête avant le second tour), restaient insuffisants. Il n’y a vraiment que dans la dernière étude qu’une réduction de l’écart entre Nicolas Sarkozy et François Hollande s’observait, le candidat UMP obtenant 48% d’intentions de vote. Le score de 47% atteint par Nicolas Sarkozy après l’entre-deux tours avait déjà été enregistré avant le premier tour et ne signait donc pas une véritable dynamique pour le président sortant. Ainsi, la pente d’augmentation de la courbe de Nicolas Sarkozy n’était pas assez forte pour permettre un croisement.

Ainsi, globalement, et malgré les nombreuses critiques qui se sont abattus sur eux, les sondages ne sont pas trompés. Si l’on peut naturellement s’attarder sur l’écart d’un à deux points entre les derniers sondages et les résultats réels (écart qui reste néanmoins compris dans la marge d’erreur), celui-ci résulte plus, à notre sens, d’une évolution du choix des électeurs dans les derniers jours qu’à une erreur dans la mesure, mais la cause de ce différentiel ne pourra naturellement jamais être déterminée avec précision.

En outre, les sondages montrent qu’ils restent essentiels dans l’évaluation des rapports de force politiques. Si certains ont voulu leur substituer d’autres analyses, à l’instar par exemple d’une prédiction du résultat de l’élection par les indicateurs économiques (www.electionscope.fr), les sondages (bien conduits et prudemment interprétés) démontrent aujourd’hui qu’ils restent des outils d’analyse pertinents.

Confrontation des derniers sondages d’intentions de vote et des premières estimations

Les premières estimations ont été diffusées à 20h. Elles accordent entre 48,0% et 48,2% pour Nicolas Sarkozy et 51,8% et 52% pour François Hollande. Ce dernier avait été invariablement donné gagnant du second tour depuis le début de la campagne par les différents sondages.

Les dernières études d’intentions de vote, réalisées quelques jours avant le scrutin, lui accordaient entre 52% et 53,5% des voix, avec une tendance au resserrement entre les deux candidats dans la dernière semaine de l’entre-deux tours.

Pour rappel, le derniers sondages parus avant l’interdiction de publication étaient les suivants (clic pour agrandir) :


Ainsi, les derniers sondages, réalisés dans leur majorité le jeudi avant le second tour, donnait un écart entre les candidats qui semble, au regard des premières estimations, un peu plus large que les résultats du vote. Cet écart reste néanmoins réduit (1,5 points au maximum, inexistant au mieux).

En outre, le resserrement entre les courbes observés tout au long de l’entre-deux tours laissait à penser que l’écart final entre les candidats serait effectivement un peu plus réduit que la moyenne donnée par ces dernières études, et il est à cet égard intéressant de remarquer que c’est l’Ifop qui semble avoir donné le score le plus proche du résultat réel, et que c’est l’étude qui a été réalisée le plus tard (terrain courant jusqu’au vendredi).

Avant de tirer des conclusions définitives, il convient néanmoins d’attendre les résultats définitifs du second tour. Une comparaison plus fine pourra alors être établie.

Comparaison entre les taux de participation à 12h et 17h et la participation finale

Les jours d’élection, dès 12h, le ministère de l’Intérieur livre le taux de participation partiel au scrutin. S’ensuit alors un jeu de comparaison pour essayer d’estimer le taux de participation final (et souvent des suppositions pour savoir quel candidat est avantagé par cette baisse ou hausse de la participation).

Pour ce second tour de l’élection présidentielle, le taux de participation était de 30,66% à 12h et de 71,96%à 17h, soit des scores supérieurs au premier tour, mais nettement inférieurs à ceux de 2007 (respectivement 34,11% et 75,11%).

Voici un rappel des taux de participation partiels et finaux en France métropolitaine pour l’élection présidentielle depuis 1981 (clic pour agrandir) :

Le taux de participation à 12h au second tour est plus élevé que celui du 1er tour, mais cela ne constitue en aucun cas une surprise. Comme le montre ce tableau, il s’agit là d’une règle qui n’a jamais été démentie à l’élection présidentielle depuis 1981.

Quant à l’estimation du taux final à partir du taux de 12h, il s’agit là d’un exercice très complexe, voire impossible. Ainsi, en 2007, la hausse du taux de participation à 12h de près de trois points au second tour s’est traduite, au final, par une participation identique aux premiers et seconds tours. En 2002, la hausse finale était au contraire plus grande que celle de 12h. 2002 était naturellement un second tour atypique, mais une hausse de la participation finale largement plus forte que celle de 12h s’était également produite en 1988.

Les difficultés sont relativement identiques à partir du taux à 17h, l’histoire montrant également que la participation a évolué assez différemment de la fin de l’après-midi à la fermeture des bureaux selon les scrutins. Néanmoins, la prévision qui peut être faite à partir de ces chiffres est logiquement plus proche de l’abstention réelle, puisque construite à partir d’un résultat obtenu alors qu’une majorité des Français se sont déjà rendus aux urnes.

Comparaison entre les estimations de 20h et les résultats réels du vote

Dimanche soir à 20h, la France attendait fébrilement les résultats du premier tour de l’élection présidentielle. Or, à 20h, les résultats diffusés ne sont pas les résultats réels de l’élection mais des estimations fournies par les instituts de sondage. Ces estimations ne sont pas des sondages : elles ne se basent pas sur l’interrogation d’un échantillon représentatif pour déterminer les résultats du vote. Elles sont construites à partir des premiers résultats du vote, à savoir les 200 premiers bulletins dépouillés dans des bureaux de vote fermant à 18h. L’institut réalisant le dispositif reçoit ces résultats d’un échantillon de bureaux de vote, construit pour être représentatif du vote national. Tout au long de la soirée, les estimations seront affinées avec l’arrivée des résultats complets, c’est-à-dire l’ensemble des bulletins dépouillés (1).

Cette année, quatre instituts ont conduit des estimations pour différentes médias :

- TNS Sofres pour TF1, LCI et RTL
- Ipsos pour France télévisions, Radio France et Le Monde
- CSA pour BFM TV, Canal + , I-télé, RMC et 20 minutes
- Harris interactive pour M6

Ces estimations ont-elles été correctes et dans quelle mesure ? L’estimation d’Ipsos pour France télévisions fait notamment parler : à 20h, l’institut a annoncé Marine Le Pen à 20,0%, un seuil symbolique que la candidate a été pourtant assez loin d’atteindre, les résultats définitifs du ministère de l’Intérieur attribuant 17,9% des suffrages à la candidate du Front national.

Voici un résumé des estimations données à 20h par les différents instituts, classés par justesse (2). Harris interactive est l’institut qui se rapproche le plus, à 20h des résultats finaux, suivi de la TNS Sofres, puis de CSA. Ipsos est, de loin, l’institut qui présente les écarts les plus grands avec les résultats réels du scrutin.

Tous les instituts ont, à 20h, surrestimé Marine Le Pen, de manière plus ou moins importante (l’écart maximal étant donc de 2,1 points pour Ipsos). Néanmoins, comme le montre ce tableau, les écarts restent réduits et l’ordre d’arrivée des candidats a bien été estimé par tous les instituts. Revenons en détail sur leurs estimations :

L’estimation Harris interactive

L’estimation des résultats à 20h par Harris interactive ont donc été les plus proches du résultat réel. Voici les différentes estimations que l’institut a présenté tout au long de la soirée électorale :

Petit nouveau dans le monde des études d’opinion et donc dans les estimations électorales, l’institut Harris interactive a réalisé une très bonne estimation pour la chaîne M6. L’écart le plus grand concerne Marine Le Pen, dont, comme tous les instituts, Harris interactive va surestimer le score en début de soiré. Mais l’écart reste réduit (18,5% à 20 heures, soit 0,6 point d’écart avec son score réel). Pour les autres candidats les écarts ne dépasseront pas 0,4 point.

Tout au long de la soirée, l’institut va se rapprocher des scores finaux et notamment gommer la légère surestimation de Marine Le Pen

L’estimation TNS Sofres

TNS Sofres se targue d’avoir fourni les estimations les plus correctes. C’est effectivement le cas pour ces estimations affinées à 22h, indéniablement très performantes : aucun écart avec les résultats réels ne dépasse 0,2 point.

En revanche, comme nous l’avons vu, à 20h, TNS Sofres fait légèrement moins bien qu’Harris interactive. Cependant, l’estimation de cet institut se révèle aussi très fiable. L’écart le plus grand avec la réalité concerne Marine Le Pen, estimée à 19% en début de soirée (soit 1,1 points d’écart avec son résultat réel). Les autres écarts sont au maximum de 0,3 point.

L’estimation CSA

A 20h, CSA annonce sur Canal +, I-télé et BFM TV un écart relativement important entre François Hollande et Nicolas Sarkozy : les deux favoris seraient séparés de plus de 3 points. Cet écart est surestimé par deux phénomènes : le score du candidat en tête est légèrement plus important que la réalité et celui du candidat en deuxième position est sous-estimé. Ainsi, le candidat socialiste est crédité de 29,3% des voix (0,7 point de plus que son score réel) et le candidat de l’UMP de 26,0% (1,2 points de moins). L’écart se réduira au cours de la soirée. Il ne sera plus que de 2,2 points dans l’estimation affinée de 22h, soit encore faiblement supérieur à celui qu’il est en réalité (1,5 points).

Sur les autres candidats, les écarts entre l’estimation de 20h et le résultat réel sont minimes. Remarquons notamment que c’est CSA qui estime le plus justement le score de Marine Le Pen à 20h (0,3 point d’écart). Les autres écarts sont de moins de 0,2 point.

Étrangement, les écarts avec la réalité sont un peu plus forts dans l’estimation de 22h, notamment pour Marine Le Pen, François Bayrou et Jean-Luc Mélenchon, mais ils demeurent faibles (0,6 point au plus pour Marine Le Pen).

L’estimation Ipsos

Ipsos a produit les estimations les plus éloignées de la réalité. Le plus fort écart entre score effectif et estimation de 20h sera de 2,1 points pour la candidate du Front national, ce qui demeure somme toute relativement réduit, mais constitue une erreur remarquée et la plus importante de la soirée. Celle-ci n’a modifié en rien la hiérarchie d’arrivée, la candidate du Front national disposant, par chance, d’un score éloigné de ces adversaires.

L’écart le plus important va donc à Marine Le Pen, annoncée à 20,0% en début de soirée, un score symbolique encore gravé dans beaucoup d’esprits.Tout au long de la soirée, l’estimation d’Ipsos va s’affiner pour la candidate du Front national et, à 21h45, l’institut annonce 18,5% pour la candidate du Front national (soit toujours 0,6 point d’écart avec son score réel).

En parallèle, Ipsos sous-estime Nicolas Sarkozy de 1,7 points. Annoncé à 25,5% à 20h, puis 25,8% à 21h30 et 26,1% à 21h45, le président sortant rassembla en réalité 27,2% des suffrages.

Enfin, nous relèverons deux autres écarts, qui apparaissent également élevé eu égard à la performance des autres instituts : l’un concerne François Bayrou, sous-estimé de 0,6 points ; et l’autre Jean-Luc Mélenchon, surestimé dans les mêmes proportions.

Pour les autres candidats, les écarts seront au plus de 0,3 point entre l’estimation de 20h et le score réel.

(1) : Pour une explication plus complète de la méthodologie des estimations, cf notamment ce très bon article sur le site de TNS Sofres : http://www.lelab2012.com/interview.php?id=778
(2) : Nous avons mesuré cette justesse en faisant la somme des écarts (en valeur absolue) aux résultats définitifs.

Les instituts de sondage se sont-ils trompés ?

Maintenant que nous disposons des résultats réels de l’élection, nous pouvons conduire une comparaison entre les dernières intentions de vote et les résultats réels du scrutin.

Hier soir, les sondages ont été beaucoup critiqués, parce que les premières estimations laissaient entrevoir un Front national pouvant recueillir environ 19% des voix et que les commentaires se sont très naturellement beaucoup attachés à ce score historiquement haut du parti d’extrême-droite. Les résultats réels montrent que Marine Le Pen a obtenu 17,9% des suffrages et l’écart entre les sondages et le résultat du scrutin n’est donc pas si important que décrié.

Nous vous présentons ci-dessous une comparaison entre la moyenne des dernières études réalisées par les instituts avant le scrutin et les résultats définitifs (hors Français de l’étranger) dont nous disposons ce matin :

Ce tableau montre que globalement, les dernières études se rapprochaient fortement du résultat obtenu dimanche et que les écarts sont minces. Si naturellement, certains instituts ont été plus proches du résultat réel que d’autres, la profession des sondeurs ne semble pas devoir mériter les accusations faciles qui ont plu sur elle hier. La correspondance n’est évidemment pas parfaite mais cela reste inhérent à l’outil : les sondages ne sont pas une science exacte et la mesure reste complexe, soumise aux marges d’erreurs, et des mouvement mineurs peuvent se produire dans l’électorat la veille et l’avant-veille du scrutin (les sondages ont été réalisés entre lundi et vendredi dernier). Malgré ces nombreuses difficultés, les sondages se révèlent très proches du vote des Français.

Il faut néanmoins noter quelques différences :

- C’est le score de Jean-Luc Mélenchon qui est le plus éloigné de la moyenne des instituts et pas celui de Marine Le Pen. Le candidat du Front de gauche a été sur-estimé de 1 à 5 points par les différents instituts (en moyenne 3 points d’écart). C’est Harris interactive qui a livré dans sa dernière étude le résultat le plus proche du score réel de Jean-Luc Mélenchon (12%). OpinionWay et TNS Sofres lui avait accordé 13%. A l’inverse, les plus forts écarts entre la réalité et les scores des sondages concernent LH2 (15%) et CSA (14,5%).

- Marine Le Pen a été, pour sa part, sous-estimée par tous les instituts. En moyenne, l’écart reste néanmoins faible (2 points). Notons que dans sa dernière étude, TNS Sofres avait placé Marine Le Pen à 17% et que la plupart des instituts l’avaient placé à 16%. Les instituts les plus éloignés de la réalité sont BVA (14%, qui plaçait donc Marine Le Pen à égalité avec Jean-Luc Mélenchon) et dans une moindre mesure LH2 (15,5%).

- Enfin, autres différences avec la moyenne des instituts mais beaucoup moins fortes et entrant dans les marges d’erreur, François Bayrou a été sur-estimé d’environ 1 point et Nicolas Sarkozy sous-estimé dans les mêmes proportions. Pour les autres candidats, les écarts sont de l’ordre de 0,5 points ou moins, et donc ne prêtent pas le flanc à la critique.

 

NB : Par le jeu des arrondis, le total ne fait pas 100 pour la colonne “moyenne”.

Les dernières intentions de vote des différents instituts à l’heure des résultats

Alors que les premières estimations ont été données à 20h, et en attendant les résultats définitifs du Ministère de l’Intérieur, voici pour rappel les dernières études d’intentions de vote des instituts (clic pour agrandir) :

Nous analyserons l’écart entre les chiffres des sondages pré-électoraux quand les résultats officiels auront été publiés mais trois conclusions s’imposent :

- Il n’y a pas de "surprise" dans le sens où les dernières intentions de vote avaient prédit l’ordre d’arrivée, et que pour la plupart des candidats, le score réel est assez proche des résultats obtenus dans les dernières enquêtes.

- Néanmoins, les instituts de sondage ont toujours des difficultés à estimer le score du Front national : après l’avoir sous-estimé en 2002 et sur-estimé en 2007, l’écart est encore important : de l’ordre de 3 à 5 points en dessous du score effectif de Marine Le Pen.

- Jean-Luc Mélenchon réalise un score notablement inférieur à celui donné dans les dernières études d’intention de vote.

 

NB : Par le jeu des arrondis, le total ne fait pas 100 pour la colonne "moyenne".