Les derniers sondages pour le second tour prévoyaient un écart légèrement plus important entre les deux candidats

Sans exception, tous les sondages ont donné, tout au long de la campagne, François en tête du second tour de l’élection présidentielle. Mais comment ces sondages résistent-ils à la confrontation avec les résultats réels du vote ?

Pour conduire cette comparaison, il faut d’intéresser aux derniers sondages publiés avant l’interdiction courant durant le week-end du scrutin. Rappelons en effet que les sondages ne sont pas une prédiction du résultat mais mesurent un rapport de force à un instant donné. La confrontation doit donc se faire avec les sondages conduits au plus près de l’échéance électorale, d’autant plus qu’il existe toujours une proportion d’électeurs décidant de leur vote au dernier instant. Si ceux-ci sont nettement minoritaires, d’autant plus pour un second tour où l’offre est restreinte et donc le choix plus aisé, ils représentent tout de même une part conséquente du corps électoral. Selon le sondage “jour du vote” de CSA, 10% des électeurs ont fait leur choix le jour-même et 17% dans l’entre-deux tours.

Les derniers sondages réalisés par les instituts donnaient les scores suivants aux deux candidats (clic pour agrandir) :

Ainsi, en moyenne, le résultat annoncé pour le candidat socialiste était de 53%, variant entre 52% et 53,5%. C’est donc le dernier sondage de l’Ifop qui se rapprochait le plus du résultat réel et donnait même le résultat effectif de dimanche quand on applique la règle de l’arrondi. A l’inverse, c’est le sondage de la TNS Sofres qui se révèle le plus éloigné des résultats réels, avec 53,5% accordés au nouveau président de la République.

Il est important de constater que le sondage de l’Ifop est celui qui a été réalisé le plus près du jour du scrutin puisque c’est le seul effectué en partie vendredi. Et il semble en effet que l’écart entre les derniers sondages parus et les résultats réels résulte d’un resserrement du rapport de force dans les derniers jours avant le scrutin, plus que d’une erreur de mesure des instituts. En effet, toutes les études ont montré un rapprochement des courbes dans l’entre-deux tours, comme le montre par exemple le baromètre de l’Ifop présenté ci-dessous :

Malgré ce resserrement des courbes, le croisement apparaissait très improbable, comme nous l’avions souligné à plusieurs reprises. En effet, les gains de Nicolas Sarkozy, certes réels (3 points entre l’après premier tour et la dernière vague d’enquête avant le second tour), restaient insuffisants. Il n’y a vraiment que dans la dernière étude qu’une réduction de l’écart entre Nicolas Sarkozy et François Hollande s’observait, le candidat UMP obtenant 48% d’intentions de vote. Le score de 47% atteint par Nicolas Sarkozy après l’entre-deux tours avait déjà été enregistré avant le premier tour et ne signait donc pas une véritable dynamique pour le président sortant. Ainsi, la pente d’augmentation de la courbe de Nicolas Sarkozy n’était pas assez forte pour permettre un croisement.

Ainsi, globalement, et malgré les nombreuses critiques qui se sont abattus sur eux, les sondages ne sont pas trompés. Si l’on peut naturellement s’attarder sur l’écart d’un à deux points entre les derniers sondages et les résultats réels (écart qui reste néanmoins compris dans la marge d’erreur), celui-ci résulte plus, à notre sens, d’une évolution du choix des électeurs dans les derniers jours qu’à une erreur dans la mesure, mais la cause de ce différentiel ne pourra naturellement jamais être déterminée avec précision.

En outre, les sondages montrent qu’ils restent essentiels dans l’évaluation des rapports de force politiques. Si certains ont voulu leur substituer d’autres analyses, à l’instar par exemple d’une prédiction du résultat de l’élection par les indicateurs économiques (www.electionscope.fr), les sondages (bien conduits et prudemment interprétés) démontrent aujourd’hui qu’ils restent des outils d’analyse pertinents.

Les estimations des instituts à 20h : justes à quelques décimales près…

Maintenant que les résultats réels sont connus, l’heure est à la confrontation des scores donnés par les instituts dans leurs estimations avec les résultats réels du vote.

Ci-dessous, figurent deux tableaux qui conduisent cette comparaison : le premier présente les estimations fournies à 20h et le deuxième les estimations affinées fournies plus tard dans la soirée (entre 21h et 22h) :

Les estimations des instituts à 20h étaient globalement justes à quelques décimales près. L’institut CSA est celui qui se rapprochait le plus du score final avec 51,8% pour François Hollande et 48,2% pour Nicolas Sarkozy, soit seulement 0,2 point d’écart. Ipsos et Harris interactive ont fourni les mêmes estimations avec 51,9% pour le candidat socialiste et 48,1% pour le président sortant, soit un écart de 0,3 point aux résultats réels. Enfin, TNS Sofres s’éloignait le plus du résultat final, avec 52% pour François Hollande et 48% pour Nicolas Sarkozy.

Ainsi, globalement, les estimations étaient très proches des résultats effectifs du scrutin. Tous les instituts ont surestimé de quelques décimales le score du candidat socialiste (et donc sous-estimé d’autant celui de son rival), mais l’écart est très faible.

En outre, au cours de la soirée, Harris interactive et Ipsos ont diffusé des résultats affinés qui collaient à 0,1 point près avec les résultats réels connus ce matin.

Confrontation des derniers sondages d’intentions de vote et des premières estimations

Les premières estimations ont été diffusées à 20h. Elles accordent entre 48,0% et 48,2% pour Nicolas Sarkozy et 51,8% et 52% pour François Hollande. Ce dernier avait été invariablement donné gagnant du second tour depuis le début de la campagne par les différents sondages.

Les dernières études d’intentions de vote, réalisées quelques jours avant le scrutin, lui accordaient entre 52% et 53,5% des voix, avec une tendance au resserrement entre les deux candidats dans la dernière semaine de l’entre-deux tours.

Pour rappel, le derniers sondages parus avant l’interdiction de publication étaient les suivants (clic pour agrandir) :


Ainsi, les derniers sondages, réalisés dans leur majorité le jeudi avant le second tour, donnait un écart entre les candidats qui semble, au regard des premières estimations, un peu plus large que les résultats du vote. Cet écart reste néanmoins réduit (1,5 points au maximum, inexistant au mieux).

En outre, le resserrement entre les courbes observés tout au long de l’entre-deux tours laissait à penser que l’écart final entre les candidats serait effectivement un peu plus réduit que la moyenne donnée par ces dernières études, et il est à cet égard intéressant de remarquer que c’est l’Ifop qui semble avoir donné le score le plus proche du résultat réel, et que c’est l’étude qui a été réalisée le plus tard (terrain courant jusqu’au vendredi).

Avant de tirer des conclusions définitives, il convient néanmoins d’attendre les résultats définitifs du second tour. Une comparaison plus fine pourra alors être établie.

Second tour de la présidentielle : les différentes estimations à 20h

Les instituts de sondage produisant des estimations donnent tous des chiffres très proches à 20h, accordant entre 51,8% et 52,0% à François Hollande et 48,0% et 48,2% pour Nicolas Sarkozy.

Pour rappel, les estimations précédentes sont diffusés dans les médias suivants :

- TNS Sofres : TF1, LCI et RTL
- Ipsos : France télévisions, Radio France et Le Monde
- CSA : BFM TV, Canal + , I-télé, RMC et 20 minutes
- Harris interactive : M6

Comparaison entre les taux de participation à 12h et 17h et la participation finale

Les jours d’élection, dès 12h, le ministère de l’Intérieur livre le taux de participation partiel au scrutin. S’ensuit alors un jeu de comparaison pour essayer d’estimer le taux de participation final (et souvent des suppositions pour savoir quel candidat est avantagé par cette baisse ou hausse de la participation).

Pour ce second tour de l’élection présidentielle, le taux de participation était de 30,66% à 12h et de 71,96%à 17h, soit des scores supérieurs au premier tour, mais nettement inférieurs à ceux de 2007 (respectivement 34,11% et 75,11%).

Voici un rappel des taux de participation partiels et finaux en France métropolitaine pour l’élection présidentielle depuis 1981 (clic pour agrandir) :

Le taux de participation à 12h au second tour est plus élevé que celui du 1er tour, mais cela ne constitue en aucun cas une surprise. Comme le montre ce tableau, il s’agit là d’une règle qui n’a jamais été démentie à l’élection présidentielle depuis 1981.

Quant à l’estimation du taux final à partir du taux de 12h, il s’agit là d’un exercice très complexe, voire impossible. Ainsi, en 2007, la hausse du taux de participation à 12h de près de trois points au second tour s’est traduite, au final, par une participation identique aux premiers et seconds tours. En 2002, la hausse finale était au contraire plus grande que celle de 12h. 2002 était naturellement un second tour atypique, mais une hausse de la participation finale largement plus forte que celle de 12h s’était également produite en 1988.

Les difficultés sont relativement identiques à partir du taux à 17h, l’histoire montrant également que la participation a évolué assez différemment de la fin de l’après-midi à la fermeture des bureaux selon les scrutins. Néanmoins, la prévision qui peut être faite à partir de ces chiffres est logiquement plus proche de l’abstention réelle, puisque construite à partir d’un résultat obtenu alors qu’une majorité des Français se sont déjà rendus aux urnes.

Comparaison entre les estimations de 20h et les résultats réels du vote

Dimanche soir à 20h, la France attendait fébrilement les résultats du premier tour de l’élection présidentielle. Or, à 20h, les résultats diffusés ne sont pas les résultats réels de l’élection mais des estimations fournies par les instituts de sondage. Ces estimations ne sont pas des sondages : elles ne se basent pas sur l’interrogation d’un échantillon représentatif pour déterminer les résultats du vote. Elles sont construites à partir des premiers résultats du vote, à savoir les 200 premiers bulletins dépouillés dans des bureaux de vote fermant à 18h. L’institut réalisant le dispositif reçoit ces résultats d’un échantillon de bureaux de vote, construit pour être représentatif du vote national. Tout au long de la soirée, les estimations seront affinées avec l’arrivée des résultats complets, c’est-à-dire l’ensemble des bulletins dépouillés (1).

Cette année, quatre instituts ont conduit des estimations pour différentes médias :

- TNS Sofres pour TF1, LCI et RTL
- Ipsos pour France télévisions, Radio France et Le Monde
- CSA pour BFM TV, Canal + , I-télé, RMC et 20 minutes
- Harris interactive pour M6

Ces estimations ont-elles été correctes et dans quelle mesure ? L’estimation d’Ipsos pour France télévisions fait notamment parler : à 20h, l’institut a annoncé Marine Le Pen à 20,0%, un seuil symbolique que la candidate a été pourtant assez loin d’atteindre, les résultats définitifs du ministère de l’Intérieur attribuant 17,9% des suffrages à la candidate du Front national.

Voici un résumé des estimations données à 20h par les différents instituts, classés par justesse (2). Harris interactive est l’institut qui se rapproche le plus, à 20h des résultats finaux, suivi de la TNS Sofres, puis de CSA. Ipsos est, de loin, l’institut qui présente les écarts les plus grands avec les résultats réels du scrutin.

Tous les instituts ont, à 20h, surrestimé Marine Le Pen, de manière plus ou moins importante (l’écart maximal étant donc de 2,1 points pour Ipsos). Néanmoins, comme le montre ce tableau, les écarts restent réduits et l’ordre d’arrivée des candidats a bien été estimé par tous les instituts. Revenons en détail sur leurs estimations :

L’estimation Harris interactive

L’estimation des résultats à 20h par Harris interactive ont donc été les plus proches du résultat réel. Voici les différentes estimations que l’institut a présenté tout au long de la soirée électorale :

Petit nouveau dans le monde des études d’opinion et donc dans les estimations électorales, l’institut Harris interactive a réalisé une très bonne estimation pour la chaîne M6. L’écart le plus grand concerne Marine Le Pen, dont, comme tous les instituts, Harris interactive va surestimer le score en début de soiré. Mais l’écart reste réduit (18,5% à 20 heures, soit 0,6 point d’écart avec son score réel). Pour les autres candidats les écarts ne dépasseront pas 0,4 point.

Tout au long de la soirée, l’institut va se rapprocher des scores finaux et notamment gommer la légère surestimation de Marine Le Pen

L’estimation TNS Sofres

TNS Sofres se targue d’avoir fourni les estimations les plus correctes. C’est effectivement le cas pour ces estimations affinées à 22h, indéniablement très performantes : aucun écart avec les résultats réels ne dépasse 0,2 point.

En revanche, comme nous l’avons vu, à 20h, TNS Sofres fait légèrement moins bien qu’Harris interactive. Cependant, l’estimation de cet institut se révèle aussi très fiable. L’écart le plus grand avec la réalité concerne Marine Le Pen, estimée à 19% en début de soirée (soit 1,1 points d’écart avec son résultat réel). Les autres écarts sont au maximum de 0,3 point.

L’estimation CSA

A 20h, CSA annonce sur Canal +, I-télé et BFM TV un écart relativement important entre François Hollande et Nicolas Sarkozy : les deux favoris seraient séparés de plus de 3 points. Cet écart est surestimé par deux phénomènes : le score du candidat en tête est légèrement plus important que la réalité et celui du candidat en deuxième position est sous-estimé. Ainsi, le candidat socialiste est crédité de 29,3% des voix (0,7 point de plus que son score réel) et le candidat de l’UMP de 26,0% (1,2 points de moins). L’écart se réduira au cours de la soirée. Il ne sera plus que de 2,2 points dans l’estimation affinée de 22h, soit encore faiblement supérieur à celui qu’il est en réalité (1,5 points).

Sur les autres candidats, les écarts entre l’estimation de 20h et le résultat réel sont minimes. Remarquons notamment que c’est CSA qui estime le plus justement le score de Marine Le Pen à 20h (0,3 point d’écart). Les autres écarts sont de moins de 0,2 point.

Étrangement, les écarts avec la réalité sont un peu plus forts dans l’estimation de 22h, notamment pour Marine Le Pen, François Bayrou et Jean-Luc Mélenchon, mais ils demeurent faibles (0,6 point au plus pour Marine Le Pen).

L’estimation Ipsos

Ipsos a produit les estimations les plus éloignées de la réalité. Le plus fort écart entre score effectif et estimation de 20h sera de 2,1 points pour la candidate du Front national, ce qui demeure somme toute relativement réduit, mais constitue une erreur remarquée et la plus importante de la soirée. Celle-ci n’a modifié en rien la hiérarchie d’arrivée, la candidate du Front national disposant, par chance, d’un score éloigné de ces adversaires.

L’écart le plus important va donc à Marine Le Pen, annoncée à 20,0% en début de soirée, un score symbolique encore gravé dans beaucoup d’esprits.Tout au long de la soirée, l’estimation d’Ipsos va s’affiner pour la candidate du Front national et, à 21h45, l’institut annonce 18,5% pour la candidate du Front national (soit toujours 0,6 point d’écart avec son score réel).

En parallèle, Ipsos sous-estime Nicolas Sarkozy de 1,7 points. Annoncé à 25,5% à 20h, puis 25,8% à 21h30 et 26,1% à 21h45, le président sortant rassembla en réalité 27,2% des suffrages.

Enfin, nous relèverons deux autres écarts, qui apparaissent également élevé eu égard à la performance des autres instituts : l’un concerne François Bayrou, sous-estimé de 0,6 points ; et l’autre Jean-Luc Mélenchon, surestimé dans les mêmes proportions.

Pour les autres candidats, les écarts seront au plus de 0,3 point entre l’estimation de 20h et le score réel.

(1) : Pour une explication plus complète de la méthodologie des estimations, cf notamment ce très bon article sur le site de TNS Sofres : http://www.lelab2012.com/interview.php?id=778
(2) : Nous avons mesuré cette justesse en faisant la somme des écarts (en valeur absolue) aux résultats définitifs.

Les instituts de sondage se sont-ils trompés ?

Maintenant que nous disposons des résultats réels de l’élection, nous pouvons conduire une comparaison entre les dernières intentions de vote et les résultats réels du scrutin.

Hier soir, les sondages ont été beaucoup critiqués, parce que les premières estimations laissaient entrevoir un Front national pouvant recueillir environ 19% des voix et que les commentaires se sont très naturellement beaucoup attachés à ce score historiquement haut du parti d’extrême-droite. Les résultats réels montrent que Marine Le Pen a obtenu 17,9% des suffrages et l’écart entre les sondages et le résultat du scrutin n’est donc pas si important que décrié.

Nous vous présentons ci-dessous une comparaison entre la moyenne des dernières études réalisées par les instituts avant le scrutin et les résultats définitifs (hors Français de l’étranger) dont nous disposons ce matin :

Ce tableau montre que globalement, les dernières études se rapprochaient fortement du résultat obtenu dimanche et que les écarts sont minces. Si naturellement, certains instituts ont été plus proches du résultat réel que d’autres, la profession des sondeurs ne semble pas devoir mériter les accusations faciles qui ont plu sur elle hier. La correspondance n’est évidemment pas parfaite mais cela reste inhérent à l’outil : les sondages ne sont pas une science exacte et la mesure reste complexe, soumise aux marges d’erreurs, et des mouvement mineurs peuvent se produire dans l’électorat la veille et l’avant-veille du scrutin (les sondages ont été réalisés entre lundi et vendredi dernier). Malgré ces nombreuses difficultés, les sondages se révèlent très proches du vote des Français.

Il faut néanmoins noter quelques différences :

- C’est le score de Jean-Luc Mélenchon qui est le plus éloigné de la moyenne des instituts et pas celui de Marine Le Pen. Le candidat du Front de gauche a été sur-estimé de 1 à 5 points par les différents instituts (en moyenne 3 points d’écart). C’est Harris interactive qui a livré dans sa dernière étude le résultat le plus proche du score réel de Jean-Luc Mélenchon (12%). OpinionWay et TNS Sofres lui avait accordé 13%. A l’inverse, les plus forts écarts entre la réalité et les scores des sondages concernent LH2 (15%) et CSA (14,5%).

- Marine Le Pen a été, pour sa part, sous-estimée par tous les instituts. En moyenne, l’écart reste néanmoins faible (2 points). Notons que dans sa dernière étude, TNS Sofres avait placé Marine Le Pen à 17% et que la plupart des instituts l’avaient placé à 16%. Les instituts les plus éloignés de la réalité sont BVA (14%, qui plaçait donc Marine Le Pen à égalité avec Jean-Luc Mélenchon) et dans une moindre mesure LH2 (15,5%).

- Enfin, autres différences avec la moyenne des instituts mais beaucoup moins fortes et entrant dans les marges d’erreur, François Bayrou a été sur-estimé d’environ 1 point et Nicolas Sarkozy sous-estimé dans les mêmes proportions. Pour les autres candidats, les écarts sont de l’ordre de 0,5 points ou moins, et donc ne prêtent pas le flanc à la critique.

 

NB : Par le jeu des arrondis, le total ne fait pas 100 pour la colonne “moyenne”.

Les dernières intentions de vote des différents instituts à l’heure des résultats

Alors que les premières estimations ont été données à 20h, et en attendant les résultats définitifs du Ministère de l’Intérieur, voici pour rappel les dernières études d’intentions de vote des instituts (clic pour agrandir) :

Nous analyserons l’écart entre les chiffres des sondages pré-électoraux quand les résultats officiels auront été publiés mais trois conclusions s’imposent :

- Il n’y a pas de “surprise” dans le sens où les dernières intentions de vote avaient prédit l’ordre d’arrivée, et que pour la plupart des candidats, le score réel est assez proche des résultats obtenus dans les dernières enquêtes.

- Néanmoins, les instituts de sondage ont toujours des difficultés à estimer le score du Front national : après l’avoir sous-estimé en 2002 et sur-estimé en 2007, l’écart est encore important : de l’ordre de 3 à 5 points en dessous du score effectif de Marine Le Pen.

- Jean-Luc Mélenchon réalise un score notablement inférieur à celui donné dans les dernières études d’intention de vote.

 

NB : Par le jeu des arrondis, le total ne fait pas 100 pour la colonne “moyenne”.

Les sondeurs sont-ils mauvais ? L’exemple de la précédente élection présidentielle

Alors que les sondages s’enchaînent dans la perspective de la prochaine élection présidentielle, les critiques à leur égard se font de plus en plus visibles du fait des écarts observés entre les études publiées par les différents instituts ces derniers jours.

L’exercice des intentions de vote est toujours complexe, mais ne s’apparente pas aux « magouilles sondagières » que l’on décrit souvent. Les redressements effectués ne le sont pas « au bon nez » du sondeur et s’appuient sur des données solides (votes antérieurs notamment), même si, il ne faut le nier non plus, entre parfois en jeu une légère part de subjectivité, le sondeur se reposant également sur l’expérience passée et sur ses connaissances en sciences politiques. Si l’on veut bien sortir du discours caricatural et dénonciateur des sondages, on retiendra que plusieurs difficultés, bien réelles, doivent être surmontées par les professionnels et que celles-ci peuvent expliquer les différences constatées entre les différents instituts de sondage, qui y apportent des réponses parfois différenciées :

 

Les « menteurs »

Quand on parle des redressements des sondages d’intentions de vote, on évoque souvent plus particulièrement la difficulté à estimer le vote pour le Front national. Si les débats autour des redressements sont centrés sur cette question, c’est que le Front national a très longtemps été la principale « victime » d’un phénomène bien décrit par les sciences politiques, la « désirabilité sociale ». Il s’agit, pour l’interviewé, de déclarer voter pour un autre candidat que celui pour lequel il a l’intention de réellement voter, parce qu’il nourrit une honte à avouer son véritable choix. Le répondant ment donc pour se rendre plus acceptable, plus “désirable” aux yeux de l’enquêteur ou de la personne qui lira les résultats.

Le vote pour l’’extrême-droite est le plus sous-déclaré. Plus généralement, le vote pour la gauche (plus facile à assumer socialement) est légèrement sur-déclaré. Notons que ce phénomène joue aussi concernant l’abstention et que les Français ont parfois du mal à avouer qu’ils ne se rendront pas aux urnes lors d’une élection, surtout quand il s’agit d’une élection nationale importante comme l’élection présidentielle.

Le biais de « désirabilité sociale » est plus important quand la personne interrogée soumet ses réponses à un enquêteur (lorsqu’il est interrogé en face-à-face ou par téléphone). Dans les sondages par internet, où le répondant est seul face à son ordinateur, ce phénomène est moins fort mais existe cependant.

Ce biais est corrigé a posteriori par le redressement de l’échantillon à partir des votes antérieurs. Ainsi, si dans l’échantillon interrogé, on trouve 28% de personnes ayant déclaré avoir voté pour Ségolène Royal en 2007, on fait en sorte que ces personnes ne représentent que le poids qu’elles devraient avoir (26%, le score réel obtenu en 2007). On donne donc dans l’échantillon à chacune de ces personnes un poids de 0,93 (et les électeurs de candidats « sous-déclarés » auront, eux, un poids supérieur à 1).

Concernant plus spécifiquement le vote Front national, ces dernières années sont marquées par une plus grande facilité pour les répondants à se dire électeurs du parti d’extrême-droite. Le redressement introduit donc un moins grand écart entre le chiffre brut et le chiffre corrigé qu’il n’a pu l’être auparavant.

 

Les hésitants

Les sondages d’intentions de vote commencent à être conduits bien avant l’élection. Or, beaucoup d’électeurs se déterminent dans les derniers jours avant le scrutin. Comme le montre le graphique ci-dessous, lors la précédente élection présidentielle française en 2007, 17% des votants déclaraient s’être décidés au dernier moment, 18% les derniers jours et 21% au cours des dernières semaines.


Cette volatilité de l’électorat est une donnée à prendre en compte quand on analyse les sondages d’intention de vote, au global, mais aussi par candidat. Il apparaît en effet, que les « hésitants » sont plus représentés dans certains électorats. En l’occurrence, pour l’élection présidentielle qui s’annonce, les hésitants sont particulièrement présents au sein de l’électorat de François Bayrou et d’Eva Joly, alors que d’autres candidats disposent de socles électoraux bien plus solides, comme François Hollande et Nicolas Sarkozy.

Ces électeurs hésitants, dont le choix peut varier d’un jour sur l’autre, apportent une difficulté supplémentaire au sondeur, qui conduit généralement ses intentions de vote de manière régulière. Or les mesures publiées par un même institut de sondage doivent rester cohérente dans le temps et ne peuvent pas varier trop fortement en raison de ces électeurs dont le choix n’est pas encore fixé (mais qui oscille généralement entre un nombre limité de candidats). Ceci peut inciter un professionnel à modérer un écart, entre deux mesures d’intentions de vote, qui serait trop important pour un candidat dont l’électorat est fortement hésitant, afin de ne pas surestimer un potentiel électoral dont la solidité est faible. Ceci ne signifie pas qu’un candidat dont l’électorat serait majoritairement hésitant ne peut voir son score augmenter (ou diminuer) dans les sondages, mais seulement que les professionnels gardent à l’esprit la volatilité de l’électorat. Ils restent plus prudents quant aux évolutions constatées pour les candidats qui disposent de nombreux électeurs “hésitants”, quitte à avoir parfois la tentation de “lisser” des évolutions constatées qui leur sembleraient pouvoir tenir plus du biais que d’un véritable mouvement de l’opinion.

De manière systématique, les sondeurs interrogent les personnes composant leur échantillon sur leur certitude de choix.

 

La qualité de l’échantillon

Pour construire des intentions de vote, et plus généralement un sondage,  la qualité de l’échantillon est essentielle. En France, les échantillons sont construits par la méthode des quotas, c’est-à-dire que dans l’échantillon, sera interrogé une proportion déterminée d’hommes et de femmes, d’urbains et de ruraux, etc. pour que ces proportions correspondent à ce qu’elles sont dans la population réelle. Généralement, les instituts imposent des quotas de sexe, d’âge, de profession, de région et de « catégorie d’agglomération » (échelle permettant de différencier les territoires ruraux et urbain)

On critique parfois les échantillons construits selon cette méthode. Et en effet, la théorie statistique pose que la représentativité de l’échantillon est assurée par un tirage aléatoire, donc sans définition de quotas, avec un hasard d’interrogation pur. Mais dans les faits, la mise en place des conditions théorique est tout simplement impossible. Ces conditions posent en effet que chaque Français possède la même probabilité d’être interrogé. Or des raisons pratiques évidentes s’y opposent  : parce qu’il n’existe aucune liste de numéros de téléphones ou de courriels comprenant toute la population (pour les enquêtes par téléphone ou internet), parce qu’il est impossible d’aller sonner à toutes les portes (digicodes et autres restrictions d’accès aux domiciles…) (pour les enquêtes en face-à-face), mais aussi parce que les gens s’absentent de chez eux, parce que certaines personnes refusent de répondre, etc.. Ainsi, les conditions de compositions d’un échantillon aléatoire ne peuvent être réunies de manière empirique. Un échantillon construit selon la méthode dite “aléatoire” sous-représenterait obligatoirement certaines catégories de population selon les biais mentionnés ci-dessus (actifs moins présents chez eux notamment). Par conséquent, les professionnels des sondages ont adopté une autre méthode, permettant de construire des échantillons représentatifs malgré toutes ces contraintes. En France, a été fait le choix de la méthode par quotas, qui a su faire ses preuves.

La qualité de l’échantillon se mesure au respect des quotas, mais également à d’autres critères. Ainsi, par exemple, pour un sondage téléphonique, il faudra veiller à rappeler plusieurs fois une personne indisponible, ou à varier les horaires d’appels, afin notamment que les personnes les plus « actives » et donc les moins présentes à leur domicile, soit bien représentées dans l’échantillon. De la même manière, pour un sondage par internet, on veillera à un temps d’interrogation permettant de recueillir l’opinion des personnes qui ne sont pas forcément connectées plusieurs fois par jour. Chaque méthodologie (interrogation par internet ou téléphone puisque ce sont généralement les deux utilisées concernant les intentions de vote) possède ses qualités et ses défauts, que les instituts de sondages connaissent (et qu’il serait malheureusement trop long de détailler ici). Les précautions décrites ci-dessous participent à réduire ces biais, et on considère que ces deux méthodologies permettent d’obtenir des échantillons représentatifs de la population française.

Une fois toutes les personnes interrogées, et donc l’échantillon constitué, les sondeurs opèrent un redressement. Celui-ci, selon le principe décrit ci-dessous, doit permettre à l’échantillon de présenter les mêmes caractéristiques que la population réelle, en termes socio-démographiques (si les quotas n’ont pas été parfaitement respectés, or il existe généralement un léger écart sur au moins un critère car il faut toujours conjuguer rapidité de constitution de l’échantillon et respect des quotas. Mais les éventuels écarts sont légers, car la qualité de l’échantillon est essentielle, et aucun sondeur digne de ce nom ne se permettrait d’avoir un échantillon trop « distordu »), mais aussi en termes politiques, et sur ce plan, le redressement est absolument nécessaire car aucun quota politique n’est fixé lors de la constitution de l’échantillon.

On évoque souvent la différence entre les chiffres bruts et les chiffres redressés dans le cas des intentions de vote. Les chiffres bruts sont complètement dépendants de la qualité de l’échantillon interrogé. Si celle-ci est au rendez-vous, les écarts sur les votes antérieurs sont généralement peu importants, mais existent. Ils ne sont pas dus uniquement à la qualité de l’échantillon, mais également aux phénomènes de sous ou sur-déclaration évoqués ci-dessous. Ils s‘expliquent également par les marges d’erreurs, autre donnée dont les sondeurs doivent tenir compte.

 

Les marges d’erreurs

Les marges d’erreurs demeurent un impondérable des sondages, posée par la théories statistiques. Les marges d’erreur varient selon la taille de l’échantillon, mais aussi selon le pourcentage considéré, ce qu’on oublie souvent. Ainsi, pour un échantillon de 1000 personnes, la marge d’erreur (avec un intervalle de confiance de 95%) est de 3,1 points pour un pourcentage égal à 50% et de 1,4 points pour un pourcentage égal à 5%.

 

L’épreuve de la réalité : le jour du vote

Face à toutes ces difficultés, comment les sondeurs s’en sont-ils sortis lors de la précédente élection présidentielle ?

Le tableau ci-dessous compare les  intentions de vote avec les résultats réels de l’élection pour l’élection de 2007. Nous avons pris pour comparaison avec les résultats réels du vote les dernières intentions de vote*, car il faut encore et toujours le rappeler, les sondages d’intentions de vote ne sont pas une prédiction des résultats électoraux. Par définition, ils servent à cerner les mouvements de l’opinion, en donnant un rapport de force à un instant t. Les sondages réalisés en février donnent le rapport de force de février, qui sera potentiellement modifié par la campagne électorale, pas le résultat du scrutin qui a lieu fin avril. Il n’y a donc de sens à ne comparer les résultats qu’avec les intentions de vote conduites le plus près possible du scrutin.

Des écarts existent, notamment concernant le vote pour Jean-Marie Le Pen, surestimé par les instituts, souvent au détriment du vote pour Nicolas Sarkozy. Néanmoins, il s’avère que les estimations des instituts se sont révélées plutôt proches des résultats réels de l’élection, surtout quand on garde à l’esprit la marge d’erreur à laquelle ces sondages sont soumis.

 

Conclusion : les sondeurs infaillibles ?

Cet article ne cherche pas à encenser les sondages. En tant que professionnels des études, nous sommes également les fins connaisseurs de leurs limites et de leurs biais. Leurs connaissances est d’ailleurs, à notre sens, une condition sine qua non de la bonne interprétation des sondages.

Les sondages sont loin d’être un instrument infaillible. La théorie statistique nous dit qu’ils seront toujours soumis aux marges d’erreurs. Les phénomènes sociologiques tels que la désirabilité sociale, la complexité effective à atteindre certaines catégories de population par les différents modes de recueil utilisés, posent que par construction, les sondages sont porteurs d’imperfections. Il n’empêche qu’on ne peut les rejeter parce qu’ils n’ont pas toujours permis de tout prévoir. Effectivement, aucun institut de sondage n’a, en 2002, donné la véritable affiche du second tour. Même si les sondeurs avancent des explications valables à cet événement (tendances au croisement des courbes de Lionel Jospin et de Jean-Marie Le Pen, détermination tardive des électeurs…), cette élection présidentielle reste le preuve vivace que la prudence dans l’interprétation doit rester de mise, que nous devons nous plier à une observation des évolutions dans le temps et à une comparaison intelligente entre les études des différents instituts de sondage.

Dans la majorité des cas néanmoins, la comparaison entre sondages d’intentions de vote et résultats de l’élection démontrent que ces outils sont pertinents et qu’ils apportent une information précieuse sur les rapports de force. En outre, ils demeurent à ce jour le seul moyen permettant de mesurer l’opinion, et par conséquent, ils ne sont pas prêts de disparaître.

 

*Les intentions de vote présentées sont les dernières réalisées par les instituts avant le scrutin de 2007 :

Sondage TNS Sofres en partenariat avec Unilog Groupe LogicaCMG pour Le Figaro, RTL et LCI, réalisé par téléphone les 18 et 19 avril 2007, auprès d’un échantillon de 1000 personnes inscrites sur les listes électorales, représentatif de la population française âgée de 18 ans et plus. http://www.tns-sofres.com/points-de-vue/530C971BB1E84260AA2AFEF6D3238977.aspx

Sondage Ipsos en partenariat avec Dell pour SFR et Le Point, réalisé par téléphone les 19 et 20 avril 2007, auprès d’un échantillon de 1598 personnes, représentatif de la population française inscrite sur les listes électorales. http://www.ipsos.fr/presidentielle-2007/index.php

Sondage CSA en partenariat avec Cisco pour Le Parisien/aujourd’hui en France, réalisé par téléphone le 20 avril 2007, auprès d’un échantillon de 1002 personnes inscrites sur les listes électorales, représentatif de la population française âgée de 18 ans et plus. http://www.csa.eu/multimedia/data/sondages/data2007/opi20070420-intentions-de-vote-a-l-election-presidentielle-de-2007-vague-27.htm

Un sondage Ifop a également été réalisé juste avant le scrutin mais les résultats ne sont pas disponibles de manière intégrale sur le site de l’institut.

Intentions de vote : des dissonances entre les instituts

A deux mois du premier tour de l’élection présidentielle, les médias se font l’écho de nombreux sondages d’intentions de vote, réalisé par différents instituts. Ce matin était diffusé par de nombreuses sources (France télévisions, Radio France, Le Monde) un sondage réalisé par l’institut Ipsos les 17 et 18 février*, soit juste après la déclaration de candidature de Nicolas Sarkozy. L’enseignement principal de ce sondage étant que l’entrée en campagne du président de la République n’avait eu aucune conséquence dans les intentions de vote, Nicolas Sarkozy recueillant toujours 25% d’intentions de vote (comme au début du mois) et son principal adversaire, François Hollande, toujours 32%.

Or, il n’aura pas échappé aux observateurs qui suivent la parution des différents sondages, que deux études , réalisées sur des périodes proches voire identiques (OpinionWay réalisée également les 17 et 18 février** et Ifop réalisée du 16 au 20 février***), donnent des résultats légèrement différents, bien que la hiérarchie entre les candidats ne varie pas.

1. D’une part ces deux instituts observent une légère augmentation des intentions de vote pour Nicolas Sarkozy suite à sa déclaration de candidature, contrairement à Ipsos. Ainsi, OpinionWay constate une augmentation de 1,5 points par rapport au 8 février. Pour l’Ifop, l’augmentation est même de trois points depuis cette date.

2. L’écart entre les deux principaux candidats varie assez nettement. Le sondage Ipsos donne un très large écart au premier tour entre Français Hollande (32%) et Nicolas Sarkozy (25%) : 7 points. Pour OpinionWay et l’Ifop, cet écart n’est que de deux points ! (29% pour François Hollande et 27% pour Nicolas Sarkozy).

Ipsos
(17-18 février)
OpinionWay
(17-18 février)
Ifop
(16-20 février)
Nathalie Arthaud 0,5 0,5 0,5
Philippe Poutou 0,5 0,5 0
Jean-Luc Mélenchon 9 8 9
François Hollande 32 29 29
Eva Joly 3 2 2,5
François Bayrou 11 13 11
Corine Lepage 1 0,5 1
Dominique de Villepin 1,5 2 2
Nicolas Sarkozy 25 27 27
Frédéric Nihous 0 0,5 0
Nicolas Dupont-Aignan 0,5 0,5 0,5
Marine Le Pen 16 16,5 17,5

Par ailleurs, cette différence dans les niveaux d’intentions de vote se retrouve également au deuxième tour :

Ipsos
(17-18 février)
OpinionWay
(17-18 février)
Ifop
(16-20 février)
François Hollande 59 56 56
Nicolas Sarkozy 41 44 44

Une différence majeure apparaît entre ces deux groupes de sondages (Ifop et OpinionWay d’une part et Ipsos d’autre part) : le mode de recueil de l’information. Alors que les deux premiers sont réalisés via internet, l’étude Ipsos utilise le téléphone. Aujourd’hui, au niveau national, les intentions de vote par internet sont aussi courantes, voire davantage que celles par téléphone, parce qu’elles sont moins coûteuses. On dit souvent que les études par internet seraient moins fiables. Rien n’est moins vrai. En réalité, les études par téléphone, comme celles par internet, ont leur défauts (leurs biais), qu’il faut connaître – et qui sont particulièrement bien connus des professionnels dans les instituts. Par internet, il est plus difficile d’interroger les catégories les plus modestes, tant au niveau de leur revenu que de leur capital culturel (car elles disposent moins que la moyenne d’un accès à internet et se connectent moins régulièrement). Mais par téléphone, certaines catégories de population sont également plus difficiles à contacter : les actifs (plus rarement chez eux) et les jeunes, notamment parce que ceux-ci ne disposent plus d’une ligne téléphone fixe. Bien que la plupart des instituts interrogent désormais également les personnes sur leur portable voire sur des numéros dégroupés (opérateurs alternatifs, offre “triple play”), les sondages téléphoniques sont également porteurs de biais et il ne faut donc pas croire qu’un sondage par téléphone serait automatiquement plus fiable qu’un sondage réalisé par internet. En outre, un sondage par internet permet à la personne interrogée de s’exprimer sans fard, puisqu’aucun enquêteur n’est présent, ce qui peut permettre à certaines personnes d’être plus sincères et de déclarer sincèrement des votes qui peuvent encore être perçus comme “honteux”, notamment le vote Front national, même si cette “honte” tend à s’estomper au fil des années et le FN à gagner en respectabilité.

Pour autant, cette différence de méthodologie suffit-elle à expliquer les écarts constatés ? Elle pourrait en tout cas l’expliquer en partie. En outre, ne l’oublions pas, ces sondages restent soumis à une marge d’erreur, inhérente à la théorie statistique, qui justifie que tous les instituts ne donnent pas exactement les mêmes chiffres. Quant aux souvent invoquées “recettes de redressement” qui expliqueraient toutes les erreurs des sondages, nous rappellerons simplement que tous les instituts redressent leurs résultats à partir de la reconstitution des votes antérieurs (c’est-à-dire en vérifiant que l’échantillon reproduit bien les résultats réels de l’élection présidentielle de 2007 notamment) et utilisent peu ou prou les mêmes méthodes pour disposer, au final, d’un échantillon représentatif sur le plan politique.

Il nous semble intéressant de souligner les différences entre ces études, car l’exploitation des sondages dans les médias est généralement parcellaire, remplaçant un sondage par un autre, trop souvent sans offrir d’analyse approfondie mais seulement en énonçant des chiffres, qui seront remplacés le lendemain par ceux d’un autre sondage. Loin de nous l’idée de vilipender un institut au détriment des autres. Nous ne prétendons pas savoir lequel produit les meilleures intentions de vote et lequel se rapproche le plus de la réalité. Il faut observer les études produites dans leur diversité et en prenant le temps de relever leurs similitudes et différences, ainsi que les évolutions dans le temps. C’est de cette confrontation que naîtront les seules analyses pertinentes.

A nos yeux, ces différentes études restent des outils indispensables pour analyser le rapport de force entre les différents candidats, mais des outils dont l’interprétation doit être prudente et intelligente. Les sondages restent soumis aux effets de contexte, à la méthodologie choisie, à la marge d’erreur. Il convient donc de les interpréter avec un regard avisé sans tomber dans un rejet stérile de ces outils. Car malgré leurs différences dans les résultats, ceux-ci nous apportent tous le même constat :  le rapport de force est clairement, à ce jour, en faveur de François Hollande, qui reste en tête des intentions de vote au premier tour même s’il semble perdre de son avance, et qui, surtout, distance toujours très nettement le président sortant au second.

* Sondage Ipsos pour France télévisions, Radio France et Le Monde, réalisé par téléphone les 17 et 18 février 2012, auprès d’un échantillon de 969 personnes, représentatif de la population française âgée de 18 ans et plus. Les intentions de vote sont établies uniquement auprès des personnes inscrites sur les listes électorales, certaines d’aller voter.

** Sondage OpinionWay pour Le Figaro et LCI, réalisé par internet les 17 et 18 février 2012 auprès d’un échantillon de 975 personnes inscrites sur les listes électorales, issu d’un échantillon de 1045 personnes, représentatif de la population française âgée de 18 ans et plus.

*** Sondage Ifop en partenariat avec Fiducial pour Paris Match, réalisé par internet du 16 au février 2012, auprès d’un échantillon de 872  personnes inscrites sur les listes électorales, issu d’un échantillon de 926 personnes, représentatif de la population française âgée de 18 ans et plus.