Les sondeurs sont-ils mauvais ? L’exemple de la précédente élection présidentielle

Alors que les sondages s’enchaînent dans la perspective de la prochaine élection présidentielle, les critiques à leur égard se font de plus en plus visibles du fait des écarts observés entre les études publiées par les différents instituts ces derniers jours.

L’exercice des intentions de vote est toujours complexe, mais ne s’apparente pas aux « magouilles sondagières » que l’on décrit souvent. Les redressements effectués ne le sont pas « au bon nez » du sondeur et s’appuient sur des données solides (votes antérieurs notamment), même si, il ne faut le nier non plus, entre parfois en jeu une légère part de subjectivité, le sondeur se reposant également sur l’expérience passée et sur ses connaissances en sciences politiques. Si l’on veut bien sortir du discours caricatural et dénonciateur des sondages, on retiendra que plusieurs difficultés, bien réelles, doivent être surmontées par les professionnels et que celles-ci peuvent expliquer les différences constatées entre les différents instituts de sondage, qui y apportent des réponses parfois différenciées :

 

Les « menteurs »

Quand on parle des redressements des sondages d’intentions de vote, on évoque souvent plus particulièrement la difficulté à estimer le vote pour le Front national. Si les débats autour des redressements sont centrés sur cette question, c’est que le Front national a très longtemps été la principale « victime » d’un phénomène bien décrit par les sciences politiques, la « désirabilité sociale ». Il s’agit, pour l’interviewé, de déclarer voter pour un autre candidat que celui pour lequel il a l’intention de réellement voter, parce qu’il nourrit une honte à avouer son véritable choix. Le répondant ment donc pour se rendre plus acceptable, plus « désirable » aux yeux de l’enquêteur ou de la personne qui lira les résultats.

Le vote pour l’’extrême-droite est le plus sous-déclaré. Plus généralement, le vote pour la gauche (plus facile à assumer socialement) est légèrement sur-déclaré. Notons que ce phénomène joue aussi concernant l’abstention et que les Français ont parfois du mal à avouer qu’ils ne se rendront pas aux urnes lors d’une élection, surtout quand il s’agit d’une élection nationale importante comme l’élection présidentielle.

Le biais de « désirabilité sociale » est plus important quand la personne interrogée soumet ses réponses à un enquêteur (lorsqu’il est interrogé en face-à-face ou par téléphone). Dans les sondages par internet, où le répondant est seul face à son ordinateur, ce phénomène est moins fort mais existe cependant.

Ce biais est corrigé a posteriori par le redressement de l’échantillon à partir des votes antérieurs. Ainsi, si dans l’échantillon interrogé, on trouve 28% de personnes ayant déclaré avoir voté pour Ségolène Royal en 2007, on fait en sorte que ces personnes ne représentent que le poids qu’elles devraient avoir (26%, le score réel obtenu en 2007). On donne donc dans l’échantillon à chacune de ces personnes un poids de 0,93 (et les électeurs de candidats « sous-déclarés » auront, eux, un poids supérieur à 1).

Concernant plus spécifiquement le vote Front national, ces dernières années sont marquées par une plus grande facilité pour les répondants à se dire électeurs du parti d’extrême-droite. Le redressement introduit donc un moins grand écart entre le chiffre brut et le chiffre corrigé qu’il n’a pu l’être auparavant.

 

Les hésitants

Les sondages d’intentions de vote commencent à être conduits bien avant l’élection. Or, beaucoup d’électeurs se déterminent dans les derniers jours avant le scrutin. Comme le montre le graphique ci-dessous, lors la précédente élection présidentielle française en 2007, 17% des votants déclaraient s’être décidés au dernier moment, 18% les derniers jours et 21% au cours des dernières semaines.


Cette volatilité de l’électorat est une donnée à prendre en compte quand on analyse les sondages d’intention de vote, au global, mais aussi par candidat. Il apparaît en effet, que les « hésitants » sont plus représentés dans certains électorats. En l’occurrence, pour l’élection présidentielle qui s’annonce, les hésitants sont particulièrement présents au sein de l’électorat de François Bayrou et d’Eva Joly, alors que d’autres candidats disposent de socles électoraux bien plus solides, comme François Hollande et Nicolas Sarkozy.

Ces électeurs hésitants, dont le choix peut varier d’un jour sur l’autre, apportent une difficulté supplémentaire au sondeur, qui conduit généralement ses intentions de vote de manière régulière. Or les mesures publiées par un même institut de sondage doivent rester cohérente dans le temps et ne peuvent pas varier trop fortement en raison de ces électeurs dont le choix n’est pas encore fixé (mais qui oscille généralement entre un nombre limité de candidats). Ceci peut inciter un professionnel à modérer un écart, entre deux mesures d’intentions de vote, qui serait trop important pour un candidat dont l’électorat est fortement hésitant, afin de ne pas surestimer un potentiel électoral dont la solidité est faible. Ceci ne signifie pas qu’un candidat dont l’électorat serait majoritairement hésitant ne peut voir son score augmenter (ou diminuer) dans les sondages, mais seulement que les professionnels gardent à l’esprit la volatilité de l’électorat. Ils restent plus prudents quant aux évolutions constatées pour les candidats qui disposent de nombreux électeurs « hésitants », quitte à avoir parfois la tentation de « lisser » des évolutions constatées qui leur sembleraient pouvoir tenir plus du biais que d’un véritable mouvement de l’opinion.

De manière systématique, les sondeurs interrogent les personnes composant leur échantillon sur leur certitude de choix.

 

La qualité de l’échantillon

Pour construire des intentions de vote, et plus généralement un sondage,  la qualité de l’échantillon est essentielle. En France, les échantillons sont construits par la méthode des quotas, c’est-à-dire que dans l’échantillon, sera interrogé une proportion déterminée d’hommes et de femmes, d’urbains et de ruraux, etc. pour que ces proportions correspondent à ce qu’elles sont dans la population réelle. Généralement, les instituts imposent des quotas de sexe, d’âge, de profession, de région et de « catégorie d’agglomération » (échelle permettant de différencier les territoires ruraux et urbain)

On critique parfois les échantillons construits selon cette méthode. Et en effet, la théorie statistique pose que la représentativité de l’échantillon est assurée par un tirage aléatoire, donc sans définition de quotas, avec un hasard d’interrogation pur. Mais dans les faits, la mise en place des conditions théorique est tout simplement impossible. Ces conditions posent en effet que chaque Français possède la même probabilité d’être interrogé. Or des raisons pratiques évidentes s’y opposent  : parce qu’il n’existe aucune liste de numéros de téléphones ou de courriels comprenant toute la population (pour les enquêtes par téléphone ou internet), parce qu’il est impossible d’aller sonner à toutes les portes (digicodes et autres restrictions d’accès aux domiciles…) (pour les enquêtes en face-à-face), mais aussi parce que les gens s’absentent de chez eux, parce que certaines personnes refusent de répondre, etc.. Ainsi, les conditions de compositions d’un échantillon aléatoire ne peuvent être réunies de manière empirique. Un échantillon construit selon la méthode dite « aléatoire » sous-représenterait obligatoirement certaines catégories de population selon les biais mentionnés ci-dessus (actifs moins présents chez eux notamment). Par conséquent, les professionnels des sondages ont adopté une autre méthode, permettant de construire des échantillons représentatifs malgré toutes ces contraintes. En France, a été fait le choix de la méthode par quotas, qui a su faire ses preuves.

La qualité de l’échantillon se mesure au respect des quotas, mais également à d’autres critères. Ainsi, par exemple, pour un sondage téléphonique, il faudra veiller à rappeler plusieurs fois une personne indisponible, ou à varier les horaires d’appels, afin notamment que les personnes les plus « actives » et donc les moins présentes à leur domicile, soit bien représentées dans l’échantillon. De la même manière, pour un sondage par internet, on veillera à un temps d’interrogation permettant de recueillir l’opinion des personnes qui ne sont pas forcément connectées plusieurs fois par jour. Chaque méthodologie (interrogation par internet ou téléphone puisque ce sont généralement les deux utilisées concernant les intentions de vote) possède ses qualités et ses défauts, que les instituts de sondages connaissent (et qu’il serait malheureusement trop long de détailler ici). Les précautions décrites ci-dessous participent à réduire ces biais, et on considère que ces deux méthodologies permettent d’obtenir des échantillons représentatifs de la population française.

Une fois toutes les personnes interrogées, et donc l’échantillon constitué, les sondeurs opèrent un redressement. Celui-ci, selon le principe décrit ci-dessous, doit permettre à l’échantillon de présenter les mêmes caractéristiques que la population réelle, en termes socio-démographiques (si les quotas n’ont pas été parfaitement respectés, or il existe généralement un léger écart sur au moins un critère car il faut toujours conjuguer rapidité de constitution de l’échantillon et respect des quotas. Mais les éventuels écarts sont légers, car la qualité de l’échantillon est essentielle, et aucun sondeur digne de ce nom ne se permettrait d’avoir un échantillon trop « distordu »), mais aussi en termes politiques, et sur ce plan, le redressement est absolument nécessaire car aucun quota politique n’est fixé lors de la constitution de l’échantillon.

On évoque souvent la différence entre les chiffres bruts et les chiffres redressés dans le cas des intentions de vote. Les chiffres bruts sont complètement dépendants de la qualité de l’échantillon interrogé. Si celle-ci est au rendez-vous, les écarts sur les votes antérieurs sont généralement peu importants, mais existent. Ils ne sont pas dus uniquement à la qualité de l’échantillon, mais également aux phénomènes de sous ou sur-déclaration évoqués ci-dessous. Ils s‘expliquent également par les marges d’erreurs, autre donnée dont les sondeurs doivent tenir compte.

 

Les marges d’erreurs

Les marges d’erreurs demeurent un impondérable des sondages, posée par la théories statistiques. Les marges d’erreur varient selon la taille de l’échantillon, mais aussi selon le pourcentage considéré, ce qu’on oublie souvent. Ainsi, pour un échantillon de 1000 personnes, la marge d’erreur (avec un intervalle de confiance de 95%) est de 3,1 points pour un pourcentage égal à 50% et de 1,4 points pour un pourcentage égal à 5%.

 

L’épreuve de la réalité : le jour du vote

Face à toutes ces difficultés, comment les sondeurs s’en sont-ils sortis lors de la précédente élection présidentielle ?

Le tableau ci-dessous compare les  intentions de vote avec les résultats réels de l’élection pour l’élection de 2007. Nous avons pris pour comparaison avec les résultats réels du vote les dernières intentions de vote*, car il faut encore et toujours le rappeler, les sondages d’intentions de vote ne sont pas une prédiction des résultats électoraux. Par définition, ils servent à cerner les mouvements de l’opinion, en donnant un rapport de force à un instant t. Les sondages réalisés en février donnent le rapport de force de février, qui sera potentiellement modifié par la campagne électorale, pas le résultat du scrutin qui a lieu fin avril. Il n’y a donc de sens à ne comparer les résultats qu’avec les intentions de vote conduites le plus près possible du scrutin.

Des écarts existent, notamment concernant le vote pour Jean-Marie Le Pen, surestimé par les instituts, souvent au détriment du vote pour Nicolas Sarkozy. Néanmoins, il s’avère que les estimations des instituts se sont révélées plutôt proches des résultats réels de l’élection, surtout quand on garde à l’esprit la marge d’erreur à laquelle ces sondages sont soumis.

 

Conclusion : les sondeurs infaillibles ?

Cet article ne cherche pas à encenser les sondages. En tant que professionnels des études, nous sommes également les fins connaisseurs de leurs limites et de leurs biais. Leurs connaissances est d’ailleurs, à notre sens, une condition sine qua non de la bonne interprétation des sondages.

Les sondages sont loin d’être un instrument infaillible. La théorie statistique nous dit qu’ils seront toujours soumis aux marges d’erreurs. Les phénomènes sociologiques tels que la désirabilité sociale, la complexité effective à atteindre certaines catégories de population par les différents modes de recueil utilisés, posent que par construction, les sondages sont porteurs d’imperfections. Il n’empêche qu’on ne peut les rejeter parce qu’ils n’ont pas toujours permis de tout prévoir. Effectivement, aucun institut de sondage n’a, en 2002, donné la véritable affiche du second tour. Même si les sondeurs avancent des explications valables à cet événement (tendances au croisement des courbes de Lionel Jospin et de Jean-Marie Le Pen, détermination tardive des électeurs…), cette élection présidentielle reste le preuve vivace que la prudence dans l’interprétation doit rester de mise, que nous devons nous plier à une observation des évolutions dans le temps et à une comparaison intelligente entre les études des différents instituts de sondage.

Dans la majorité des cas néanmoins, la comparaison entre sondages d’intentions de vote et résultats de l’élection démontrent que ces outils sont pertinents et qu’ils apportent une information précieuse sur les rapports de force. En outre, ils demeurent à ce jour le seul moyen permettant de mesurer l’opinion, et par conséquent, ils ne sont pas prêts de disparaître.

 

*Les intentions de vote présentées sont les dernières réalisées par les instituts avant le scrutin de 2007 :

Sondage TNS Sofres en partenariat avec Unilog Groupe LogicaCMG pour Le Figaro, RTL et LCI, réalisé par téléphone les 18 et 19 avril 2007, auprès d’un échantillon de 1000 personnes inscrites sur les listes électorales, représentatif de la population française âgée de 18 ans et plus. http://www.tns-sofres.com/points-de-vue/530C971BB1E84260AA2AFEF6D3238977.aspx

Sondage Ipsos en partenariat avec Dell pour SFR et Le Point, réalisé par téléphone les 19 et 20 avril 2007, auprès d’un échantillon de 1598 personnes, représentatif de la population française inscrite sur les listes électorales. http://www.ipsos.fr/presidentielle-2007/index.php

Sondage CSA en partenariat avec Cisco pour Le Parisien/aujourd’hui en France, réalisé par téléphone le 20 avril 2007, auprès d’un échantillon de 1002 personnes inscrites sur les listes électorales, représentatif de la population française âgée de 18 ans et plus. http://www.csa.eu/multimedia/data/sondages/data2007/opi20070420-intentions-de-vote-a-l-election-presidentielle-de-2007-vague-27.htm

Un sondage Ifop a également été réalisé juste avant le scrutin mais les résultats ne sont pas disponibles de manière intégrale sur le site de l’institut.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s