Le QI : ce célèbre inconnu

Nathalie Boisselier
3 oct. 2022
21 min de lecture

Dernière mise à jour : 19 oct. 2022

Il est très facile de critiquer le QI, et de très nombreuses personnes ne s’en privent pas. Pourtant, il s'agit d'une notion complexe enrichie au cours d'un siècle de recherche.

Photo Colin Behrens (pixabay.com)

Qu’est-ce que le QI ?

Nous devons à Wilhem Stern d’avoir introduit la notion de Quotient Intellectuel (QI) en 1912. En prolongement des travaux de Binet et Simon qui avaient publié en 1905 la première version de leur "Echelle Métrique d’Intelligence", Stern introduit ce qu’il désigne comme un "quotient mental". Il s’agit, grâce à une équation divisant l’âge mental par l’âge réel et en multipliant le résultat par 100, de proposer une forme compréhensible du calcul de l’intelligence des enfants et des adolescents jusqu’à 16 ans (Savournin, 2013). La notion de QI a cependant commencé à se répandre véritablement au moment où Lewis Terman (1916) traduit et adapte l’échelle révisée de Binet et Simon (1908) et la publie sous le nom d’"Echelle d’intelligence de Stanford-Binet".

Le QI de Stern, tel que repris par Terman, pose cependant le problème de représenter un indice de développement. Il ne permet ni de comparer entre eux des enfants de différents âges, ni de mesurer l’intelligence des adultes. Les travaux de Robert Yerkes, dans les années 1920, ont été déterminants pour dépasser ces difficultés. Mais ce sont surtout les travaux de David Wechsler qui ont marqué l’histoire de la psychométrie de l’intelligence et qui sont passés à la postérité. A partir de 1932, ce psychologue américain développe une batterie pour mesurer l’intelligence de l’adulte en s’exonérant de la notion d’âge mental ou d’âge de référence pour introduire la notion de QI standard. Ce faisant, il choisit comme norme une moyenne de 100 et un écart type de 15 pour obtenir des résultats proches de ceux obtenus avec les tests de QI classiques. Il souhaitait ainsi rester cohérent avec le système numérique auquel étaient habitués les psychologues administrant traditionnellement les tests issus de l'échelle de Binet.

Les échelles de Wechsler sont désormais au nombre de trois et permettent de mesurer l’intelligence tout au long de la vie :

Wechsler Preschool and Primary Intelligence Scale (WPPSI) : pour les enfants de 2 ans et 6 mois à 7 ans et 3 mois.
Wechsler Intelligence Scale for Children (WISC) : pour les enfants et les adolescents de 6 ans à 16 ans et 11 mois.
Wechsler Adult Intelligence Scale (WAIS) : pour les adultes de 16 à 79 ans et 11 mois.

Nous en sommes actuellement à la quatrième version pour la WPPSI et la WAIS, et à la cinquième version pour la WISC. Ce sont les échelles d’intelligence les plus administrées dans le monde puisqu’elles ont été adaptées et standardisées dans de très nombreux pays différents.

Le QI de Wechsler

Il est très facile de critiquer le QI et de très nombreuses personnes ne s’en privent pas ; c’est vendeur. Il s’agit pour cela de réchauffer le bon vieux soupçon de l’élitisme et de prôner l’égalité (au détriment de l’équité que l’égalité n’a jamais garantie). Le QI semble une notion simple que l’on peut critiquer simplement. Il n’en est pourtant rien, et des milliers d’articles scientifiques montrent à quel point il s’agit d’un concept complexe et difficile à appréhender. Essayons au moins d’en définir les principales caractéristiques.

La première chose à savoir, c’est que les scores de QI s’inscrivent dans une fourchette allant de 40 à 160 [1]. Les scores compris entre 40 et 70 sont considérés comme déficitaires (i.e., entraient anciennement dans la détermination du déficit intellectuel ou retard mental). Les scores allant de 130 à 160 identifient le haut potentiel intellectuel (HPI), c’est-à-dire des compétences intellectuelles hors-normes. Par ailleurs, et par comparaison au QI de Binet-Stern, le QI de Weschler n’est plus un quotient, mais un rang dans une population de référence. La détermination du QI d’une personne consiste donc à situer son score par rapport à un échantillon de référence, un groupe de sujets d’âge et de culture comparables dont les scores de QI sont connus.

La deuxième chose à savoir, c’est que, comme pour toutes les aptitudes humaines, les scores de QI suivent une loi qui est appelée « Loi normale ». Ils s’organisent donc sous une courbe dite de Gauss. C’est vrai en France et dans tous les pays du monde. C’est vrai pour l’intelligence, mais c’est aussi vrai pour le temps nécessaire pour courir un 100m, et même pour les notes des étudiants à un examen (s’il y a assez d’étudiants et si le sujet est bien fait). Comme la moyenne du QI a été fixée à 100, l’organisation gaussienne des scores de QI implique que 50% des gens ont un QI inférieur à 100 et 50% des gens ont un QI supérieur à 100. En outre, plus on s’éloigne de la moyenne, moins il y a de personnes : il ne reste déjà plus que 5% d'individus au-delà de QI 120, et 2,28% au-delà de QI 130.

Voici ce que cela donne si on met tout cela dans un graphique :

Sous la courbe des QI, vous n’aurez pas manqué de noter cette ligne appelée "Percentiles". Cette ligne est finalement la plus importante. On ne peut pas comprendre la notion de QI sans comprendre cette ligne.

Prenons un exemple : suite à la passation d’une échelle de Wechsler, un adulte obtient un QI Total (QIT) de 107, ce qui le situe au rang percentile 68. Cela signifie que 68% des personnes de sa tranche d’âge et issues de sa culture ont un niveau de performance intellectuelle inférieur au sien.

Si un autre adulte obtient un QIT de 130, il se situe au rang percentile 98. Cela signifie que 98% des personnes de sa tranche d’âge et issues de sa culture ont un niveau de performance intellectuelle inférieur au sien.

[1] Pourquoi les scores de QI sont compris entre 40 et 160 et pas entre 0 et 200 ? Parce qu’en dessous de 40, les personnes n’ont tout simplement pas les ressources cognitives suffisantes pour répondre aux questions du test, même les plus simples. Il ne serait de toute façon pas éthiquement justifiable de les y soumettre. Au-dessus de 160, il faut se rappeler que le QI est calculé en comparaison d’un échantillon de référence, c’est-à-dire un groupe de personnes dont les scores au test sont connus. Il n’existe tout bonnement pas suffisamment de personnes dont les performances sont aussi élevées pour constituer l’échantillon de référence. Mais est-ce qu’il existe des personnes dont le QI de Wechsler dépasse 160 ? Oui, bien sûr, quoi qu’elles soient extrêmement rares.

De quoi le QI rend-il compte ?

Pour ce qui concerne la plupart des échelles d’intelligence permettant le calcul d’un score global, le QI représente le niveau de performance intellectuelle moyen d’un individu. De manière plus précise concernant la quatrième version de l’échelle de Wechsler pour adultes (WAIS-IV ; Wechsler, 2011), le QIT représente une moyenne équipondérée des notes standard obtenues aux différents subtests (Lecerf et al., 2011), c’est-à-dire que chacun des 10 subtests obligatoires y contribue à hauteur de 10%.

Cette dernière phrase nécessite d’expliquer comment s’organise la WAIS-IV. Elle se compose de 10 tâches (ou épreuves cognitives ou subtests) obligatoires, c’est-à-dire dont les notes permettent le calcul du QIT. Les notes aux subtests peuvent être comprises de 1 à 19. Il s’ajoute 5 subtests complémentaires que le psychologue peut décider de faire passer en fonction de ce qu’il recherche, c’est-à-dire de ses hypothèses avec son patient avant la passation du bilan. Il peut aussi administrer les subtests complémentaires en fonction de ce qu’il observe en cours de bilan. Sauf dans des cas très précis (qui sont des cas de force majeure), la règle est de ne pas substituer des subtests complémentaires à des subtests obligatoires lors du calcul du QIT.

Les 10 subtests balayent les compétences dans différents domaines cognitifs réputés comme étant relativement indépendants les uns des autres. Quatre de ces domaines sont évalués par la WAIS-IV et ils permettent de déterminer des notes comprises entre 50 et 150 :

L’indice de compréhension verbale (ICV) rend compte des notes obtenues aux subtests Similitudes, Compréhension et Information.
L’indice de raisonnement perceptif (IRP) rend compte des notes obtenues aux subtests Cubes, Matrices et Puzzles visuels.
L’indice de mémoire de travail (IMT) rend compte des notes obtenues aux subtests Mémoire des chiffres et Arithmétique.
L’indice de vitesse de traitement (IVT) rend compte des notes obtenues aux subtests Symboles et Code.

Voici le modèle sous-jacent à la WAIS-IV (image extraite du site de Pearson clinical, qui est l’éditeur du test) :

Dans le modèle de Wechsler tel qu’il a été abondamment décrit (e.g., Lichtenberger & Kaufman, 2012), il est facilement observable que l’échelle d’intelligence mesure le raisonnement verbal, c’est-à-dire le raisonnement à partir des connaissances déjà acquises dans l’environnement. Il s’agit de l’ICV. Le raisonnement non-verbal, c’est-à-dire le raisonnement logique sans pouvoir faire appel aux connaissances antérieures est également évalué ; il s’agit de l’IRP. Dans ce modèle, l’IMT et l’IVT sont considérés comme des fonctions de soutien du raisonnement. Contrairement à l’ICV et l’IRP, ces deux indices ne rendent pas compte de « contenus de la pensée » (Lecerf et al., 2011).

Doit-on communiquer systématiquement le QI ?

Répondons à cette interrogation et à quelques autres, consécutivement à ce qui a pu être lu ici ou là sur les réseaux sociaux. Déjà, un score de QI est toujours calculable. Il n’y a pas de configuration où il ne peut pas l’être, sauf si la passation a été interrompue par cas de force majeure et qu'il manque plusieurs notes de subtests. Dès le moment où l’ensemble des subtests obligatoires a été administré, le QI est calculable et il est recommandé de le communiquer. Ne serait-ce que parce que le répondant a payé cher pour son bilan et qu’il est quand même venu pour connaître ce chiffre...

Mais pourquoi, sinon ? Déjà, parce que le QI est le seul indice permettant de déterminer le haut potentiel intellectuel (HPI) s’il s’agissait de l’objet de la passation du bilan neurocognitif (Labouret & Grégoire, 2018). Ensuite parce que des études ont permis de montrer la validité prédictive du QIT sur la réussite académique et les notes au moment de l’entrée à l’université au-delà des scores obtenus aux autres indices (e.g., Canivez, 2013; Freberg et al., 2008; Pettersson et al., 2020). Sans le QIT, il n'y a pas de prédiction fiable possible, quoi qu'on en dise. Enfin, toutes les études scientifiques qui se sont attachées à étudier le lien éventuel entre le QI et différentes variables (par ex., la curiosité intellectuelle, la stabilité émotionnelle) ne se sont pas soucié de l’hétérogénéité des profils de leurs participants. Le fait scientifique que l’intelligence s’associe avec la stabilité émotionnelle (Sniekers et al., 2017) renvoie à l’intelligence générale, et pas à des notes d'indices comme par exemple l’intelligence verbale (ICV) ou non-verbale (IRP).

Une autre question est : le QI est-il toujours interprétable ? La réponse est : oui, bien sûr. Le fait de dire qu’un score de QI n’est pas représentatif du fonctionnement intellectuel d’une personne est déjà une interprétation. Donc oui, le score de QI est toujours interprétable. En revanche, il peut y avoir des écarts importants entre les scores obtenus aux différents subtests ou entre les différents scores d’indices. On parle alors de dispersion ou de variabilité intra-individuelle ou d’hétérogénéité cognitive. Dans ce cas, une interprétation séparée des notes composites aux indices est préférée pour mieux expliquer le fonctionnement intellectuel de la personne. Mais le QIT était bien interprétable. De plus, il faut bien comprendre que l’hétérogénéité cognitive ne renvoie pas toujours à la pathologie. Et il n’existe pas à l’heure actuelle le moindre consensus pour associer certains profils de scores à des pathologies précises de type TDA/H, trouble du spectre autistique (TSA), ou troubles des apprentissages (McGill et al., 2018). En revanche, cela ne veut pas dire non plus que l’hétérogénéité ne serait jamais problématique. Il y a des seuils (probablement individuels) où elle a vraisemblablement des conséquences psycho-comportementales.

L'erreur de mesure

Il est courant d’entendre ou de lire que la mesure du QI à travers les tests d’intelligence n’est pas stable. Une personne pourrait faire une très belle performance un jour, tandis que sa performance un autre jour pourrait être radicalement différente. En statistique, ce phénomène est appelé « l’erreur de mesure ». L'erreur de mesure rend compte du fait que les humains ne sont pas toujours constants, dépendant de leur stress, leur état de fatigue, ou leur interlocuteur. On peut ainsi concevoir qu’un psychologue antipathique va affecter la performance de ses répondants par son comportement. C’est vrai. Mais il ne faut pas non plus exagérer le phénomène. Déjà parce que les conditions de passation sont prises en charge dans le Manuel d’administration et de cotation de l’échelle, qu’il s’agisse de la lumière, du bruit, de la manière dont le répondant doit être installé, etc. Tout est défini. En d’autres termes, le psychologue veille aux conditions de passation de telle sorte à réduire l’amplitude de l’erreur de mesure.

Ne commentons pas le fait que les psychologues n’ont strictement aucun intérêt à se comporter de manière antipathique avec leurs patients. On peut clairement imaginer que cela existe, mais il ne faut pas grossir le trait : ce n’est certainement pas le cas général. De la même manière, il appartient aux psychologues de veiller à ne pas administrer le test s’ils constatent que leur patient est sous l’emprise d’une substance, submergé par le stress, tout droit sorti d’une nuit blanche, ou venant de se faire quitter par son partenaire. Dans ce cas, rappelons quand même que, quelle que soit leur bienveillance, les psychologues font deux repas par jour comme tout le monde. Quand un test est interrompu ou annulé le jour J pour des raisons qui n’impliquent pas leur responsabilité, même s'ils sont compréhensifs, il est normal que leurs honoraires soient acquittés (spéciale dédicace aux gens qui présentent les psychologues comme de vilains profiteurs, ou qui pensent qu'il n'est pas grave d'annuler son bilan quelques minutes avant l'heure du rendez-vous).

Malgré tout, on pourra me dire que tout ceci est un ensemble d’allégations et que les témoignages des personnes sur Internet vont plutôt dans le sens où la pleine mesure de leurs performances n’a pas été restituée par les résultats du test à cause du stress présent lors de la passation. Il se trouve que cela a fait l'objet d'études. Dans la recherche, on parle de l'étude de la « fiabilité test-retest » d'une échelle ; elle permet d'établir s'il existe une invariance des scores entre les deux passations de cette même échelle. La question de recherche est alors la suivante : si la WAIS-IV est administrée à des personnes à plusieurs semaines d’intervalle, obtiendront-elles en moyenne le même score de QI ?

Il apparaît bien que oui. Comme l’écrivent Sherman et al. (2006) : “IQ tests are an example of tests designed a priori to capture stable estimates of an individual’s ability levels; these typically have high test-retest correlations”. Par exemple, Fan et al. (2019) ont trouvé une fiabilité test-retest jugée excellente en administrant une version courte de la WAIS-IV à 84 adultes appartenant à l’échantillon d’étalonnage chinois de l’échelle, avec en moyenne 32,2 jours entre les deux passations.

Donc, oui, pour me répéter (j’ai l’âge de mes artères), l’erreur de mesure existe bel et bien. Mais, sauf cas exceptionnel, la mesure du QI à différents moments est relativement stable. La magnitude des effets d’apprentissage entre deux passations ne doit pas plus être exagérée (Sherman et al., 2006), ce qui s’ajoute à une bonne validité concurrente des échelles de Wechsler. Dit autrement, le score de QI obtenu lors de la passation d’une échelle de Wechsler est fortement corrélé au score total obtenu en passant une autre échelle validée d’intelligence.

Oui, mais ce n’est pas stable quand même…

Si, c’est toujours stable dans l’instabilité. Je m’explique. Tout le monde sait que l’intelligence des enfants se développe et qu’ils n’atteindront la pleine mesure de leur intelligence que vers la fin de l'adolescence (16 à 18 ans selon les individus). De plus, nous vieillissons et certaines de nos capacités déclinent. Toutes ne se développent pas et ne déclinent d’ailleurs pas de la même manière ou selon la même temporalité. Oui, mais cela reste stable.

Ceux qui ont lu attentivement ce long opus se souviendront de ce que représente le QI : un rang (percentile) dans une population de référence. Donc, une personne dont le QI est mesuré à 110 quand elle a 20 ans se situera au rang percentile 75. Elle sera décrite comme disposant de meilleures compétences intellectuelles que 75% des personnes de son âge. Si on évalue le QI de cette même personne à 70 ans et que cette personne a un vieillissement normal (sans trouble neuro-évolutif), elle aura vraisemblablement un QI aux alentours de 110 et elle sera toujours décrite comme plus performante que 75% des personnes de son âge. Ses performances seront pourtant bien différentes. Il y a par exemple de fortes chances que sa vitesse de traitement ait diminué. Oui, mais comme toutes les personnes de son âge ; c’est la raison pour laquelle elle conservera sa « place » sous la courbe de Gauss.

L’intervalle de confiance

Une autre critique récemment entendue voulant soutenir que le QI n’est pas stable renvoyait à l’intervalle de confiance. Qu’est-ce que cela veut dire ? Cela veut par exemple dire que le QI d’un adulte évalué à 107 a en réalité 95% de chances d’avoir un QI compris entre 102 et 112, le plus probable étant un score de QI estimé à 107. L’intervalle de confiance est donc la fourchette des scores dans laquelle un QI a 95% de chances de se trouver. Pour l’échelle de Wechsler pour adultes, l’intervalle de confiance a une amplitude en moyenne de 10 points (± 5 points autour du score de QI estimé).

C’est vrai que cela pose un problème quand on regarde les rangs percentiles correspondants. On dit effectivement à cet adulte de QI 107 (rang percentile 68 ; intervalle de confiance [102-112]) qu’il est possible que son intelligence soit plus performante que celle de 55% des personnes des gens de son âge (si QI 102) si son score se situe à l'extrémité basse de l'intervalle de confiance… ou alors de 79% des gens (QI 112). Ce n’est quand même pas pareil.

Oui, mais rappelez-vous de la Loi normale et de la courbe de Gauss : plus on avance dans les rangs du QI, moins il y a de monde. C'est pareil dans les rangs déficitaires du QI.

Prenons alors un adulte qui est évalué avec un QI 130, et donc un intervalle de confiance à 95% qui est [124-134]. Son QI 130 le place au rang percentile 98. Son niveau de performance cognitive est donc supérieur à celui de 98% des adultes de son âge, avec au minimum un QI de 124 (rang percentile 95) et au maximum un QI de 134 (rang percentile 99). Donc, quoi qu’il arrive, cet adulte est intellectuellement plus performant que 95 à 99% des gens. Il n’y a pas de quoi s’inquiéter.

En conséquence, les groupes ou associations qui se composent de HPI regroupent des personnes dont les capacités intellectuelles se situent dans un mouchoir de poche.

Maintenant, pourquoi éprouvent-ils le besoin de se retrouver entre eux ? Pourquoi les gens ressentent-ils le besoin de se retrouver sur des critères aussi généraux que la religion, l’appartenance politique ou l’orientation sexuelle, voire même autour d’une passion (le foot, la philatélie…) ? Chacun a le droit d’avoir une opinion sur le sujet, de penser que c’est bien ou mal. Mais sur le plan de la psychologie, on peut trouver une réponse dans la théorie de l’autodétermination de Deci et Ryan (2000). Cette théorie se donne pour objectif de déterminer pourquoi les gens agissent comme ils le font, quelle est la motivation derrière leurs actions. Selon Deci et Ryan, leurs motifs répondent à des besoins psychologiques fondamentaux qui sont liés à l’espèce. Ils en ont identifié trois :

- Le besoin de compétence : besoin de se sentir efficace dans les interactions que l’on a avec les autres, besoin de pouvoir exprimer ses capacités,

- Le besoin d’autonomie : besoin de se sentir être l’origine ou la source de ses propres comportements,

- Le besoin d’affiliation : besoin de se sentir connecté aux autres, avoir un sentiment d’appartenance avec d’autres individus.

En faisant appel au besoin d’affiliation (et celui de compétence), il est au moins possible de comprendre pourquoi des personnes HPI éprouvent le besoin de s’affilier à des groupes sociaux composés d’autres personnes HPI. Il n'y a rien de bien transcendant ou de vraiment suspect.

Les tests de QI ne mesurent pas tout

Il est évident que c’est le cas : les tests de QI ne mesurent pas toutes les capacités cognitives plus ou moins présentes chez l’humain. Pas plus que les modèles de la personnalité ne prétendent capturer tout de la personnalité d’un individu. Par exemple, le modèle du Big Five de Costa et MacCrae (1992) permet d’évaluer les personnes sur cinq dimensions indépendantes de la personnalité (Ouverture à l’expérience, Conscienciosité, Extraversion, Agréabilité, Neuroticisme). Mais ces cinq dimensions ne constituent qu’un minimum pour décrire dans son entier la personnalité d’un individu (il existe d'autres traits pertinents qui ne sont pas pris en charge par le Big Five). Il en va de même pour les tests d’intelligence.

La question pourrait alors se poser d’ajouter des compétences à la mesure de l’intelligence. La réponse n’est pas si simple. Les échelles de Wechsler, mais aussi tous les tests d’intelligence actuellement disponibles, sont compatibles et alignés avec le modèle de l’intelligence de Cattell-Horn-Carroll (CHC ; Carroll, 1993) qui hérite en ligne direct des travaux de Charles Spearman (1904) et de sa découverte de son facteur g d’intelligence générale. Le CHC (représenté sur la Figure ci-dessous) est le modèle le mieux validé pour rendre compte des composantes et de l’organisation de l’intelligence humaine. Il se présente avec, à son sommet (niveau 3 ou strate 3), un facteur g d’intelligence générale qui correspond au niveau moyen de performance d’un individu dans différents domaines intellectuels réputés indépendants (strate 2, facteurs secondaires). Chacun de ces domaines représente la mise en œuvre de processus cognitifs de base (niveau 1, facteurs primaires) qui sont évalués par des tâches cognitives (les subtests des échelles d'intelligence).

Il existe deux manières de coter les résultats d'un adulte lors de la passation d'une échelle d'intelligence pour adulte de Wechsler (WAIS-IV). La manière la plus courante est celle proposée par le Manuel de cotation du test lui-même (des tables de conversion sont fournies avec la mallette du test). Elle fait appel au modèle de Wechsler. L’autre manière est de réaliser la cotation en faisant appel au modèle CHC et aux normes fournies par Lecerf et al. (2012) pour la France. En plus des subtests obligatoires, cette méthode de cotation nécessite d’administrer au répondant 3 subtests parmi les subtests supplémentaires.

Cette cotation en faisant appel au CHC n'est pas utilisée dans la pratique actuelle de la WAIS-IV (le logiciel fourni avec le test ne la propose pas, ni les fameuses tables de conversion). Mais elle montre l’ancrage théorique des échelles de Wechsler, un ancrage qui serait perdu si des subtests évaluant des domaines cognitifs n’appartenant pas au CHC étaient ajoutés aux subtests actuels. Toute la littérature scientifique sur l’intelligence ne serait plus d’aucun usage et on ne saurait plus franchement ce que l’on mesure. En conséquence, aussi séduisant que cela puisse paraître, le fait d’ajouter un subtest évaluant la créativité ou la pensée rationnelle aux échelles de Wechsler ne serait pas une avancée, mais un recul. Les échelles perdraient leur ancrage théorique, et donc vraisemblablement ce qu'on appelle en psychométrie leur "validité de construit".

Une autre remarque est liée à différentes correspondances notables entre le modèle CHC et le modèle de la WAIS-IV. Le QI est une bonne approximation du facteur g. On parle d’approximation parce que, comme je l’ai écrit plus haut, le QI est une moyenne équipondérée des notes standard obtenues aux différents subtests (Lecerf et al., 2011), c’est-à-dire que chacun des 10 subtests obligatoires y contribue à hauteur de 10%. En contraste, dans le modèle CHC, le score en facteur g « est obtenu à partir d’un ensemble de mesures, dont la contribution dépend de la saturation en facteur g de chacune des mesures » (Lecerf et al., 2011). En effet, tous les subtests ne contribuent pas selon la même importance à l’intelligence générale. Certains subtests y contribuent plus que d’autres (on dit qu'ils saturent plus ou moins le facteur g). Autant il en sera tenu compte dans une cotation à partir du modèle CHC, autant cela ne sera pas le cas en réalisant une cotation avec le modèle de Wechsler.

Comme l’illustre Lecerf (2011) : « Prenons l’exemple des sous-tests Code et Similitudes : dans le calcul du QIT, ces 2 épreuves interviennent avec le même poids, soit 10 %. En revanche, dans le score en facteur g, la contribution du sous-test Similitudes est plus importante que celle de l’épreuve Code, car la saturation en facteur g de ce premier est plus élevée (respectivement 0,77 vs. 0,36 selon Grégoire, 2009). »

Par un effet de régression vers la moyenne, une personne qui a un score « bas » au subtest Code va donc voir son score de QI tiré vers le bas quand la cotation avec le modèle de Wechsler sera réalisée. Mais cela ne serait pas le cas avec une cotation en accord avec le CHC. C’est une des raisons pour lesquelles la dernière version de l’échelle d’intelligence pour enfants, la WISC-V (Wechsler, 2016) a été totalement alignée avec le modèle CHC. La version 5 de l’échelle pour adultes (WAIS-V) est donc attendue avec impatience, bien qu’aucune date n’ait été fixée par l’éditeur.

Allons plus loin. Une personne qui a un profil homogène n’est pas vraiment impactée par le phénomène de régression vers la moyenne. En effet, si les notes à tous ses subtests sont proches les unes des autres, peu importe à quel point tel ou tel subtest sature le QI ; chaque note a la même importance pour le calcul du QI (compte à hauteur de 10%).

Mais plus on augmente dans les rangs du QI, plus les profils sont hétérogènes. Ceci est expliqué cette fois par un autre effet, celui de « la différenciation des aptitudes selon l’efficience » qui rend compte d'une autre loi statistique : la Loi des rendements décroissants mise en lumière par Spearman (1927). La différenciation des aptitudes selon l’efficience rend probablement compte du fait que plus les individus disposent de ressources cognitives étendues, plus ils disposent de stratégies pour résoudre un même problème. Donc, les personnes HPI ayant par nature des scores plus variables, elles sont plus sensibles au phénomène de régression vers la moyenne que les personnes avec un QI proche ou en-dessous de 100.

De plus, les personnes HPI sont traditionnellement évaluées avec des scores plus bas en Vitesse de Traitement (indice IVT auquel appartient le subtest Code) comparativement à leurs scores aux autres indices, particulièrement ICV et IRP. Conjointement, l'IVT est l'indice qui sature le moins le QI. Les personnes HPI sont donc particulièrement sensibles au phénomène de régression vers la moyenne, par rapport aux personnes ayant un QI dans la moyenne (QI environ 100).

Les « Twice »

Et puis, tant qu’à parler de la « régression vers la moyenne », parlons d’une dernière petite subtilité. Celle qui rend compte de la Double Exceptionnalité. Les personnes doublement exceptionnelles (2e) sont celles qui ont une intelligence supérieure avec un trouble chronique connexe susceptible d’affecter leur profil neurocognitif. Cette spécificité concerne par exemple les personnes avec TDA/H, TSA, trouble des apprentissages (trouble dys), bipolarité, etc.

Ces personnes vont souvent avoir des fonctions exécutives affectées, et donc un Indice de Mémoire de Travail (IMT) et/ou de Vitesse de Traitement (IVT) qui sont chutés comparativement à leurs performances en Compréhension Verbale (ICV) et en Raisonnement Perceptif (IRP). Ces notes composites basses en IVT et en IMT vont « tirer » leur QI Total vers le bas par un phénomène de régression vers la moyenne.

C’est pourquoi, pour ce qui les concerne, il est important pour les psychologues de calculer un Indice d’Aptitude Générale (IAG) quand ils constatent qu’il n’y a pas trop d’écart entre les notes de l’ICV et del’IRP. Cet IAG, en rendant compte de leurs capacités de raisonnement, permettra de rendre justice aux personnes 2e, et de les rassurer quant à leur niveau d’intelligence.

Dans un monde parallèle, le QI ne mesurerait pas l’intelligence

Le titre de ce paragraphe est un peu provocateur, mais il renvoie à une docte aberration qui se lit assez régulièrement. Déjà, si on parle d’intelligence, il convient de la définir. Selon la task force réunie autour d’Ulrich Neisser en 1996, l’intelligence se définit comme l’aptitude globale et variable entre les individus à traiter des idées complexes dans la vie de tous les jours, à s’adapter efficacement à leur environnement, à apprendre de l’expérience, à s’engager dans des raisonnements variés et à surmonter les obstacles en réfléchissant.

Tout le monde notera au passage que cette définition ne dit rien de la valeur humaine. Il serait donc bon d’arrêter de critiquer le QI uniquement pour essayer de se « narcissiser » par une sorte de système malsain de vases communicants. Tout est critiquable, y compris la notion de QI. Mais, comme je l’ai écrit plus haut, il faut pouvoir le faire avec des arguments solides et étayés. Rappelons à ce sujet que les livres ne passent pas par le processus de validation des écrits scientifiques par les pairs, le fameux « peer review process ». Ils ne sont pas validés par des pairs chercheurs, mais par un éditeur dont l’objectif est le profit. Ce n’est pas une critique du monde de l’édition, mais une réalité bien compréhensible dans une économie de marché. Certaines théories philosophées peuvent se trouver dans les livres sans être étayées par des recherches solides. Dans un livre, on peut aussi faire « parler » une étude au-delà de ce que ses résultats permettaient de conclure. Ces surinterprétations ne passeraient pas dans un article soumis à un journal scientifique.

Rappelons aussi que « oui », plusieurs formes d’intelligence ont été postulées au cours du siècle écoulé, avec plus ou moins de validation scientifique (plutôt moins que plus, soyons honnêtes). Parmi ces formes d’intelligence, un seul modèle n’est pas remis en question : le modèle CHC proposé par Carroll (1993), parce qu’il fait l’objet d’une validation de plusieurs milliers d’études empiriques. Le lien théorique fort qui existe entre le facteur g d’intelligence et le QI répondent à la question de savoir ce que reflète le QI : il reflète bien l’intelligence cognitive puisqu’il reflète ou mesure le facteur g d’intelligence générale. Dire le contraire en l'état actuel de la recherche n'est rien d'autre que pseudoscientifique.

En conclusion

Tout n’a pas été dit ici concernant cette notion complexe qu’est le QI. Il est impossible de rendre compte de manière synthétique d’un siècle de recherche sur l’intelligence, ses localisations cérébrales, ses corrélats génétiques, et sur le fait qu’elle est bien partagée entre toutes les catégories sociales, et entre les deux sexes. Si un lien avec la « richesse » (le niveau socio-économique ou NSE) a pu être établi, c’est que, en général, les personnes les plus intelligentes sont aussi celles qui accèdent aux emplois les plus rémunérateurs. Cela ne veut pas dire que des personnes HPI ne peuvent pas être en position de sous-réalisation. Mais cela ne veut pas dire non plus que le HPI est un « truc pour gosses de riches ».

Références

Binet, A., & Simon, T. (1908). L’intelligence des imbéciles. L’Année psychologique, 15(1), 1‑147. https://doi.org/10.3406/psy.1908.3754

Canivez, G. L. (2013). Incremental criterion validity of WAIS-IV factor index scores : Relationships with WIAT-II and WIAT-III subtest and composite scores. Psychological Assessment, 25(2), 484‑495. https://doi.org/10.1037/a0032092

Carroll, J. B. (1993). Human cognitive abilities : A survey of factor-analytic studies. Cambridge University Press.

Costa, P. T., & MacCrae, R. R. (1992). Revised NEO personality inventory (NEO PI-R) and NEO five-factor inventory (NEO-FFI) : Professional manual. Psychological Assessment Resources, Incorporated.

Deci, E. L., & Ryan, R. M. (2000). The « What » and « Why » of Goal Pursuits : Human Needs and the Self-Determination of Behavior. Psychological Inquiry, 11(4), 227‑268. https://doi.org/10.1207/S15327965PLI1104_01

Fan, H.-Z., Zhu, J.-J., Wang, J., Cui, J.-F., Chen, N., Yao, J., Tan, S.-P., Duan, J.-H., Pang, H.-T., & Zou, Y.-Z. (2019). Four-Subtest Index-based Short Form of WAIS-IV : Psychometric Properties and Clinical Utility. Archives of Clinical Neuropsychology, 34(1), 81‑88. https://doi.org/10.1093/arclin/acy016

Freberg, M. E., Vandiver, B. J., Watkins, M. W., & Canivez, G. L. (2008). Significant Factor Score Variability and the Validity of the WISC-III Full Scale IQ in Predicting Later Academic Achievement. Applied Neuropsychology, 15(2), 131‑139. https://doi.org/10.1080/09084280802084010

Labouret, G., & Grégoire, J. (2018). La dispersion intra-individuelle et le proﬁl des scores dans les QI élevés. A.N.A.E., 154, 271‑279.

Lecerf, T., Golay, P., & Reverte, I. (2012). Scores composites CHC pour la WAIS-IV : Normes francophones. Pratiques Psychologiques, 18(4), 401‑412. https://doi.org/10.1016/j.prps.2012.03.001

Lecerf, T., Reverte, I., Coleaux, L., Maillard, F., Favez, N., & Rossier, J. (2011). Indice d’aptitude général et indice de compétence cognitive pour le WISC-IV : Normes empiriques versus normes statistiques. European Review of Applied Psychology, 61(2), 115‑122. https://doi.org/10.1016/j.erap.2011.01.001

Lichtenberger, E. O., & Kaufman, A. S. (2012). Essentials of WAIS-IV assessment (Second Edition). John Wiley & Sons.

McGill, R. J., Dombrowski, S. C., & Canivez, G. L. (2018). Cognitive profile analysis in school psychology : History, issues, and continued concerns. Journal of School Psychology, 71, 108‑121. https://doi.org/10.1016/j.jsp.2018.10.007

Neisser, U., Boodoo, G., Bouchard, T. J., Boykin, A. W., Brody, N., Ceci, S. J., Halpern, D. F., Loehlin, J. C., Perloff, R., Sternberg, R. J., & Urbina, S. (1996). Intelligence : Knowns and Unknowns. American Psychologist, 51(2), 77‑101. http://dx.doi.org/10.1037/0003-066X.51.2.77

Pettersson, E., Larsson, H., D’Onofrio, B. M., Bölte, S., & Lichtenstein, P. (2020). The general factor of psychopathology : A comparison with the general factor of intelligence with respect to magnitude and predictive validity. World Psychiatry, 19(2), 206‑213. https://doi.org/10.1002/wps.20763

Savournin, F. (2013). 2. Le QI. In L’Aide-mémoire du Wisc-IV: Vol. 2e éd. (p. 13‑23). Dunod. https://www.cairn.info/l-aide-memoire-du-wisc-iv--9782100588053-p-13.htm

Sniekers, S., Stringer, S., Watanabe, K., Jansen, P. R., Coleman, J. R. I., Krapohl, E., Taskesen, E., Hammerschlag, A. R., Okbay, A., Zabaneh, D., Amin, N., Breen, G., Cesarini, D., Chabris, C. F., Iacono, W. G., Ikram, M. A., Johannesson, M., Koellinger, P., Lee, J. J., … Posthuma, D. (2017). Genome-wide association meta-analysis of 78,308 individuals identifies new loci and genes influencing human intelligence. Nature Genetics, 49(7), 1107‑1112. https://doi.org/10.1038/ng.3869

Spearman, C. (1904). « General intelligence, » objectively determined and measured. The American Journal of Psychology, 15(2), 201‑293. https://doi.org/10.2307/1412107

Spearman, C. (1927). The abilities of man. MacMillan.

Terman, L. M. (1916). The measurement of intelligence. Houghton-Mifﬂin.

Wechsler, D. (2011). Echelle d’Intelligence pour Adultes—4ème édition (WAIS-IV). ECPA.

Wechsler, D. (2016). Manuel de l’échelle d’intelligence de Weschler pour enfants (cinquième édition). ECPA.