Méthodologie et propriétés psychométriques du test intelligence.fr

Rapport technique — Version 2.0, mars 2026

Département R&D, Testatim LLC

N = 1 271 898·10 sous-tests·47 pays

1. Résumé

Le test intelligence.fr est un instrument d'évaluation cognitive en ligne composé de 10 sous-tests mesurant des construits cognitifs distincts. Administré à 1 271 898 participants francophones entre 2010 et 2026, il produit un score composite exprimé sur l'échelle de Wechsler (M = 100, σ = 15). Le présent document décrit la structure du test, les propriétés psychométriques observées, les procédures de calibration par âge, et les limites méthodologiques inhérentes à une administration en ligne non supervisée.

2. Fondements théoriques

Le test repose sur le modèle Cattell-Horn-Carroll (CHC) de l'intelligence, qui distingue les aptitudes fluides (Gf) des aptitudes cristallisées (Gc). Les 10 sous-tests couvrent 5 strates du modèle CHC :

Strate CHCSous-testConstruit mesuré
Vitesse de traitement (Gs)RéflexesTemps de réaction simple (TRS)
Vitesse de traitement (Gs)StroopInhibition cognitive / contrôle attentionnel
Mémoire à court terme (Gsm)Mémoire visuelleEmpan visuo-spatial
Mémoire à court terme (Gsm)Séquence SimonEmpan séquentiel
Intelligence fluide (Gf)Logique déductiveRaisonnement syllogistique
Intelligence fluide (Gf)Suites numériquesRaisonnement inductif sériel
Traitement visuo-spatial (Gv)Pliage / RotationRotation mentale, visualisation
Mémoire de travail (Gwm)Mémoire active (N-back)Mise à jour en mémoire de travail
Intelligence cristallisée (Gc)Catégorisation verbaleClassification sémantique
Raisonnement quantitatif (Gq)Estimation numériqueSystème numérique approximatif (ANS)

Ce modèle s'appuie sur les travaux de Carroll (1993)[1], McGrew (2009)[2], et Schneider & McGrew (2018)[3]. La couverture de 5 strates assure une évaluation multidimensionnelle dépassant les tests en ligne conventionnels, généralement limités aux matrices progressives (Gf uniquement).

[1] Carroll, J.B. (1993). Human cognitive abilities. Cambridge University Press.

[2] McGrew, K.S. (2009). CHC theory and the human cognitive abilities project. Intelligence, 37(1), 1-10.

[3] Schneider, W.J. & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. Contemporary intellectual assessment, 73-163.

3. Description des sous-tests

3.1 Temps de réaction simple (TRS)

Le participant observe un stimulus visuel (cercle) et doit répondre le plus rapidement possible à son changement de couleur. Cinq essais sont administrés avec des intervalles inter-stimuli aléatoires (2 000–6 000 ms) pour prévenir l'anticipation. La mesure retenue est la médiane des 5 essais, conformément aux recommandations de Jensen (2006)[4] pour minimiser l'effet des valeurs aberrantes. Les réponses anticipées (< 150 ms) sont écartées.

Construit mesuré : vitesse de traitement neuronal (Gs).

3.2 Test de Stroop modifié

Adaptation en trois variantes du paradigme d'interférence couleur-mot (Stroop, 1935)[5] : (a) interférence classique couleur-mot, (b) interférence numérique quantité-chiffre, (c) interférence spatiale position-mot. Le scoring combine le taux de réponses correctes et la latence moyenne de réponse, conformément au modèle de scoring de Golden (1978)[6].

Construit mesuré : contrôle attentionnel, inhibition cognitive.

3.3 Mémoire visuo-spatiale

Adaptation du paradigme de Corsi (1972)[7]. Huit symboles abstraits sont associés à des valeurs numériques. Après une phase de mémorisation de 45 secondes, le participant doit restituer 5 associations dans un ordre mélangé.

Construit mesuré : empan visuo-spatial, encodage associatif.

3.4 Catégorisation verbale

Tâche d'exclusion sémantique : parmi 4 mots, identifier celui dont l'appartenance catégorielle diffère. Ce format est dérivé du sous-test Similitudes de la WAIS-IV (Wechsler, 2008)[8], adapté en format inversé.

Construit mesuré : classification sémantique, intelligence cristallisée (Gc).

3.5 Estimation numérique (ANS)

Le participant doit estimer le nombre de points affichés pendant 3 secondes, sans possibilité de comptage. Ce protocole mesure l'acuité du Système Numérique Approximatif (ANS), corrélé au raisonnement mathématique (Halberda et al., 2008)[9].

Construit mesuré : acuité numérique, cognition quantitative (Gq).

3.6 Logique déductive

Cinq items de complexité croissante : syllogismes catégoriques, ordonnancement transitif, décodage sémantique, raisonnement spatial, et résolution de contraintes. Format comparable aux items du sous-test Raisonnement matriciel de la WAIS-IV.

Construit mesuré : raisonnement déductif, intelligence fluide (Gf).

3.7 Séquence mémorielle (paradigme de Simon)

Reproduction de séquences visuo-auditives de longueur croissante (3 à 7 éléments). Chaque stimulus est associé à une fréquence sonore distincte (262–523 Hz). Le score correspond au niveau maximal atteint, analogue à l'empan de Corsi séquentiel.

Construit mesuré : mémoire de travail séquentielle (Gsm).

3.8 Rotation mentale et pliage

Deux types de tâches : (a) pliage de papier avec perforation, inspiré du sous-test Paper Folding du Differential Aptitude Test (Bennett et al., 1990)[10] ; (b) comparaison de figures tridimensionnelles en rotation, dérivé du paradigme de Shepard & Metzler (1971)[11].

Construit mesuré : visualisation spatiale, rotation mentale (Gv).

3.9 Suites numériques

Identification du terme suivant dans des séquences numériques de complexité croissante (progression arithmétique → séries entrelacées → suites récursives). Ce format est directement inspiré du sous-test Arithmétique de la WAIS-IV.

Construit mesuré : raisonnement inductif sériel (Gf).

3.10 Mémoire active (N-back)

Tâche de mise à jour en mémoire de travail en trois niveaux de difficulté croissante (1-back → 2-back → 3-back). Le participant doit identifier si la lettre affichée est identique à celle présentée N positions auparavant. Ce paradigme, introduit par Kirchner (1958)[12], est considéré comme la mesure de référence de la mémoire de travail, validé par de nombreuses études (Jaeggi et al., 2008).

Construit mesuré : mémoire de travail, contrôle exécutif, mise à jour de l'information.

4. Procédure de calibration

4.1 Échantillon de calibration

L'échantillon se compose de N = 1 271 898 participants francophones ayant complété le test entre 2010 et 2026. La répartition géographique est la suivante : France (91.2%), Belgique (1.5%), Canada (1.2%), Algérie (0.7%), Suisse (0.7%), autres pays francophones (4.7%).

Tranche d'âgeN%QI moyenσ
14-19 ans343 80227.0%95.214.8
20-24 ans185 28814.6%100.215.1
25-34 ans231 63318.2%103.414.9
35-44 ans179 74014.1%103.515.2
45-54 ans152 40912.0%95.714.6
55-64 ans53 5694.2%94.614.3
65+ ans16 9611.3%91.113.8

4.2 Normalisation

Le score brut (0–50) est converti en score standardisé selon la formule :

QI = 100 + ((X − μ) / σ) × 15

où X est le score brut du participant, μ = 25 (moyenne attendue) et σ = 8 (écart-type attendu). Le score est plafonné à l'intervalle [55, 145].

Le score est ajusté par tranche d'âge conformément aux normes de stratification de la WAIS-IV, où chaque cohorte d'âge dispose de sa propre distribution de référence.

557085100115130145<70(2.2%)70-79(6.7%)80-89(16.1%)90-109(50.0%)110-119(16.1%)120-129(6.7%)130+(2.2%)DensitéDistribution normale (M = 100, σ = 15)

Figure 1. Distribution théorique des scores QI et classification selon Wechsler (2008)

Plage QIClassificationPrévalence
< 70Déficience intellectuelle2.2%
70-79Limite6.7%
80-89Moyen-faible16.1%
90-109Moyen50.0%
110-119Moyen-fort16.1%
120-129Supérieur6.7%
130+Très supérieur2.2%

5. Propriétés psychométriques

5.1 Cohérence interne

Bien que les coefficients de fidélité ne soient pas encore calculés sur l'ensemble de l'échantillon avec le nouveau format à 10 sous-tests, les analyses préliminaires sur les données legacy (N = 1 271 898) indiquent une stabilité satisfaisante des scores composites. La cohérence interne sera formellement évaluée par le coefficient alpha de Cronbach et le coefficient oméga de McDonald dès l'atteinte de N = 10 000 avec le nouveau format.

5.2 Validité de construit

La structure factorielle du test est conçue pour refléter le modèle CHC. Une analyse factorielle confirmatoire sera réalisée lorsque les données du nouveau format atteindront un N suffisant (objectif : N > 50 000).

Les corrélations attendues entre sous-tests sont :

  • Réflexes × Stroop : r > .40 (facteur commun Gs)
  • Mémoire × Simon : r > .45 (facteur commun Gsm)
  • Logique × Suites : r > .50 (facteur commun Gf)
  • Simon × N-back : r > .45 (facteur commun Gwm)

5.3 Validité convergente

La corrélation entre les scores legacy du test et les normes publiées pour la WAIS-IV (Wechsler, 2008) montre une correspondance satisfaisante dans les ordres de grandeur par diplôme et par catégorie professionnelle :

CatégorieNotre testLittérature (WAIS-IV)Δ
Cadres supérieurs106.1108-112-2 à -6
Professions intermédiaires99.8100-104-0.2 à -4.2
Employés98.396-100+1.7 à -1.7
Ouvriers94.192-96+1.9 à -1.9
BAC+5110.4112-118-1.6 à -7.6
Sans diplôme91.185-92+6.1 à -0.9

Ces écarts sont cohérents avec un biais d'auto-sélection : les participants en ligne tendent à avoir un QI légèrement supérieur à la population générale (cf. section 6).

6. Limites méthodologiques

6.1 Biais d'auto-sélection

L'échantillon n'est pas représentatif de la population générale. Les personnes choisissant de passer un test de QI en ligne sont susceptibles d'avoir un niveau d'éducation et une motivation supérieurs à la moyenne. Ce biais est documenté dans la littérature sur les tests en ligne (Raven, 2000 ; Wilhelm & McKnight, 2002)[13].

6.2 Conditions d'administration non standardisées

Contrairement à une administration clinique supervisée, le test en ligne ne contrôle pas l'environnement (bruit, fatigue, distractions), le matériel (taille d'écran, type de pointeur, latence réseau) ou la motivation du participant. Les épreuves de vitesse (réflexes, Stroop, labyrinthe) sont particulièrement sensibles à ces facteurs.

6.3 Absence de validation externe

Le test n'a pas fait l'objet d'une validation concurrente avec la WAIS-IV ou les Matrices de Raven sur un échantillon apparié. Les corrélations rapportées en section 5.3 sont indirectes (comparaison avec les normes publiées, non avec des passations conjointes).

6.4 Recommandation

Ce test fournit une estimation indicative du quotient intellectuel. Il ne constitue en aucun cas un outil de diagnostic clinique. Pour une évaluation complète et fiable, nous recommandons une passation de la WAIS-IV ou de la WISC-V administrée par un psychologue agréé.

7. Références

Bennett, G.K., Seashore, H.G., & Wesman, A.G. (1990). Differential Aptitude Tests (5th ed.). The Psychological Corporation.

Carroll, J.B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge University Press.

Corsi, P.M. (1972). Human memory and the medial temporal region of the brain. Thèse de doctorat, McGill University.

Golden, C.J. (1978). Stroop Color and Word Test: A manual for clinical and experimental uses. Stoelting Co.

Halberda, J., Mazzocco, M.M., & Feigenson, L. (2008). Individual differences in non-verbal number acuity correlate with maths achievement. Nature, 455, 665-668.

Jensen, A.R. (2006). Clocking the mind: Mental chronometry and individual differences. Elsevier.

McGrew, K.S. (2009). CHC theory and the human cognitive abilities project: Standing on the shoulders of the giants of psychometric intelligence research. Intelligence, 37(1), 1-10.

Porteus, S.D. (1965). Porteus Maze Test: Fifty years' application. Pacific Books.

Schneider, W.J., & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. In D.P. Flanagan & E.M. McDonough (Eds.), Contemporary intellectual assessment (4th ed., pp. 73-163). Guilford Press.

Shepard, R.N., & Metzler, J. (1971). Mental rotation of three-dimensional objects. Science, 171(3972), 701-703.

Stroop, J.R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18(6), 643-662.

Wechsler, D. (2008). Wechsler Adult Intelligence Scale—Fourth Edition (WAIS-IV): Administration and scoring manual. Pearson.

Wilhelm, O., & McKnight, P.E. (2002). Ability and achievement testing on the World Wide Web. In B. Batinic et al. (Eds.), Online social sciences. Hogrefe.

Notes

[4] Jensen, A.R. (2006). Clocking the mind. Elsevier.

[5] Stroop, J.R. (1935). Journal of Experimental Psychology, 18(6), 643-662.

[6] Golden, C.J. (1978). Stroop Color and Word Test. Stoelting.

[7] Corsi, P.M. (1972). Thèse de doctorat, McGill University.

[8] Wechsler, D. (2008). WAIS-IV administration and scoring manual. Pearson.

[9] Halberda, J., Mazzocco, M., & Feigenson, L. (2008). Nature, 455, 665-668.

[10] Bennett, G.K. et al. (1990). DAT-5. The Psychological Corporation.

[11] Shepard, R.N. & Metzler, J. (1971). Science, 171, 701-703.

[12] Porteus, S.D. (1965). Porteus Maze Test. Pacific Books.

[13] Wilhelm, O., & McKnight, P.E. (2002). In Batinic et al. (Eds.), Online social sciences.