Méthodologie et propriétés psychométriques du test intelligence.fr
Rapport technique — Version 2.0, mars 2026
Département R&D, Testatim LLC
1. Résumé
Le test intelligence.fr est un instrument d'évaluation cognitive en ligne composé de 10 sous-tests mesurant des construits cognitifs distincts. Administré à 1 271 898 participants francophones entre 2010 et 2026, il produit un score composite exprimé sur l'échelle de Wechsler (M = 100, σ = 15). Le présent document décrit la structure du test, les propriétés psychométriques observées, les procédures de calibration par âge, et les limites méthodologiques inhérentes à une administration en ligne non supervisée.
2. Fondements théoriques
Le test repose sur le modèle Cattell-Horn-Carroll (CHC) de l'intelligence, qui distingue les aptitudes fluides (Gf) des aptitudes cristallisées (Gc). Les 10 sous-tests couvrent 5 strates du modèle CHC :
| Strate CHC | Sous-test | Construit mesuré |
|---|---|---|
| Vitesse de traitement (Gs) | Réflexes | Temps de réaction simple (TRS) |
| Vitesse de traitement (Gs) | Stroop | Inhibition cognitive / contrôle attentionnel |
| Mémoire à court terme (Gsm) | Mémoire visuelle | Empan visuo-spatial |
| Mémoire à court terme (Gsm) | Séquence Simon | Empan séquentiel |
| Intelligence fluide (Gf) | Logique déductive | Raisonnement syllogistique |
| Intelligence fluide (Gf) | Suites numériques | Raisonnement inductif sériel |
| Traitement visuo-spatial (Gv) | Pliage / Rotation | Rotation mentale, visualisation |
| Mémoire de travail (Gwm) | Mémoire active (N-back) | Mise à jour en mémoire de travail |
| Intelligence cristallisée (Gc) | Catégorisation verbale | Classification sémantique |
| Raisonnement quantitatif (Gq) | Estimation numérique | Système numérique approximatif (ANS) |
Ce modèle s'appuie sur les travaux de Carroll (1993)[1], McGrew (2009)[2], et Schneider & McGrew (2018)[3]. La couverture de 5 strates assure une évaluation multidimensionnelle dépassant les tests en ligne conventionnels, généralement limités aux matrices progressives (Gf uniquement).
[1] Carroll, J.B. (1993). Human cognitive abilities. Cambridge University Press.
[2] McGrew, K.S. (2009). CHC theory and the human cognitive abilities project. Intelligence, 37(1), 1-10.
[3] Schneider, W.J. & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. Contemporary intellectual assessment, 73-163.
3. Description des sous-tests
3.1 Temps de réaction simple (TRS)
Le participant observe un stimulus visuel (cercle) et doit répondre le plus rapidement possible à son changement de couleur. Cinq essais sont administrés avec des intervalles inter-stimuli aléatoires (2 000–6 000 ms) pour prévenir l'anticipation. La mesure retenue est la médiane des 5 essais, conformément aux recommandations de Jensen (2006)[4] pour minimiser l'effet des valeurs aberrantes. Les réponses anticipées (< 150 ms) sont écartées.
Construit mesuré : vitesse de traitement neuronal (Gs).
3.2 Test de Stroop modifié
Adaptation en trois variantes du paradigme d'interférence couleur-mot (Stroop, 1935)[5] : (a) interférence classique couleur-mot, (b) interférence numérique quantité-chiffre, (c) interférence spatiale position-mot. Le scoring combine le taux de réponses correctes et la latence moyenne de réponse, conformément au modèle de scoring de Golden (1978)[6].
Construit mesuré : contrôle attentionnel, inhibition cognitive.
3.3 Mémoire visuo-spatiale
Adaptation du paradigme de Corsi (1972)[7]. Huit symboles abstraits sont associés à des valeurs numériques. Après une phase de mémorisation de 45 secondes, le participant doit restituer 5 associations dans un ordre mélangé.
Construit mesuré : empan visuo-spatial, encodage associatif.
3.4 Catégorisation verbale
Tâche d'exclusion sémantique : parmi 4 mots, identifier celui dont l'appartenance catégorielle diffère. Ce format est dérivé du sous-test Similitudes de la WAIS-IV (Wechsler, 2008)[8], adapté en format inversé.
Construit mesuré : classification sémantique, intelligence cristallisée (Gc).
3.5 Estimation numérique (ANS)
Le participant doit estimer le nombre de points affichés pendant 3 secondes, sans possibilité de comptage. Ce protocole mesure l'acuité du Système Numérique Approximatif (ANS), corrélé au raisonnement mathématique (Halberda et al., 2008)[9].
Construit mesuré : acuité numérique, cognition quantitative (Gq).
3.6 Logique déductive
Cinq items de complexité croissante : syllogismes catégoriques, ordonnancement transitif, décodage sémantique, raisonnement spatial, et résolution de contraintes. Format comparable aux items du sous-test Raisonnement matriciel de la WAIS-IV.
Construit mesuré : raisonnement déductif, intelligence fluide (Gf).
3.7 Séquence mémorielle (paradigme de Simon)
Reproduction de séquences visuo-auditives de longueur croissante (3 à 7 éléments). Chaque stimulus est associé à une fréquence sonore distincte (262–523 Hz). Le score correspond au niveau maximal atteint, analogue à l'empan de Corsi séquentiel.
Construit mesuré : mémoire de travail séquentielle (Gsm).
3.8 Rotation mentale et pliage
Deux types de tâches : (a) pliage de papier avec perforation, inspiré du sous-test Paper Folding du Differential Aptitude Test (Bennett et al., 1990)[10] ; (b) comparaison de figures tridimensionnelles en rotation, dérivé du paradigme de Shepard & Metzler (1971)[11].
Construit mesuré : visualisation spatiale, rotation mentale (Gv).
3.9 Suites numériques
Identification du terme suivant dans des séquences numériques de complexité croissante (progression arithmétique → séries entrelacées → suites récursives). Ce format est directement inspiré du sous-test Arithmétique de la WAIS-IV.
Construit mesuré : raisonnement inductif sériel (Gf).
3.10 Mémoire active (N-back)
Tâche de mise à jour en mémoire de travail en trois niveaux de difficulté croissante (1-back → 2-back → 3-back). Le participant doit identifier si la lettre affichée est identique à celle présentée N positions auparavant. Ce paradigme, introduit par Kirchner (1958)[12], est considéré comme la mesure de référence de la mémoire de travail, validé par de nombreuses études (Jaeggi et al., 2008).
Construit mesuré : mémoire de travail, contrôle exécutif, mise à jour de l'information.
4. Procédure de calibration
4.1 Échantillon de calibration
L'échantillon se compose de N = 1 271 898 participants francophones ayant complété le test entre 2010 et 2026. La répartition géographique est la suivante : France (91.2%), Belgique (1.5%), Canada (1.2%), Algérie (0.7%), Suisse (0.7%), autres pays francophones (4.7%).
| Tranche d'âge | N | % | QI moyen | σ |
|---|---|---|---|---|
| 14-19 ans | 343 802 | 27.0% | 95.2 | 14.8 |
| 20-24 ans | 185 288 | 14.6% | 100.2 | 15.1 |
| 25-34 ans | 231 633 | 18.2% | 103.4 | 14.9 |
| 35-44 ans | 179 740 | 14.1% | 103.5 | 15.2 |
| 45-54 ans | 152 409 | 12.0% | 95.7 | 14.6 |
| 55-64 ans | 53 569 | 4.2% | 94.6 | 14.3 |
| 65+ ans | 16 961 | 1.3% | 91.1 | 13.8 |
4.2 Normalisation
Le score brut (0–50) est converti en score standardisé selon la formule :
où X est le score brut du participant, μ = 25 (moyenne attendue) et σ = 8 (écart-type attendu). Le score est plafonné à l'intervalle [55, 145].
Le score est ajusté par tranche d'âge conformément aux normes de stratification de la WAIS-IV, où chaque cohorte d'âge dispose de sa propre distribution de référence.
Figure 1. Distribution théorique des scores QI et classification selon Wechsler (2008)
| Plage QI | Classification | Prévalence |
|---|---|---|
| < 70 | Déficience intellectuelle | 2.2% |
| 70-79 | Limite | 6.7% |
| 80-89 | Moyen-faible | 16.1% |
| 90-109 | Moyen | 50.0% |
| 110-119 | Moyen-fort | 16.1% |
| 120-129 | Supérieur | 6.7% |
| 130+ | Très supérieur | 2.2% |
5. Propriétés psychométriques
5.1 Cohérence interne
Bien que les coefficients de fidélité ne soient pas encore calculés sur l'ensemble de l'échantillon avec le nouveau format à 10 sous-tests, les analyses préliminaires sur les données legacy (N = 1 271 898) indiquent une stabilité satisfaisante des scores composites. La cohérence interne sera formellement évaluée par le coefficient alpha de Cronbach et le coefficient oméga de McDonald dès l'atteinte de N = 10 000 avec le nouveau format.
5.2 Validité de construit
La structure factorielle du test est conçue pour refléter le modèle CHC. Une analyse factorielle confirmatoire sera réalisée lorsque les données du nouveau format atteindront un N suffisant (objectif : N > 50 000).
Les corrélations attendues entre sous-tests sont :
- Réflexes × Stroop : r > .40 (facteur commun Gs)
- Mémoire × Simon : r > .45 (facteur commun Gsm)
- Logique × Suites : r > .50 (facteur commun Gf)
- Simon × N-back : r > .45 (facteur commun Gwm)
5.3 Validité convergente
La corrélation entre les scores legacy du test et les normes publiées pour la WAIS-IV (Wechsler, 2008) montre une correspondance satisfaisante dans les ordres de grandeur par diplôme et par catégorie professionnelle :
| Catégorie | Notre test | Littérature (WAIS-IV) | Δ |
|---|---|---|---|
| Cadres supérieurs | 106.1 | 108-112 | -2 à -6 |
| Professions intermédiaires | 99.8 | 100-104 | -0.2 à -4.2 |
| Employés | 98.3 | 96-100 | +1.7 à -1.7 |
| Ouvriers | 94.1 | 92-96 | +1.9 à -1.9 |
| BAC+5 | 110.4 | 112-118 | -1.6 à -7.6 |
| Sans diplôme | 91.1 | 85-92 | +6.1 à -0.9 |
Ces écarts sont cohérents avec un biais d'auto-sélection : les participants en ligne tendent à avoir un QI légèrement supérieur à la population générale (cf. section 6).
6. Limites méthodologiques
6.1 Biais d'auto-sélection
L'échantillon n'est pas représentatif de la population générale. Les personnes choisissant de passer un test de QI en ligne sont susceptibles d'avoir un niveau d'éducation et une motivation supérieurs à la moyenne. Ce biais est documenté dans la littérature sur les tests en ligne (Raven, 2000 ; Wilhelm & McKnight, 2002)[13].
6.2 Conditions d'administration non standardisées
Contrairement à une administration clinique supervisée, le test en ligne ne contrôle pas l'environnement (bruit, fatigue, distractions), le matériel (taille d'écran, type de pointeur, latence réseau) ou la motivation du participant. Les épreuves de vitesse (réflexes, Stroop, labyrinthe) sont particulièrement sensibles à ces facteurs.
6.3 Absence de validation externe
Le test n'a pas fait l'objet d'une validation concurrente avec la WAIS-IV ou les Matrices de Raven sur un échantillon apparié. Les corrélations rapportées en section 5.3 sont indirectes (comparaison avec les normes publiées, non avec des passations conjointes).
6.4 Recommandation
Ce test fournit une estimation indicative du quotient intellectuel. Il ne constitue en aucun cas un outil de diagnostic clinique. Pour une évaluation complète et fiable, nous recommandons une passation de la WAIS-IV ou de la WISC-V administrée par un psychologue agréé.
7. Références
Bennett, G.K., Seashore, H.G., & Wesman, A.G. (1990). Differential Aptitude Tests (5th ed.). The Psychological Corporation.
Carroll, J.B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge University Press.
Corsi, P.M. (1972). Human memory and the medial temporal region of the brain. Thèse de doctorat, McGill University.
Golden, C.J. (1978). Stroop Color and Word Test: A manual for clinical and experimental uses. Stoelting Co.
Halberda, J., Mazzocco, M.M., & Feigenson, L. (2008). Individual differences in non-verbal number acuity correlate with maths achievement. Nature, 455, 665-668.
Jensen, A.R. (2006). Clocking the mind: Mental chronometry and individual differences. Elsevier.
McGrew, K.S. (2009). CHC theory and the human cognitive abilities project: Standing on the shoulders of the giants of psychometric intelligence research. Intelligence, 37(1), 1-10.
Porteus, S.D. (1965). Porteus Maze Test: Fifty years' application. Pacific Books.
Schneider, W.J., & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. In D.P. Flanagan & E.M. McDonough (Eds.), Contemporary intellectual assessment (4th ed., pp. 73-163). Guilford Press.
Shepard, R.N., & Metzler, J. (1971). Mental rotation of three-dimensional objects. Science, 171(3972), 701-703.
Stroop, J.R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18(6), 643-662.
Wechsler, D. (2008). Wechsler Adult Intelligence Scale—Fourth Edition (WAIS-IV): Administration and scoring manual. Pearson.
Wilhelm, O., & McKnight, P.E. (2002). Ability and achievement testing on the World Wide Web. In B. Batinic et al. (Eds.), Online social sciences. Hogrefe.
Notes
[4] Jensen, A.R. (2006). Clocking the mind. Elsevier.
[5] Stroop, J.R. (1935). Journal of Experimental Psychology, 18(6), 643-662.
[6] Golden, C.J. (1978). Stroop Color and Word Test. Stoelting.
[7] Corsi, P.M. (1972). Thèse de doctorat, McGill University.
[8] Wechsler, D. (2008). WAIS-IV administration and scoring manual. Pearson.
[9] Halberda, J., Mazzocco, M., & Feigenson, L. (2008). Nature, 455, 665-668.
[10] Bennett, G.K. et al. (1990). DAT-5. The Psychological Corporation.
[11] Shepard, R.N. & Metzler, J. (1971). Science, 171, 701-703.
[12] Porteus, S.D. (1965). Porteus Maze Test. Pacific Books.
[13] Wilhelm, O., & McKnight, P.E. (2002). In Batinic et al. (Eds.), Online social sciences.