Le test de QI intelligence.fr est-il fiable ?

Le test est basé sur le modèle Cattell-Horn-Carroll (CHC) et calibré sur 1,27 million de résultats. Cependant, il fournit une estimation indicative et ne remplace pas une évaluation clinique par un psychologue agréé.

Combien de temps dure le test de QI ?

Le test complet comprend 10 épreuves cognitives et dure environ 20 minutes. Le résultat est immédiat et gratuit.

Comment le score QI est-il calculé ?

Le score brut est converti en score standardisé selon l'échelle de Wechsler (moyenne = 100, écart-type = 15), ajusté par tranche d'âge conformément aux normes psychométriques internationales.

Quelles compétences cognitives sont évaluées ?

Le test évalue 5 strates du modèle CHC : vitesse de traitement (Gs), mémoire à court terme (Gsm), intelligence fluide (Gf), traitement visuo-spatial (Gv), mémoire de travail (Gwm), intelligence cristallisée (Gc) et raisonnement quantitatif (Gq).

Le test de QI en ligne est-il gratuit ?

Oui, le test est 100% gratuit. Vous recevez votre score QI et votre profil cognitif immédiatement après avoir complété les 10 épreuves.

Méthodologie et propriétés psychométriques du test intelligence.fr

Rapport technique — Version 2.0, mars 2026

Département R&D, Testatim LLC

N = 1 271 898·10 sous-tests·47 pays

1. Résumé

Le test intelligence.fr est un instrument d'évaluation cognitive en ligne composé de 10 sous-tests mesurant des construits cognitifs distincts. Administré à 1 271 898 participants francophones entre 2010 et 2026, il produit un score composite exprimé sur l'échelle de Wechsler (M = 100, σ = 15). Le présent document décrit la structure du test, les propriétés psychométriques observées, les procédures de calibration par âge, et les limites méthodologiques inhérentes à une administration en ligne non supervisée.

2. Fondements théoriques

Le test repose sur le modèle Cattell-Horn-Carroll (CHC) de l'intelligence, qui distingue les aptitudes fluides (Gf) des aptitudes cristallisées (Gc). Les 10 sous-tests couvrent 5 strates du modèle CHC :

Strate CHC	Sous-test	Construit mesuré
Vitesse de traitement (Gs)	Réflexes	Temps de réaction simple (TRS)
Vitesse de traitement (Gs)	Stroop	Inhibition cognitive / contrôle attentionnel
Mémoire à court terme (Gsm)	Mémoire visuelle	Empan visuo-spatial
Mémoire à court terme (Gsm)	Séquence Simon	Empan séquentiel
Intelligence fluide (Gf)	Logique déductive	Raisonnement syllogistique
Intelligence fluide (Gf)	Suites numériques	Raisonnement inductif sériel
Traitement visuo-spatial (Gv)	Pliage / Rotation	Rotation mentale, visualisation
Mémoire de travail (Gwm)	Mémoire active (N-back)	Mise à jour en mémoire de travail
Intelligence cristallisée (Gc)	Catégorisation verbale	Classification sémantique
Raisonnement quantitatif (Gq)	Estimation numérique	Système numérique approximatif (ANS)

Ce modèle s'appuie sur les travaux de Carroll (1993)^[1], McGrew (2009)^[2], et Schneider & McGrew (2018)^[3]. La couverture de 5 strates assure une évaluation multidimensionnelle dépassant les tests en ligne conventionnels, généralement limités aux matrices progressives (Gf uniquement).

^[1] Carroll, J.B. (1993). Human cognitive abilities. Cambridge University Press.

^[2] McGrew, K.S. (2009). CHC theory and the human cognitive abilities project. Intelligence, 37(1), 1-10.

^[3] Schneider, W.J. & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. Contemporary intellectual assessment, 73-163.

3. Description des sous-tests

3.1 Temps de réaction simple (TRS)

Le participant observe un stimulus visuel (cercle) et doit répondre le plus rapidement possible à son changement de couleur. Cinq essais sont administrés avec des intervalles inter-stimuli aléatoires (2 000–6 000 ms) pour prévenir l'anticipation. La mesure retenue est la médiane des 5 essais, conformément aux recommandations de Jensen (2006)^[4] pour minimiser l'effet des valeurs aberrantes. Les réponses anticipées (< 150 ms) sont écartées.

Construit mesuré : vitesse de traitement neuronal (Gs).

3.2 Test de Stroop modifié

Adaptation en trois variantes du paradigme d'interférence couleur-mot (Stroop, 1935)^[5] : (a) interférence classique couleur-mot, (b) interférence numérique quantité-chiffre, (c) interférence spatiale position-mot. Le scoring combine le taux de réponses correctes et la latence moyenne de réponse, conformément au modèle de scoring de Golden (1978)^[6].

Construit mesuré : contrôle attentionnel, inhibition cognitive.

3.3 Mémoire visuo-spatiale

Adaptation du paradigme de Corsi (1972)^[7]. Huit symboles abstraits sont associés à des valeurs numériques. Après une phase de mémorisation de 45 secondes, le participant doit restituer 5 associations dans un ordre mélangé.

Construit mesuré : empan visuo-spatial, encodage associatif.

3.4 Catégorisation verbale

Tâche d'exclusion sémantique : parmi 4 mots, identifier celui dont l'appartenance catégorielle diffère. Ce format est dérivé du sous-test Similitudes de la WAIS-IV (Wechsler, 2008)^[8], adapté en format inversé.

Construit mesuré : classification sémantique, intelligence cristallisée (Gc).

3.5 Estimation numérique (ANS)

Le participant doit estimer le nombre de points affichés pendant 3 secondes, sans possibilité de comptage. Ce protocole mesure l'acuité du Système Numérique Approximatif (ANS), corrélé au raisonnement mathématique (Halberda et al., 2008)^[9].

Construit mesuré : acuité numérique, cognition quantitative (Gq).

3.6 Logique déductive

Cinq items de complexité croissante : syllogismes catégoriques, ordonnancement transitif, décodage sémantique, raisonnement spatial, et résolution de contraintes. Format comparable aux items du sous-test Raisonnement matriciel de la WAIS-IV.

Construit mesuré : raisonnement déductif, intelligence fluide (Gf).

3.7 Séquence mémorielle (paradigme de Simon)

Reproduction de séquences visuo-auditives de longueur croissante (3 à 7 éléments). Chaque stimulus est associé à une fréquence sonore distincte (262–523 Hz). Le score correspond au niveau maximal atteint, analogue à l'empan de Corsi séquentiel.

Construit mesuré : mémoire de travail séquentielle (Gsm).

3.8 Rotation mentale et pliage

Deux types de tâches : (a) pliage de papier avec perforation, inspiré du sous-test Paper Folding du Differential Aptitude Test (Bennett et al., 1990)^[10] ; (b) comparaison de figures tridimensionnelles en rotation, dérivé du paradigme de Shepard & Metzler (1971)^[11].

Construit mesuré : visualisation spatiale, rotation mentale (Gv).

3.9 Suites numériques

Identification du terme suivant dans des séquences numériques de complexité croissante (progression arithmétique → séries entrelacées → suites récursives). Ce format est directement inspiré du sous-test Arithmétique de la WAIS-IV.

Construit mesuré : raisonnement inductif sériel (Gf).

3.10 Mémoire active (N-back)

Tâche de mise à jour en mémoire de travail en trois niveaux de difficulté croissante (1-back → 2-back → 3-back). Le participant doit identifier si la lettre affichée est identique à celle présentée N positions auparavant. Ce paradigme, introduit par Kirchner (1958)^[12], est considéré comme la mesure de référence de la mémoire de travail, validé par de nombreuses études (Jaeggi et al., 2008).

Construit mesuré : mémoire de travail, contrôle exécutif, mise à jour de l'information.

4. Procédure de calibration

4.1 Échantillon de calibration

L'échantillon se compose de N = 1 271 898 participants francophones ayant complété le test entre 2010 et 2026. La répartition géographique est la suivante : France (91.2%), Belgique (1.5%), Canada (1.2%), Algérie (0.7%), Suisse (0.7%), autres pays francophones (4.7%).

Tranche d'âge	N	%	QI moyen	σ
14-19 ans	343 802	27.0%	95.2	14.8
20-24 ans	185 288	14.6%	100.2	15.1
25-34 ans	231 633	18.2%	103.4	14.9
35-44 ans	179 740	14.1%	103.5	15.2
45-54 ans	152 409	12.0%	95.7	14.6
55-64 ans	53 569	4.2%	94.6	14.3
65+ ans	16 961	1.3%	91.1	13.8

4.2 Normalisation

Le score brut (0–50) est converti en score standardisé selon la formule :

QI = 100 + ((X − μ) / σ) × 15

où X est le score brut du participant, μ = 25 (moyenne attendue) et σ = 8 (écart-type attendu). Le score est plafonné à l'intervalle [55, 145].

Le score est ajusté par tranche d'âge conformément aux normes de stratification de la WAIS-IV, où chaque cohorte d'âge dispose de sa propre distribution de référence.

Figure 1. Distribution théorique des scores QI et classification selon Wechsler (2008)

Plage QI	Classification	Prévalence
< 70	Déficience intellectuelle	2.2%
70-79	Limite	6.7%
80-89	Moyen-faible	16.1%
90-109	Moyen	50.0%
110-119	Moyen-fort	16.1%
120-129	Supérieur	6.7%
130+	Très supérieur	2.2%

5. Propriétés psychométriques

5.1 Cohérence interne

Bien que les coefficients de fidélité ne soient pas encore calculés sur l'ensemble de l'échantillon avec le nouveau format à 10 sous-tests, les analyses préliminaires sur les données legacy (N = 1 271 898) indiquent une stabilité satisfaisante des scores composites. La cohérence interne sera formellement évaluée par le coefficient alpha de Cronbach et le coefficient oméga de McDonald dès l'atteinte de N = 10 000 avec le nouveau format.

5.2 Validité de construit

La structure factorielle du test est conçue pour refléter le modèle CHC. Une analyse factorielle confirmatoire sera réalisée lorsque les données du nouveau format atteindront un N suffisant (objectif : N > 50 000).

Les corrélations attendues entre sous-tests sont :

Réflexes × Stroop : r > .40 (facteur commun Gs)
Mémoire × Simon : r > .45 (facteur commun Gsm)
Logique × Suites : r > .50 (facteur commun Gf)
Simon × N-back : r > .45 (facteur commun Gwm)

5.3 Validité convergente

La corrélation entre les scores legacy du test et les normes publiées pour la WAIS-IV (Wechsler, 2008) montre une correspondance satisfaisante dans les ordres de grandeur par diplôme et par catégorie professionnelle :

Catégorie	Notre test	Littérature (WAIS-IV)	Δ
Cadres supérieurs	106.1	108-112	-2 à -6
Professions intermédiaires	99.8	100-104	-0.2 à -4.2
Employés	98.3	96-100	+1.7 à -1.7
Ouvriers	94.1	92-96	+1.9 à -1.9
BAC+5	110.4	112-118	-1.6 à -7.6
Sans diplôme	91.1	85-92	+6.1 à -0.9

Ces écarts sont cohérents avec un biais d'auto-sélection : les participants en ligne tendent à avoir un QI légèrement supérieur à la population générale (cf. section 6).

6. Limites méthodologiques

6.1 Biais d'auto-sélection

L'échantillon n'est pas représentatif de la population générale. Les personnes choisissant de passer un test de QI en ligne sont susceptibles d'avoir un niveau d'éducation et une motivation supérieurs à la moyenne. Ce biais est documenté dans la littérature sur les tests en ligne (Raven, 2000 ; Wilhelm & McKnight, 2002)^[13].

6.2 Conditions d'administration non standardisées

Contrairement à une administration clinique supervisée, le test en ligne ne contrôle pas l'environnement (bruit, fatigue, distractions), le matériel (taille d'écran, type de pointeur, latence réseau) ou la motivation du participant. Les épreuves de vitesse (réflexes, Stroop, labyrinthe) sont particulièrement sensibles à ces facteurs.

6.3 Absence de validation externe

Le test n'a pas fait l'objet d'une validation concurrente avec la WAIS-IV ou les Matrices de Raven sur un échantillon apparié. Les corrélations rapportées en section 5.3 sont indirectes (comparaison avec les normes publiées, non avec des passations conjointes).

6.4 Recommandation

Ce test fournit une estimation indicative du quotient intellectuel. Il ne constitue en aucun cas un outil de diagnostic clinique. Pour une évaluation complète et fiable, nous recommandons une passation de la WAIS-IV ou de la WISC-V administrée par un psychologue agréé.

7. Références

Bennett, G.K., Seashore, H.G., & Wesman, A.G. (1990). Differential Aptitude Tests (5th ed.). The Psychological Corporation.

Carroll, J.B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge University Press.

Corsi, P.M. (1972). Human memory and the medial temporal region of the brain. Thèse de doctorat, McGill University.

Golden, C.J. (1978). Stroop Color and Word Test: A manual for clinical and experimental uses. Stoelting Co.

Halberda, J., Mazzocco, M.M., & Feigenson, L. (2008). Individual differences in non-verbal number acuity correlate with maths achievement. Nature, 455, 665-668.

Jensen, A.R. (2006). Clocking the mind: Mental chronometry and individual differences. Elsevier.

McGrew, K.S. (2009). CHC theory and the human cognitive abilities project: Standing on the shoulders of the giants of psychometric intelligence research. Intelligence, 37(1), 1-10.

Porteus, S.D. (1965). Porteus Maze Test: Fifty years' application. Pacific Books.

Schneider, W.J., & McGrew, K.S. (2018). The Cattell-Horn-Carroll theory of cognitive abilities. In D.P. Flanagan & E.M. McDonough (Eds.), Contemporary intellectual assessment (4th ed., pp. 73-163). Guilford Press.

Shepard, R.N., & Metzler, J. (1971). Mental rotation of three-dimensional objects. Science, 171(3972), 701-703.

Stroop, J.R. (1935). Studies of interference in serial verbal reactions. Journal of Experimental Psychology, 18(6), 643-662.

Wechsler, D. (2008). Wechsler Adult Intelligence Scale—Fourth Edition (WAIS-IV): Administration and scoring manual. Pearson.

Wilhelm, O., & McKnight, P.E. (2002). Ability and achievement testing on the World Wide Web. In B. Batinic et al. (Eds.), Online social sciences. Hogrefe.

Notes

^[4] Jensen, A.R. (2006). Clocking the mind. Elsevier.

^[5] Stroop, J.R. (1935). Journal of Experimental Psychology, 18(6), 643-662.

^[6] Golden, C.J. (1978). Stroop Color and Word Test. Stoelting.

^[7] Corsi, P.M. (1972). Thèse de doctorat, McGill University.

^[8] Wechsler, D. (2008). WAIS-IV administration and scoring manual. Pearson.

^[9] Halberda, J., Mazzocco, M., & Feigenson, L. (2008). Nature, 455, 665-668.

^[10] Bennett, G.K. et al. (1990). DAT-5. The Psychological Corporation.

^[11] Shepard, R.N. & Metzler, J. (1971). Science, 171, 701-703.

^[12] Porteus, S.D. (1965). Porteus Maze Test. Pacific Books.

^[13] Wilhelm, O., & McKnight, P.E. (2002). In Batinic et al. (Eds.), Online social sciences.

Passer le test→