Studeia propose un calcul de proficiency par Théorie de Réponse à l'Item (TRI) pour les évaluations de style ENEM. Nous expliquons ici ce que c'est, comment cela fonctionne — et, en toute honnêteté, ce que ce n'est pas.
Réponse rapide
- Modèle TRI 2PL (discrimination + difficulté), style ENEM
- N'est PAS le 3PL officiel de l'INEP (sans paramètre de chance aléatoire)
- La calibration nécessite ~20 réponses/item ; en dessous, fallback TCT
- Proficiency (theta) par EAP, échelle 0–1000
- Utile pour mesurer équitablement et identifier les items problématiques
Qu'est-ce que la TRI
La Théorie de Réponse à l'Item modélise la probabilité de bonne réponse à une question en fonction du niveau de l'élève et des caractéristiques de l'item. Dans le modèle 2PL, chaque item possède deux paramètres :
- Discrimination (a) : dans quelle mesure l'item distingue les élèves forts des élèves faibles.
- Difficulté (b) : le niveau de proficiency auquel la chance de bonne réponse est de 50 %.
Contrairement au simple pourcentage, la TRI attribue un poids différent à chaque item — une question difficile et discriminante « vaut plus » qu'une question facile et ambiguë.
Honnêteté : 2PL, et non le 3PL de l'INEP
L'ENEM officiel utilise un modèle 3PL, qui inclut un troisième paramètre (chance de bonne réponse aléatoire). Studeia implémente le 2PL — fidèle à l'esprit de l'ENEM, mais pas le calcul officiel de l'INEP. Nous l'utilisons pour ordonner la proficiency et réviser les items, sans prétendre reproduire la note officielle.
Comment ça fonctionne
- Calibration : à partir des réponses, la discrimination et la difficulté de chaque item sont estimées (via une transformation TCT→logistique).
- Volume minimum de données : en dessous de ~20 réponses par item, la plateforme utilise la TCT (pourcentage de bonnes réponses) pour éviter des estimations instables.
- Proficiency (theta) : estimée par EAP (Expected A Posteriori) avec un prior normal.
- Échelle : theta converti en 0–1000 dans le style ENEM.
À quoi l'utiliser
| Objectif | Comment la TRI aide |
|---|---|
| Mesurer équitablement | Les items difficiles/discriminants ont un poids différent |
| Comparer les élèves | Échelle 0–1000 commune |
| Réviser l'épreuve | Les items à faible discrimination sont candidats à la suppression |
| Examens blancs ENEM | Proficiency dans le style de l'épreuve |
Limitations (déclarées)
- C'est du 2PL, pas du 3PL — ne reproduit pas la note officielle de l'ENEM.
- Nécessite un volume de réponses pour la calibration (sinon, TCT).
- Ne remplace pas l'analyse pédagogique — c'est un outil de mesure.
Questions fréquentes
Est-ce le 3PL de l'INEP ? Non — c'est du 2PL style ENEM, sans paramètre de chance aléatoire.
Combien de réponses pour calibrer ? ~20 par item ; en dessous, fallback TCT.
Sur quelle échelle ? Theta par EAP converti en 0–1000.
À quoi ça sert ? Mesurer équitablement, comparer les élèves et réviser les items.
Consultez le Quiz Engine et le cas d'usage cours préparatoire ENEM.