Studeia ofrece un cálculo de proficiencia por Teoría de Respuesta al Ítem (TRI) para evaluaciones estilo ENEM. Aquí explicamos qué es, cómo funciona — y, con honestidad, qué no es.
Respuesta rápida
- Modelo TRI 2PL (discriminación + dificultad), estilo ENEM
- NO es el 3PL oficial del INEP (sin parámetro de acierto al azar)
- La calibración necesita ~20 respuestas/ítem; por debajo de eso, fallback TCT
- Proficiencia (theta) por EAP, escala 0–1000
- Útil para medir con justicia e identificar ítems problemáticos
Qué es la TRI
La Teoría de Respuesta al Ítem modela la probabilidad de acertar una pregunta en función de la proficiencia del alumno y las características del ítem. En el modelo 2PL, cada ítem tiene dos parámetros:
- Discriminación (a): qué tan bien separa el ítem a los alumnos fuertes de los débiles.
- Dificultad (b): el nivel de proficiencia en el que la probabilidad de acertar es del 50%.
A diferencia del porcentaje simple, la TRI otorga un peso diferente a cada ítem — una pregunta difícil y discriminativa "vale más" que una fácil y ambigua.
Honestidad: 2PL, no 3PL del INEP
El ENEM oficial usa un modelo 3PL, que incluye un tercer parámetro (acierto al azar). Studeia implementa 2PL — fiel al espíritu del ENEM, pero no es el cálculo oficial del INEP. Usamos esto para ordenar la proficiencia y revisar ítems, sin prometer reproducir la puntuación oficial.
Cómo funciona
- Calibración: a partir de las respuestas, se estiman la discriminación y la dificultad de cada ítem (mediante transformación TCT→logística).
- Mínimo de datos: por debajo de ~20 respuestas por ítem, la plataforma usa TCT (porcentaje de aciertos) para no generar estimaciones inestables.
- Proficiencia (theta): estimada por EAP (Expected A Posteriori) con prior normal.
- Escala: theta convertido a 0–1000 al estilo ENEM.
Para qué usarla
| Objetivo | Cómo ayuda la TRI |
|---|---|
| Medir con justicia | Los ítems difíciles/discriminativos pesan diferente |
| Comparar alumnos | Escala 0–1000 común |
| Revisar el examen | Los ítems de baja discriminación son candidatos a eliminar |
| Simulacros ENEM | Proficiencia al estilo del examen |
Limitaciones (declaradas)
- Es 2PL, no 3PL — no reproduce la puntuación oficial del ENEM.
- Necesita volumen de respuestas para calibrar (de lo contrario, TCT).
- No reemplaza el análisis pedagógico — es una herramienta de medición.
Preguntas frecuentes
¿Es el 3PL del INEP? No — es 2PL estilo ENEM, sin parámetro de acierto al azar.
¿Cuántas respuestas para calibrar? ~20 por ítem; por debajo de eso, fallback TCT.
¿En qué escala? Theta por EAP convertido a 0–1000.
¿Para qué sirve? Medir con justicia, comparar alumnos y revisar ítems.
Consulta el Quiz Engine y el caso de uso de academia de preparación ENEM.