Proficiencia por TRI (modelo 2PL, estilo ENEM)

Studeia ofrece un cálculo de proficiencia por Teoría de Respuesta al Ítem (TRI) para evaluaciones estilo ENEM. Aquí explicamos qué es, cómo funciona — y, con honestidad, qué no es.

Respuesta rápida

Modelo TRI 2PL (discriminación + dificultad), estilo ENEM
NO es el 3PL oficial del INEP (sin parámetro de acierto al azar)
La calibración necesita ~20 respuestas/ítem; por debajo de eso, fallback TCT
Proficiencia (theta) por EAP, escala 0–1000
Útil para medir con justicia e identificar ítems problemáticos

Qué es la TRI

La Teoría de Respuesta al Ítem modela la probabilidad de acertar una pregunta en función de la proficiencia del alumno y las características del ítem. En el modelo 2PL, cada ítem tiene dos parámetros:

Discriminación (a): qué tan bien separa el ítem a los alumnos fuertes de los débiles.
Dificultad (b): el nivel de proficiencia en el que la probabilidad de acertar es del 50%.

A diferencia del porcentaje simple, la TRI otorga un peso diferente a cada ítem — una pregunta difícil y discriminativa "vale más" que una fácil y ambigua.

Honestidad: 2PL, no 3PL del INEP

El ENEM oficial usa un modelo 3PL, que incluye un tercer parámetro (acierto al azar). Studeia implementa 2PL — fiel al espíritu del ENEM, pero no es el cálculo oficial del INEP. Usamos esto para ordenar la proficiencia y revisar ítems, sin prometer reproducir la puntuación oficial.

Cómo funciona

Calibración: a partir de las respuestas, se estiman la discriminación y la dificultad de cada ítem (mediante transformación TCT→logística).
Mínimo de datos: por debajo de ~20 respuestas por ítem, la plataforma usa TCT (porcentaje de aciertos) para no generar estimaciones inestables.
Proficiencia (theta): estimada por EAP (Expected A Posteriori) con prior normal.
Escala: theta convertido a 0–1000 al estilo ENEM.

Para qué usarla

Objetivo	Cómo ayuda la TRI
Medir con justicia	Los ítems difíciles/discriminativos pesan diferente
Comparar alumnos	Escala 0–1000 común
Revisar el examen	Los ítems de baja discriminación son candidatos a eliminar
Simulacros ENEM	Proficiencia al estilo del examen

Limitaciones (declaradas)

Es 2PL, no 3PL — no reproduce la puntuación oficial del ENEM.
Necesita volumen de respuestas para calibrar (de lo contrario, TCT).
No reemplaza el análisis pedagógico — es una herramienta de medición.

Preguntas frecuentes

¿Es el 3PL del INEP? No — es 2PL estilo ENEM, sin parámetro de acierto al azar.

¿Cuántas respuestas para calibrar? ~20 por ítem; por debajo de eso, fallback TCT.

¿En qué escala? Theta por EAP convertido a 0–1000.

¿Para qué sirve? Medir con justicia, comparar alumnos y revisar ítems.

Consulta el Quiz Engine y el caso de uso de academia de preparación ENEM.

FAQ

¿Studeia usa el mismo TRI 3PL del ENEM/INEP?

No. Studeia implementa un modelo TRI 2PL (dos parámetros: discriminación y dificultad), al estilo del ENEM, pero no es el modelo 3PL oficial del INEP (que incluye el parámetro de acierto al azar). Es un TRI 2PL honesto, útil para ordenar la proficiencia e identificar ítems problemáticos, sin pretender reproducir el cálculo oficial del ENEM.

¿Cuántas respuestas se necesitan para calibrar?

La calibración 2PL necesita un volumen mínimo de respuestas por ítem para ser confiable — alrededor de 20 respuestas. Por debajo de ese límite, la plataforma usa un fallback a Teoría Clásica de los Tests (TCT, basada en porcentaje de aciertos), evitando estimaciones inestables con pocos datos.

¿Cómo se estima la proficiencia y en qué escala?

La proficiencia (theta) se estima por EAP (Expected A Posteriori) con prior normal, a partir de los parámetros 2PL calibrados, y se convierte a una escala 0–1000 al estilo ENEM. Esto permite comparar a los alumnos en una escala común, en lugar de solo por el número bruto de aciertos.

¿Para qué sirve la TRI en la práctica?

Para medir la proficiencia de forma más justa que el porcentaje simple (las preguntas difíciles y discriminativas pesan diferente), ordenar a los alumnos en una escala comparable e identificar ítems problemáticos (baja discriminación) para revisión. Es útil en academias de preparación y simulacros estilo ENEM, así como en evaluaciones a gran escala.