A Studeia oferece um cálculo de proficiência por Teoria de Resposta ao Item (TRI) para avaliações estilo ENEM. Aqui explicamos o que ele é, como funciona — e, com honestidade, o que ele não é.
Resposta rápida
- Modelo TRI 2PL (discriminação + dificuldade), estilo ENEM
- NÃO é o 3PL oficial do INEP (sem parâmetro de acerto ao acaso)
- Calibração precisa de ~20 respostas/item; abaixo disso, fallback CTT
- Proficiência (theta) por EAP, escala 0–1000
- Útil para medir com justiça e identificar itens problemáticos
O que é TRI
A Teoria de Resposta ao Item modela a probabilidade de acerto de uma questão em função da proficiência do aluno e das características do item. No modelo 2PL, cada item tem dois parâmetros:
- Discriminação (a): quão bem o item separa alunos fortes de fracos.
- Dificuldade (b): o nível de proficiência em que a chance de acerto é 50%.
Diferente do percentual simples, a TRI dá peso diferente a cada item — uma questão difícil e discriminativa "vale mais" do que uma fácil e ambígua.
Honestidade: 2PL, não 3PL do INEP
O ENEM oficial usa um modelo 3PL, que inclui um terceiro parâmetro (acerto ao acaso). A Studeia implementa 2PL — fiel ao espírito do ENEM, mas não o cálculo oficial do INEP. Usamos isso para ordenar proficiência e revisar itens, sem prometer reproduzir a nota oficial.
Como funciona
- Calibração: a partir das respostas, estima-se discriminação e dificuldade de cada item (via transformação CTT→logística).
- Mínimo de dados: abaixo de ~20 respostas por item, a plataforma usa CTT (percentual de acertos) para não gerar estimativas instáveis.
- Proficiência (theta): estimada por EAP (Expected A Posteriori) com prior normal.
- Escala: theta convertido para 0–1000 no estilo ENEM.
Para que usar
| Objetivo | Como a TRI ajuda |
|---|---|
| Medir com justiça | Itens difíceis/discriminativos pesam diferente |
| Comparar alunos | Escala 0–1000 comum |
| Revisar a prova | Itens de baixa discriminação são candidatos a remover |
| Simulados ENEM | Proficiência no estilo da prova |
Limitações (declaradas)
- É 2PL, não 3PL — não reproduz a nota oficial do ENEM.
- Precisa de volume de respostas para calibrar (senão, CTT).
- Não substitui análise pedagógica — é uma ferramenta de medida.
Perguntas frequentes
É o 3PL do INEP? Não — é 2PL estilo ENEM, sem parâmetro de acerto ao acaso.
Quantas respostas para calibrar? ~20 por item; abaixo disso, fallback CTT.
Em que escala? Theta por EAP convertido para 0–1000.
Para que serve? Medir com justiça, comparar alunos e revisar itens.
Veja o Quiz Engine e o caso de uso de cursinho ENEM.