Pular para o conteúdo
Studeia Docs

Gravação e transcrição de aulas ao vivo (multi-provider)

Como a Studeia trata gravação e transcrição de aulas ao vivo: acesso seguro à gravação por papel, transcrição native-first (VTT do provedor) com fallback STT, revisão e ingestão no RAG.

2026-06-22 7 min
Resposta curta

A Studeia trata gravação e transcrição de aulas ao vivo de forma multi-provider. O acesso à gravação é resolvido por papel no servidor — nunca como link bruto, sem expor a chave do provedor. A transcrição é native-first: usa a transcrição nativa do provedor (VTT) quando existe e cai para STT (Whisper→Google) só quando necessário. Após revisão (pending→review→approved→ingested), pode ser ingerida no RAG, fazendo o tutor IA responder também com base na aula falada.

Aulas ao vivo geram dois ativos valiosos: a gravação e a transcrição. A Studeia trata os dois de forma segura e multi-provider, e ainda transforma a transcrição em material para o tutor IA.

Resposta rápida

  • Acesso à gravação resolvido por papel no servidor (admin/professor/aluno matriculado)
  • Nunca link bruto — token efêmero ou proxy, sem expor a chave do provedor
  • Transcrição native-first: VTT do provedor primeiro; STT (Whisper→Google) só se preciso
  • Fluxo de revisão (pending→review→approved→ingested)
  • Transcrição aprovada pode ser ingerida no RAG do curso

Acesso seguro à gravação

A gravação não é entregue como URL bruta (que vazaria credenciais). A plataforma resolve a autenticação por trás, conforme o provedor:

ProvedorComo entrega
BBBRedirect para a página de player
ZoomRedirect com token re-mintado
TeamsProxy dos bytes (Graph exige Bearer)
MeetRedirect governado pela ACL do Drive

A autorização por papel (admin institucional, professor dono, aluno matriculado) é checada no servidor.

Transcrição native-first

  1. Nativa primeiro: tenta a transcrição do provedor (Zoom/Teams/Meet em VTT), normalizada para texto. Gratuita.
  2. Fallback STT: só quando não há nativa, baixa a mídia (com autenticação resolvida pelo adapter) e transcreve com Whisper, caindo para Google Speech-to-Text.
  3. Limitação: o BBB padrão pode não expor mídia baixável para STT — nesse caso, degrada com mensagem clara.

Da transcrição ao tutor IA

A transcrição passa por um fluxo de estados:

pending → review → approved → ingested

Uma vez aprovada, pode ser ingerida no RAG do curso. A partir daí, o tutor IA responde também com base no que foi dito na aula ao vivo — não só no material escrito. Isso amplia a cobertura do tutor sem trabalho manual de transcrever.

Confiabilidade

Webhooks de gravação são instáveis (atrasos, falhas). Por isso, um cron de sincronização funciona como fallback: ele busca gravações e transcrições pendentes periodicamente, garantindo que nada se perca.

Perguntas frequentes

Quem acessa a gravação? Admin, professor dono e aluno matriculado — por papel, no servidor.

Como é a transcrição? Native-first (VTT do provedor); STT (Whisper→Google) só se preciso.

Vira material do tutor? Sim, após aprovação, ingerida no RAG.

Funciona com qualquer provedor? Sim (BBB/Zoom/Teams/Meet), com particularidades por provedor.


Veja as aulas ao vivo e a ingestão RAG.

FAQ

Quem pode acessar a gravação de uma aula ao vivo?

O acesso é resolvido por papel no servidor: admin institucional, o professor dono da aula e alunos matriculados (na turma, quando a aula é escopada por turma). A gravação nunca é entregue como link bruto — a plataforma resolve a autenticação por trás (redirect com token efêmero ou proxy dos bytes), sem expor a chave do provedor ao navegador.

Como funciona a transcrição das aulas?

É native-first: a plataforma primeiro tenta a transcrição nativa do provedor (Zoom/Teams/Meet em VTT, normalizada para texto), que é gratuita. Só quando não há transcrição nativa é que recorre a STT (Whisper, com fallback para Google Speech-to-Text), baixando a mídia com autenticação resolvida pelo adapter do provedor.

A transcrição vira material de estudo para o tutor IA?

Pode. A transcrição passa por um fluxo de revisão (pending→review→approved→ingested). Uma vez aprovada, pode ser ingerida no RAG do curso, fazendo com que o tutor IA responda também com base no que foi dito na aula ao vivo — não só no material escrito.

Funciona com qualquer provedor de vídeo?

A gravação e a transcrição usam o adapter pattern multi-provider (BBB, Zoom, Teams, Google Meet). Cada provedor tem particularidades: a transcrição nativa varia, e o BBB padrão pode não expor mídia baixável para STT, caso em que a plataforma degrada com mensagem clara. Um cron de sincronização funciona como fallback aos webhooks.

Veja tambem

Gravação e transcrição de aulas ao vivo (multi-provider)