Estudo propõe modelo que prevê evasão escolar no ensino superior a partir do desempenho acadêmico

Crédito da fotografia: 
Brenno Carvalho (Agência O Globo)
Pesquisadores do Instituto de Computação da Universidade Federal Fluminense (UFF) utilizam dados de históricos dos alunos e Inteligência Artificial para estudar a evasão

Um dos grandes desafios enfrentados pelo sistema educacional brasileiro, seja no ensino básico ou superior, é a evasão escolar — quando um aluno deixa de frequentar a instituição de ensino por diferentes razões. De acordo com o Mapa do Ensino Superior no Brasil, do Instituto Semesp, mais da metade dos alunos que ingressam no ensino superior abandonam as universidades ou faculdades antes de concluírem a graduação. Com base nos anos de 2017 a 2021, os dados revelam que 55,5% dos alunos desistem do curso, 18,1% continuam e apenas 26,3% adquirem o diploma no período de tempo proposto. A essa questão dedica-se a pesquisa “É possível prever evasão com base apenas no desempenho acadêmico?”, realizada por pesquisadores do Instituto de Computação da Universidade Federal Fluminense (UFF).

A investigação que articula ciência de dados com desafios enfrentados pela educação brasileira começou a partir de uma orientação de trabalho de conclusão de curso, como conta o professor Alexandre Plastino. “Eu e a professora Simone fomos orientadores do Carlos Henrique. Na época, ele concluía a graduação em Ciência da Computação e tinha nos procurado com interesse em trabalhar na área de ciência de dados com foco e aplicação na educação. Assim, começamos a desenvolver esse projeto”. O docente explica que, em trabalhos que se propõe a analisar a evasão escolar, é comum considerar atributos socioeconômicos, mas, no caso da pesquisa, a questão principal é se seria possível prever a evasão escolar considerando apenas o desempenho acadêmico dos alunos ao longo dos anos de graduação. Para a base de dados foram escolhidos ingressantes do curso de graduação em Ciência da Computação de 2017 a 2019, como esclarece o mestrando Carlos Henrique Santos.

“Conseguimos construir diferentes modelos, um para cada um dos dez períodos que em média um aluno leva para se graduar em Ciência da Computação. O modelo é aplicado ao fim de cada período, porque quando o aluno está no primeiro semestre, por exemplo, tem apenas as informações daquele primeiro período, mas quando está no quarto, já fez ou poderia ter feito um conjunto maior de disciplinas”, comenta Plastino. Para isso, os pesquisadores envolvidos com o projeto utilizaram uma técnica da Inteligência Artificial chamada “árvore de decisão”. O pesquisador explica que existem algoritmos prontos disponíveis que  “treinam” uma árvore de decisão a partir de informações dos históricos dos alunos já fora da universidade, seja por conclusão do curso ou abandono. “Com as notas deles do passado, conseguimos extrair esses padrões. A árvore de decisão, na realidade, é um conjunto de padrões extraídos pelo algoritmo de Inteligência Artificial que identifica as disciplinas mais relevantes e calcula as probabilidades de evasão”.


Árvore de decisão gerada para a base do 4º semestre / Créditos: Carlos Henrique D. C. Santos, Simone de Lima Martins e Alexandre Plastino

Construir modelos preditivos para cada período da graduação foi importante porque uma quantidade maior de informações é obtida com o passar dos semestres. O docente esclarece que é até possível prever se o aluno vai evadir ou não com base apenas nas notas obtidas no primeiro semestre, mas o grau de certeza é de cerca de 80%. Aproximando-se do final do curso, essa porcentagem aumenta, passando para cerca de 90% no quinto ou sexto período e tornando mais fácil realizar essa previsão. “Os modelos foram construídos basicamente com informações das disciplinas que o aluno cursou até então; por isso, é mais fácil fazer essa previsão quando o aluno está perto de se formar. Isso é extremamente interessante, porque com pouca informação já poderíamos sinalizar para as coordenações se aquele aluno tem uma alta chance de evadir, assim, a coordenação poderia agir com base nessa informação e tentar ajudar o estudante de alguma forma”, continua.

Plastino ressalta, no entanto, que esse modelo preditivo não justifica a razão para o aluno evadir, apenas permite que se extraiam padrões comuns a outros graduandos. Por exemplo, segundo a árvore de decisão gerada para base do 4o semestre, se um aluno foi reprovado em Programação Estruturada, em Cálculo 2A e em Probabilidade e Estatística — disciplinas da grade curricular do curso de Ciência da Computação —, há uma grande chance de desistir da graduação, mas ele não vai abandonar o curso porque reprovou nessas matérias, e sim porque passa por uma sobrecarga de trabalho ou problemas pessoais. “Nós não conseguimos dizer por que o aluno vai evadir, mas sinalizamos esse padrão e isso dá uma chance para a coordenação buscar saber o que está acontecendo e tomar uma atitude para ajudá-lo”, afirma. “O aluno evade provavelmente pelos mesmos motivos que o levaram a reprovação, seja porque trabalha, mora longe, tem dificuldade para chegar à universidade ou para se concentrar. O que encontramos foi um padrão: quando um graduando reprova em certas matérias, as chances de evadir são maiores”.

A abordagem proposta pelos pesquisadores está disponível e pode ser reproduzida em outras graduações, não apenas no curso de Ciência da Computação da UFF, e até mesmo fora do ensino superior, como no ensino médio. “No ensino médio, os alunos não fazem disciplinas diferentes como no ensino superior, as matérias são sempre as mesmas, mas acredito que o modelo seria adaptável sem grande dificuldade”, afirma o professor. Plastino também acrescenta que, com a associação entre dados socioeconômicos e as informações de desempenho acadêmico, seria possível aumentar o poder preditivo das árvores de decisão geradas e ajudar a explicar as razões para a desistência dos estudantes. “Esses são atributos que, se estivessem na base de dados, poderíamos utilizar para explicar o motivo da evasão”, conclui.

____

Carlos Henrique D. C. Santos é mestrando em Computação na Universidade Federal Fluminense (UFF). Possui interesse na área de Inteligência Artificial.

Simone de Lima Martins é graduada em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (1984), mestrado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro (1988) e doutorado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro (1999). Atualmente, é professora associada da Universidade Federal Fluminense. Tem experiência na área de Ciência da Computação, com ênfase em Heurísticas, atuando principalmente nos seguintes temas: metaheurísticas e paralelização de aplicações.

Alexandre Plastino é professor Titular do Instituto de Computação da Universidade Federal Fluminense (UFF), atualmente é Coordenador do Programa de Pós-Graduação em Computação da UFF, Cientista do Nosso Estado da FAPERJ e Bolsista de Produtividade em Pesquisa do CNPq Nível II. Possui Graduação em Informática pela Universidade Federal do Rio de Janeiro (UFRJ, 1988), mestrado em Engenharia de Sistemas e Computação pela Universidade Federal do Rio de Janeiro (COPPE-UFRJ, 1990) e doutorado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio, 2000). Em 2008, realizou um pós-doutorado na Universidade de Kent (Reino Unido) com o apoio da CAPES e, entre 2009 e 2011, foi Jovem Cientista do Nosso Estado da FAPERJ. Suas principais áreas de interesse atuais são: Mineração de Dados e Otimização Combinatória.

Compartilhe