O Projeto Victor, fruto de uma parceria entre o Supremo Tribunal Federal (STF) e a Universidade de Brasília (UnB), acaba de concluir sua terceira etapa, faltando apenas mais uma para ser implantado em definitivo. Referência no cenário internacional, por seu pioneirismo no uso de inteligência artificial na solução dos desafios pertinentes à uma maior eficiência e rapidez dos processos, o projeto foi iniciado no final de 2017, tem por principal objetivo auxiliar o STF na análise dos recursos extraordinários recebidos de todo o país, especialmente quanto a sua classificação em temas de repercussão geral de maior incidência.
Ferramenta Victor já converteu automaticamente mais de dez milhões de páginas em texto

technology artifical intelligence background with face
Desde 2018, a pesquisa e o desenvolvimento do Victor, parceria do Supremo Tribunal Federal (STF) com a Universidade de Brasília (UnB), já exibem resultados positivos. Ainda em laboratório, a ferramenta conseguiu classificar os 27 temas de repercussão geral de maior incidência. Ao encarar a missão de levar adiante um projeto tão complexo — somente a extração de base de dados para a pesquisa levava meses para ser concluída — ficou evidente que, para botar o classificador de temas funcionando 100% era fundamental resolver também o problema relativo à informação: o texto puro.
Hoje, o STF recebe recursos em meio eletrônico de todos os tribunais do país. Também abriga processos que tramitaram nos juizados especiais, cuja íntegra se encontrava em arquivos no formato pdf, sem camada de texto puro que viabilizasse a leitura por máquina. Além disso, tais documentos continham as peças processuais (petição inicial, acórdão recorrido, petição de recurso extraordinário, entre outras) sem qualquer identificação ou indexação. As pastas não tinham nomes ou etiquetas , com informações como acórdão, petição de recurso extraordinário etc, dificultando sua localização no processo.
Para resolver esse problema, e permitiu que a Inteligência artificial pudesse ser aplicada em linguagem natural (texto), Victor precisou executar quatro funções. Primeiro, converteu as imagens em textos no processo digital ou eletrônico. Em seguida, fez a separação do começo e do fim de um documento. Também separou e classificou as peças processuais mais utilizadas nas atividades do STF. Por fim, identificou os temas de repercussão geral de maior incidência.
Com isso, todos os recursos recebidos diariamente no STF em meio eletrônico têm a eventual camada de imagem em seus pdfs convertida automaticamente em texto. Até maio de 2021, este procedimento ocorreu em mais de 10 milhões de páginas.