Facebook Facebook Twitter LinkedIn Youtube Flickr SoundCloud
18/11/2020 12:00

td-banner

TD 2612 - Línguas Naturais E Máquinas Artificiais: aplicação de técnicas de mineração de texto para a classificação de sentenças judiciais brasileiras

Lucas Moreira Gomes, Jader Martins Camboim de Sá e Peng Yaohao, Brasília, novembro de 2020    

 

Este trabalho investigou o uso de técnicas de inteligência artificial e de mineração de texto para a classificação de sentenças judiciais quanto à procedência do pedido do autor da ação, bem como discutiu potenciais aplicações alternativas no âmbito da formulação e avaliação de políticas públicas. Ademais, o trabalho construiu um levantamento de estudos relativos à jurimetria provenientes da literatura científica especializada e detalhou a operacionalização do tratamento de dados textuais, bem como definindo conceitos e métodos básicos de mineração de texto. Por fim, uma análise empírica de classificação de textos jurídicos em quatro categorias foi executada utilizando-se dados do Tribunal Regional Federal da 2ª região coletados pelo IpeaJus, banco de dados do Ipea sobre o sistema de justiça do Brasil, com os resultados sendo discutidos à luz de diversas métricas quantitativas de avaliação e prospectos de desenvolvimentos futuros em contextos diversos.

Palavras-chave: processamento em linguagem natural; classificação de documentos; procedência jurídica; jurimetria; Big Data.

This paper investigated the usage of artificial intelligence and text mining techniques for classification of court judgments and discussed potential alternative applications in formulation and evaluation of public policies. Besides, we built a survey of studies related to Jurimetry based on the specialized scientific literature and detailed the operationalization of the of textual data treatment, as well as basic concepts and methods of text mining. Finally, we performed an empirical analysis of classification of legal texts into four categories using real data from the Brazilian 2nd Federal Regional Court collected by IpeaJus, the database about the Brazilian Justice System from Ipea, discussing the results in light of various quantitative evaluation metrics and prospects for future developments in different contexts.

Keywords: natural language processing; document classification; legal proceedings; jurimetry; Big Data.

 

  acesseAcesse o sumário executivo  acesseAcesse o documento (2 MB)

 

 
 

Todo o conteúdo deste site está publicado sob a Licença Creative Commons Atribuição 2.5 Brasil.
Ipea - Instituto de Pesquisa Econômica Aplicada


Política de Privacidade
Expediente – Assessoria de Imprensa e Comunicação