Clasificación de texto. Utilizando métricas de ganancia de información para categorizar disposiciones legales
Publication: Revista Internacional de Tecnología, Conocimiento y Sociedad
Dentro del ámbito de la clasificación de textos, en este trabajo hemos estudiado herramientas para clasificar textos en castellano pertenecientes al dominio jurídico. Concretamente, hemos estudiado diferentes métricas basadas en la ganancia de información y su rendimiento a la hora de clasificar las disposiciones legales que conforman un Boletín Oficial. Todas las métricas estudiadas han presentado unos buenos resultados de clasificación, incluso cuando la muestra de entrenamiento era de tamaño reducido. Los resultados presentados muestran las métricas basadas en la ganancia de información como una alternativa a tener en cuenta a la hora de abordar problemas de Aprendizaje Automático con este tipo de textos.