Santiago Castro - Detección de humor en tweets en español

Fecha de inicio

Miércoles, 3 Junio, 2015 - 12:00

Aun cuando el humor ha sido estudiado desde el punto de vista psicológico, cognitivo, y lingüístico, su estudio desde un punto de vista computacional es todavía un área a explorar en el marco de la lingüística computacional. Algunos trabajos previos existen, pero se está aún lejos de concretar una caracterización del humor que permita su reconocimiento y generación automática. En este proyecto se construye un corpus de tweets etiquetados según el valor humorístico en base a votaciones de personas, definiendo implícitamente de esta manera qué es humor, y se realiza un clasificador de humor en tweets en español utilizando técnicas de aprendizaje automático supervisado como Support Vector Machine, k Nearest Neighbors, Árboles de decisión y dos tipos de clasificadores Naïve Bayes, llegando a una precisión de 83,6% y un recall de 68,9 %.
Palabras clave: Humor, Humor Computacional, Reconocimiento de Humor, Aprendizaje Automático, Procesamiento del Lenguaje Natural, tweets.