Expresiones de Referencia y Figuras Retóricas para la Distinción y Descripción de Entidades en Discursos Generados Automáticamente (Spanish version)

TitleExpresiones de Referencia y Figuras Retóricas para la Distinción y Descripción de Entidades en Discursos Generados Automáticamente (Spanish version)
Publication TypeThesis
Year of Publication2009
AuthorsHervás R
Academic DepartmentDepartamento de Ingeniería del Software e Inteligencia Artificial
DegreePhD Thesis
UniversityUCM
Abstract

El campo de la interacción hombre-máquina ha ido evolucionando rápidamente en los últimos años, convirtiéndose en un elemento fundamental de cualquier sistema informático. Si un sistema es capaz de comunicarse con un ser humano mediante interacciones que a éste le resulten naturales y amigables (voz, imágenes, etc.), el usuario será mucho más perceptivo hacia la información que está recibiendo y tendrá más confianza en la aplicación.

En este sentido, un campo fundamental dentro de la interacción hombre-máquina es el de la Generación de Lenguaje Natural (GLN), un subcampo de la Inteligencia Artificial y la Lingüística Computacional que se encarga del diseño e implementación de sistemas que producen textos comprensibles en lenguajes humanos. Entre todos los problemas que se deben resolver para que el proceso completo de generación resulte satisfactorio, se encuentra el de decidir cómo habrá que referirse a las entidades o elementos que aparecerán en el texto.

La tarea de Generación de Expresiones de Referencia se encarga de resolver este problema concreto. Las diferentes menciones al mismo elemento en un texto deben ser reemplazadas por la forma específica en que referirse a ellas o referencias. A la hora de planificar las referencias de un texto se deben tener en cuenta dos propósitos. En primer lugar, una referencia a un elemento del discurso debe permitir al lector u oyente distinguir a este elemento de cualquier otro presente en el contexto con el que se pudiera confundir. Por otro lado, en ocasiones las referencias contendrán información que más allá de la función de distinguir pretendan además describir las entidades a las que se refieren, presentando información relevante sobre las mismas previamente desconocida.

De estas dos funciones (distintiva y descriptiva), sólo la primera ha sido ampliamente estudiada en la literatura. Se pueden encontrar numerosos trabajos que se encargan de abarcar el problema de la generación de expresiones de referencia con función distintiva estudiando aspectos como la minimalidad de una expresión, la semejanza de la expresión a las utilizadas por los seres humanos, la no ambigüedad de la referencia generada, etc.

En cuanto a la descripción de entidades, aunque existen trabajos sobre generación de lenguaje natural basada en descripciones, se ha realizado poco trabajo desde el punto de vista del enriquecimiento del discurso con expresiones descriptivas que además realcen cierta información considerada importante, o sobre la relación de este proceso con la función distintiva de las referencias.

En este trabajo se aborda la generación de referencias de dos maneras diferentes. En primer lugar se proponen soluciones alternativas y mejoras a los algoritmos clásicos de generación de expresiones de referencia básica con función distintiva. Se aborda el problema desde tres frentes diferentes: cómo adecuar el nivel de abstracción al que se están nombrando las referencias según el contexto de la situación, qué estrategia de búsqueda usar para la elección de los atributos que permitan distinguir a un concepto, y qué palabras o expresiones resultan más adecuadas para expresar una referencia en lenguaje natural. Para cada uno de estos frentes se presentan soluciones basadas en técnicas y recursos clásicos de la Inteligencia Artificial como son los algoritmos evolutivos, el razonamiento basado en casos, o las ontologías. Además se evaluarán las diferentes soluciones presentadas teniendo en cuenta las métricas clásicas en este campo.

En segundo lugar se explora el enriquecimiento de un discurso dado aportando información descriptiva utilizando figuras retóricas basadas en similitudes entre dominios como la comparación y la analogía. Para que sea posible utilizar este tipo de figuras en un sistema de generación de lenguaje natural se deben resolver problemas de arquitectura, fuentes de conocimiento, determinación de las analogías y comparaciones, etc. En este trabajo se estudian estos problemas y se propone un marco general para abordar la generación de este tipo de referencias.

Los resultados obtenidos para las soluciones propuestas en este trabajo dan lugar a una discusión sobre aspectos a mejorar en trabajo futuro y limitaciones de los algoritmos implementados. También se discute la relación de la generación de expresiones de referencia, desde el punto de vista de sus funciones distintiva y descriptiva, con el resto del proceso de generación de lenguaje natural.

Finalmente se presentan las conclusiones de esta investigación, así como líneas abiertas para trabajo futuro y campos de aplicación de las soluciones y resultados obtenidos.

AttachmentSize
HervasTesis.pdf2.22 MB