Artículos de revistas
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
Generación de abstracts a partir de la estructura de género vía la léxico-gramática: Modelización de selección y proyección de rasgos
Fecha
2006-12Registro en:
Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-354
0035-0451
0718-0934
CONICET Digital
CONICET
Autor
Castel, Victor Miguel
Resumen
The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed
descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata
features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper. El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad
del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones
parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas
entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de
AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho