Clasificación automática de textos considerando el estilo de redacción

ROSA MARIA COYOTL MORALES

dc.contributor	LUIS VILLASEÑOR PINEDA
dc.contributor	MANUEL MONTES Y GOMEZ
dc.creator	ROSA MARIA COYOTL MORALES
dc.date	2007
dc.date.accessioned	2023-07-25T16:21:53Z
dc.date.available	2023-07-25T16:21:53Z
dc.identifier	http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/587
dc.identifier.uri	https://repositorioslatinoamericanos.uchile.cl/handle/2250/7805805
dc.description	Nowadays there is a large amount of information available in digital format. All this information is useless if we do not have adequate mechanisms for its access, classification and analysis. In particular, text classification concerns the automatic assignment of free text documents to one or more predefined categories. Most work in this field focuses on categorizing documents by their topic. However, a document can be also classified by its written style (non-topic classification). Basically, nontopic classification considers tasks such as sentiment classification, plagiarism detection, authorship attribution, genre classification, etc. The main objective of this thesis is to propose methods for determining the lexical features that allow characterizing the written style of documents. The proposed methods consider the characterization of documents by sets of word sequences that combine content and functional words. The usefulness of this kind of characterization is demonstrated by its application in the tasks of authorship attribution and genre classification.
dc.description	En la actualidad existe una inmensa cantidad de información disponible en formato electrónico. Toda esta información es improductiva si no se dispone con mecanismos apropiados para su acceso, clasificación y análisis. En particular, la clasificación automática de textos consiste en colocar un documento dentro de un grupo de clases previamente definidas. La mayor parte del trabajo en esta área se ha enfocado en la clasificación de textos por su tema o tópico. Sin embargo, un documento también puede ser clasificado de acuerdo a su estilo (clasificación notemática). En la clasificación no-temática se consideran tareas tales como la clasificación de opiniones, la detección de plagio, la atribución de autoría, la clasificación por género, etc. El objetivo principal de esta tesis es proponer métodos que permitan determinar los rasgos léxicos que hacen posible caracterizar el estilo de escritura de los documentos. Los métodos descritos consideran la caracterización de los documentos a través un conjunto de secuencias de palabras que combinan tanto palabras de contenido como funcionales. La utilidad de este tipo de caracterización se demuestra mediante su aplicación en las tareas de atribución de autoría y clasificación por género.
dc.format	application/pdf
dc.language	spa
dc.publisher	Instituto Nacional de Astrofísica, Óptica y Electrónica
dc.relation	citation:Coyotl-Morales RM
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	http://creativecommons.org/licenses/by-nc-nd/4.0
dc.subject	info:eu-repo/classification/Aprendizaje automático/Machine learning
dc.subject	info:eu-repo/classification/Clasificación/Classification
dc.subject	info:eu-repo/classification/Análisis de la información/Information analysis
dc.subject	info:eu-repo/classification/cti/1
dc.subject	info:eu-repo/classification/cti/12
dc.subject	info:eu-repo/classification/cti/1203
dc.subject	info:eu-repo/classification/cti/330405
dc.subject	info:eu-repo/classification/cti/330405
dc.title	Clasificación automática de textos considerando el estilo de redacción
dc.type	info:eu-repo/semantics/masterThesis
dc.type	info:eu-repo/semantics/acceptedVersion
dc.audience	students
dc.audience	researchers
dc.audience	generalPublic

Este ítem pertenece a la siguiente institución

Instituto Nacional de Astrofísica, Óptica y Electrónica (México)

Clasificación automática de textos considerando el estilo de redacción

Este ítem pertenece a la siguiente institución

Ítems relacionados

Compendio de innovaciones socioambientales en la frontera sur de México ﻿

Caminar el cafetal: perspectivas socioambientales del café y su gente ﻿

Cambio social y agrícola en territorios campesinos. Respuestas locales al régimen neoliberal en la frontera sur de México ﻿

Compendio de innovaciones socioambientales en la frontera sur de México

Caminar el cafetal: perspectivas socioambientales del café y su gente

Cambio social y agrícola en territorios campesinos. Respuestas locales al régimen neoliberal en la frontera sur de México