info:eu-repo/semantics/article
Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection
Author
SABINO MIRANDA JIMENEZ
Efstathios Stamatatos
Institutions
Abstract
En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio.
Subjects
Related items
Showing items related by title, author, creator and subject.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA