info:eu-repo/semantics/article
Automatic Generation of Summary Obfuscation Corpus for Plagiarism Detection
Autor
SABINO MIRANDA JIMENEZ
Efstathios Stamatatos
Institución
Resumen
En este artículo, describimos un enfoque para crear un corpus de ofuscación de resumen para la tarea de detección de plagio. Nuestro método se basa en información de las Conferencias de comprensión de documentos relacionadas con los años 2001 y 2006, para el idioma inglés. En general, un resumen no atribuido utilizado en el documento de otra persona se considera un tipo de plagio porque las ideas principales del autor siguen siendo sucintas. Para crear el corpus, usamos un Reconocidor de Entidades Nombradas (NER) para identificar las entidades dentro de un documento original, sus resúmenes asociados y documentos de destino. Después, estas entidades, junto con párrafos similares en los documentos de destino, se utilizan para falsificar documentos sospechosos y documentos plagiados. El corpus fue probado en competencia de plagio.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA