Tesis
Algoritmo Character N-Gram para la detección de plagio bajo un enfoque intrínseco
Registro en:
Autor
Huaycochea Bayton, Jesús Alberto
Huaycochea Bayton, Jesús Alberto
Institución
Resumen
El presente trabajo tiene como objetivo la aplicación del enfoque intrínseco para la detección de plagio, a través del algoritmo planteado en un inicio por Efstathios Stamatatos, conocido como Character N-gram, con la finalidad de poder detectar potenciales fragmentos de texto que pueden contar con actividad de plagio dentro de su estructura, analizando únicamente el documento en cuestión y sin la necesidad de acudir a una fuente de documentos externos para su verificación, basándose en las características de escritura del propio documento.
La investigación se llevará a cabo siguiendo el método científico y será de carácter netamente experimental, realizando las pruebas correspondientes con el conjunto de documentos de prueba, brindados de manera gratuita por el concurso internacional de detección de plagio PAN en su 11ava edición (PAN11). Adicionalmente, se realizarán pruebas con documentos académicos obtenidos de distintos estudiantes pertenecientes a diversas instituciones académicas del país.
Finalmente, se entregará la codificación del algoritmo mencionado en el lenguaje de programación Python y las sugerencias para futuras investigaciones que pueden mejorar la efectividad de este en la tarea de la detección de plagio. Tesis