A simple and efficient algorithm for automatic classification of web pages
Un algoritmo simple y eficiente para la clasificación automática de páginas web
dc.creator | Garcia, María del Cisne | |
dc.creator | Pasmay, Fausto | |
dc.creator | Carrera, Enrique V. | |
dc.date | 2009-04-01 | |
dc.date.accessioned | 2023-08-08T20:18:30Z | |
dc.date.available | 2023-08-08T20:18:30Z | |
dc.identifier | https://revistas.usfq.edu.ec/index.php/avances/article/view/11 | |
dc.identifier | 10.18272/aci.v1i1.11 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/8067958 | |
dc.description | Este artículo propone un simple pero eficiente clasificador de paginas Web basado en la frecuencia de termi- nos. La simplicidad esta dada por el uso de un conjunto pequeüo de terminos para describir cada clase, mientras que la eficiencia es alcanzada mediante embolsamiento. El uso de atributos simples como la frecuencia de terminos tambien reduce la complejidad de los algoritmos de preprocesamiento y extracción de características. Sin embargo, un problema de usar propiedades dependientes de los terminos incluidos en cada paígina es la seleccioí n de la descripcioí n de teírminos correspondiente para cada una de las clases. En este trabajo, la seleccion de terminos para cada clase se basa en el coeficiente TFIDF, mientras que el enbol- samiento utiliza clasificadores probados como redes neuronales y algoritmos bayesianos. Los resultados de nuestra evaluacion muestran un clasificador sumamente rápido con una exactitud superior al 83 %. | es-ES |
dc.format | application/pdf | |
dc.language | spa | |
dc.publisher | USFQ PRESS, departamento editorial de la Universidad San Francisco de Quito USFQ | es-ES |
dc.relation | https://revistas.usfq.edu.ec/index.php/avances/article/view/11/13 | |
dc.source | ACI Avances en Ciencias e Ingenierías; Vol. 1 No. 1 (2009); 57-61 | en-US |
dc.source | ACI Avances en Ciencias e Ingenierías; Vol. 1 Núm. 1 (2009); 57-61 | es-ES |
dc.source | 2528-7788 | |
dc.source | 1390-5384 | |
dc.source | 10.18272/aci.v1i1 | |
dc.subject | Minería de datos | es-ES |
dc.subject | clasificacion | es-ES |
dc.subject | frecuencia de terminos | es-ES |
dc.subject | embolsamiento | es-ES |
dc.subject | World Wide Web | es-ES |
dc.title | A simple and efficient algorithm for automatic classification of web pages | en-US |
dc.title | Un algoritmo simple y eficiente para la clasificación automática de páginas web | es-ES |
dc.type | info:eu-repo/semantics/article | |
dc.type | info:eu-repo/semantics/publishedVersion | |
dc.type | Artículo evaluado por pares | es-ES |