dc.contributorVillafuerte Serna, Rony
dc.creatorCampos Ardiles, Isaac
dc.date.accessioned2021-06-02T01:35:31Z
dc.date.accessioned2023-06-02T13:11:46Z
dc.date.available2021-06-02T01:35:31Z
dc.date.available2023-06-02T13:11:46Z
dc.date.created2021-06-02T01:35:31Z
dc.date.issued2021
dc.identifier253T20210054
dc.identifierhttp://hdl.handle.net/20.500.12918/5702
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/6548987
dc.description.abstractEl presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están planteados no pueden resolver el caso particular que será objeto de este estudio. Por ello un nuevo problema llama- do Data Streaming Clustering fue propuesto y fue objeto de investigación de muchos estudios. Este problema está definido como el clustering de un flujo de datos recibidos continuamente. Data Streaming clustering tiene como objetivo encontrar y mantener un conjunto de clusters válidos en un continuo y posiblemente ilimitado flujo de datos. Teniendo en cuenta las limitantes actuales en la tecnología como la capacidad de la memoria o limitaciones en el tiempo computacional. Es importante tener en cuenta que los algoritmos para el problema de clustering no pueden resolver eficientemente el problema en estudio sin una previa modificación, ya que no toman en cuenta estas características. Debido a las características de este problema los algoritmos planteados para resolver el problema de Data Streaming clustering pueden ser usados para minería de datos con características especiales como outliers o ruido en los datos, como grabaciones telefónicas, transacciones bancarias, información de redes sociales. En esta investigación se presenta el diseño e implementación de un algoritmo para Data Streaming Clustering para datasets con clusters irregulares, outliers y sin necesidad de un conocimiento previo del número de clusters, además se realiza un análisis y discusión sobre los resultados.
dc.languagespa
dc.publisherUniversidad Nacional de San Antonio Abad del Cusco
dc.publisherPE
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectClustering
dc.subjectData streaming
dc.subjectEstructura disjoint-set
dc.subjectFeature vector
dc.titleAlgoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
dc.typeinfo:eu-repo/semantics/bachelorThesis


Este ítem pertenece a la siguiente institución