info:eu-repo/semantics/article
DYNAMIC CUR, UNA ALTERNATIVA A LA VARIABLE SELECCIÓN EN DESCOMPOSICIÓN CUR
DYNAMIC CUR, AN ALTERNATIVE TO VARIABLE SELECTION IN CUR DECOMPOSITION
Autor
Barahona, Greibin
Martín Barreiro, Carlos Manuel
González García, Nerea
Hernández González, Sergio
Sánchez Barba, Mercedes
Galindo Villardón, María Purificación
Institución
Resumen
CUR decomposition is one of the matrix decomposition techniques proposed in the literature for the selection of rows and/or columns of a data matrix. Dynamic CUR is proposed as an alternative to the selection criteria of the CUR decomposition basedon probabilistic criteria. This alternative tries to fit the most adequate theoretical probability distribution to the empirical distribution of the leverages obtained from the start and based on it, automatically determines not only the individuals and/or variables that need to be selected, but also their numbers. In this way, Dynamic CUR sets itself apart from CUR in the information selection criteria, dynamizing the calculation of the approximation error starting from an optimal initial selection ofparameters based on the most adequate probability distribution. Lastly, with the purpose of facilitating the use of this new method in any practical context, the Dynamic CUR algorithm has been developed in C#.NET and R languages La descomposición CUR es una de las técnicas de descomposición matricial propuesta en la literatura para la selección de filas y/o columnas de una matriz de datos. Se propone Dinamic CUR, una alternativa al criterio de selección de la descomposición CUR basada en criterios probabilísticos. Esta propuesta trata de ajustar la distribución de probabilidad teórica más adecuada a la distribución empírica de los puntajes altamente influyentes obtenidos de partida y, a partir de ella, determina de manera automática no sólo los individuos y/o variables a seleccionar sino el número de ellas. Así, DinamicCUR se diferencia de CUR en el criterio de selección de la información, dinamizando el cálculo del error de aproximación a partir de una óptima elección inicial de parámetros en base a la distribución de probabilidad más adecuada. Por último, con el fin de facilitar el uso de este nuevo método en cualquier contexto práctico, se ha desarrollado el algoritmo DinamicCUR en lenguaje C#.NET y R