info:eu-repo/semantics/masterThesis
Métodos para la selección de características y clasificación de péptidos antimicrobianos
Feature selection methods and classi?cation of antimicrobial peptides
Autor
Jesús Armando Beltrán Verdugo
Institución
Resumen
Los péptidos antimicrobianos (AMPs) son una alternativa potencial para combatir los patógenos resistentes a antibióticos debido a que poseen múltiples mecanismos de acción en contra de microbios tales como: bacterias, hongos y virus. Estos péptidos se encuentran en la naturaleza en casi todas las formas de vida como parte del sistema inmune. Los AMPs son una plantilla interesante para producir nuevos agentes antimicrobianos selectivos, es decir, péptidos con alta actividad antimicrobiana pero con bajos niveles de toxicidad en el orga- nismo huésped. Las técnicas tradicionales para el diseño y optimización de péptidos pueden ser tardadas y costosas, por lo que asistirse de herramientas computacionales puede ayudar a limitar el vasto espacio de secuencias que se tienen que evaluar en el laboratorio.Un método para la predicción de péptidos antimicrobianos (AMPs) y no antimicrobianos (no AMPs) es QSAR (Quantitative Structure-Activity Relationship). Este método relaciona las propiedades ?sicoquímicas (descriptores moleculares) del péptido con su actividad biológica mediante un modelo matemático. Un aspecto importante para la construcción del modelo es la selección de los descriptores moleculares. Actualmente, existen miles de descriptores medibles en los péptidos, por lo que elegir los descriptores moleculares que capturen las pro- piedades relevantes de los AMPs se torna una tarea difícil. Las principales razones de esta di?cultad son: primero, no se conoce una regla determinista que gobierne la elección de los descriptores; segundo, explorar el espacio de todos los posibles subconjuntos de descriptores no es factible, ya que el espacio de búsqueda es de tamaño 2n (donde n es el número de descriptores). En el presente trabajo se propone el diseño de un algoritmo para la selección de características compuesto principalmente por dos elementos: un algoritmo genético para la generación y búsqueda e?ciente de los posibles subconjuntos de características y una máquina de soporte vectorial (SVM) para evaluar la calidad del subconjunto seleccionado. El algoritmo recibe como entrada un conjunto de péptidos con y sin actividad antimicrobiana, un conjunto X de características y un modelo de clasi?cación. La salida del algoritmo es el subconjunto de descriptores con la máxima exactitud del modelo de clasi?cación. Los resultados indican que con el mejor subconjunto encontrado de características se puede construir un modelo de clasi?cación que predice correctamente la actividad del 96% de los péptidos de prueba. Este mismo modelo logra una exactitud de 82.3% sobre un conjunto de casos desconocidos para el algoritmo Antimicrobial peptides (AMPs) are a promising alternative for combating pathogen that are resistant to antibiotics, because their multiple action mechanisms against microbe such as, bacteria, fungi, and virus. These peptides are in nature in almost every form of life, as a part of the defense mechanism. The AMPs are an interesting template to produce new selec- tive antimicrobials agents, i.e., peptides with a high antimicrobial activity and a low toxicity level in the host organism. Traditional techniques for peptide design and optimization can be tedious and expensive, therefore the use of computational tools can help to reduce the sequence space that have to be evaluated in the laboratory.QSAR (Quantitative Structure-Activity Relationship) is a method for predicting active (AMPs) and not active (non-AMPs) peptides. This method use a mathematical model to associate the peptides physicochemical properties (molecular descriptors) to their biological activity. An important aspect to build the mathematical model is the selection of molecular descriptors. Nowadays, there are thousands of proposed descriptors, therefore, to choose the ones that capture the relevant AMPs properties is a hard goal to achieve. The main reason for this are: ?rst, it is unknown a deterministic rule that governs the descriptors selection; second, to explore the space of all possible descriptor subsets is not feasible, this is because the size of the search space is 2n (where n is the number of descriptor).We propose a features selection algorithm, composed by two main elements: a genetic algorithm for the generation and e?cient search of the characteristics subsets, and a Support Vector Machine (SVM) to evaluate the quality of the selected subset. The algorithm receives as input a set of peptides with and without antimicrobial activity, a set X of characteristics and a classi?cation model. The algorithm outputs the descriptor subset with the highest accuracy in the prede?ned classi?cation model. The results show that the best characteristics subset achieved can develop a classi?cation model that predicts the activity correctly over 96% of the tested peptides. This model has an 82.3% accuracy over a set peptides which is unknown to the algorithm
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA