Browsing by Author "Quintana-Zaez, Julio"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item Minería de Patrones Secuenciales aplicada a la Predicción del Plegamiento de Proteínas(LACCEI, Inc., 2019-07) Quintana-Zaez, Julio; Velarde-Bedregal, Hector R.; Calderón-Ruiz, Guillermo E.; Santisteban-Toca, Cosme E.La minería de secuencias consiste en encontrar patrones estadísticamente relevantes en colecciones de datos representados de forma secuencial. Éstos, son un importante tipo de datos, donde importa el orden que ocupan los elementos en el conjunto y que encuentra una amplia gama de aplicaciones en la Bioinformática y la Biología Computacional. La predicción de estructuras de proteínas es una de estas aplicaciones. Donde, una proteína no es más que una secuencia de aminoácidos formando patrones conocidos como hélices alfa, láminas beta y giros. Para efectos de nuestra investigación, estas colecciones o estructuras secundarias serían los itemsets, mientras que los aminoácidos que conforman la totalidad de la secuencia, los ítems. A pesar de múltiples intentos por predecir plegamiento de las proteínas, los algoritmos desarrollados a la actualidad solo alcanzan un 35% de efectividad. Es por ello que proponemos SPMCcm, un algoritmo basado en la predicción de secuencias frecuentes y un esquema de clasificadores. El cual emplea la información brindada por la secuencia de aminoácidos, en dos etapas. Dónde, la primera etapa aprende de las interacciones entre las estructuras secundarias de las proteínas, las cuales extrae como secuencias frecuentes o itemsets. Mientras, que la segunda etapa aprende de la interacción entre los aminoácidos presentes en las estructuras interactuantes o ítems. La evaluación experimental demostró que SPMCcm se comporta de forma similar, con independencia del clasificador base empleado, alcanzando precisiones en la predicción de hasta un 48%, superiores al 35% reportado por la literatura, sin emplear grandes recursos computacionales y posee capacidad explicativa.