Minería de Patrones Secuenciales aplicada a la Predicción del Plegamiento de Proteínas

dc.contributor.authorQuintana-Zaez, Julio
dc.contributor.authorVelarde-Bedregal, Hector R.
dc.contributor.authorCalderón-Ruiz, Guillermo E.
dc.contributor.authorSantisteban-Toca, Cosme E.
dc.date.accessioned2019-08-17T03:07:59Z
dc.date.accessioned2022-02-22T12:03:35Z
dc.date.available2019-08-17T03:07:59Z
dc.date.available2022-02-22T12:03:35Z
dc.date.issued2019-07
dc.description.abstractLa minería de secuencias consiste en encontrar patrones estadísticamente relevantes en colecciones de datos representados de forma secuencial. Éstos, son un importante tipo de datos, donde importa el orden que ocupan los elementos en el conjunto y que encuentra una amplia gama de aplicaciones en la Bioinformática y la Biología Computacional. La predicción de estructuras de proteínas es una de estas aplicaciones. Donde, una proteína no es más que una secuencia de aminoácidos formando patrones conocidos como hélices alfa, láminas beta y giros. Para efectos de nuestra investigación, estas colecciones o estructuras secundarias serían los itemsets, mientras que los aminoácidos que conforman la totalidad de la secuencia, los ítems. A pesar de múltiples intentos por predecir plegamiento de las proteínas, los algoritmos desarrollados a la actualidad solo alcanzan un 35% de efectividad. Es por ello que proponemos SPMCcm, un algoritmo basado en la predicción de secuencias frecuentes y un esquema de clasificadores. El cual emplea la información brindada por la secuencia de aminoácidos, en dos etapas. Dónde, la primera etapa aprende de las interacciones entre las estructuras secundarias de las proteínas, las cuales extrae como secuencias frecuentes o itemsets. Mientras, que la segunda etapa aprende de la interacción entre los aminoácidos presentes en las estructuras interactuantes o ítems. La evaluación experimental demostró que SPMCcm se comporta de forma similar, con independencia del clasificador base empleado, alcanzando precisiones en la predicción de hasta un 48%, superiores al 35% reportado por la literatura, sin emplear grandes recursos computacionales y posee capacidad explicativa.en_US
dc.description.countryCubaen
dc.description.institutionUniversidad de Ciego de Ávilaen
dc.description.trackSoftware Engineering, Telecommunications, Cybersecurity and Computational toolsen
dc.identifier.isbn978-958-52071-4-1
dc.identifier.issn2414-6390
dc.identifier.otherhttp://laccei.org/LACCEI2019-MontegoBay/meta/FP37.html
dc.identifier.urihttp://dx.doi.org/10.18687/LACCEI2019.1.1.37
dc.identifier.urihttps://axces.info/handle/10.18687/20190101_37
dc.journal.referatopeerReview
dc.language.isoEnglishen_US
dc.publisherLACCEI, Inc.en_US
dc.rightsLACCEI License
dc.rights.urihttps://laccei.org/blog/copyright-laccei-papers/
dc.subjectMinería de patrones secuencialesen_US
dc.subjectPlegamiento de proteínasen_US
dc.subjectMapas de contacto{en_US
dc.subjectEsquemas de clasificación.en_US
dc.titleMinería de Patrones Secuenciales aplicada a la Predicción del Plegamiento de Proteínas
dc.typeArticleen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
FP37.pdf
Size:
430.38 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
64 B
Format:
Plain Text
Description: