Construcción de un modelo de clasificación de toxicidad en el desarrollo de fármacos basado en deep learning

En este trabajo de tesis se evaluaron diferentes arquitecturas de redes neuronales profundas, configurándolas con diferentes hiperparámetros y características como son: las funciones de activación, cantidad de capas ocultas y nodos. Lo anterior, tiene como objetivo construcción de un modelo de clasi...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: GÉNESIS VIRIDIANA VARELA SALINAS
Weitere Verfasser: Adolfo Josué Rodríguez Rodríguez
Format: Tesis Maestria
Sprache:Español[ 65]
Veröffentlicht: Universidad Autónoma de Tamaulipas 2021
Schlagworte:
Online Zugang:http://riuat.uat.edu.mx/handle/123456789/2277
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:En este trabajo de tesis se evaluaron diferentes arquitecturas de redes neuronales profundas, configurándolas con diferentes hiperparámetros y características como son: las funciones de activación, cantidad de capas ocultas y nodos. Lo anterior, tiene como objetivo construcción de un modelo de clasificación de toxicidad en el desarrollo de fármacos basado en Deep learning, el cual lleva por nombre Modelo_binario. Para la evaluación de este modelo, así como las distintas arquitecturas mencionadas se crearon y utilizaron 4 Conjuntos de datos. Estos conjuntos de datos están conformados con los datos del archivo SMILES del ensayo AhR del programa Tox21 y agregando los descriptores para cada molécula que fueron calculados con la herramienta Pybel, la diferencia en cada conjunto de datos reside en los descriptores seleccionados para cada uno de ellos. En los resultados, el Modelo_binario alimentado con los 16 descriptores de Pybel, demostró una precisión entre 3 % y 5 % más alta y una pérdida del 2% al 5% más baja en comparación a las demás arquitecturas probadas. Por otra parte, también se encontró que al emplear la función Adam como optimizador se evitó el problema de desvanecimiento de la gradiente que presentó el optimizador SGD en las arquitecturas probadas. En conclusión y de acuerdo con los resultados obtenidos, los datos de entrada en una red neuronal son de suma importancia, ya que la cantidad o selección inadecuada de las características afecta el rendimiento del modelo. Por lo anterior, la selección de una gran cantidad de descriptores, así como características en una red neuronal; no está ligado a una buena predicción. En cuanto a la cantidad de nodos y funciones de optimización que se utilizarán en un modelo de Deep learning, estas deben ajustarse al trabajo y tipo de modelo ya que fácilmente se puede caer en un sobreajuste o subajuste.