Construcción de un modelo de clasificación de toxicidad en el desarrollo de fármacos basado en deep learning

En este trabajo de tesis se evaluaron diferentes arquitecturas de redes neuronales profundas, configurándolas con diferentes hiperparámetros y características como son: las funciones de activación, cantidad de capas ocultas y nodos. Lo anterior, tiene como objetivo construcción de un modelo de clasi...

Full description

Saved in:
Bibliographic Details
Main Author: GÉNESIS VIRIDIANA VARELA SALINAS
Other Authors: Adolfo Josué Rodríguez Rodríguez
Format: Tesis Maestria
Language:Español[ 65]
Published: Universidad Autónoma de Tamaulipas 2021
Subjects:
Online Access:http://riuat.uat.edu.mx/handle/123456789/2277
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:En este trabajo de tesis se evaluaron diferentes arquitecturas de redes neuronales profundas, configurándolas con diferentes hiperparámetros y características como son: las funciones de activación, cantidad de capas ocultas y nodos. Lo anterior, tiene como objetivo construcción de un modelo de clasificación de toxicidad en el desarrollo de fármacos basado en Deep learning, el cual lleva por nombre Modelo_binario. Para la evaluación de este modelo, así como las distintas arquitecturas mencionadas se crearon y utilizaron 4 Conjuntos de datos. Estos conjuntos de datos están conformados con los datos del archivo SMILES del ensayo AhR del programa Tox21 y agregando los descriptores para cada molécula que fueron calculados con la herramienta Pybel, la diferencia en cada conjunto de datos reside en los descriptores seleccionados para cada uno de ellos. En los resultados, el Modelo_binario alimentado con los 16 descriptores de Pybel, demostró una precisión entre 3 % y 5 % más alta y una pérdida del 2% al 5% más baja en comparación a las demás arquitecturas probadas. Por otra parte, también se encontró que al emplear la función Adam como optimizador se evitó el problema de desvanecimiento de la gradiente que presentó el optimizador SGD en las arquitecturas probadas. En conclusión y de acuerdo con los resultados obtenidos, los datos de entrada en una red neuronal son de suma importancia, ya que la cantidad o selección inadecuada de las características afecta el rendimiento del modelo. Por lo anterior, la selección de una gran cantidad de descriptores, así como características en una red neuronal; no está ligado a una buena predicción. En cuanto a la cantidad de nodos y funciones de optimización que se utilizarán en un modelo de Deep learning, estas deben ajustarse al trabajo y tipo de modelo ya que fácilmente se puede caer en un sobreajuste o subajuste.