Diagnóstico de cáncer pulmonar a través de un análisis cuantitativo de imágenes de tomografía computarizada.
Loading...
Date
2020
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El trabajo realizado consistió en el desarrollo de un código computacional capaz
de encontrar diferencias estadísticamente significativas entre imágenes de tomografía
computacional en poblaciones de pacientes con nódulos pulmonares benignos y malignos,
obtenidos del repositorio abierto TCIA [2]. Los features utilizados para diferenciar las
poblaciones consistieron en features morfológicos tridimensionales, features de primer
orden y basados en matriz de co-ocurrencia del nivel de gris (GLCM). Estos features se
obtuvieron con el software MITK [3] luego de segmentar el nódulo pulmonar mediante
Region growing en la misma plataforma. Con los features que mostraron diferencias
entre ambas poblaciones se construyeron modelos univariados de Machine Learning con
los algoritmos Regresión logística (LR), Vecinos cercanos (KNN), Arbol de decisión ´
(DT), Máquinas de soporte vectorial (SVM) y Naive Bayes (NB) para predecir la
clasificación de los nódulos pulmonares, eliminando aquellos features correlacionados que
tenían un bajo rendimiento. Se evaluó la métrica F1 para analizar el desempeño de los
modelos, utilizando validación cruzada con k = 5 repetida 20 veces. Se realizó también
un modelo multivariado buscando la combinación de features que tiene la menor razón
de falsos negativos, encontrando como resultado los features Promedio, Disimilitud,
Compacticidad y Correlación con el algoritmo NB, obteniéndose un FNR = 0.307 ±
0.036 y AUC = 0.678 ± 0.025. Este conjunto de features están en concordancia con
relaciones previamente encontradas [4,5] y con características que el profesional médico
observa comúnmente en imágenes de tomografía computarizada.
Description
Tesis (Magíster en Física Médica)--Pontificia Universidad Católica de Chile, 2020