Inference from RDS data over Directed Networks

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El muestreo dirigido por los encuestados (Respondent-Driven Sampling, RDS) es una técnica utilizada para recolectar datos de poblaciones humanas socialmente conectadas que no tienen un marco de muestreo definido. Un paso fundamental para realizar inferencias basadas en el diseño de datos RDS es estimar las probabilidades de muestreo. Tradicionalmente, se ha asumido que una cadena de Markov de primer orden sobre una red completamente conectada y no dirigida representa adecuadamente el RDS. Sin embargo, este modelo simplificado no tiene en cuenta que la red puede ser dirigida y homofílica. Este trabajo propone métodos para abordar estos problemas y estimar la prevalencia de un estado de infección en redes de este tipo.Las principales contribuciones metodológicas de esta tesis son tres: primero, la introducción de un modelo de configuración de red parcialmente dirigida y homofílica; segundo, el desarrollo de dos representaciones matemáticas del proceso de muestreo RDS en el modelo propuesto; y tercero, la propuesta de un modelo bayesiano que considera una red dirigida y el número de conexiones entre nodos infectados y no infectados para estimar la prevalencia del estado de infección.Se realizaron estudios de simulación para demostrar que las probabilidades de muestreo resultantes con nuestras propuestas son similares a las del RDS tradicional, mejorando la estimación de prevalencia bajo diversos escenarios realistas, asumiendo que dichas probabilidades son conocidas. La estimación de la prevalencia del estado de infección se realiza bajo fuertes suposiciones sobre la red, como la ausencia de homofilia o la dirección de los bordes.Para la aplicación del modelo, se utilizó la teoría de copulas, el modelamiento de distribuciones marginales y un modelo de superpoblación para estimar información a partir de datos no observados de la red. Las simulaciones realizadas mostraron una mejora en la estimación de la prevalencia del estado de infección en términos de sesgo y variabilidad utilizando datos de RDS.
Description
Tesis (Doctor in Statistics)--Pontificia Universidad Católica de Chile, 2023.
Keywords
Citation