Comparación de tres modelos de predicción para predecir la enfermedad pulmonar obstructiva crónica en China

by | Dic 30, 2023 | 0 comments

Yuhan Teng,1 Yining Jian,2 Xin Yue Chen,3 Yang Li,4 Bing Han,2 Lei Wang3

1Departamento de Medicina Clínica, Universidad Médica del Suroeste, Luzhou, Sichuan, República Popular China; 2Departamento de Salud Pública, Universidad Médica de China, Shenyang, Liaoning, República Popular China; 3Departamento de Medicina General, Primer Hospital de la Universidad Médica de China, Shenyang, Liaoning, República Popular China; 4Departamento de Medicina General, Centro de Servicios de Salud Comunitarios Hunnan Zhujia, Shenyang, Liaoning, República Popular China

Correspondencia: Lei Wang, Departamento de Medicina General, Primer Hospital de la Universidad Médica de China, 122 N Nanjing St., Distrito de Heping, Shenyang, 110001, República Popular de China, Fax +86-24-83283333, Correo electrónico [email protected]

Objetivo: Predecir el número futuro de pacientes con enfermedad pulmonar obstructiva crónica (EPOC) en China y comparar los tres modelos de predicción.
Métodos: Se utilizaron un modelo aditivo generalizado (GAM), un modelo de media móvil integrada autorregresiva (ARIMA) y un método de ajuste de curvas para ajustar y predecir el número de pacientes con EPOC en China. Los datos sobre el número de pacientes con EPOC en China entre 1990 y 2019 se obtuvieron de la base de datos Global Burden of Disease (GBD). El coeficiente de determinación (R2), error absoluto medio (MAE), error porcentual absoluto medio (MAPE), error cuadrático medio (RMSE), error relativo de predicción, criterio de información de Akaike (AIC) y criterio de información bayesiano (BIC) se utilizaron para evaluar y comparar. el efecto de ajuste, el efecto de predicción y la confiabilidad de los tres modelos.
Resultados: Los métodos GAM, ARIMA y de ajuste de curvas podrían predecir las tendencias futuras de la EPOC en China. El rendimiento del GAM es el mejor entre los tres modelos, mientras que el método de ajuste de curvas es el peor y el modelo ARIMA (0,1,2) está en el medio. Los resultados de predicción de los tres modelos mostraron que se espera que el número de pacientes con EPOC en China aumente de 2020 a 2025.
Conclusión: Se recomiendan los modelos GAM y AIRMA para predecir la prevalencia futura de la EPOC en China. Se espera que el número de pacientes con EPOC en China aumente en los próximos años. Aún es necesario fortalecer la prevención y el control de la EPOC en China. El uso de modelos apropiados para predecir tendencias futuras en la EPOC brindará apoyo a los responsables de las políticas de salud.

Palabras clave: modelo aditivo generalizado, modelo ARIMA, método de ajuste de curvas, EPOC, predicción

Introducción

La enfermedad pulmonar obstructiva crónica (EPOC) es una enfermedad común, prevenible y tratable que generalmente es causada por una exposición significativa a partículas o gases nocivos.1 La EPOC es una afección pulmonar heterogénea caracterizada por síntomas respiratorios crónicos (disnea, tos, producción de esputo) debido a anomalías de las vías respiratorias (bronquitis, bronquiolitis) y/o alvéolos (enfisema) que causan una obstrucción persistente, a menudo progresiva, del flujo de aire.2 La EPOC es un problema de salud mundial que supone una pesada carga para el mundo. Desde 1990 hasta 2019, el número de pacientes con EPOC aumentó de 115 millones a 212 millones en todo el mundo.3 En China, el número de pacientes con EPOC aumentó de 28 millones en 1990 a 45 millones en 2019.3 Además, la EPOC es una de las principales causas de mortalidad en todo el mundo. En 2017, el número total de muertes por EPOC fue de aproximadamente 3,2 millones en todo el mundo, y la tasa de mortalidad estandarizada por edad fue de 42,2 por 100.000, ocupando el tercer lugar en el mundo.4 En China, con más de un millón en 2019.5 La prevención y el control de la EPOC se han convertido en un desafío importante para el mundo y China. Por lo tanto, predecir la prevalencia de la EPOC y el número de pacientes con EPOC en el futuro proporcionará datos de apoyo a los responsables de la toma de decisiones en materia de salud.

Se han utilizado varios métodos para predecir tendencias futuras de enfermedades epidemiológicas. Por ejemplo, se utilizó el modelo aditivo generalizado (GAM) para predecir la incidencia del cáncer de pulmón entre mujeres de 25 a 84 años en cinco países, incluidos Estados Unidos, Reino Unido y Australia.6 En China, se utilizó el modelo de media móvil integrada autorregresiva (ARIMA) para predecir el número de pacientes y las tendencias de prevalencia de diabetes y enfermedad renal crónica.7,8 Un estudio utilizó el método de ajuste de curvas y la memoria a corto plazo (LSTM) para predecir el número de casos de enfermedad por virus corona 2019 (COVID-19) en la India.9 Sin embargo, el número de estudios existentes sobre la predicción de la tendencia futura de la EPOC es pequeño y pocos estudios han comparado la precisión de los métodos de predicción de la EPOC.

En este estudio, utilizamos el modelo GAM, ARIMA y el método de ajuste de curvas para predecir el número de pacientes con EPOC en China de 2020 a 2025, y comparamos los efectos de ajuste y predicción de los tres modelos. Se utilizó el número de pacientes con EPOC en China entre 1990 y 2018 para ajustar los modelos y el número de pacientes con EPOC en 2019 para probar los modelos. El objetivo de este estudio fue explorar métodos apropiados para predecir la prevalencia de la EPOC en China, estimar el riesgo futuro y la carga de enfermedad de la EPOC, proporcionar referencias para la prevención y el control de la EPOC en China y proporcionar datos que respalden las decisiones de salud. haciendo que los departamentos inviertan recursos médicos en el tratamiento clínico de la EPOC.

Materiales y métodos

Datos

Los datos sobre el número de pacientes con EPOC en China de 1990 a 2019 se obtuvieron del Global Health Data Exchange (GHDx). Herramienta de resultados del GBD (2023). https://vizhub.healthdata.org/gbd-results/. La base de datos se estableció utilizando Microsoft Excel 2016 y los análisis estadísticos de los datos se realizaron utilizando R 4.2.0.

juego

El modelo aditivo generalizado (GAM) es una extensión del modelo de regresión lineal, que se basa en un modelo lineal generalizado y un modelo aditivo.10 GAM es un modelo de regresión flexible. Sus variables predictoras pueden ser lineales o no lineales y pueden aplicarse a datos con varias distribuciones, incluidas la normal, binomial, gamma y Poisson. GAM predice las tendencias de la enfermedad mediante un ajuste no paramétrico con suposiciones relajadas sobre la relación entre la respuesta y las variables predictivas, y la flexibilidad del GAM para establecer variables predictivas le permite lograr una alta precisión predictiva.11 El GAM tiene la siguiente desigualdad:12

(1)

donde g() es la función de enlace, µ(x)=E(y/x), α es la intersección, f() es una función univariada arbitraria para cada variable predictora, xj Si la variable respuesta yi es independiente de una distribución exponencial de un solo parámetro, la distribución tiene una función de densidad o función de densidad de probabilidad de la siguiente manera:

(2)

donde θi es el parámetro natural de esta distribución exponencial, diferentes yi corresponde a diferentes θi, es el parámetro de molestia o escala, es igual para todos yi, b y C son las funciones utilizadas para determinar el tipo de distribución.

Modelo ARIMA

El modelo de media móvil integrada autorregresiva (ARIMA) es un método común para el análisis y la predicción de series de tiempo que puede predecir valores futuros a partir de valores pasados.13 Por lo tanto, las tendencias futuras de las enfermedades se pueden predecir utilizando el número anterior de personas con una enfermedad.7,8 El modelo ARIMA consta de un modelo autorregresivo (AR), un modelo de media móvil (MA) y un modelo de integración (I), que corresponden a los tres parámetros. pag, q y d respectivamente. El AR (pag) representa el modelo autorregresivo de orden p, que se utiliza para asociar el patrón de un período único con sus períodos anteriores. La maestría (q) representa un modelo de media móvil de orden q que utiliza los errores asociados con el pronóstico en un paso de tiempo anterior para pronosticar una variable en un paso de tiempo posterior. I (d) es el proceso inverso de diferenciación para generar el pronóstico, que se refiere al orden de diferencia que convierte una serie de tiempo no estacionaria en una serie de tiempo estacionaria. La combinación de estos tres componentes produce ARIMA (p, d, q) modelo. El modelo AR generalizado de orden p (ecuación (3)) y el modelo MA de orden q (ecuación (4)) se pueden expresar como

dónde yt es el valor actual de la serie temporal, C es la intersección, (i=1,2… pag) es el parámetro autorregresivo, θi (i=1,2… pag) es el parámetro de media móvil, εt es la serie de ruido blanco con media cero, εt=yt-yt-1. Basado en la ecuación. (3) y la ecuación. (4), obtenemos el modelo ARIMA generalizado, de la siguiente manera:

(5)

dónde es la serie de tiempo estacionaria después de la diferenciación. Uso del operador de marcha atrás Bmetroyt=ytm en Ec. (5), la ARIMA (p, d, q) el modelo se puede expresar como:

(6)

Método de ajuste de curvas

El método de ajuste de curvas es una técnica común para el modelado de datos.14 Es el proceso de transformar la relación observada en un conjunto de datos particular en una función parametrizada y puede usarse para predicción y estimación de parámetros.15 El método de ajuste de curvas construye una curva o función matemática del número de pacientes para predecir las tendencias futuras de la enfermedad ajustando mejor una serie de puntos de datos del número de pacientes en el pasado.dieciséis Los métodos de ajuste de curvas incluyen varias clases, como polinomios, funciones exponenciales, funciones de potencia y funciones logarítmicas.14 Los polinomios son una opción común para el ajuste de curvas y su forma general es la siguiente:

(7)

dónde Ci (i=0,1… norte) es un número real; es el parámetro autorregresivo, que es el parámetro o coeficiente de X, n es el grado del polinomio.

Evaluación del modelo

Las métricas de evaluación del modelo pueden evaluar intuitivamente el rendimiento del modelo. Al comparar las diversas métricas de evaluación de diferentes modelos, podemos comparar intuitivamente el rendimiento de diferentes modelos de predicción en varios aspectos. El modelo de predicción que funcione mejor en todos los aspectos será más fiable a la hora de predecir las tendencias de las enfermedades. Los tres métodos de predicción de este estudio se evaluaron y compararon utilizando métricas de evaluación de modelos comunes. El efecto de ajuste del modelo se evaluó utilizando el coeficiente de determinación (R2), error absoluto medio (MAE), error porcentual absoluto medio (MAPA) y raíz del error cuadrático medio (RMSE). El efecto predictivo del modelo se evaluó utilizando el error relativo de predicción. Criterio de información de Akaike (AIC) y criterio de información bayesiano (BIC) se utilizaron para evaluar la confiabilidad del análisis de series de tiempo. Las ecuaciones para las métricas de evaluación del modelo son las siguientes:

(8)

dónde SSr es la suma de los cuadrados de los residuos, SSt es la suma total de cuadrados, yi es el valor real, Fi es el valor ajustado, es la media de los valores reales. El valor de R2 osciló entre 0 y 1, y los valores más cercanos a 1 indican un mejor ajuste del modelo.

(9)


(10)


(11)

Valores más pequeños de MAE, MAPAy RMSE Los valores indicaron un mejor efecto de ajuste del modelo.

(12)

dónde es el valor predicho. Cuanto menor sea el valor de la error relativo de predicciónmejor será el efecto de predicción del modelo.

(13)


(14)

dónde denota la función de probabilidad, k denota el número total de parámetros del modelo, norte denota el número de observaciones. Valores más pequeños de AIC y BIC Los valores indicaron un modelo más confiable.

Resultados

Evaluación del modelo

El GAM utilizado para predecir el número de pacientes con EPOC se modeló utilizando los años como predictor. Utilizando el número de pacientes con EPOC en China de 1990 a 2019 para ajustar y validar el modelo, encontramos que cuando la dimensión base k= 22, el GAM tuvo el efecto predictivo y de ajuste óptimo. La selección del modelo se basó en el principio de validación cruzada generalizada (GCV). La puntuación del GCV (1.5749e+09) y la desviación explicada (100%) del GAM establecida por año mostraron que el modelo funciona bien.

El modelo ARIMA (0,1,2) se construyó ajustando el número de pacientes con EPOC en China de 1990 a 2018. Después de la primera transformación de diferencias, la serie temporal original cambió de no estacionaria a estacionaria, y la serie temporal diferenciadora pasó la prueba aumentada de Dickey-Fuller (ADF) (valor ADF = −3,8001, P <0,05). El modelo ARIMA (0,1,2) pasó la prueba de ruido blanco (PAG>0,05), lo que indica que se ajusta bien y puede usarse para predecir el número de pacientes con EPOC en el futuro.

Para el…

Truncado en 12000 caracteresTraducido automáticamente
Publicación Original

0 Comments

Submit a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

próximas capacitaciones

No se han encontrado próximas capacitaciones de Fisioterapia Respiratoria.

newsletter de respiratoria