Diagnóstico de Dolor en la Fosa Ilíaca Derecha. Una Nueva Puntuación Diagnóstica Basada en Métodos de Árbol de Decisión y Redes Neuronales Artificiales/Cirugía Española

El objetivo de nuestro estudio es utilizar los datos de los servicios de urgencias para desarrollar un diagnóstico diferencial para el dolor RIF basado en la metodología de árbol de clasificación. También compararemos este modelo con las puntuaciones clásicas y la puntuación generada por una red neuronal artificial (RNA) para ayudar en el diagnóstico de AA y otros procesos abdominales.

Método

Estudio observacional prospectivo de un período de 18 meses (entre el 1 de julio de 2015 y el 31 de diciembre de 2016) realizado en la sala de emergencias de un hospital de segundo nivel con 450 camas hospitalarias y 93.000 visitas anuales a la sala de emergencias.

Los pacientes dieron su consentimiento informado firmado y el estudio fue aprobado por el Comité de Ética en Investigación Clínica (CEIC) del hospital.

Se incluyeron pacientes mayores de 14 años con más de 6h de evolución del dolor en el RIF. Se excluyeron los pacientes con apendicectomías previas y los que se perdieron en el seguimiento.

Una vez establecido el diagnóstico de dolor en el RIF, se recogieron las siguientes variables: edad, sexo, cirugía abdominal previa, índice de masa corporal (IMC), tiempo de evolución de los síntomas en horas, toma previa de analgesia y temperatura corporal.

Se recogieron las variables clínicas incluidas en los modelos clásicos: dolor previo similar, signo de Blumberg (positivo o no), migración del dolor, aumento del dolor con tos, aumento del dolor con movilización, náuseas/vómitos, anorexia, diarrea y estreñimiento. Datos analíticos incluidos: número de leucocitos (número de células×109), porcentaje de neutrófilos ( % ) y niveles séricos de PCR (mg/dL). El método analítico utilizado fue el método estándar de laboratorio hospitalario. Durante el seguimiento, los datos registrados incluyeron si el paciente estaba hospitalizado, si se realizó la cirugía y el diagnóstico al final del episodio. Se establecieron cuatro grupos diagnósticos: dolor inespecífico de RIF (NsP) cuando se remitieron los síntomas y el paciente fue dado de alta a domicilio; AA cuando se operó al paciente y la anatomía patológica fue concordante; dolor abdominal en el RIF sin inflamación (NIRIF) y dolor abdominal en el RIF con inflamación (IRIF). La inflamación se definió como la existencia de 2 o más síntomas clínicos de los siguientes, además del dolor en RIF: temperatura >38°C o

°C, frecuencia cardíaca >90 bpm, frecuencia respiratoria superior a 20 respiraciones por minuto o pCO2 mmHg, leucocitos sanguíneos >12000/mL o

Se calcularon los valores para los algoritmos Alvarado,4 AIR6 y Fenyö-Lindberg5.

Análisis Estadístico

Las variables se expresan como media y desviación estándar o como porcentaje. Para la comparación entre grupos (4 categorías) se utilizó la prueba Chi-cuadrado para las variables cualitativas y la prueba no paramétrica de Kruskal–Wallis para las variables continuas. Un valor P

El modelo de árbol de clasificación se creó utilizando el módulo AnswerTree del programa SPSS® (versión 20.0). Se utilizó la opción de Detección Automática de Interacción Chi-Cuadrado (CHAID) con un criterio de parada limitado a un número mínimo de 15 pacientes por nodo terminal.8

El modelo ANN se implementó utilizando el programa Alyuda® (Neurointelligence) que incorpora la metodología Perceptrón multicapa con backpropagation.9

La estrategia para incorporar variables en los modelos fue el tipo de «modelo completo» (inclusión de todas las variables candidatas); ambos modelos tienen capacidad de selección automática de variables de acuerdo con la significación o jerarquía. La validación interna de los dos modelos se realizó mediante validación cruzada (10 particiones). La capacidad discriminatoria de los modelos se determinó calculando el área bajo la curva ROC y los porcentajes de clasificación correcta (PCC).10

Resultados

295 pacientes presentaron dolor en el RIF, y se excluyeron 43: 15 con apendicectomía previa, 5 con menos de 6h de síntomas progresivos y 23 por falta de seguimiento. El grupo de estudio final estuvo compuesto por 252 pacientes (Fig. 1).

De este total, 121 pacientes ingresaron en el hospital, de los cuales 107 fueron tratados quirúrgicamente. Los casos se definieron por grupos diagnósticos: 114 casos de NsP, 93 AA, 30 NIRIF y 15 IRIF. Los diagnósticos incluidos en la clasificación de NIRIF fueron: 11 casos de infecciones del tracto urinario, 7 cólicos renales, 5 gastroenteritis aguda, 2 obstrucción intestinal parcial, un quiste ovárico y 4 «otros diagnósticos». Los diagnósticos incluidos en el grupo IRIF fueron: 5 casos de enfermedad inflamatoria pélvica, 4 pielonefritis aguda, 2 abscesos tubováricos, 2 diverticulitis aguda, una colecistitis aguda y una enfermedad inflamatoria intestinal.

En la Tabla 1 se muestran las características clínicas de los pacientes incluidos en los 4 grupos diagnósticos. En general, los pacientes son jóvenes y no hay diferencias según el sexo.

En la Tabla 2 se muestran las variables analíticas y las puntuaciones de los modelos clásicos estudiados. Si calculamos las curvas ROC (AUC) de las puntuaciones para el diagnóstico único de AA en comparación con los 3 diagnósticos restantes, obtenemos 0,82 (0,76–0,87) para la puntuación de Alvarado, 0,83 (0,77–0,88) para el AIRE y 0,88 (0,84–0,92) para Fenyö-Lindberg.

la Tabla 2.

Características Analíticas y Puntuaciones de Alvarado, AIR y Fenyö-Lindberg por Grupos Diagnósticos (n = 252).

	All(n=252)	NsP(n=114)	AA(n=93)	NIRIF(n=30)	IRIF(n=15)
Leucocytes (109/l)	12±5	10±4	16±4	10±4	14±4
Percentage of neutrophils	75±12	69±13	82±7	72±13	78±7
CRP (mg/L)	60±54	25±15	98±78	38±23	129±81
Alvarado	5±2	4±2	6±1	4±2	6±1
AIR	6±2	5±2	7±1	5±2	7±1
Fenyö-Lindberg	7±30	−9±25	31±18	−14±27	19±17

AA: apendicitis aguda; AIRE: Apendicitis Respuesta inflamatoria; IRIF: dolor RIF con inflamación; NIRIF: dolor RIF sin inflamación; NsP: dolor RIF inespecífico; PCR: proteína C reactiva.Valores

como media±DE.

la Comparación entre grupos con la prueba de Kruskal–Wallis.

CHAID Modelo de Árbol de Clasificación

El CHAID modelo seleccionado 6 variables: número de leucocitos, PCR, tos dolorosa, signo de Blumberg, sexo y tiempo de evolución.

La jerarquía de variables, seleccionadas automáticamente, se muestra en la Fig. 2. La primera es el número de leucocitos y, según el punto de corte (también determinado automáticamente), se incorporan las siguientes variables. El modelo determina 10 reglas de toma de decisiones que son los nodos finales.

Fig. 2.

Árbol de decisión CHAID con 10 reglas de decisión-nodos finales.

(0.63 MB).

Los nodos finales (Fig. 2) se puede clasificar en 3 categorías. Los nodos 10, 11 y 13 muestran una clasificación clara para el grupo diagnóstico de NsP, los nodos 7, 14 y 17 para el diagnóstico de AA, y los nodos 5, 12, 15 y 16 con una clasificación menos clara (incluye los diagnósticos de NIRIF e IRIF), que pueden considerarse especiales. Por ejemplo, estos grupos especiales requerían más ecografías en comparación con los grupos con una clasificación más clara (41,6 vs.21,1; P

.01).Modelo de Red Neuronal Artificial

El modelo de ANN generado que se genera automáticamente selecciona 10 variables: signo de Blumberg, migración del dolor, aumento del dolor, aumento del dolor con el movimiento, dolor al toser, anorexia, temperatura, número de leucocitos, horas de evolución y niveles de PCR. La arquitectura que se crea automáticamente se compone de una capa de entrada (con las 10 variables seleccionadas), una capa oculta con 12 nodos y una capa de salida con la posibilidad de los 4 grupos de diagnóstico. El modelo asigna a cada paciente (registro) un grupo de diagnóstico de las 4 probabilidades diagnósticas posibles. El modelo ANN también determina que la variable con mayor peso es el número de leucocitos.

La tabla 3 compara el modelo ANN y el árbol de clasificación CHAID. No se observan diferencias significativas entre los porcentajes de CCP ni en las curvas ROC calculadas.

Discusión

Este estudio se comparó con otros estudios publicados en la literatura sobre el dolor en el RIF (Tabla 4). Se revisaron los tamaños de muestra y se observó una variabilidad notable (la mayoría osciló entre 139 y 545 pacientes, siendo el mayor de ellos 941 pacientes).19

la Tabla 4.

Comparación Descriptiva de Nuestro Estudio Con Otros Artículos Publicados Sobre Dolor RIF.

Name of Study	YearPlace	N	DesignService	Methodology	Population	Utility
Alvarado4	1986USA	305	RSurgery	DEV Alvarado	SUSP AAHOSP	DIAG AA
Fenyö-Lindberg4	1997Sweden	1,167	PSurgery	DEV Fenyö-Lindberg	SUSP AAHOSP	DIAG AA
Fenyö-Lindberg11	2004Sweden	455	PSurgery	VAL Fenyö-LindbergFemales	SUSP AAFemales-HOSP	DIAG AASurgery
Tzanakis et al.12	2005Greece	504	PSurgery and radiology	DEV ScoreVAL Alvarado	SUSP AAHOSP	DIAG AAUltrasound
Rennie et al.13	2006Great Britain	300	PSurgery	Study in females	SUSP AAFemales-HOSP	DIAG AA
Antevil et al.14	2006USA	383609	P-RSurgery	VAL CT	SUSP AAHOSP	DIAG AACT
Andersson et al.6	2008Switzerland	545	PSurgery	AlvaradoDEV Score LR	SUSP AAHOSP	DIAG AA
McCartan et al.15	2010Ireland	302	PSurgery	Review AA	SUSP AAHOSP	DIAG AA
Lintula et al.16	2010Finland	181	PSurgery	VAL ScorePediatrics	SUSP AAHOSP	DIAG AA
Poletti et al.17	2011Switzerland	183	PRadiology	VAL ULT/CT	SUSP AAHOSP	DIAG AAULTG-CT
Chong et al.18	2011Singapore	192	PSurgeryEmergency	VAL RIPASAEmergency	Dolor RIFHOSP	DIAG AA
De Castro et al.19	2012Holland	941	PEmergency	VAL Score	SUSP AAHOSP	DIAG AA
Gudelis et al.	2018Spain	252	PEmergency	DEV Score	Dolor RIFER	DIAG dolor RIF

AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: ultrasonido; RIF: fosa ilíaca derecha; HOSP: pacientes hospitalizados; P: prospectivo; R: retrospectivo; LR: modelo de regresión logística; SUSP AA: sospecha de AA; TC: tomografía computarizada; ER: sala de emergencias; VAL: validación.

Uno de los aportes de nuestro estudio es el uso de 4 grupos de clasificación. En nuestra serie, el grupo más numeroso de pacientes fue el NsP. En los estudios que se llevaron a cabo con pacientes más seleccionados (después de haber pasado por un ‘filtro’ inicial en la sala de Emergencias), este grupo fue más reducido.13,14

El grupo de AA incluyó a todos los pacientes ingresados en el servicio de cirugía y tratados quirúrgicamente por sospecha de AA, cuyo diagnóstico fue confirmado por patología anatómica. El porcentaje de estos pacientes varió según los criterios de inclusión de los diferentes estudios publicados.17

En nuestro estudio, el diagnóstico de AA fue determinado por la patología anatómica. Si consideramos a los pacientes con sospecha de AA sometidos a cirugía, encontramos que solo 6 (5,7%) pacientes no presentaban un diagnóstico anatómico patológico de AA (3 con diagnóstico final de NsP y 3 IRIF). Este porcentaje (5,7%) de apendicectomías negativas es menor que los informes de otras series que oscilan entre el 10% y el 23%.7,11,15

Creemos que el uso de otras dos categorías de diagnóstico NIRIF e IRIF proporciona una visión más amplia del problema y una clasificación que se comporta de manera diferente para determinar un diagnóstico (se necesitarán más pruebas de imagen), así como tratamiento y pronóstico.

La principal ventaja del modelo basado en árboles de clasificación, que en nuestro caso es el tipo CHAID, es que el modelo es fácil de interpretar. Las reglas de clasificación que se generan incluyen a todos los posibles pacientes y aspectos de los diferentes subgrupos, como la edad y el sexo.20,21

El modelo CHAID ha detectado que la variable más importante es el número de leucocitos (coincidiendo con el modelo ANN). El CHAID también incluye el nivel CRP en la segunda línea. También es interesante observar que la variable clínica incluida es el dolor al toser. Durante el examen clínico, este dolor no depende del explorador, sino de una maniobra lejos del examen abdominal directo. Las 10 reglas de clasificación generadas se han agrupado de acuerdo con la principal posibilidad diagnóstica. Se pueden encontrar reglas más claras para el diagnóstico de NsP y AA (que llamamos ‘especiales’) donde el diagnóstico diferencial alcanza una mayor prominencia ya que los grupos NIRIF e IRIF están más presentes.

Otras series se han publicado utilizando diferentes metodologías de árbol de clasificación, como CART, pero solo diferenciaron entre AA y no AA. También se han realizado modelos con variables clínicas y analíticas,22 utilizando la combinación con Alvarado23 y añadiendo pruebas de imagen.24

El modelo ANN utilizado alcanza valores aceptables de capacidad de discriminación. La desventaja de este modelo es que funciona como una «caja negra» y no se puede interpretar de manera sencilla para uso clínico, ya que consta de 480 parámetros (10×12×4) que incluyen todas las interacciones entre las variables de entrada, las de la capa oculta y las de los nodos de salida. Un ordenador es necesario para su uso, y funciona como un modelo comparativo. El ANN utiliza todas las interconexiones de las variables utilizadas y no es más preciso que el modelo basado en CHAID. Otros estudios han utilizado la RNA para el diagnóstico de AA (centrándose solo en AA y no AA).25

Este estudio también tiene varias limitaciones. La principal es la asignación de los grupos. Estos son grupos que no han sido validados por la literatura, y el AA se considera un proceso inflamatorio. Sería interesante tener una muestra de mayor tamaño, especialmente en los grupos de diagnóstico de NIRIF e IRIF. En defensa del estudio, creemos que los modelos que solo comparan AA frente a otras afecciones tienen menos capacidad para ser utilizados en el manejo real del paciente.

En conclusión, creemos que los profesionales que tratan a pacientes con dolor RIF pueden beneficiarse de modelos que son fáciles de interpretar y proporcionan una clasificación con más de dos posibilidades (AA vs.no AA). El modelo CHAID generado ha logrado este objetivo, aunque debe ser validado en otras series más grandes.

Financiación

No se recibió financiación para la realización de este estudio.

Conflicto de intereses

No tenemos ningún conflicto de intereses que declarar.

Maybaygiare.org

Maybaygiare.org

Diagnóstico de Dolor en la Fosa Ilíaca Derecha. Una Nueva Puntuación Diagnóstica Basada en Métodos de Árbol de Decisión y Redes Neuronales Artificiales/Cirugía Española

Deja una respuesta Cancelar la respuesta