L’obiettivo del nostro studio è quello di utilizzare i dati del dipartimento di emergenza per sviluppare una diagnosi differenziale per il dolore RIF basato sulla metodologia dell’albero di classificazione. Confronteremo anche questo modello con i punteggi classici e il punteggio generato da una rete neurale artificiale (ANN) per aiutare nella diagnosi di AA e altri processi addominali.
Metodo
Studio osservazionale prospettico di un periodo di 18 mesi (tra il 1 luglio 2015 e il 31 dicembre 2016) eseguito nel pronto soccorso (ER) di un ospedale di secondo livello con 450 posti letto ospedalieri e 93.000 visite ER annuali.
I pazienti hanno dato il loro consenso informato firmato e lo studio è stato approvato dal Comitato etico della ricerca clinica (CEIC) presso l’ospedale.
Abbiamo incluso pazienti di età superiore ai 14 anni con più di 6 ore di evoluzione del dolore nel RIF. I pazienti con appendicectomie precedenti e quelli che sono stati persi al follow-up sono stati esclusi.
Una volta stabilita la diagnosi di dolore nel RIF, sono state raccolte le seguenti variabili: età, sesso, precedente intervento chirurgico addominale, indice di massa corporea (BMI), tempo di evoluzione dei sintomi in ore, precedente assunzione di analgesia e temperatura corporea.
Sono state raccolte le variabili cliniche incluse nei modelli classici: dolore precedente simile, segno di Blumberg (positivo o meno), migrazione del dolore, aumento del dolore con tosse, aumento del dolore con mobilizzazione, nausea / vomito, anoressia, diarrea e stitichezza. Dati analitici inclusi: numero di leucociti (numero di cellule×109), percentuale di neutrofili ( % ) e livelli sierici di CRP (mg/dL). Il metodo analitico utilizzato era il metodo standard di laboratorio ospedaliero. Durante il follow-up, i dati registrati includevano se il paziente è stato ricoverato in ospedale, se è stato eseguito un intervento chirurgico e la diagnosi alla fine dell’episodio. Sono stati stabiliti quattro gruppi diagnostici: dolore RIF non specifico (NsP) quando i sintomi sono stati rimessi e il paziente è stato dimesso a casa; AA quando il paziente è stato operato e l’anatomia patologica è stata concordante; dolore addominale nel RIF senza infiammazione (NIRIF) e dolore addominale nel RIF con infiammazione (IRIF). L’infiammazione è stata definita come l’esistenza di 2 o più sintomi clinici dei seguenti, oltre al dolore RIF: temperatura >38°C o
°C, la frequenza cardiaca >90bpm, la frequenza respiratoria maggiore di 20 respiri al minuto o mmHg pCO2, leucociti del sangue >12000/mL
I valori per il Alvarado,4 AIR6 e Fenyö-Lindberg5 algoritmi di calcolo.
Analisi statistica
Le variabili sono espresse come media e deviazione standard o come percentuale. Per il confronto tra gruppi (4 categorie) è stato utilizzato il test Chi-quadrato per le variabili qualitative e il test di Kruskal–Wallis non parametrico per le variabili continue. Un valore P
Il modello ad albero di classificazione è stato creato utilizzando il modulo AnswerTree del programma SPSS® (versione 20.0). L’opzione di rilevamento automatico dell’interazione Chi-Quadrato (CHAID) è stata utilizzata con un criterio di arresto limitato a un numero minimo di pazienti 15 per nodo terminale.8
Il modello ANN è stato implementato utilizzando il programma Alyuda® (Neurointelligence) che incorpora la metodologia Percettron multistrato con backpropagation.9
La strategia per incorporare le variabili nei modelli era il tipo “full model” (inclusione di tutte le variabili candidate); entrambi i modelli hanno capacità di selezione automatica delle variabili in base alla significatività o alla gerarchia. La validazione interna dei due modelli è stata effettuata tramite validazione incrociata (10 partizioni). La capacità discriminatoria dei modelli è stata determinata calcolando l’area sotto la curva ROC e le percentuali di classificazione corretta (PCC).10
Risultati
295 pazienti presentavano dolore nel RIF e 43 erano esclusi: 15 con precedente appendicectomia, 5 con meno di 6 ore di progressione dei sintomi e 23 per mancanza di follow-up. Il gruppo di studio finale era composto da 252 pazienti (Fig. 1).
Di questo totale, 121 pazienti sono stati ricoverati in ospedale, 107 dei quali sono stati trattati chirurgicamente. I casi sono stati definiti da gruppi diagnostici: 114 casi di NsP, 93 AA, 30 NIRIF e 15 IRIF. Le diagnosi incluse nella classificazione NIRIF sono state: 11 casi di infezioni del tratto urinario, 7 coliche renali, 5 gastroenteriti acute, 2 ostruzioni intestinali parziali, una cisti ovarica e 4 “altre diagnosi”. Le diagnosi incluse nel gruppo IRIF erano: 5 casi di malattia infiammatoria pelvica, 4 pielonefrite acuta, 2 ascesso tubo-ovarico, 2 diverticolite acuta, una colecistite acuta e una malattia infiammatoria intestinale.
La tabella 1 mostra le caratteristiche cliniche dei pazienti inclusi nei 4 gruppi diagnostici. In generale, i pazienti sono giovani e non ci sono differenze in base al sesso.
La tabella 2 mostra le variabili analitiche e i punteggi dei modelli classici studiati. Se calcoliamo le curve ROC (AUC) dei punteggi per la singola diagnosi di AA rispetto alle 3 diagnosi rimanenti, otteniamo 0,82 (0,76–0,87) per il punteggio Alvarado, 0,83 (0,77–0,88) per AIR e 0,88 (0,84–0,92) per Fenyö-Lindberg.
Caratteristiche analitiche e punteggi di Alvarado, AIR e Fenyö-Lindberg per gruppi diagnostici (n=252).
All(n=252) | NsP(n=114) | AA(n=93) | NIRIF(n=30) | IRIF(n=15) | P Valuea | |
---|---|---|---|---|---|---|
Leucocytes (109/l) | 12±5 | 10±4 | 16±4 | 10±4 | 14±4 | |
Percentage of neutrophils | 75±12 | 69±13 | 82±7 | 72±13 | 78±7 | |
CRP (mg/L) | 60±54 | 25±15 | 98±78 | 38±23 | 129±81 | |
Alvarado | 5±2 | 4±2 | 6±1 | 4±2 | 6±1 | |
AIR | 6±2 | 5±2 | 7±1 | 5±2 | 7±1 | |
Fenyö-Lindberg | 7±30 | −9±25 | 31±18 | −14±27 | 19±17 |
AA: appendicite acuta; AIR: Appendicite Risposta infiammatoria; IRIF: dolore RIF con infiammazione; NIRIF: dolore RIF senza infiammazione; NsP: dolore RIF aspecifico; CRP: proteina C-reattiva.
Valori come media±SD.
Confronto tra gruppi con il test Kruskal–Wallis.
Modello ad albero di classificazione CHAID
Il modello CHAID ha selezionato 6 variabili: numero di leucociti, CRP, tosse dolorosa, segno di Blumberg, sesso e tempo di evoluzione.
La gerarchia delle variabili, selezionata automaticamente, è mostrata in Fig. 2. Il primo è il numero di leucociti e, in base al punto di cut-off (determinato anche automaticamente), vengono incorporate le seguenti variabili. Il modello determina 10 regole decisionali che sono i nodi finali.
CHAID albero decisione con 10 reglas de decisión-nodos finales.
I nodi finali (Fig. 2) può essere classificato in 3 categorie. I nodi 10, 11 e 13 mostrano una chiara classificazione per il gruppo diagnostico NsP, i nodi 7, 14 e 17 per la diagnosi AA e i nodi 5, 12, 15 e 16 con una classificazione meno chiara (include le diagnosi NIRIF e IRIF), che possono essere considerati speciali. Ad esempio, questi gruppi speciali richiedevano più ultrasuoni rispetto ai gruppi con classificazione più chiara (41.6 vs. 21.1; P
.01).Modello di rete neurale artificiale
Il modello ANN generato che viene generato seleziona automaticamente 10 variabili: segno di Blumberg, migrazione del dolore, aumento del dolore, aumento del dolore con il movimento, dolore quando si tossisce, anoressia, temperatura, numero di leucociti, ore di evoluzione e livelli di CRP. L’architettura che viene creata automaticamente è composta da un livello di input (con le 10 variabili selezionate), un livello nascosto con 12 nodi e un livello di output con la possibilità dei 4 gruppi diagnostici. Il modello assegna per ogni paziente (registro) un gruppo diagnostico delle 4 possibili probabilità diagnostiche. Il modello ANN determina anche che la variabile con il maggior peso è il numero di leucociti.
La tabella 3 confronta il modello ANN e l’albero di classificazione CHAID. Non si osservano differenze significative tra le percentuali PCC o nelle curve ROC calcolate.
Discussione
Questo studio è stato confrontato con altri studi pubblicati in letteratura sul dolore nel RIF (Tabella 4). Le dimensioni del campione sono state riviste e hanno mostrato una notevole variabilità (la maggior parte variava tra 139 e 545 pazienti, il più grande era di 941 pazienti).19
Confronto descrittivo del nostro studio con altri articoli pubblicati sul dolore RIF.
Name of Study | YearPlace | N | DesignService | Methodology | Population | Utility |
---|---|---|---|---|---|---|
Alvarado4 | 1986USA | 305 | RSurgery | DEV Alvarado | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg4 | 1997Sweden | 1,167 | PSurgery | DEV Fenyö-Lindberg | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg11 | 2004Sweden | 455 | PSurgery | VAL Fenyö-LindbergFemales | SUSP AAFemales-HOSP | DIAG AASurgery |
Tzanakis et al.12 | 2005Greece | 504 | PSurgery and radiology | DEV ScoreVAL Alvarado | SUSP AAHOSP | DIAG AAUltrasound |
Rennie et al.13 | 2006Great Britain | 300 | PSurgery | Study in females | SUSP AAFemales-HOSP | DIAG AA |
Antevil et al.14 | 2006USA | 383609 | P-RSurgery | VAL CT | SUSP AAHOSP | DIAG AACT |
Andersson et al.6 | 2008Switzerland | 545 | PSurgery | AlvaradoDEV Score LR | SUSP AAHOSP | DIAG AA |
McCartan et al.15 | 2010Ireland | 302 | PSurgery | Review AA | SUSP AAHOSP | DIAG AA |
Lintula et al.16 | 2010Finland | 181 | PSurgery | VAL ScorePediatrics | SUSP AAHOSP | DIAG AA |
Poletti et al.17 | 2011Switzerland | 183 | PRadiology | VAL ULT/CT | SUSP AAHOSP | DIAG AAULTG-CT |
Chong et al.18 | 2011Singapore | 192 | PSurgeryEmergency | VAL RIPASAEmergency | Dolor RIFHOSP | DIAG AA |
De Castro et al.19 | 2012Holland | 941 | PEmergency | VAL Score | SUSP AAHOSP | DIAG AA |
Gudelis et al. | 2018Spain | 252 | PEmergency | DEV Score | Dolor RIFER | DIAG dolor RIF |
AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: ultrasuoni; RIF: fossa rightaca destra; HOSP: pazienti ricoverati; P: prospettico; R: retrospettivo; LR: modello di regressione logistica; SUSP AA: sospetto AA; CT: tomografia computerizzata; ER: pronto soccorso; VAL: validazione.
Uno dei contributi del nostro studio è l’uso di 4 gruppi di classificazione. Nella nostra serie, il più grande gruppo di pazienti era il gruppo NsP. Negli studi che sono stati condotti con pazienti più selezionati (dopo essere passati attraverso un “filtro” iniziale nel pronto soccorso), questo gruppo è stato più ridotto.13,14
Il gruppo AA comprendeva tutti i pazienti che sono stati ricoverati nel reparto di chirurgia e trattati chirurgicamente per sospetta AA, la cui diagnosi è stata confermata da patologia anatomica. La percentuale di questi pazienti variava in base ai criteri di inclusione dei diversi studi pubblicati.17
Nel nostro studio, la diagnosi AA è stata determinata dalla patologia anatomica. Se abbiamo considerato pazienti con sospetta AA sottoposti a intervento chirurgico, abbiamo scoperto che solo 6 (5,7%) pazienti non presentavano una diagnosi di patologia anatomica di AA (3 con diagnosi finale di NsP e 3 IRIF). Questa percentuale (5,7%) di appendicectomie negative è inferiore alle segnalazioni di altre serie comprese tra il 10% e il 23%.7,11,15
Riteniamo che l’uso di altre due categorie diagnostiche NIRIF e IRIF fornisca una visione più ampia del problema e una classificazione che si comporta in modo diverso per determinare una diagnosi (saranno necessari più test di imaging), nonché trattamento e prognosi.
Il vantaggio principale del modello basato sugli alberi di classificazione, che nel nostro caso è il tipo CHAID, è che il modello è facile da interpretare. Le regole di classificazione che vengono generate includono tutti i possibili pazienti e gli aspetti di diversi sottogruppi, come l’età e il sesso.20,21
Il modello CHAID ha rilevato che la variabile più importante è il numero di leucociti (coincidente con il modello ANN). Il CHAID include anche il livello CRP nella seconda riga. È anche interessante notare che la variabile clinica inclusa è il dolore quando si tossisce. Durante l’esame clinico, questo dolore non dipende dall’esploratore ma da una manovra lontana dall’esame addominale diretto. Le 10 regole di classificazione generate sono state raggruppate in base alla principale possibilità diagnostica. Regole più chiare possono essere trovate per la diagnosi di NsP e AA (che chiamiamo “speciali”) dove la diagnosi differenziale raggiunge una maggiore importanza poiché i gruppi NIRIF e IRIF sono più presenti.
Altre serie sono state pubblicate utilizzando diverse metodologie di albero di classificazione, come il CART, ma si sono differenziate solo tra AA e non AA. Sono stati anche realizzati modelli con variabili cliniche e analitiche, 22 utilizzando la combinazione con Alvarado23 e aggiungendo test di imaging.24
Il modello ANN utilizzato raggiunge valori accettabili di capacità discriminante. Lo svantaggio di questo modello è che funziona come una “scatola nera” e non può essere interpretato in modo semplice per l’uso clinico, poiché consiste di 480 parametri (10×12×4) che includono tutte le interazioni tra le variabili di input, quelle del livello nascosto e quelle dei nodi di output. Un computer è necessario per il suo utilizzo e funziona come un modello comparativo. L’ANN utilizza tutte le interconnessioni delle variabili utilizzate e non è più preciso del modello basato su CHAID. Altri studi hanno utilizzato ANN per la diagnosi di AA (concentrandosi solo su AA e non AA).25
Questo studio ha anche diverse limitazioni. Il principale è l’assegnazione dei gruppi utilizzati. Questi sono gruppi che non sono stati convalidati dalla letteratura e AA è considerato un processo infiammatorio. Sarebbe interessante avere una dimensione del campione più grande, specialmente nei gruppi diagnostici NIRIF e IRIF. In difesa dello studio, crediamo che i modelli che confrontano solo AA rispetto ad altre condizioni abbiano meno capacità di essere utilizzati nella gestione reale del paziente.
In conclusione, crediamo che i professionisti che trattano pazienti con dolore RIF possano beneficiare di modelli facili da interpretare e fornire una classificazione con più di due possibilità (AA vs. non-AA). Il modello CHAID generato ha raggiunto questo obiettivo, anche se dovrebbe essere convalidato in altre serie più grandi.
Finanziamento
Non è stato ricevuto alcun finanziamento per condurre questo studio.
Conflitto di interessi
Non abbiamo alcun conflitto di interessi da dichiarare.