formålet med vores undersøgelse er at bruge beredskabsafdelingsdata til at udvikle en differentieret diagnose for RIF-smerter baseret på klassificeringstræmetodologi. Vi vil også sammenligne denne model med klassiske scoringer og scoren genereret af et kunstigt neuralt netværk (ANN) for at hjælpe med diagnosen AA og andre abdominale processer.
metode
prospektiv observationsundersøgelse af en 18-måneders periode (mellem 1.juli 2015 og 31. December 2016) udført i skadestuen (ER) på et andet niveau hospital med 450 hospitalssenge og 93.000 årlige ER-besøg.
patienterne gav deres underskrevne informerede samtykke, og undersøgelsen blev godkendt af Clinical Research Ethics Committee (CEIC) på hospitalet.
Vi inkluderede patienter over 14 år med mere end 6 timers smerteudvikling i RIF. Patienter med tidligere appendectomies og dem, der var tabt for opfølgning, blev udelukket.
når diagnosen smerte i RIF blev etableret, blev følgende variabler indsamlet: alder, køn, tidligere abdominal kirurgi, kropsmasseindeks (BMI), symptomudviklingstid i timer, tidligere indtagelse af analgesi og kropstemperatur.
de kliniske variabler inkluderet i de klassiske modeller blev indsamlet: lignende tidligere smerte, Blumberg tegn (positiv eller ej), migration af smerte, øget smerte med hoste, øget smerte med mobilisering, kvalme / opkastning, anoreksi, diarre og forstoppelse. Analytiske data inkluderet: antal leukocytter (antal celler med en vægt på 109), procentdel af neutrofiler ( % ) og serum CRP-niveauer (mg/dL). Den anvendte analysemetode var hospitalslaboratoriets standardmetode. Under opfølgningen omfattede de registrerede data, om patienten blev indlagt på hospitalet, om operationen blev udført og diagnosen i slutningen af episoden. Fire diagnostiske grupper blev etableret: ikke-specifik RIF-smerte (NsP), når symptomerne blev overført, og patienten blev udskrevet til hjemmet; AA, når patienten blev opereret, og den patologiske anatomi var i overensstemmelse; mavesmerter i RIF uden betændelse (NIRIF) og smerter i maven i RIF med betændelse (IRIF). Inflammation blev defineret som eksistensen af 2 eller flere kliniske symptomer på følgende, ud over smerter i RIF: temperatur >38 liter C eller
liter C, puls >90 BPM, respirationsfrekvens større end 20 vejrtrækninger pr.minut eller pCO2 mmHg, blodleukocytter >12000/ml eller
værdierne for Alvarado -, 4 air6-og feny-lutberg5-algoritmerne blev beregnet.
statistisk analyse
variablerne udtrykkes som middel-og standardafvigelse eller som procentdel. Til sammenligning mellem grupper (4 kategorier) blev Chi-kvadreret test anvendt til kvalitative variabler og den ikke–parametriske Kruskal-Vægis test for kontinuerlige variabler. En p-værdi
klassificeringstræmodellen blev oprettet ved hjælp af Svartree-modulet i SPSS-programmet (version 20.0). Chi-firkantet automatisk Interaktionsdetektering (CHAID) blev brugt med et stopkriterium begrænset til et minimum antal 15 patienter pr.8
ANN-modellen blev implementeret ved hjælp af alyuda Kurt (Neurointelligence) – programmet, der inkorporerer flerlags Perceptron-metoden med backpropagation.9
strategien for at inkorporere variabler i modellerne var typen ‘fuld model’ (inkludering af alle kandidatvariablerne); begge modeller har automatisk variabel valgfunktion i henhold til betydning eller hierarki. Den interne validering af de to modeller blev udført gennem krydsvalidering (10 partitioner). Modellernes diskriminerende kapacitet blev bestemt ved at beregne arealet under ROC-kurven og procenter for korrekt klassificering (PCC).10
resultater
295 patienter havde smerter i RIF, og 43 blev udelukket: 15 med tidligere appendektomi, 5 med mindre end 6 timer med fremskredne symptomer og 23 på grund af manglende opfølgning. Den endelige studiegruppe bestod af 252 patienter (Fig. 1).
fra dette samlede antal blev 121 patienter indlagt på hospitalet, hvoraf 107 blev behandlet kirurgisk. Tilfælde blev defineret af diagnostiske grupper: 114 tilfælde af NsP, 93 AA, 30 NIRIF og 15 IRIF. Diagnoserne inkluderet i nirif-klassificeringen var: 11 tilfælde af urinvejsinfektioner, 7 nyrekolik, 5 akut gastroenteritis, 2 delvis tarmobstruktion, en ovariecyst og 4 ‘andre diagnoser’. Diagnoserne inkluderet i IRIF-gruppen var: 5 tilfælde af bækkenbetændelsessygdom, 4 akut pyelonephritis, 2 tubo-ovarie-abscess, 2 akut diverticulitis, en akut cholecystitis og en inflammatorisk tarmsygdom.
tabel 1 viser de kliniske egenskaber hos patienterne inkluderet i de 4 diagnostiske grupper. Generelt er patienterne unge, og der er ingen forskelle efter køn.
tabel 2 viser de analytiske variabler og scoringerne af de klassiske modeller, der er undersøgt. Hvis vi beregner ROC-kurverne (AUC) for scorerne for den enkelte diagnose af AA sammenlignet med de 3 resterende diagnoser, opnår vi 0,82 (0,76–0,87) for Alvarado–scoren, 0,83 (0,77–0,88) for luft og 0,88 (0,84-0,92) for Feny Krishberg.
analytiske egenskaber og Alvarado -, luft-og Feny-Kurt-Lindberg-score efter diagnostiske grupper (n=252).
All(n=252) | NsP(n=114) | AA(n=93) | NIRIF(n=30) | IRIF(n=15) | P Valuea | |
---|---|---|---|---|---|---|
Leucocytes (109/l) | 12±5 | 10±4 | 16±4 | 10±4 | 14±4 | |
Percentage of neutrophils | 75±12 | 69±13 | 82±7 | 72±13 | 78±7 | |
CRP (mg/L) | 60±54 | 25±15 | 98±78 | 38±23 | 129±81 | |
Alvarado | 5±2 | 4±2 | 6±1 | 4±2 | 6±1 | |
AIR | 6±2 | 5±2 | 7±1 | 5±2 | 7±1 | |
Fenyö-Lindberg | 7±30 | −9±25 | 31±18 | −14±27 | 19±17 |
AA: akut appendicitis; luft: Appendicitis inflammatorisk respons; IRIF: RIF smerte med betændelse; NIRIF: RIF smerte uden betændelse; NsP: uspecifik RIF smerte; CRP: C-reaktivt protein.
værdier som middelværdi.
sammenligning mellem grupper med Kruskal–Vægis testen.
CHAID-Klassificeringstræmodel
CHAID-modellen valgte 6 variabler: antal leukocytter, CRP, smertefuld hoste, Blumberg tegn, køn og evolutionstid.
hierarkiet af variabler, valgt automatisk, er vist i Fig. 2. Den første er antallet af leukocytter, og ifølge afskæringspunktet (også bestemt automatisk) inkorporeres følgende variabler. Modellen bestemmer 10 beslutningsregler, der er de endelige noder.
CHAID beslutningstræ med 10 reglas de decisi pristn-nodos finales.
de endelige noder (Fig. 2) kan klassificeres i 3 kategorier. Knudepunkter 10, 11 og 13 viser en klar klassificering for NSP-diagnosegruppen, knudepunkter 7, 14 og 17 til AA-diagnose og knudepunkter 5, 12, 15 og 16 med en klassificering, der er mindre klar (inkluderer nirif-og IRIF-diagnoser), som kan betragtes som speciel. For eksempel krævede disse specielle grupper flere ultralyd sammenlignet med grupperne med klarere klassificering (41.6 vs 21.1; P
.01).Kunstig neuralt netværksmodel
den genererede ANN-model, der genereres, vælger automatisk 10 variabler: Blumberg-tegn, smertemigration, øget smerte, øget smerte med bevægelse, smerter ved hoste, anoreksi, temperatur, antal leukocytter, evolutionstimer og CRP-niveauer. Arkitekturen, der oprettes automatisk, består af et inputlag (med de 10 valgte variabler), et skjult lag med 12 noder og et outputlag med mulighed for de 4 diagnostiske grupper. Modellen tildeler for hver patient (register) en diagnostisk gruppe ud af de 4 mulige diagnostiske sandsynligheder. ANN-modellen bestemmer også, at variablen med mest vægt er antallet af leukocytter.
tabel 3 sammenligner ANN-modellen og chaid-klassificeringstræet. Der observeres ingen signifikante forskelle mellem PCC-procenterne eller i de beregnede ROC-kurver.
Diskussion
denne undersøgelse blev sammenlignet med andre undersøgelser offentliggjort i litteraturen om smerter i RIF (Tabel 4). Prøvestørrelserne blev gennemgået og viste bemærkelsesværdig variation (størstedelen varierede mellem 139 og 545 patienter, hvoraf den største var 941 patienter).19
beskrivende sammenligning af vores undersøgelse med andre offentliggjorte artikler om RIF-smerte.
Name of Study | YearPlace | N | DesignService | Methodology | Population | Utility |
---|---|---|---|---|---|---|
Alvarado4 | 1986USA | 305 | RSurgery | DEV Alvarado | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg4 | 1997Sweden | 1,167 | PSurgery | DEV Fenyö-Lindberg | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg11 | 2004Sweden | 455 | PSurgery | VAL Fenyö-LindbergFemales | SUSP AAFemales-HOSP | DIAG AASurgery |
Tzanakis et al.12 | 2005Greece | 504 | PSurgery and radiology | DEV ScoreVAL Alvarado | SUSP AAHOSP | DIAG AAUltrasound |
Rennie et al.13 | 2006Great Britain | 300 | PSurgery | Study in females | SUSP AAFemales-HOSP | DIAG AA |
Antevil et al.14 | 2006USA | 383609 | P-RSurgery | VAL CT | SUSP AAHOSP | DIAG AACT |
Andersson et al.6 | 2008Switzerland | 545 | PSurgery | AlvaradoDEV Score LR | SUSP AAHOSP | DIAG AA |
McCartan et al.15 | 2010Ireland | 302 | PSurgery | Review AA | SUSP AAHOSP | DIAG AA |
Lintula et al.16 | 2010Finland | 181 | PSurgery | VAL ScorePediatrics | SUSP AAHOSP | DIAG AA |
Poletti et al.17 | 2011Switzerland | 183 | PRadiology | VAL ULT/CT | SUSP AAHOSP | DIAG AAULTG-CT |
Chong et al.18 | 2011Singapore | 192 | PSurgeryEmergency | VAL RIPASAEmergency | Dolor RIFHOSP | DIAG AA |
De Castro et al.19 | 2012Holland | 941 | PEmergency | VAL Score | SUSP AAHOSP | DIAG AA |
Gudelis et al. | 2018Spain | 252 | PEmergency | DEV Score | Dolor RIFER | DIAG dolor RIF |
AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: ultralyd; RIF: højre iliac fossa; HOSP: indlagte patienter; P: prospektiv; R: retrospektiv; LR: logistisk regressionsmodel; SUSP AA: mistænkt AA; CT: computertomografi; ER: akutrum; VAL: Validering.
et af bidragene fra vores undersøgelse er brugen af 4 klassifikationsgrupper. I vores serie var den største gruppe af patienter NSP-gruppen. I de undersøgelser, der blev udført med flere udvalgte patienter (efter at have passeret et indledende ‘filter’ i ER), var denne gruppe mere reduceret.13,14
AA-gruppen omfattede alle de patienter, der blev indlagt på kirurgisk afdeling og behandlet kirurgisk for mistanke om AA, hvis diagnose blev bekræftet af anatomisk patologi. Procentdelen af disse patienter varierede i henhold til inklusionskriterierne i de forskellige offentliggjorte undersøgelser.17
i vores undersøgelse blev AA-diagnosen bestemt af den anatomiske patologi. Hvis vi overvejede patienter med mistanke om AA, der blev opereret, fandt vi, at kun 6 (5,7%) patienter ikke præsenterede en anatomisk patologidiagnose af AA (3 med endelig diagnose af NsP og 3 IRIF). Denne procentdel (5, 7%) af negative appendektomier er lavere end rapporter fra andre serier, der spænder mellem 10% og 23%.7,11,15
Vi mener, at brugen af to andre nirif-og IRIF-diagnostiske kategorier giver et bredere overblik over problemet og en klassificering, der opfører sig forskelligt til bestemmelse af en diagnose (flere billeddannelsestest er nødvendige) samt behandling og prognose.
den største fordel ved modellen baseret på klassificeringstræer, som i vores tilfælde er CHAID-typen, er, at modellen er let at fortolke. De klassificeringsregler, der genereres, inkluderer alle mulige patienter og aspekter af forskellige undergrupper, såsom alder og køn.20,21
CHAID-modellen har påvist, at den vigtigste variabel er antallet af leukocytter (sammenfaldende med ANN-modellen). CHAID inkluderer også CRP-niveauet i anden linje. Det er også interessant at bemærke, at den kliniske variabel inkluderet er smerte ved hoste. Under den kliniske undersøgelse afhænger denne smerte ikke af udforskeren, men af en manøvre langt fra direkte abdominal undersøgelse. De 10 genererede klassificeringsregler er grupperet i henhold til den vigtigste diagnostiske mulighed. Klarere regler kan findes for diagnosen NsP og AA (som vi kalder ‘speciel’), hvor differentialdiagnosen når en større fremtrædende plads, da NIRIF-og IRIF-grupperne er mere til stede.
andre serier er blevet offentliggjort ved hjælp af forskellige klassificeringstræmetoder, såsom CART, men de differentierede kun mellem AA og ikke-AA. Modeller er også lavet med kliniske og analytiske variabler,22 ved hjælp af kombinationen med Alvarado23 og tilføjelse af billeddannelsestest.24
den anvendte ANN-model opnår acceptable værdier for diskriminerende kapacitet. Ulempen ved denne model er, at den fungerer som en ‘sort boks’ og ikke kan fortolkes på en enkel måde til klinisk brug, da den består af 480 parametre (10 liter 12 liter 4), der inkluderer alle interaktioner mellem inputvariablerne, dem i det skjulte lag og dem i outputnoderne. En computer er nødvendig til brug, og den fungerer som en sammenlignende model. ANN bruger alle sammenkoblinger af de anvendte variabler og er ikke mere nøjagtige end CHAID-baseret model. Andre undersøgelser har brugt ANN til diagnose af AA (kun med fokus på AA og ikke-AA).25
denne undersøgelse har også flere begrænsninger. Den vigtigste er tildelingen af de anvendte grupper. Disse er grupper, der ikke er valideret af litteraturen, og AA anses for at være en inflammatorisk proces. Det ville være interessant at have en større prøvestørrelse, især i nirif og IRIF diagnostiske grupper. Til forsvar for undersøgelsen mener vi, at de modeller, der kun sammenligner AA versus andre forhold, har mindre kapacitet til at blive brugt i reel patientstyring.
afslutningsvis mener vi, at fagfolk, der behandler patienter med RIF-smerter, kan drage fordel af modeller, der er lette at fortolke og give en klassificering med mere end to muligheder (AA vs. ikke-AA). Den genererede CHAID-model har nået dette mål, skønt den skal valideres i andre større serier.
finansiering
der blev ikke modtaget nogen finansiering til at gennemføre denne undersøgelse.
interessekonflikt
Vi har ingen interessekonflikt at erklære.