Het doel van onze studie is om gegevens van de spoedeisende hulp te gebruiken om een differentiële diagnose voor RIF-pijn te ontwikkelen op basis van classificatieboommethodologie. We zullen dit model ook vergelijken met klassieke scores en de score gegenereerd door een artificial neural network (ANN) om te helpen bij de diagnose van AA en andere abdominale processen.
methode
prospectieve observationele studie van een periode van 18 maanden (tussen 1 juli 2015 en 31 December 2016) uitgevoerd in de eerste hulp (SEH) van een ziekenhuis van het tweede niveau met 450 ziekenhuisbedden en 93.000 jaarlijkse SEH-bezoeken.
de patiënten gaven hun ondertekende geïnformeerde toestemming en de studie werd goedgekeurd door de Clinical Research Ethics Committee (CEIC) in het ziekenhuis.
patiënten ouder dan 14 jaar met meer dan 6 uur pijnevolutie in de RIF werden opgenomen. Patiënten met eerdere blindedarmaandoeningen en patiënten die niet in de follow-up waren opgenomen, werden uitgesloten.
zodra de diagnose van pijn in het RIF werd vastgesteld, werden de volgende variabelen verzameld: leeftijd, geslacht, eerdere abdominale chirurgie, body mass index (BMI), symptoomevolutie tijd in uren, eerdere analgesie en lichaamstemperatuur.
de klinische variabelen in de klassieke modellen werden verzameld: vergelijkbare eerdere pijn, Blumberg-teken (positief of niet), migratie van pijn, verhoogde pijn bij hoesten, verhoogde pijn bij mobilisatie, misselijkheid/braken, anorexia, diarree en constipatie. Inclusief analytische gegevens: aantal leukocyten (aantal cellen×109), percentage neutrofielen ( % ) en serum CRP-spiegels (mg/dL). De gebruikte analysemethode was de standaardmethode van het ziekenhuislaboratorium. Tijdens de follow-up omvatten de geregistreerde gegevens of de patiënt in het ziekenhuis werd opgenomen, of een operatie werd uitgevoerd en de diagnose aan het einde van de episode. Vier diagnostische groepen werden vastgesteld: niet-specifieke RIF-pijn (NsP) wanneer de symptomen werden overgebracht en de patiënt naar huis werd ontslagen; AA wanneer de patiënt werd geopereerd en de pathologische anatomie concordant was; buikpijn in de RIF zonder ontsteking (NIRIF) en buikpijn in de RIF met ontsteking (IRIF). Ontsteking werd gedefinieerd als het bestaan van 2 of meer klinische symptomen van de volgende, naast pijn bij RIF: temperatuur >38°C of
°c, hartslag >90bpm, ademhalingssnelheid groter dan 20 ademhalingen per minuut of pCO2 mmHg, bloedleukocyten >12000/mL of
de waarden voor de algoritmen Alvarado,4 air6 en fenyö-lindberg5 werden berekend.
statistische analyse
De variabelen worden uitgedrukt als gemiddelde en standaardafwijking of als percentage. Voor de vergelijking tussen groepen (4 categorieën) werd de Chi-kwadraat test gebruikt voor kwalitatieve variabelen en de niet–parametrische Kruskal-Wallis test voor continue variabelen. Een p waarde
het classificatieboommodel is gemaakt met behulp van de AnswerTree module van het SPSS® programma (versie 20.0). De Chi-Square Automatic Interaction Detection (CHAID) optie werd gebruikt met een stopcriterium beperkt tot een minimum aantal van 15 patiënten per terminale knoop.8
Het ANN-model werd geà mplementeerd met behulp van het Alyuda® (Neurointelligence) – programma dat de multilayer Perceptron-methodologie met backpropagatie bevat.9
de strategie voor het opnemen van variabelen in de modellen was het type “volledig model” (het opnemen van alle kandidaatvariabelen); beide modellen hebben automatische variabele selectiemogelijkheden volgens betekenis of hiërarchie. De interne validatie van de twee modellen werd uitgevoerd door middel van kruisvalidatie (10 partities). De discriminerende capaciteit van de modellen werd bepaald door de oppervlakte onder de ROC-curve en percentages van correcte classificatie (PCC) te berekenen.10
resultaten
295 patiënten vertoonden pijn in de RIF, en 43 werden uitgesloten: 15 met eerdere appendectomie, 5 met minder dan 6 uur van voortschrijdende symptomen, en 23 bij gebrek aan follow-up. De laatste studiegroep bestond uit 252 patiënten (Fig. 1).
van dit totaal werden 121 patiënten opgenomen in het ziekenhuis, van wie 107 operatief werden behandeld. Gevallen werden gedefinieerd door diagnostische groepen: 114 gevallen van NsP, 93 AA, 30 NIRIF en 15 IRIF. De in de nirif-classificatie opgenomen diagnoses waren: 11 gevallen van urineweginfecties, 7 nierkolieken, 5 acute gastro-enteritis, 2 partiële darmobstructie, één ovariale cyste en 4 ‘andere diagnoses’. De diagnoses in de IRIF-groep waren: 5 gevallen van ontstekingen in het bekken, 4 acute pyelonefritis, 2 tubo-ovariaal abces, 2 acute diverticulitis, één acute cholecystitis en één inflammatoire darmziekte.
Tabel 1 toont de klinische kenmerken van de patiënten opgenomen in de 4 diagnostische groepen. Over het algemeen zijn de patiënten jong en zijn er geen verschillen naar geslacht.
Tabel 2 toont de analytische variabelen en de scores van de bestudeerde klassieke modellen. Als we de ROC–curven (AUC) van de scores berekenen voor de enkelvoudige diagnose van AA in vergelijking met de 3 resterende diagnoses, krijgen we 0,82 (0,76–0,87) voor de Alvarado–score, 0,83 (0,77-0,88) voor lucht en 0,88 (0,84-0,92) voor Fenyö-Lindberg.
analytische kenmerken en Alvarado, AIR en Fenyö-Lindberg Scores per diagnostische groepen (n = 252).
All(n=252) | NsP(n=114) | AA(n=93) | NIRIF(n=30) | IRIF(n=15) | P Valuea | |
---|---|---|---|---|---|---|
Leucocytes (109/l) | 12±5 | 10±4 | 16±4 | 10±4 | 14±4 | |
Percentage of neutrophils | 75±12 | 69±13 | 82±7 | 72±13 | 78±7 | |
CRP (mg/L) | 60±54 | 25±15 | 98±78 | 38±23 | 129±81 | |
Alvarado | 5±2 | 4±2 | 6±1 | 4±2 | 6±1 | |
AIR | 6±2 | 5±2 | 7±1 | 5±2 | 7±1 | |
Fenyö-Lindberg | 7±30 | −9±25 | 31±18 | −14±27 | 19±17 |
AA: acute appendicitis; lucht: Appendicitis inflammatoire respons; IRIF: RIF pijn met ontsteking; NIRIF: RIF pijn zonder ontsteking; NSP: niet-specifieke RIF pijn; CRP: C-reactief eiwit.
waarden als gemiddelde±SD.
vergelijking tussen groepen met de Kruskal–Wallis-test.
CHAID Classificatiestructuur Model
het CHAID-model geselecteerde 6 variabelen: aantal leukocyten, CRP, pijnlijke hoest, Blumberg teken, seks en evolutie tijd.
de hiërarchie van automatisch geselecteerde variabelen wordt weergegeven in Fig. 2. De eerste is het aantal leukocyten en, afhankelijk van het cut-off punt (ook automatisch bepaald), worden de volgende variabelen opgenomen. Het model bepaalt 10 besluitvormingsregels die de uiteindelijke knooppunten zijn.
chaid decision tree met 10 reglas de decisión-nodos finales.
de laatste knooppunten (Fig. 2) kan worden ingedeeld in 3 categorieën. Knooppunten 10, 11 en 13 tonen een duidelijke classificatie voor de NSP diagnostische groep, knooppunten 7, 14 en 17 voor AA diagnose, en knooppunten 5, 12, 15 en 16 met een classificatie die minder duidelijk is (inclusief nirif en IRIF diagnoses), die als speciaal kan worden beschouwd. Deze speciale groepen hadden bijvoorbeeld meer echo ‘ s nodig dan de groepen met een duidelijkere classificatie (41.6 vs.21.1; P
.01).Artificial Neural Network Model
het gegenereerde ANN-model dat wordt gegenereerd selecteert automatisch 10 variabelen: Blumberg-teken, pijnmigratie, verhoogde pijn, verhoogde pijn bij beweging, pijn bij hoesten, anorexia, temperatuur, aantal leukocyten, evolutieuren en CRP-waarden. De architectuur die automatisch wordt gemaakt bestaat uit een invoerlaag( met de 10 geselecteerde variabelen), een verborgen laag met 12 knooppunten en een uitvoerlaag met de mogelijkheid van de 4 diagnostische groepen. Het model kent voor elke patiënt (register) een diagnostische groep toe uit de 4 mogelijke diagnostische waarschijnlijkheden. Het ANN-model bepaalt ook dat de variabele met het meeste gewicht het aantal leukocyten is.
Tabel 3 vergelijkt het ANN-model en de CHAID-classificatiestructuur. Er worden geen significante verschillen waargenomen tussen de PCC-percentages of in de berekende ROC-curven.
discussie
deze studie werd vergeleken met andere studies gepubliceerd in de literatuur over pijn in het RIF (Tabel 4). De steekproefomvang werd beoordeeld en vertoonde opmerkelijke variabiliteit (de meerderheid varieerde tussen 139 en 545 patiënten, de grootste waren 941 patiënten).19
beschrijvende vergelijking van onze studie met andere gepubliceerde artikelen over RIF-pijn.
Name of Study | YearPlace | N | DesignService | Methodology | Population | Utility |
---|---|---|---|---|---|---|
Alvarado4 | 1986USA | 305 | RSurgery | DEV Alvarado | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg4 | 1997Sweden | 1,167 | PSurgery | DEV Fenyö-Lindberg | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg11 | 2004Sweden | 455 | PSurgery | VAL Fenyö-LindbergFemales | SUSP AAFemales-HOSP | DIAG AASurgery |
Tzanakis et al.12 | 2005Greece | 504 | PSurgery and radiology | DEV ScoreVAL Alvarado | SUSP AAHOSP | DIAG AAUltrasound |
Rennie et al.13 | 2006Great Britain | 300 | PSurgery | Study in females | SUSP AAFemales-HOSP | DIAG AA |
Antevil et al.14 | 2006USA | 383609 | P-RSurgery | VAL CT | SUSP AAHOSP | DIAG AACT |
Andersson et al.6 | 2008Switzerland | 545 | PSurgery | AlvaradoDEV Score LR | SUSP AAHOSP | DIAG AA |
McCartan et al.15 | 2010Ireland | 302 | PSurgery | Review AA | SUSP AAHOSP | DIAG AA |
Lintula et al.16 | 2010Finland | 181 | PSurgery | VAL ScorePediatrics | SUSP AAHOSP | DIAG AA |
Poletti et al.17 | 2011Switzerland | 183 | PRadiology | VAL ULT/CT | SUSP AAHOSP | DIAG AAULTG-CT |
Chong et al.18 | 2011Singapore | 192 | PSurgeryEmergency | VAL RIPASAEmergency | Dolor RIFHOSP | DIAG AA |
De Castro et al.19 | 2012Holland | 941 | PEmergency | VAL Score | SUSP AAHOSP | DIAG AA |
Gudelis et al. | 2018Spain | 252 | PEmergency | DEV Score | Dolor RIFER | DIAG dolor RIF |
AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: ultrasound; RIF: right iliac fossa; HOSP: hospitalized patients; P: prospective; R: retrospective; LR: logistic regression model; SUSP AA: suspected AA; CT: computed tomography; ER: emergency room; VAL: validation.
een van de bijdragen van onze studie is het gebruik van 4 classificatiegroepen. In onze serie was de grootste groep patiënten de NsP-groep. In de onderzoeken die werden uitgevoerd met meer geselecteerde patiënten (na een eerste ‘filter’ in de ER te hebben doorlopen) was deze groep meer gereduceerd.13,14
de AA-groep omvatte alle patiënten die werden opgenomen in de chirurgische afdeling en operatief werden behandeld voor vermoedelijke AA, waarvan de diagnose werd bevestigd door anatomische pathologie. Het percentage van deze patiënten varieerde volgens de inclusiecriteria van de verschillende gepubliceerde onderzoeken.17
in onze studie werd de AA-diagnose bepaald door de anatomische pathologie. Als we rekening hielden met patiënten met vermoedelijke AA die een operatie ondergingen, vonden we dat slechts 6 (5,7%) patiënten geen anatomische pathologische diagnose van AA vertoonden (3 met definitieve diagnose van NsP en 3 IRIF). Dit percentage (5,7%) van negatieve appendicomies is lager dan rapporten uit andere reeksen variërend tussen 10% en 23%.7,11,15
wij zijn van mening dat het gebruik van twee andere nirif-en IRIF-diagnostische Categorieën een breder beeld geeft van het probleem en een classificatie die zich anders gedraagt voor het bepalen van een diagnose (meer beeldvormingstests zullen nodig zijn), evenals behandeling en prognose.
het belangrijkste voordeel van het model op basis van classificatiebomen, dat in ons geval het CHAID-type is, is dat het model gemakkelijk te interpreteren is. De classificatieregels die worden gegenereerd omvatten alle mogelijke patiënten en aspecten van verschillende subgroepen, zoals leeftijd en geslacht.20,21
het CHAID-model heeft aangetoond dat de belangrijkste variabele het aantal leukocyten is (samenvalt met het ANN-model). De CHAID bevat ook het CRP-niveau in de tweede regel. Het is ook interessant op te merken dat de klinische variabele opgenomen is pijn bij hoesten. Tijdens het klinisch onderzoek is deze pijn niet afhankelijk van de ontdekkingsreiziger, maar van een manoeuvre ver van direct buikonderzoek. De 10 gegenereerde classificatieregels zijn gegroepeerd volgens de belangrijkste diagnostische mogelijkheid. Duidelijkere regels kunnen worden gevonden voor de diagnose van NsP en AA (die we ‘speciaal’ noemen) waar de differentiële diagnose een grotere prominentie bereikt omdat de nirif-en IRIF-groepen meer aanwezig zijn.
andere reeksen zijn gepubliceerd met behulp van verschillende classificatieschema ‘ s, zoals CART, maar zij maakten alleen onderscheid tussen AA en niet-AA. Er zijn ook modellen gemaakt met klinische en analytische variabelen,22 met behulp van de combinatie met Alvarado23 en het toevoegen van beeldvormingstests.24
het gebruikte ANN-model bereikt aanvaardbare waarden voor de discriminatiecapaciteit. Het nadeel van dit model is dat het werkt als een ‘black box’ en niet kan worden geïnterpreteerd op een eenvoudige manier voor klinisch gebruik, omdat het bestaat uit 480 parameters (10×12×4) die alle interacties tussen de input variabelen, die van de verborgen laag en die van de output knooppunten omvatten. Een computer is nodig voor het gebruik ervan, en het functioneert als een vergelijkend model. De ANN gebruikt alle interconnecties van de gebruikte variabelen en is niet nauwkeuriger dan CHAID-gebaseerd model. Andere studies hebben ANN gebruikt voor de diagnose van AA (alleen gericht op AA en niet-AA).
Dit onderzoek heeft ook een aantal beperkingen. De belangrijkste is de toewijzing van de gebruikte groepen. Dit zijn groepen die niet zijn gevalideerd door de literatuur, en AA wordt beschouwd als een ontstekingsproces. Het zou interessant zijn om een grotere steekproefgrootte te hebben, vooral in de diagnostische groepen van NIRIF en IRIF. Ter verdediging van de studie, wij geloven dat de modellen die alleen vergelijken AA versus andere voorwaarden hebben minder capaciteit om te worden gebruikt in echte patiëntenmanagement.
concluderend zijn wij van mening dat professionals die patiënten met RIF-pijn behandelen, baat kunnen hebben bij modellen die gemakkelijk te interpreteren zijn en een classificatie met meer dan twee mogelijkheden bieden (AA VS.niet-AA). Het gegenereerde CHAID-model heeft dit doel bereikt, hoewel het in andere grotere series moet worden gevalideerd.
financiering
er werd geen financiering ontvangen om deze studie uit te voeren.
belangenverstrengeling
We hebben geen belangenverstrengeling aan te geven.