Ziel unserer Studie ist es, Daten aus der Notaufnahme zu verwenden, um eine Differentialdiagnose für RIF-Schmerzen basierend auf der Klassifikationsbaummethodologie zu entwickeln. Wir werden dieses Modell auch mit vergleichen klassische Scores und die von einem künstlichen neuronalen Netzwerk (ANN) erzeugte Punktzahl zur Unterstützung der Diagnose von AA und anderen abdominalen Prozessen.
Methode
Prospektive Beobachtungsstudie über einen Zeitraum von 18 Monaten (zwischen dem 1. Juli 2015 und dem 31. Dezember 2016) in der Notaufnahme eines Krankenhauses der zweiten Ebene mit 450 Krankenhausbetten und 93.000 jährlichen Notaufnahmen.
Die Patienten gaben ihre unterzeichnete Einverständniserklärung ab, und die Studie wurde von der Ethikkommission für klinische Forschung (CEIC) im Krankenhaus genehmigt.
Wir haben Patienten über 14 Jahre mit mehr als 6 Stunden Schmerzentwicklung in die RIF eingeschlossen. Patienten mit früheren Appendektomien und Patienten, die für die Nachsorge verloren gingen, wurden ausgeschlossen.
Sobald die Diagnose von Schmerzen im RIF gestellt war, wurden die folgenden Variablen gesammelt: Alter, Geschlecht, vorherige Bauchoperation, Body-Mass-Index (BMI), Symptomentwicklungszeit in Stunden, vorherige Einnahme von Analgesie und Körpertemperatur.
Die in den klassischen Modellen enthaltenen klinischen Variablen wurden gesammelt: ähnliche vorherige Schmerzen, Blumberg-Zeichen (positiv oder nicht), Migration von Schmerzen, erhöhte Schmerzen mit Husten, erhöhte Schmerzen mit Mobilisierung, Übelkeit/ Erbrechen, Anorexie, Durchfall und Verstopfung. Analytische Daten enthalten: anzahl der Leukozyten (Anzahl der Zellen × 109), Prozentsatz der Neutrophilen (%) und Serum-CRP-Spiegel (mg / dl). Die verwendete Analysemethode war die Standardmethode des Krankenhauslabors. Während der Nachsorge umfassten die registrierten Daten, ob der Patient ins Krankenhaus eingeliefert wurde, ob eine Operation durchgeführt wurde und die Diagnose am Ende der Episode. Es wurden vier Diagnosegruppen eingerichtet: unspezifische RIF-Schmerzen (NsP), wenn die Symptome nachließen und der Patient nach Hause entlassen wurde; AA, wenn der Patient operiert wurde und die pathologische Anatomie übereinstimmte; bauchschmerzen im RIF ohne Entzündung (NIRIF) und Schmerzen Bauch im RIF mit Entzündung (IRIF). Entzündung wurde definiert als das Vorhandensein von 2 oder mehr klinischen Symptomen der folgenden, zusätzlich zu Schmerzen in RIF: Temperatur >38° C oder
°C, Herzfrequenz >90bpm, Atemfrequenz größer als 20 Atemzüge pro Minute oder pCO2 mmHg, Blutleukozyten >12000/ml oder
Die Werte für die Algorithmen Alvarado, 4 AIR6 und Fenyö-Lindberg5 wurden berechnet.
Statistische Analyse
Die Variablen werden als Mittelwert und Standardabweichung oder als Prozentsatz ausgedrückt. Für den Vergleich zwischen Gruppen (4 Kategorien) wurde der Chi-Quadrat–Test für qualitative Variablen und der nichtparametrische Kruskal-Wallis-Test für kontinuierliche Variablen verwendet. Ein P-Wert
Das Klassifikationsbaummodell wurde mit dem AnswerTree-Modul des SPSS®-Programms (Version 20.0) erstellt. Die Chi-Quadrat-Option zur automatischen Interaktionserkennung (CHAID) wurde mit einem Stoppkriterium verwendet, das auf eine Mindestanzahl von 15 Patienten pro Terminalknoten beschränkt war.8
Das ANN-Modell wurde mit dem Alyuda® (Neurointelligence) -Programm implementiert, das die mehrschichtige Perzeptron-Methodik mit Backpropagation enthält.9
Die Strategie zur Einbeziehung von Variablen in die Modelle war der Typ ‚vollständiges Modell‘ (Einbeziehung aller Kandidatenvariablen); Beide Modelle verfügen über eine automatische Variablenauswahl nach Signifikanz oder Hierarchie. Die interne Validierung der beiden Modelle erfolgte durch Kreuzvalidierung (10 Partitionen). Die diskriminierende Kapazität der Modelle wurde durch Berechnung der Fläche unter der ROC-Kurve und der Prozentsätze der korrekten Klassifizierung (PCC) bestimmt.10
Ergebnisse
295 Patienten zeigten Schmerzen im RIF, und 43 wurden ausgeschlossen: 15 mit vorheriger Appendektomie, 5 mit weniger als 6 Stunden fortschreitenden Symptomen und 23 wegen fehlender Nachsorge. Die letzte Studiengruppe bestand aus 252 Patienten (Abb. 1).
Von dieser Gesamtzahl wurden 121 Patienten ins Krankenhaus eingeliefert, von denen 107 operativ behandelt wurden. Die Fälle wurden nach Diagnosegruppen definiert: 114 Fälle von NsP, 93 AA, 30 NIRIF und 15 IRIF. Die in die NIRIF-Klassifikation einbezogenen Diagnosen waren: 11 Fälle von Harnwegsinfektionen, 7 Nierenkoliken, 5 akute Gastroenteritis, 2 partielle Darmobstruktion, eine Ovarialzyste und 4 ‚andere Diagnosen‘. Die Diagnosen in der IRIF-Gruppe waren: 5 Fälle von entzündlichen Erkrankungen des Beckens, 4 akute Pyelonephritis, 2 tubo-ovarieller Abszess, 2 akute Divertikulitis, eine akute Cholezystitis und eine entzündliche Darmerkrankung.
Tabelle 1 zeigt die klinischen Merkmale der Patienten in den 4 diagnostischen Gruppen. Im Allgemeinen sind die Patienten jung und es gibt keine Unterschiede nach Geschlecht.
Tabelle 2 zeigt die analytischen Variablen und die Scores der untersuchten klassischen Modelle. Wenn wir die ROC–Kurven (AUC) der Scores für die Einzeldiagnose von AA im Vergleich zu den 3 verbleibenden Diagnosen berechnen, erhalten wir 0, 82 (0, 76-0, 87) für den Alvarado–Score, 0, 83 (0, 77-0, 88) für LUFT und 0, 88 (0, 84-0, 92) für Fenyö–Lindberg.
Analytische Eigenschaften und Alvarado-, AIR- und Fenyö-Lindberg-Scores nach diagnostischen Gruppen (n=252).
All(n=252) | NsP(n=114) | AA(n=93) | NIRIF(n=30) | IRIF(n=15) | P Valuea | |
---|---|---|---|---|---|---|
Leucocytes (109/l) | 12±5 | 10±4 | 16±4 | 10±4 | 14±4 | |
Percentage of neutrophils | 75±12 | 69±13 | 82±7 | 72±13 | 78±7 | |
CRP (mg/L) | 60±54 | 25±15 | 98±78 | 38±23 | 129±81 | |
Alvarado | 5±2 | 4±2 | 6±1 | 4±2 | 6±1 | |
AIR | 6±2 | 5±2 | 7±1 | 5±2 | 7±1 | |
Fenyö-Lindberg | 7±30 | −9±25 | 31±18 | −14±27 | 19±17 |
AA: akute Blinddarmentzündung; AIR: Entzündungsreaktion der Blinddarmentzündung; IRIF: RIF-Schmerz mit Entzündung; NIRIF: RIF-Schmerz ohne Entzündung; NsP: unspezifischer RIF-Schmerz; CRP: C-reaktives Protein.
Werte als Mittelwert±SD.
Vergleich zwischen Gruppen mit dem Kruskal–Wallis-Test.
CHAID-Klassifikationsbaummodell
Das CHAID-Modell hat 6 Variablen ausgewählt: anzahl der Leukozyten, CRP, schmerzhafter Husten, Blumberg-Zeichen, Geschlecht und Entwicklungszeit.
Die Hierarchie der automatisch ausgewählten Variablen ist in Abb. 2. Die erste ist die Anzahl der Leukozyten und entsprechend dem Cut-off-Punkt (auch automatisch bestimmt) werden die folgenden Variablen aufgenommen. Das Modell bestimmt 10 Entscheidungsregeln, die die endgültigen Knoten sind.
CHAID Entscheidungsbaum mit 10 reglas de decisión-nodos finales.
Die letzten Knoten (Abb. 2) kann in 3 Kategorien eingeteilt werden. Die Knoten 10, 11 und 13 zeigen eine klare Klassifizierung für die NsP-Diagnosegruppe, die Knoten 7, 14 und 17 für die AA-Diagnose und die Knoten 5, 12, 15 und 16 mit einer weniger klaren Klassifizierung (einschließlich NIRIF- und IRIF-Diagnosen), die als speziell angesehen werden können. Zum Beispiel benötigten diese speziellen Gruppen mehr Ultraschall im Vergleich zu den Gruppen mit klarerer Klassifizierung (41,6 vs. 21,1; P
.01).Künstliches neuronales Netzwerkmodell
Das generierte ANN-Modell, das automatisch generiert wird, wählt 10 Variablen aus: Blumberg-Zeichen, Schmerzmigration, erhöhte Schmerzen, erhöhte Schmerzen bei Bewegung, Schmerzen beim Husten, Anorexie, Temperatur, Anzahl der Leukozyten, Entwicklungsstunden und CRP-Spiegel. Die automatisch erstellte Architektur besteht aus einer Eingangsschicht (mit den 10 ausgewählten Variablen), einer versteckten Schicht mit 12 Knoten und einer Ausgangsschicht mit der Möglichkeit der 4 Diagnosegruppen. Das Modell weist jedem Patienten (Register) eine Diagnosegruppe aus den 4 möglichen Diagnosewahrscheinlichkeiten zu. Das ANN-Modell bestimmt auch, dass die Variable mit dem größten Gewicht die Anzahl der Leukozyten ist.Tabelle 3 vergleicht das ANN-Modell und den CHAID-Klassifikationsbaum. Es werden keine signifikanten Unterschiede zwischen den PCC-Prozentsätzen oder in den berechneten ROC-Kurven beobachtet.
Diskussion
Diese Studie wurde mit anderen in der Literatur veröffentlichten Studien über Schmerzen im RIF verglichen (Tabelle 4). Die Stichprobengrößen wurden überprüft und zeigten eine bemerkenswerte Variabilität (die Mehrheit lag zwischen 139 und 545 Patienten, die größte 941 Patienten).19
Beschreibender Vergleich unserer Studie mit anderen veröffentlichten Artikeln über RIF-Schmerzen.
Name of Study | YearPlace | N | DesignService | Methodology | Population | Utility |
---|---|---|---|---|---|---|
Alvarado4 | 1986USA | 305 | RSurgery | DEV Alvarado | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg4 | 1997Sweden | 1,167 | PSurgery | DEV Fenyö-Lindberg | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg11 | 2004Sweden | 455 | PSurgery | VAL Fenyö-LindbergFemales | SUSP AAFemales-HOSP | DIAG AASurgery |
Tzanakis et al.12 | 2005Greece | 504 | PSurgery and radiology | DEV ScoreVAL Alvarado | SUSP AAHOSP | DIAG AAUltrasound |
Rennie et al.13 | 2006Great Britain | 300 | PSurgery | Study in females | SUSP AAFemales-HOSP | DIAG AA |
Antevil et al.14 | 2006USA | 383609 | P-RSurgery | VAL CT | SUSP AAHOSP | DIAG AACT |
Andersson et al.6 | 2008Switzerland | 545 | PSurgery | AlvaradoDEV Score LR | SUSP AAHOSP | DIAG AA |
McCartan et al.15 | 2010Ireland | 302 | PSurgery | Review AA | SUSP AAHOSP | DIAG AA |
Lintula et al.16 | 2010Finland | 181 | PSurgery | VAL ScorePediatrics | SUSP AAHOSP | DIAG AA |
Poletti et al.17 | 2011Switzerland | 183 | PRadiology | VAL ULT/CT | SUSP AAHOSP | DIAG AAULTG-CT |
Chong et al.18 | 2011Singapore | 192 | PSurgeryEmergency | VAL RIPASAEmergency | Dolor RIFHOSP | DIAG AA |
De Castro et al.19 | 2012Holland | 941 | PEmergency | VAL Score | SUSP AAHOSP | DIAG AA |
Gudelis et al. | 2018Spain | 252 | PEmergency | DEV Score | Dolor RIFER | DIAG dolor RIF |
AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: Ultraschall; RIF: rechte Fossa iliaca; HOSP: hospitalisierte Patienten; P: prospektiv; R: retrospektiv; LR: logistisches Regressionsmodell; SUSP AA: Verdacht auf AA; CT: Computertomographie; ER: Notaufnahme; VAL: Validierung.
Einer der Beiträge unserer Studie ist die Verwendung von 4 Klassifikationsgruppen. In unserer Serie war die größte Patientengruppe die NsP-Gruppe. In den Studien, die mit mehr ausgewählten Patienten durchgeführt wurden (nachdem sie einen anfänglichen ‚Filter‘ in der Notaufnahme durchlaufen hatten), war diese Gruppe stärker reduziert.13,14
Die AA-Gruppe umfasste alle Patienten, die in die chirurgische Abteilung aufgenommen und bei Verdacht auf AA operativ behandelt wurden, deren Diagnose durch anatomische Pathologie bestätigt wurde. Der Prozentsatz dieser Patienten variierte entsprechend den Einschlusskriterien der verschiedenen veröffentlichten Studien.17
In unserer Studie wurde die AA-Diagnose durch die anatomische Pathologie bestimmt. Wenn wir Patienten mit Verdacht auf AA betrachteten, die operiert wurden, stellten wir fest, dass nur 6 (5,7%) Patienten keine anatomische Pathologiediagnose von AA aufwiesen (3 mit endgültiger Diagnose von NsP und 3 IRIF). Dieser Prozentsatz (5, 7%) negativer Appendektomien ist niedriger als bei Berichten aus anderen Serien zwischen 10% und 23%.7,11,15
Wir glauben, dass die Verwendung von zwei anderen NIRIF- und IRIF-Diagnosekategorien eine breitere Sicht auf das Problem und eine Klassifizierung bietet, die sich bei der Bestimmung einer Diagnose (weitere bildgebende Tests sind erforderlich) sowie der Behandlung und Prognose unterschiedlich verhält.
Der Hauptvorteil des auf Klassifikationsbäumen basierenden Modells, das in unserem Fall der CHAID-Typ ist, besteht darin, dass das Modell leicht zu interpretieren ist. Die generierten Klassifizierungsregeln umfassen alle möglichen Patienten und Aspekte verschiedener Untergruppen wie Alter und Geschlecht.20,21
Das CHAID-Modell hat festgestellt, dass die wichtigste Variable die Anzahl der Leukozyten ist (die mit dem ANN-Modell übereinstimmt). Der CHAID enthält auch den CRP-Pegel in der zweiten Zeile. Es ist auch interessant festzustellen, dass die klinische Variable Schmerzen beim Husten sind. Während der klinischen Untersuchung hängt dieser Schmerz nicht vom Forscher ab, sondern von einem Manöver, das weit von der direkten Bauchuntersuchung entfernt ist. Die 10 generierten Klassifizierungsregeln wurden nach der Hauptdiagnosemöglichkeit gruppiert. Klarere Regeln können für die Diagnose von NsP und AA (die wir als ’speziell‘ bezeichnen) gefunden werden, bei denen die Differentialdiagnose eine größere Bedeutung erlangt, da die NIRIF- und IRIF-Gruppen präsenter sind.Andere Serien wurden unter Verwendung verschiedener Klassifikationsbaummethoden wie CART veröffentlicht, unterschieden jedoch nur zwischen AA und Nicht-AA. Es wurden auch Modelle mit klinischen und analytischen Variablen erstellt,22 unter Verwendung der Kombination mit Alvarado23 und Hinzufügen von Bildgebungstests.24
Das verwendete ANN-Modell erreicht akzeptable Werte der Unterscheidungsfähigkeit. Der Nachteil dieses Modells ist, dass es wie eine ‚Black Box‘ funktioniert und für den klinischen Einsatz nicht einfach interpretiert werden kann, da es aus 480 Parametern (10 × 12 × 4) besteht, die alle Wechselwirkungen zwischen den Eingabevariablen, denen der verborgenen Schicht und denen der Ausgabeknoten. Für seine Verwendung ist ein Computer erforderlich, der als Vergleichsmodell fungiert. Das ANN verwendet alle Verbindungen der verwendeten Variablen und ist nicht genauer als das CHAID-basierte Modell. Andere Studien haben ANN für die Diagnose von AA verwendet (mit Schwerpunkt nur auf AA und Nicht-AA).25
Diese Studie hat auch einige Einschränkungen. Die wichtigste ist die Zuordnung der verwendeten Gruppen. Dies sind Gruppen, die in der Literatur nicht validiert wurden, und AA wird als entzündlicher Prozess angesehen. Es wäre interessant, eine größere Stichprobengröße zu haben, insbesondere in den NIRIF- und IRIF-Diagnosegruppen. Zur Verteidigung der Studie glauben wir, dass die Modelle, die nur AA mit anderen Bedingungen vergleichen, weniger Kapazität haben, um im realen Patientenmanagement verwendet zu werden.Zusammenfassend glauben wir, dass Fachleute, die Patienten mit RIF-Schmerzen behandeln, von Modellen profitieren können, die einfach zu interpretieren sind und eine Klassifizierung mit mehr als zwei Möglichkeiten bieten (AA vs. Nicht-AA). Das generierte CHAID-Modell hat dieses Ziel erreicht, obwohl es in anderen größeren Serien validiert werden sollte.
Finanzierung
Für die Durchführung dieser Studie wurden keine Mittel erhalten.
Interessenkonflikt
Wir haben keinen Interessenkonflikt zu erklären.