L’objectif de notre étude est d’utiliser les données des services d’urgence pour développer un diagnostic différentiel de la douleur RIF basé sur la méthodologie de l’arbre de classification. Nous comparerons également ce modèle avec les scores classiques et le score généré par un réseau de neurones artificiels (ANN) pour aider au diagnostic des AA et d’autres processus abdominaux.
Méthode
Étude d’observation prospective d’une période de 18 mois (entre le 1er juillet 2015 et le 31 décembre 2016) réalisée aux urgences (URGENCES) d’un hôpital de deuxième niveau avec 450 lits d’hôpital et 93 000 visites annuelles aux urgences.
Les patients ont donné leur consentement éclairé signé et l’étude a été approuvée par le Comité d’Éthique de la Recherche clinique (CEIC) de l’hôpital.
Nous avons inclus des patients de plus de 14 ans avec plus de 6h d’évolution de la douleur dans le RIF. Les patients avec des appendicectomies antérieures et ceux qui ont été perdus pour le suivi ont été exclus.
Une fois le diagnostic de douleur dans le RIF établi, les variables suivantes ont été collectées: âge, sexe, chirurgie abdominale antérieure, indice de masse corporelle (IMC), temps d’évolution des symptômes en heures, prise antérieure d’analgésie et température corporelle.
Les variables cliniques incluses dans les modèles classiques ont été collectées: douleur antérieure similaire, signe de Blumberg (positif ou non), migration de la douleur, augmentation de la douleur avec toux, augmentation de la douleur avec mobilisation, nausées / vomissements, anorexie, diarrhée et constipation. Données analytiques incluses: nombre de leucocytes (nombre de cellules×109), pourcentage de neutrophiles (%) et taux sériques de CRP (mg / dL). La méthode d’analyse utilisée était la méthode standard du laboratoire hospitalier. Au cours du suivi, les données enregistrées comprenaient si le patient était hospitalisé, si une intervention chirurgicale avait été effectuée et le diagnostic à la fin de l’épisode. Quatre groupes diagnostiques ont été établis: douleur RIF non spécifique (NsP) lorsque les symptômes ont disparu et que le patient a été renvoyé à domicile; AA lorsque le patient a été opéré et que l’anatomie pathologique était concordante; douleur abdominale dans le RIF sans inflammation (NIRIF) et douleur abdominale dans le RIF avec inflammation (IRIF). L’inflammation a été définie comme l’existence de 2 symptômes cliniques ou plus des symptômes suivants, en plus de la douleur dans le RIF: température > 38 ° C ou
° C, fréquence cardiaque > 90bpm, fréquence respiratoire supérieure à 20 respirations par minute ou pCO2 mmHg, leucocytes sanguins > 12000/mL ou
Les valeurs des algorithmes Alvarado, 4 AIR6 et Fenyö-Lindberg5 ont été calculées.
Analyse statistique
Les variables sont exprimées en moyenne et écart type ou en pourcentage. Pour la comparaison entre les groupes (4 catégories), le test du Chi carré a été utilisé pour les variables qualitatives et le test non paramétrique de Kruskal-Wallis pour les variables continues. Une valeur P
Le modèle d’arborescence de classification a été créé à l’aide du module AnswerTree du programme SPSS® (version 20.0). L’option de Détection automatique de l’Interaction du Chi Carré (CHAID) a été utilisée avec un critère d’arrêt limité à un nombre minimum de 15 patients par nœud terminal.8
Le modèle ANN a été mis en œuvre à l’aide du programme Alyuda® (Neurointelligence) qui intègre la méthodologie Perceptron multicouche avec rétropropagation.9
La stratégie d’intégration des variables dans les modèles était de type » modèle complet » (inclusion de toutes les variables candidates); les deux modèles ont une capacité de sélection automatique des variables selon la signification ou la hiérarchie. La validation interne des deux modèles a été réalisée par validation croisée (10 partitions). La capacité discriminatoire des modèles a été déterminée en calculant l’aire sous la courbe ROC et les pourcentages de classification correcte (PCC).10
Résultats
295 patients présentaient des douleurs dans le RIF, et 43 ont été exclus: 15 avec une appendicectomie antérieure, 5 avec moins de 6h de symptômes progressifs et 23 pour manque de suivi. Le groupe d’étude final était composé de 252 patients (Fig. 1).
Sur ce total, 121 patients ont été admis à l’hôpital, dont 107 ont été traités chirurgicalement. Les cas ont été définis par groupes diagnostiques: 114 cas de NsP, 93 AA, 30 NIRIF et 15 IRIF. Les diagnostics inclus dans la classification NIRIF étaient: 11 cas d’infections des voies urinaires, 7 coliques néphrétiques, 5 gastro-entérites aiguës, 2 occlusion intestinale partielle, un kyste de l’ovaire et 4 « autres diagnostics ». Les diagnostics inclus dans le groupe IRIF étaient: 5 cas de maladie inflammatoire pelvienne, 4 pyélonéphrite aiguë, 2 abcès tubo-ovarien, 2 diverticulite aiguë, une cholécystite aiguë et une maladie inflammatoire de l’intestin.
Le tableau 1 montre les caractéristiques cliniques des patients inclus dans les 4 groupes diagnostiques. En général, les patients sont jeunes et il n’y a pas de différences selon le sexe.
Le tableau 2 présente les variables analytiques et les scores des modèles classiques étudiés. Si nous calculons les courbes ROC (ASC) des scores pour le diagnostic unique d’AA par rapport aux 3 diagnostics restants, nous obtenons 0,82 (0,76–0,87) pour le score Alvarado, 0,83 (0,77–0,88) pour l’AIR et 0,88 (0,84–0,92) pour Fenyö-Lindberg.
Caractéristiques analytiques et scores Alvarado, AIR et Fenyö-Lindberg par Groupes Diagnostiques (n = 252).
All(n=252) | NsP(n=114) | AA(n=93) | NIRIF(n=30) | IRIF(n=15) | P Valuea | |
---|---|---|---|---|---|---|
Leucocytes (109/l) | 12±5 | 10±4 | 16±4 | 10±4 | 14±4 | |
Percentage of neutrophils | 75±12 | 69±13 | 82±7 | 72±13 | 78±7 | |
CRP (mg/L) | 60±54 | 25±15 | 98±78 | 38±23 | 129±81 | |
Alvarado | 5±2 | 4±2 | 6±1 | 4±2 | 6±1 | |
AIR | 6±2 | 5±2 | 7±1 | 5±2 | 7±1 | |
Fenyö-Lindberg | 7±30 | −9±25 | 31±18 | −14±27 | 19±17 |
AA: appendicite aiguë; AIR: Réponse inflammatoire de l’appendicite; IRIF: douleur RIF avec inflammation; NIRIF: douleur RIF sans inflammation; NsP: douleur RIF non spécifique; CRP: Protéine C-réactive.
Valeurs en moyenne±SD.
Comparaison entre les groupes avec le test de Kruskal-Wallis.
Modèle d’arbre de classification CHAID
Le modèle CHAID a sélectionné 6 variables: nombre de leucocytes, CRP, toux douloureuse, signe de Blumberg, sexe et temps d’évolution.
La hiérarchie des variables, sélectionnées automatiquement, est illustrée à la Fig. 2. Le premier est le nombre de leucocytes et, selon le point de coupure (également déterminé automatiquement), les variables suivantes sont incorporées. Le modèle détermine 10 règles de prise de décision qui sont les nœuds finaux.
Arbre de décision CHAID avec 10 reglas de decisión-nodos finales.
Les nœuds finaux (Fig. 2) peut être classé en 3 catégories. Les nœuds 10, 11 et 13 présentent une classification claire pour le groupe de diagnostic NsP, les nœuds 7, 14 et 17 pour le diagnostic AA, et les nœuds 5, 12, 15 et 16 avec une classification moins claire (comprend les diagnostics NIRIF et IRIF), qui peuvent être considérés comme spéciaux. Par exemple, ces groupes spéciaux nécessitaient plus d’ultrasons que les groupes avec une classification plus claire (41,6 vs. 21,1; P
.01).Modèle de réseau neuronal artificiel
Le modèle ANN généré sélectionne automatiquement 10 variables: signe de Blumberg, migration de la douleur, augmentation de la douleur, augmentation de la douleur avec le mouvement, douleur lors de la toux, anorexie, température, nombre de leucocytes, heures d’évolution et taux de CRP. L’architecture créée automatiquement est composée d’une couche d’entrée (avec les 10 variables sélectionnées), d’une couche cachée avec 12 nœuds et d’une couche de sortie avec la possibilité des 4 groupes de diagnostic. Le modèle attribue pour chaque patient (registre) un groupe diagnostique parmi les 4 probabilités diagnostiques possibles. Le modèle ANN détermine également que la variable ayant le plus de poids est le nombre de leucocytes.
Le tableau 3 compare le modèle ANN et l’arbre de classification CHAID. Aucune différence significative n’est observée entre les pourcentages de PCC ou dans les courbes ROC calculées.
Discussion
Cette étude a été comparée à d’autres études publiées dans la littérature sur la douleur dans le FRR (tableau 4). Les tailles des échantillons ont été examinées et ont montré une variabilité notable (la majorité variait entre 139 et 545 patients, le plus grand étant 941 patients).19
Comparaison Descriptive de Notre Étude Avec D’Autres Articles Publiés Sur La Douleur Liée Au RIF.
Name of Study | YearPlace | N | DesignService | Methodology | Population | Utility |
---|---|---|---|---|---|---|
Alvarado4 | 1986USA | 305 | RSurgery | DEV Alvarado | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg4 | 1997Sweden | 1,167 | PSurgery | DEV Fenyö-Lindberg | SUSP AAHOSP | DIAG AA |
Fenyö-Lindberg11 | 2004Sweden | 455 | PSurgery | VAL Fenyö-LindbergFemales | SUSP AAFemales-HOSP | DIAG AASurgery |
Tzanakis et al.12 | 2005Greece | 504 | PSurgery and radiology | DEV ScoreVAL Alvarado | SUSP AAHOSP | DIAG AAUltrasound |
Rennie et al.13 | 2006Great Britain | 300 | PSurgery | Study in females | SUSP AAFemales-HOSP | DIAG AA |
Antevil et al.14 | 2006USA | 383609 | P-RSurgery | VAL CT | SUSP AAHOSP | DIAG AACT |
Andersson et al.6 | 2008Switzerland | 545 | PSurgery | AlvaradoDEV Score LR | SUSP AAHOSP | DIAG AA |
McCartan et al.15 | 2010Ireland | 302 | PSurgery | Review AA | SUSP AAHOSP | DIAG AA |
Lintula et al.16 | 2010Finland | 181 | PSurgery | VAL ScorePediatrics | SUSP AAHOSP | DIAG AA |
Poletti et al.17 | 2011Switzerland | 183 | PRadiology | VAL ULT/CT | SUSP AAHOSP | DIAG AAULTG-CT |
Chong et al.18 | 2011Singapore | 192 | PSurgeryEmergency | VAL RIPASAEmergency | Dolor RIFHOSP | DIAG AA |
De Castro et al.19 | 2012Holland | 941 | PEmergency | VAL Score | SUSP AAHOSP | DIAG AA |
Gudelis et al. | 2018Spain | 252 | PEmergency | DEV Score | Dolor RIFER | DIAG dolor RIF |
AA: acute appendicitis; DEV: development; DIAG: diagnosis; ULT: échographie; RIF: fosse iliaque droite; HOSP: patients hospitalisés; P: prospective; R: rétrospective; LR: modèle de régression logistique; SUSP AA: AA suspecté; CT: tomodensitométrie; ER: salle d’urgence; VAL: validation.
L’une des contributions de notre étude est l’utilisation de 4 groupes de classification. Dans notre série, le plus grand groupe de patients était le groupe NsP. Dans les études menées avec plus de patients sélectionnés (après avoir traversé un « filtre » initial à l’URGENCE), ce groupe était plus réduit.13,14
Le groupe AA comprenait tous les patients admis au service de chirurgie et traités chirurgicalement pour une suspicion d’AA, dont le diagnostic a été confirmé par une pathologie anatomique. Le pourcentage de ces patients variait selon les critères d’inclusion des différentes études publiées.17
Dans notre étude, le diagnostic AA a été déterminé par la pathologie anatomique. Si nous avons considéré les patients avec une suspicion d’AA ayant subi une intervention chirurgicale, nous avons constaté que seulement 6 (5,7%) patients ne présentaient pas de diagnostic anatomique de l’AA (3 avec diagnostic final de NsP et 3 IRIF). Ce pourcentage (5,7 %) d’appendicectomies négatives est inférieur aux rapports d’autres séries allant de 10 % à 23 %.7,11,15
Nous pensons que l’utilisation de deux autres catégories diagnostiques NIRIF et IRIF offre une vision plus large du problème et une classification qui se comporte différemment pour déterminer un diagnostic (plus de tests d’imagerie seront nécessaires) ainsi que le traitement et le pronostic.
Le principal avantage du modèle basé sur des arbres de classification, qui dans notre cas est le type CHAID, est que le modèle est facile à interpréter. Les règles de classification générées incluent tous les patients possibles et les aspects de différents sous-groupes, tels que l’âge et le sexe.20,21
Le modèle CHAID a détecté que la variable la plus importante est le nombre de leucocytes (coïncidant avec le modèle ANN). Le CHAID inclut également le niveau CRP dans la deuxième ligne. Il est également intéressant de noter que la variable clinique incluse est la douleur lors de la toux. Lors de l’examen clinique, cette douleur ne dépend pas de l’explorateur mais d’une manœuvre loin de l’examen abdominal direct. Les 10 règles de classification générées ont été regroupées en fonction de la principale possibilité de diagnostic. Des règles plus claires peuvent être trouvées pour le diagnostic de NsP et d’AA (que nous appelons « spécial ») où le diagnostic différentiel atteint une plus grande importance puisque les groupes NIRIF et IRIF sont plus présents.
D’autres séries ont été publiées en utilisant différentes méthodologies d’arborescence de classification, telles que CART, mais elles ne faisaient que différencier AA et non-AA. Des modèles ont également été réalisés avec des variables cliniques et analytiques,22 en utilisant la combinaison avec Alvarado23 et en ajoutant des tests d’imagerie.24
Le modèle ANN utilisé atteint des valeurs acceptables de capacité discriminante. L’inconvénient de ce modèle est qu’il fonctionne comme une « boîte noire » et ne peut pas être interprété de manière simple pour un usage clinique, puisqu’il est constitué de 480 paramètres (10×12×4) qui incluent toutes les interactions entre les variables d’entrée, celles de la couche cachée et celles des nœuds de sortie. Un ordinateur est nécessaire à son utilisation et fonctionne comme un modèle comparatif. L’ANN utilise toutes les interconnexions des variables utilisées et n’est pas plus précise que le modèle basé sur CHAID. D’autres études ont utilisé l’ANN pour le diagnostic de l’AA (en se concentrant uniquement sur les AA et les non-AA).25
Cette étude présente également plusieurs limites. Le principal est l’affectation des groupes utilisés. Ce sont des groupes qui n’ont pas été validés par la littérature, et l’AA est considéré comme un processus inflammatoire. Il serait intéressant d’avoir un échantillon de plus grande taille, en particulier dans les groupes de diagnostic NIRIF et IRIF. Pour défendre l’étude, nous pensons que les modèles qui ne comparent que les AA par rapport à d’autres conditions ont moins de capacité à être utilisés dans la prise en charge réelle des patients.
En conclusion, nous pensons que les professionnels qui traitent des patients souffrant de douleur IRF peuvent bénéficier de modèles faciles à interpréter et offrant une classification avec plus de deux possibilités (AA vs non-AA). Le modèle CHAID généré a atteint cet objectif, bien qu’il devrait être validé dans d’autres séries plus importantes.
Financement
Aucun financement n’a été reçu pour mener cette étude.
Conflit d’intérêts
Nous n’avons aucun conflit d’intérêts à déclarer.