Exactitude de l'auto-evaluation des medecins comparee a la mesure observee des competences: Une revue systematique

Ce message apparaît peut-être en raison d'une inadaptation de votre moteur de recherché aux références internet requises. Comprenez la raison de l'apparition de ce message et ce que vous pouvez faire pour mieux connaître le site.

Institution: STANFORD Univ Med Center | Mon compte | s'inscrire

Vol. 296 No. 9, 6 Septembre 2006

REVUE

Cet Article
•	Résumé
•	PDF
•	Version anglaise
•	Sauvegarder dans Citation Manager
•	Permissions

Contenu en rapport
•	Articles similaires dans ce journal

Pages du praticien
Exactitude de l'auto-évaluation des médecins comparée à la mesure observée des compétences

Une revue systématique

David A. Davis, MD; Paul E. Mazmanian, PhD; Michael Fordis, MD; R. Van Harrison, PhD; Kevin E. Thorpe, MMath; Laure Perrier, MEd, MLIS S

RÉSUMÉ

Contexte Les activités clés d'acquisition des connaissancestout au long de la carrière, les crédits de formationmédicale continue, la revalidation de la certificationde spécialité, et la compétence cliniquesont liés aux capacités des médecins àévaluer leurs propres besoins en matière de formationet à choisir les activités qui répondentà ces besoins.

Objectifs Déterminer avec précision comment les médecinss'auto-évaluent par rapport à l'observation externede leurs compétences.

Source de données Les bases de données électroniquesMEDLINE, EMBASE, CINAHL, PsycINFO, les ressources de rechercheet développement basées sur la FMC, et des moteursde recherches personnels ont été explorésen utilisant des termes se rapportant à l'auto-apprentissage, l'auto-évaluationet l'autoréflexion.

Sélection des études Les études étaient inclusessi elles comparaient les évaluations auto-notéesdes médecins avec des observations extérieures,si elles utilisaient des mesures quantifiables et reproductibles,si elles incluaient une étude de population au moinségale à cinquante pour cent de médecinstraitants, internes ou autre professionnel de santé, etse déroulaient en Angleterre, Canada, Etats Unis, Australieet Nouvelle Zélande. Les études étaientexclues si elles comparaient des auto-rapports, des étudesd'étudiants en médecine, concernaient les perceptionsdu médecin sur l'état des patients, si elles décrivaientle développement de mesures d'auto-évaluation,ou étaient des programmes d'auto-évaluation de sociétésspécialisées. Les études conduites dansle contexte d'une intervention éducationnelle ou d'améliorationde qualité étaient incluses seulement si des donnéescomparatives étaient obtenues avant l'intervention.

Recueil des données Etaient extraits les populations étudiées,le contenu et le domaine d'auto-évaluation de l'étude,la méthode utilisée pour mesurer l'auto-évaluationdes participants de l'étude et celles utiliséespour mesurer leur compétence ou performance, l'existenceet l'emploi de tests statistiques, les résultats d'étudeet les données comparatives expliquées.

Synthèse des données Cette recherche a produitsept cent vingt-cinq articles parmi lesquels dix-sept satisfaisaientaux critères d'inclusion. Les études incluaientun grand nombre de domaines, comparaisons, mesures et rigueurméthodologique. Sur les vingt comparaisons entre auto-évaluationet évaluation externe, treize ont peu démontré,rien démontré ou ont démontré unerelation inverse. Un certain nombre d'études ont montréque la précision était moins exacte dans l'auto-évaluationchez les médecins les moins expérimentéset chez les plus confiants. Ces résultats sont compatiblesavec ceux rencontrés dans d'autres professions.

Conclusion Bien que de qualité sous-optimale, la prépondérancedes preuves suggère que les médecins ont une capacitélimitée à s'auto-évaluer avec précision.Les processus actuellement utilisés pour mettre en placeun développement professionnel et évaluer les compétencesauraient besoin de plus se focaliser sur l'évaluationexterne.

JAMA. 2006;296:1094-1102.

L'auto-évaluation et la formation continue autodirigée ontlongtemps été les piliers de la profession médicale, carce sont des activités supposées étroitement liéesà la qualité des soins apportés au patient.¹Les médecins aux Etats Unis doivent démontrerleur engagement à apprendre tout au long de leur carrièreen choisissant et en participant à des programmes deformation médicale continue (FMC)² et en obtenant descrédits de FMC réclamés par la majoritédes Conseils de l'Ordre des Médecins des différentsétats sous la rubrique « loi sur la pratique médicaledans l'état ».³ Le certificat de validation desmédecins par l'Association Médicale Américaine⁴ basésur la participation à la FMC, satisfait aux exigencesde la Commission Commune sur l'Accréditation des Organisationsde Santé liée à l'accréditationde l'hôpital.

L'auto-évaluation et la formation continue ont étéadoptées par le Conseil Américain des SpécialitésMédicales comme étant l'un des quatre élémentsde son programme de maintien d'une certification.⁵ De plus,les représentants du Conseil Américain de Médecine Internequi ont choisi de repasser leur certification doivent compléter uncycle de dix ans, processus focalisé sur le développement professionnelcontinu et qui demande aux médecins d'être capablesde s'auto-évaluer.⁶ Dans la formation médicaleuniversitaire, la question de l'apprentissage par l'exercicepratique et de l'amélioration basée sur l'auto-évaluationest un principe essentiel du développement professionnelau Canada,⁷ aux Etats-Unis⁸ et dans d'autres pays.⁹

Chacun des éléments de cette chaîne – l'importancede l'auto-évaluation, l'apprentissage permanent, l'acquisitionde crédits de FMC et leur utilisation pour le maintiende l'autorisation d'exercer, l'accréditation et la certificationcontinue – dépendent fortement de la capacitédes médecins à déterminer leurs propresbesoins d'apprendre et de trouver les ressources pour les satisfaire.

Pourtant, une revue récente de la littératureorientée vers la théorie sur l'auto-évaluation(incluant celles des professionnels de santé) soulèvede nombreuses questions concernant les défaillances desprofessionnels à exprimer un jugement concis de leurperformance de manière régulière ou pertinente,ce qui est une exigence critique pour une profession autorégulée.¹⁰

Sachant que le terme auto-évaluation est utilisépour décrire plusieurs types d'activités, nousnous sommes intéressés à considérerl'aspect « auto-cotation » ou « auto-audit» par contraste à l'utilisation du contrôlede connaissances auto-administré ou de la performanceclinique. A notre connaissance, il n'existe pas de revues systématiquesd'études de ce type d'auto-évaluation médicalecomparée à des observations externes. Par conséquent,nous avons revu la littérature pour détermineravec précision, comment les médecins auto-évaluésse comparent avec les observations externes de leur compétence.

MÉTHODES

Sources d'information: Les bases de données MEDLINE (1966-Juillet2006), EMBASE (1980-Juillet 2006), CINAHL (1982-Juillet 2006), PsycINFO(1967-Juillet 2006), la base de ressource de Recherche et développementpour la FMC (1978-July 2006)¹¹ et les moteurs de recherche privésutilisant les termes apprentissage autodirigé, auto-évaluation,auto-réflexion, auto-cotation, exercice de réflexion,rapport de plusieurs sources, et termes apparentés. L'indexationde ce sujet dans les bases de données de la littératureest limitée et très peu de titres pertinents étaientdisponibles, la recherche dépendait par conséquentde l'identification de mots clés dans des articles innovateurset des groupes d'experts. La recherche manuelle a étéconduite en revoyant des références d'articlesrécupérés. La stratégie complètede recherche est disponible sur demande.

Sélection des données

Etaient incluent les études s'étant focalisées surune comparaison entre médecins auto-évalués déterminéspar une auto-cotation et une ou plusieurs mesures externes deleurs capacités. Les études choisies utilisaientce type d'auto-évaluations (perception des médecinsou anticipation de la connaissance, capacité ou performance) comparésà des mesures externes bien décrites — examenclinique structuré et objectif (ECSO) dans le mêmedomaine ou comparaison des notes de performance observées.De plus, les études inclues devaient: utiliser des mesuresquantifiables et reproductibles; avoir une population étudiéed'au moins cinquante pour cent de médecins, internes,ou professionnels de santé tels que les infirmièresou médecins assistants pour pouvoir être généraliséesà ces groupes et être menées au Canada,Etats-Unis, Australie, Nouvelle-Zélande qui ont des exigencesde formation, d'actualisation des compétences, de langueset de FMC communes. Nous avons exclu les études de comparaisond'auto-rapports, celles évaluant des étudiantsen médicine ou principalement d'autres professionnelsde santé, celles portant sur le développementou le contrôle des mesures d'auto-évaluation, l'évaluationde l'impression des médecins sur l'état des patientsou les programmes d'auto-évaluation de sociétés spécialiséesqui fournissent un corrigé des tests de connaissanceaux médecins. Les études menées dans un contexted'intervention visant à améliorer la qualitéou l'aspect éducatif dans ce domaine d'évaluationn'étaient incluses que si des données comparativesétaient obtenues avant l'intervention.

Recueil des données

L'information suivante était extraite de chaque article: étudede population; domaine du contenu et domaine d'auto-évaluationde l'étude; méthode utilisée pour mesurerl'auto-évaluation des participants de l'étude;méthodes utilisées pour observer ou mesurer lescompétences ou performances des participants; l'existenceet l'utilisation de mesures quantifiables; et l'étudedes résultats. Lorsqu'elles étaient disponibles,les données à l'intérieur de l'étudepouvant expliquer les associations entre auto-évaluationet évaluation externe étaient recherchées.Aucune extraction des données n'était conduited'une manière aveugle. Une métaanalyse n'a pasété faite dans la mesure où les constructionsconceptuelles dans le domaine de l'auto-évaluation étaientvariées et évaluaient différentes capacitésutilisant des mesures variables.

La qualité méthodologique de l'article était évaluéeen déterminant (1) s'il était suffisamment descriptifpour permettre la reproductibilité de la population étudiée,(2) le domaine d'auto-évaluation, et (3) l'indicationexplicite d'une procédure en aveugle des observationsexternes d'auto-évaluation. De plus, l'échantillonnagesur lequel l'étude de population était basée,les méthodes utilisées d'auto-évaluationet d'évaluation externe, l'identification de modèles-pilotesou de méthodes validées par les auteurs des études,et la présence et le caractère appropriédes tests statistiques étaient déterminés.

La recherche de la littérature a été faitepas l'un des auteurs (L.P) et reproduite par un spécialistede la gestion de l'information indépendant. L'un desauteurs (D.A.D) déterminait les critères d'inclusion.Les critères d'inclusion étaient appliquésau résumé de tous les articles par deux des auteurs(D.A.D., P.E.M.) et confirmés par un autre auteur (L.P.).Les méthodes d'extraction des données ont été développéespar l'un des auteurs (D.A.D.) et ont été appliquéespar deux des auteurs (D.A.D., P.E.M.) aux articles qui répondaientau critère d'inclusion. Les désaccords sur lescritères de recherche, les données extraction,et la classification des résultats des études étaientrésolus par consensus.

RÉSULTATS

Résultats de la recherche et vue d'ensemble de l'article

Les stratégies de recherche ont permis de trouver septcent vingt-cinq articles après avoir éliminédes études qui faisaient doublon et les étudesnon pertinentes lors de la recherche par titre. Aprèsapplication des critères d'inclusion aux résumésde ces articles et en excluant les études baséessur les rapports personnels, l'évaluation des étudiantsen médecine ou d'autres professions de santé necorrespondant pas aux critères d'inclusion, les étudescentrées sur le patient ou les rapports sur le développementd'outils et de conceptions d'auto-évaluation, d'évaluationde formation après le cursus d'étude ou d'auto-évaluationde programmes de sociétés spécialisées,restaient 30 articles publiés entre 1998 et 2005. Aprèsrevue du texte complet de ces articles, treize autres furentexclues en se basant sur ces critères ou parce qu'ilsse rapportaient aux caractéristiques des médecinstelles que leur processus de décision ou le fait qu'ellesavaient été faites dans des pays exclus, laissantdixsept articles^12-28 répondant à tous les critèresd'inclusion. Trois études ont utilisé deux comparaisonsexternes chacune,^12,15,23 résultant en vingt comparaisonsentre auto-évaluation et évaluation externe.

La majorité des résultats de ces étudesse rapportant à la médicine clinique, comme l'expériencedes procédures, les soins palliatifs et les connaissances généralesen médicine.^{12-17,21-25,27,28} Une étude étaitcentrée sur la faculté d'enseignement,¹⁸ une autresur les compétences culturelles,¹⁹ et deux autres surla médecine basée sur les preuves.^20,26 Six étudesexaminaient les capacités d'auto-évaluation desmédecins traitants et une étude tenait comptedes médecins traitants,¹⁶ médecins assistantset infirmières. L'étude par Léopold et al¹⁶était conduite dans un contexte d'intervention éducative spécifiqueet précise. Le reste des études^{12,14,15,17,21-23,26} serapportait aux étudiants en médecine en formationou à la fois aux étudiants et médecinstraitants (Tableau 2 et Tableau 3).^25,28

Voir ce tableau:
[dans cette fenêtre]
[dans une nouvelle fenêtre]

Tableau 2.. Etude ayant examiné l'auto-évaluation des médecins praticiens.

Voir ce tableau:
[dans cette fenêtre]
[dans une nouvelle fenêtre]

Tableau 3.. Etudes ayant examiné l'auto-évaluation de médecins diplômés en formation et de médecins praticiens.

Voir une version plus large (112K):
[dans cette fenêtre]
[dans une nouvelle fenêtre]

Figure.. Recherche et sélection des études sélectionnées.

Domaines d'auto-évaluation

Les vingt comparaisons entre auto-évaluation et évaluation externeétaient divisées en trois approches d'auto-évaluation.Six études^{14,15,17,20,26,28} se rapportaient àl'auto-évaluation prédictive, qui est la capacitédes médecins de prédire sa performance d'aprèsune évaluation future des compétences.^{12,16,18,19,21-25}

Neuf comparaisons concernaient la théorie d'auto-évaluationadditionnelle et rétrospective. Dans deux études,^12,16 ondemandait aux participants de noter leur performance dans unexercice de simulation récemment complété,plus tard comparé aux notations données par desobservateurs externes. Sept études demandaient aux participantsde fournir des représentations mentales d'euxmêmesau cours du temps (compétents en médecine générale,^21-25 compétentsen enseignement chirurgical,¹⁸ et compétence culturelleet linguistique¹⁹) comparées aux perceptions de performancedans ces domaines par des internes,¹⁸ des patients,¹⁹ des surveillantset personnel de service,^22,23 des tests objectifs^21,23,24 oudes audits de dossiers d'observation.²⁵

La dernière approche était celle de l'auto-évaluationsimultanée. Deux études dans cette catégoriedemandaient aux médecins d'auto-identifier leurs besoinsactuels en matière d'apprentissage. Dans chacune, le processusincluait une réflexion sur ses performances, connaissancesou capacités dans des situations familières.

Méthode d'auto-évaluation

L'auto-cotation était menée dans des étudespar questionnaire, liste ou enquête et se concentraitsur les besoins d'apprentissage,^13,27 la confiance dans la réalisationdes procédures,^14,16 les capacités générales cliniques,^{12,21-25,27,28} l'estimationmédicale et critique des connaissances^17,20,26 ainsique les compétences non cliniques (ex: capacités d'enseigneret compétences culturaleslinguistiques).

Méthodes par évaluation externe

Les études ont comparé l'auto-notation par des médecinsavec des mesures objectives externes constantes^14,15 tellesque les OSCE, des patients standardisés,^12-21 des simulations,¹⁶ laperformance lors de la formation ou d'autres examens,^{17,23,24,26-28} l'auditdes dossiers cliniques,²⁵ ou la capacité à expliquerles concepts de la médecine par les preuves àun interlocuteur en aveugle.²⁰

Les études ont aussi comparé l'auto-notation des médecinsà des données dérivées d'interviewsstructurés complétés par les agendas des médecins¹³ oules cotations d'intervenants tels que les internes,¹⁸ patients¹⁹ou superviseurs universitaires.^12,15,22,23

Dans trois des études,^12,18,23 les instruments utilisésdans l'auto-notation des médecins correspondaient bienaux instruments utilisés à des buts comparatifs

Méthode par comparaison d'auto-évaluation et évaluation externe

Les études ont démontré une certaine hétérogénéitédans leur choix de comparaison et l'utilisation des méthodesstatistiques. Les études rapportaient soit l'utilisationde statistiques descriptives,^13,20,21,24 soit des statistiques déductives.^{12,14-19,22,23,25-28}

Deux études n'ont pas identifié les tests statistiques appliqués.^12,22 Uneétude¹² utilisait le même instrument pour auto-évaluationet mesure externe, permettant par conséquence des testsd'accord précis.

Précision de l'auto-évaluation

Des vingt comparaisons entre auto-évaluation et évaluation externe,treize ont démontré peu, pas ou une relation inverse entreles mesures d'auto-évaluation et les autres indicateurs.^{2-18,20,21,23,26,27} Sixétudes utilisaient des notes de confiance globale comparées auxperformances des procédures utilisant des check-lists comportementalespour noter la performance dans l'évaluation de la démence,¹² la compétence dans les procédures, ^14-16 lesconseils au patient en faveur de la santé²¹ et la capacitéde donner des soins en urgence.²³ Deux études ont utilisésdes interviews structurées comme mesure externe, mettanten évidence un manque d'harmonie entre auto-évaluationet observation externe pour déterminer les besoins deformation dans les soins médicaux palliatifs¹³ et dansles capacités des médecins a expliquer les termesde la médecine basée sur l'évidence.²⁰ Troisétudes utilisaient des tests tels que des examens àchoix multiples en soins d'urgence,²³ des articles standardiséspour tester les capacités d'évaluation critique²⁶et des tests vrai/faux dans trois domaines de médecine générale.²⁷

Voir ce tableau:
[dans cette fenêtre]
[dans une nouvelle fenêtre]

Tableau 1.. Etudes montrant l'auto-évaluation des capacités d'enseigner, des compétences culturelles, et de la médecine basée sur les preuves.

Une étude montrait l'échec des chirurgiens pourjuger des capacités de perception des internes par rapportaux capacités d'enseigner des chirurgiens.¹⁸ De plus,la proportion d'études rapportant peu, pas ou une relation inversen'a pas semblé varier en fonction du niveau de formation oude l'expérience ou des années d'étude.

Par contraste, sept comparaisons^{12,15,19,22,24,25,28} ont démontrédes associations positives entre auto-évaluation et laplupart des observations externes. Trois ont trouvé uneconstance (et peu de variabilité) entre auto-notation aprèsréalisation d'une performance par les internes et les notationsdes témoins pour des nivaux globaux ou généraux decapacité à évaluer la démence,¹² lescapacités cliniques de base¹⁵ et dans la compétenceà prendre en charge les aspects psychologiques de l'exercicede la médecine générale.²² Deux étudesont démontré des associations positives entre expertiseauto-évaluée et le diagnostic par examen médicaldes violences sexuelles sur enfant,²⁴ ou l'aisance àreconnaitre les caractères de la varicelle.²⁸ Les deuxétudes utilisaient des étiquettes et photographiesde signes cliniques. Une étude¹⁹ montrait une importanteassociation entre auto-évaluation du médecin desa compétence linguistique et culturelle et les rapportsdes patients sur l'approche interpersonnelle de la prise en charge,ceci en utilisant un instrument standardisé. Une autre étude²⁵ démontraitl'association entre la sensibilité auto-évaluéeaux aspects émotionnels et psychologiques des patientset le diagnostic de ces aspects en pratique par l'audit des dossierscliniques.

Néanmoins, ces deux études²⁴ et une autre²⁴ montraientune variabilité parmi un sousgroupe de participants se considérantcompétents. Dans l'étude de Robin et al,²⁵ les médecinsse considérant meilleurs pour détecter les émotionscachées étaient en fait moins précis que leurscollègues. Dans l'étude faite par Paradise et al,²⁴on trouve une grande variabilité parmi les participantset des désaccords avec le consensus des experts traitantdu diagnostic d'abus sexuels dans vingt pour cent d'experts auto-proclamés.²⁴ Parmices études identifiées comme ayant peu ou pasde relation avec les observations auto-identifiées etles autres, il y avait trois cas concernant la perception erronéedes capacités. Tout d'abord Léopold et al¹⁶ ont trouvéune relation inverse entre confiance et compétence dans lasimulation d'injections intra-articulaires. Ensuite, Fox et al¹⁵ont démontré moins de concordance dans un contexteOSCE entre les auto-perceptions et les autres pour évaluerdes capacités basiques cliniques mal effectuéespar rapport à des exemples au cours desquels les participantsavaient bien réussi. Troisièmement, Parker et al¹⁷ont remarqué que les internes qui avaient un score situédans le quartile le plus bas pour un examen en médecinegénérale demandant des connaissances de base reconnaissaientmoins bien leurs besoins de formation que ceux dans les quartilesles plus élevés.

En ce qui concerne les variables qui pourraient expliquer les différencesde la précision de l'auto-évaluation, deux étudesrapportent l'âge^16,25 et une étude l'expérience²⁸ desparticipants, reliant cela aux capacités d'auto-évaluation.L'âge ou l'expérience n'étaient pas corrélésà la capacité du médecin à jugerles possibilités de faire une injection intra-articulaire.¹⁶ Parcomparaison, l'âge n'était pas corréléà la diminution de la propension à diagnostiquerl'aspect émotionnel d'une affection dans une étude²⁵et à une plus grande précision pour faire un diagnosticde varicelle dans l'autre.²⁸

Qualité Méthodologique

Les études ont démontré des variationsdans la qualité des méthodes employées.La majorité des populations étudiées étaientbien décrites. Seule une étude²⁰ utilisait lavague phrase « médecins généralistes ».De plus, le schéma d'échantillonnage était décritdans la plupart des études, bien que le chiffre total duquelest extrait l'échantillon ne soit pas été identifiédans 3 études^12,17,20 et qu'une description utile desnon-participants ne soit pas disponible pour 9 des études.^{13,15-18,23,25,26,28} Letype de contenu était bien caractérisédans toutes les études sous forme de texte ou de tableau.Deux études^13,20 utilisaient des méthodes de recherchequalitative standardisées telles que des interviews transcritesou enregistrées. Seule une étude²⁰ faisait référenceà l'utilisation en aveugle d'un observateur externe.

Quantitativement, 9 études^{12,14-16,19,21,23,25,27} utilisaientdes mesures pré-testées ou validées telles queles OSCE, des patients standardisés et des instruments standardiséset 2 de ces études^14,16 décrivaient des critèresobjectifs d'observation de la performance. Deux études^14,15 ontutilisé des étudiants en médecine pourun test pilote des méthodes de comparaison des mesuresd'auto-évaluation. En comparaison, ^{13,15-21,24,26,27} lesautres études ont appliqué des instruments d'auto-évaluationou d'autres instruments qui n'ont pas été décritscomme ayant été des tests pilotes ou des testsvalidés.

En ce qui concerne l'utilisation et le commentaire des tests statistiques,nous avons trouvé des exemples de méthodes inappropriées.Par exemple, 2 études^12,22 n'ont pas mentionnéquels tests avaient été utilisés. Parmiles autres problèmes, nous avons identifié desdonnées insuffisantes ou imparfaites empêchantla confirmation des rapports de cotes,¹⁹ les variables de dichotomisation,^19,28 l'utilisationincomplète ou imparfaite des paramètres dans deséchelles avec des applications statistiques inadaptées,²⁰ ainsique des justifications insuffisantes de l'utilisation de statistiquesavec des échelles mixtes (par exemple des comparaisons d'intervallesde confiance avec des scores OSCE).^14,15 Lorsque des comparaisonsmultiples ont été effectuées, il n'y apas eu de description des calculs faits pour ajuster sur l'inflationdes erreurs de type I. Aucune tendance a l'améliorationde la rigueur méthodologique n'a été observéependant la durée de temps de ces études.

COMMENTAIRE

Relation entre auto-évaluation et évaluation externe

Cette revue systématique a trouvé que dans lamajorité des études appropriées, les médecins n'apparaissaientpas comme s'auto-évaluant avec précision. Nousavons observé des associations faibles ou pas d'associationdu tout entre évaluations de médecins auto-cotéset évaluations externes.

Alors que certaines études trouvaient des associationsraisonnables entre les capacités d'auto-évaluation démontréespar les médecins et les évaluations externes dansle domaine sensibilité culturelle et linguistique,¹⁸ entreauto-évaluations et évaluations par un superviseur àun niveau général,^12,15,22 entre autotests ettests externes,^24,28 et entre auto-évaluation et auditsur dossier, d'importantes variations et quelques erreurs dejugement apparaissent dans d'autres études.^24,25 Dansles études montrant une précision pauvre ou limitée del'auto-évaluation, cette observation était indépendantedu niveau de formation, de la spécialité, du domained'auto-évaluation, ou du style de comparaison.

Ces résultats ne sont pas nouveaux. Sibley et al²⁹ ont rapportédes résultats semblables il y a plus de deux décennies,comme l'ont fait Gordon³⁰ et Dunning³¹ et al³¹ par la suite. Lesrésultats sont compatibles avec les études d'autres disciplines.Par exemple, dans une méta-analyse d'études d'auto-évaluation,en droit, ingénierie, counseling, science du comportement,psychologie, et médecine, Falchikov et Boud³² ont remarquéune corrélation entre auto-évaluation et évaluationexterne d'étudiants dont les performances se situaiententre 0,05 et 0,82 avec une moyenne de 0,39. Dans les professionsde santé, Gordon³⁰ a trouvé que la corrélationpour l'auto-évaluation des connaissances se situait entre0,02 et 0,65. De plus, malgré nos résultats dansdeux études^24,28 qui précisent que l'auto-évaluationspécifique peut être un facteur prédictiffiable de la performance, Eva et al³³ ont trouvé quede faibles corrélations persistent même si les domainessont bien définis. En fin de compte, et plus inquiétant,les résultats montrent que ceux qui réussissaientle moins bien à l'évaluation externe, s'auto-évaluaientaussi le moins bien. Ces résultats^34,35 ont étédémontrés par d'autres et demandent une meilleurecompréhension.

Prises ensemble, ces conclusions incitent à réfléchir surl'emploi des évaluations auto-cotées et sur son rôledans la formation permanente ainsi que sa valeur dans la régulationet les soins aux patients.

Structure et étude de l'évaluation auto-cotée

Ces études soulignent plusieurs considérationspour l'étude de l'auto-évaluation en tant quedomaine important de la compétence du médecin.Tout d'abord la structure de l'évaluation auto-notéen'est pas elle-même facile à étudier, engrande partie parce que sa nature n'est ni pleinement développéeni testée.¹⁰ Nous avons défini trois types discretsd'évaluation: prévisible, résumée,simultanée.

Un bénéfice supplémentaire pourrait résulterde l'intérêt porté a la clarté conceptuelleet la cohérence dans le domaine de l'auto-évaluation;^36,37 unecompréhension plus complète de l'auto-évaluation continueet une définition plus précise de l'auto-évaluationpour inclure une compréhension accrue des capacitésdes médecins à réfléchir^38,39 etde la pertinence de ces idées.⁴⁰

De plus, étant donné que ces études n'apportent quepeu de lumière sur le processus de l'auto-évaluation, deplus amples recherches dans ce domaine pourraient évoluer au-delàdes frontières de la psychologie sociale et du comportementpour inclure la connaissance, la simulation ou d'autres approchesprometteuses telles que l'estimation de l'auto-efficacitéou l'étude du rôle que l'âge et l'expériencepourrait jouer dans ce processus.⁴¹

Deuxièmement, si de telles études d'auto-évaluationsont entreprises, les chercheurs devraient accroître larigueur et le compte – rendu de l'étude en décrivantmieux leurs populations, la structure d'échantillon,et leurs méthodes; en différenciant plus clairementles types d'auto-évaluation; en tentant de résoudredes questions du biais des volontaires et en formulant de meilleursguides pratiques afin d'étudier et de rapporter l'auto-évaluationcomparée à l'évaluation externe. Dans leurrevue des méthodes d'auto-évaluation, Ward et al³⁶demandaient également une plus grande rigueur méthodologiqueen améliorant la validité et la fiabilitédes références externes standards, en augmentantla description des supports dans les questionnaires utilisésdans les outils d'auto-évaluation, et en se concentrantplus sur la couverture des résultats au niveau individuelet moins au niveau du groupe.

Limites

Plusieurs limites doivent être considéréesdans cette revue. D'abord, pendant que des recherches de littérature étaienteffectuées par l'un des auteurs et un spécialisteindépendant de l'information pour fournir une couvertureexhaustive de la littérature, le manque de nombreux « MedicalSubject Headings » dans les données de la littératurepeut avoir contribué à ne pas avoir récupérécertaines études. Nous avons essayé de surmontercette limite en utilisant des moteurs de recherche brevetésqui utilisaient des textes complets de stratégies de recherche.Deuxièmement, certaines études manquaient de descriptionsdes méthodes, résultats, et de l'utilisation destests statistiques, limitant nos capacités à décrire lesétudes plus complètement, pour développerdes hypothèses explicatives, ou pour généraliser. Troisièmement,les domaines de compétence ou de performance dans cesétudes, les outils utilisés pour les mesurer etles suppositions (telles que prédiction d'une futureperformance dans un test, ou l'auto-notation dans une performancepassée en tant que professeur) étaient variables,empêchant une approche méta-analytique.

Enfin, on peut argumenter que le relativement petit nombre d'étudestrouvé dans cette revue — avec leur mélangede méthodes, niveaux différents de formation et d'expériencedes médecins, participation volontaire de médecins,et variation d'approche — fournit une base inadéquatede preuves pour comprendre la capacité des médecinsà compléter des évaluations auto-cotées.Toutefois, nous croyons que la littérature sélectionnéeoffre des preuves assez pertinentes des limites des capacitésdes médecins à évaluer indépendammentleur performance. Ces résultats peuvent aider àinformer à la fois d'autres recherches dans ce domaineet la structure et pratique de la formation autodirigéeet l'auto-évaluation à l'université eten formation continue.

Evaluation des formats et du contenu

S'il est vrai que les médecins ne sont pas performantsdans ce domaine, on a besoin de nouvelles initiatives et denouveaux formats pour aider au processus de l'auto-évaluationet pour promouvoir et évaluer avec plus de précisiondes domaines de compétence plus vastes tels que le professionnalismeet la formation permanente.³⁸

Les résultats positifs concernaient la performance globaleavec possibilité de retour d'information sur des étendues importantesde soin par des superviseurs, ^12,15,19,22 étaléeau cours du temps ou dans un domaine très spécialisétel que les abus sexuels d'enfants ou le bioterrorisme, danslequel on pourrait espérer que le praticien s'auto-évalueraitavec précision.

Enfin, une approche plus utile pourrait être de se concentrersur des auto-évaluations spécifiques avec uneapproche externe pour guider le praticien dans ses activitéséducationnelles et dans d'autres activités destinéesà améliorer ses performances.

Premièrement de telles mesures pourraient inclure le développementd'un processus de développement professionnel continuplus général impliquant des portfolios éducatifs, uneformation documentée basée sur la pratique et l'améliorationdes activités, pour créer une formation moinsgénérale et plus détaillée et des pratiquesobjectives répondant aux compétences généralesadoptées par le Conseil d'Accréditation pour laFormation Médicale Universitaire.⁸

Deuxièmement, la formation peut réduire les variationsentre auto-évaluation et évaluation externe enencourageant l'internalisation de mesures objectives ou de référencesde la performance.¹⁰ Bien qu'une étude¹⁶ dans cette revueait montré de manière marginale une améliorationde la corrélation entre confiance et performance suivantune formation avec retour d'information, une autre étude⁴² rapportaitqu'une formation augmentait la relation entre les techniques delavage de main observées et auto-évaluéesà la suite d'une initiative visant à améliorerla qualité au niveau hospitalier. De manière similaire,les médecins en formation peuvent être capablesde s'auto-évaluer de précisément lorsqu'ilscomparent leurs notes à celles des autres.³⁰

Une attention à cet effet de formation et au phénomène deretour d'information en médecine aussi bien à l'université,ainsi qu'en FMC, semble à la fois appropriée etbien située dans le temps.^43,44

Troisièmement, étant donné que certainsbesoins d'amélioration (par exemple ceux dans le domainepsychosocial) ^13,45,46 peuvent être plus difficiles àauto-évaluer, des méthodes telles que les évaluationsdes retours d'information de sources multiples (360°) peuventconstituer l'étape suivante nécessaire, en particulierlorsque les capacités interpersonnelles ou le professionnalismedoivent être évalués.⁴⁷

Quatrièmement, les mesures objectives de compétenceet de performance méritent une sérieuse considération, particulièrementquand les problèmes d'autorisation d'exercer et de ré-obtentionde diplôme, la qualité et la sécuritédu patient sont de première importance. De ce point devue, le Service National de Santé en Angleterre a fourniun exemple d'auto-évaluation éclairée effectuée enexterne en formulant le concept d'estimation (le processus structuré« d'autoréflexion facilitée »⁴⁸⁾ dans lequelun évaluateur externe guide et dirige le processus d'auto-évaluation.Enfin, des sociétés spécialiséeset d'autres sociétés peuvent accroître leurrôle en fournissant des objectifs de formation baséssur les preuves et ceci de manière régulière auxmembres de leur spécialité, donnant ainsi desmarqueurs externes de compétence.

Informations sur les auteurs

Correspondance: Laure Perrier, MEd, MLIS, University of Toronto, 500 University Ave, 6th Floor, Toronto, Ontario, Canada M5G 1V7 (l.perrier@utoronto.ca).

Contributions des auteurs: le Dr Davis a eu un accèscomplet à toutes les données publiées del'étude et accepte la responsabilité de l'intégritéet de la précision de l'analyse des données.

Conception et schéma de l'étude: Davis, Harrison,Mazmanian, Fordis.

Recueil des données: Davis, Perrier.

Analyse et interprétation des données: Davis, Mazmanian,Fordis, Harrison, Thorpe.

Rédaction du manuscrit: Davis, Fordis, Harrison, Mazmanian.

Revue critique du manuscrit: Davis, Mazmanian, Fordis, Harrison, Thorpe,Perrier.

Analyse statistique: Mazmanian, Fordis, Thorpe. Obtention du financement:Davis, Perrier.

Aide administrative, technique et matérielle: Perrier.

Supervision de l'étude: Davis.

Liens financiers: aucun déclaré.

Financement/Soutien: le Dr Davis a bénéficié partiellementd'un soutien de l'Association of American Medical Colleges'Petersdorfscholar-in-residence program. Ms Perrier a bénéficiépartiellement d'un soutien du Research and Development ResourceBase in Continuing Medical Education, finance par l'AcademicDevelopment Fund in Continuing Education de l'University ofToronto, qui est soutenue en partie par l'Alliance for Continuing MedicalEducation, la Society for Academic Continuing Medical Education,et le Royal College of Physicians and Surgeons du Canada.

Rôle du sponsor: aucun sponsor n'a été impliquédans le schema et la conduite de l'étude, le recueil,la prise en charge et l'interprétation des données nidans préparation, la revue et l'approbation du manuscrit.

Remerciements: nous remercions pour leur soutien l'Association ofAmerican Medical Colleges'Resource Center, en particulier Marian Talifero,pour avoir fourni les recherches complémentaires de la littératureet les autres membres du groupe de travail en Formation MédicaleContinue, dont Nancy Davis, PhD. Nous remercions aussi Kevin Eva,PhD, McMaster University (Hamilton, Ontario), et Anton Kuzel,MD, MHPE, Virginia Commonwealth University (Richmond), pourleurs commentaires. Aucune de ces personnes n'a reçude compensation pour son aide.

Affiliations des auteurs: Knowledge Translation Program of the Li Ka Shing Knowledge Institute at St Michael's Hospital (Dr Davis et Mr Thorpe), Departments of Health Policy, Management, and Evaluation (Dr Davis), Family and Community Medicine (Dr Davis), and Public Health Sciences (Mr Thorpe), and the Office of Continuing Education and Professional Développement (Ms Perrier), University of Toronto, Toronto, Ontario; Departments of Family Medicine and Epidemiology and Community Health, School of Medicine, Virginia Commonwealth University, Richmond (Dr Mazmanian); Center for Collaborative and Interactive Technologies, Baylor College of Medicine, Houston, Tex (Dr Fordis); and Department of Medical Education, University of Michigan, Ann Arbor (Dr Harrison).

BIBLIOGRAPHIE

1. Westberg J, Jason H. Fostering learners' reflection and self-assessment. Fam Med. 1994;26: 278-282. PUBMED
2. Davis NL, Willis CE. A new metric for continuing medical educationcredit. J Contin Educ Health Prof. 2004;24: 139-144. PUBMED
3. Johnson DA, Austin DL, Thompson JN. Role of state medical boards incontinuing medical education. J Contin Educ Health Prof. 2005; 25:183-189. PUBMED
4. American Medical Association. Physician resources for CME.http://www.ama-assn.org/ama/pub/category/2922.html.Accessed March 23, 2006.
5. American Board of Medical Specialties. Approved initiatives for Maintenance of Certification for the ABMS board members.http://www.abms.org/Downloads/Publications/3-Approved%20Initiatives%20for%20MOC.pdf.Accessed June 9, 2006.
6. Wasserman SI, Kimball HR, Duffy FD; Task Force on Recertification.Recertification in internal medicine: a program of continuous professionaldevelopment. Ann Intern Med. 2000;133: 202-208. FREE FULL TEXT
7. Can MEDS 2000: extract from the CanMEDS 2000 Project Societal NeedsWorking Group Report. Med Teach. 2000;22: 549-554. PUBMED
8. Accreditation Council for Graduate Medical Education. General competencies.http://www.acgme.org/outcome/compcompFull.asp.Accessed June 9, 2006.
9. Bashook PG, Miller SH, Parboosingh J, Horowitz SD, eds.Credentialing physician specialist: a world perspective proceedings.http://www.abms.org/Downloads/Conferences/Credentialing%20Physician%20Specialists.pdf.Accessed June 9, 2006.
10. Eva KW, Regehr G. Self-assessment in the health professions: are formulation and research agenda. Acad Med.2005; 80:S46-S54. PUBMED
11. Research and Development Resource Base in CME.http://www.cme.utoronto.ca/search.Accessed March 23, 2006.
12. Biernat K, Simpson D, Duthie E Jr, Bragg D, London R. Primary careresidents self assessment skills in dementia. Adv Health Sci EducTheory Pract. 2003; 8:105-110.
13. Amery J, Lapwood S. A study into the educational needs ofchildren's hospice doctors: a descriptive quantitative and qualitative survey. Palliat Med. 2004;18: 727-733. FREE FULL TEXT
14. Barnsley L, Lyon PM, Ralston SJ, et al. Clinical skills in juniormedical officers: a comparison of self-reported confidence and observed competence. Med Educ. 2004;38: 358-367. PUBMED
15. Fox RA, Ingham Clark CL, Scotland AD, Dacre JE. A study ofpre-registration house officers' clinical skills. MedEduc. 2000; 34:1007-1012.
16. Leopold SS, Morgan HD, Kadel NJ, Gardner GC, Schaad DC, Wolf FM.Impact of educational intervention on confidence and competence in the performance of a simple surgical task. J Bone Joint SurgAm. 2005; 87:1031-1037. PUBMED
17. Parker RW, Alford C, Passmore C. Can family medicine residentspredict their performance on the in-training examination? FamMed. 2004; 36:705-709.
18. Claridge JA, Calland JF, Chandrasekhara V, Young JS, Sanfey H,Schirmer BD. Comparing resident measurements to attending surgeonself-perceptions of surgical educators. Am J Surg.2003; 185:323-327. PUBMED
19. Fernandez A, Schillinger D, Grumbach K, et al. Physician language ability and cultural competence: an exploratory study of communication with Spanish-speaking patients. J Gen Intern Med.2004; 19:167-174. PUBMED
20. Young JM, Glasziou P, Ward JE. General practitioners' selfratings of skills in evidence based medicine: validation study.BMJ. 2002; 324:950-951. FREE FULL TEXT
21. Hoppe RB, Farquhar LJ, Stoffelmayr HR. Residents' attitudes towards and skills in counseling: using undetected standardized patients.J Gen Intern Med. 1990;5: 415-420. PUBMED
22. Ireton HR, Sherman M. Self-ratings of graduating family practice residents' psychological medicine abilities. Fam Pract ResJ. 1988; 7:236-244.
23. Johnson D, Cujec B. Comparison of self, nurse, and physician assessment of residents rotating through an intensive care unit.Crit Care Med. 1998;26: 1811-1816. PUBMED
24. Paradise JE, Finkel MA, Beiser AS, et al. Assessments ofgirls' genital findings and the likelihood of sexual abuse: agreement among physicians selfrated as skilled. Arch Pediatr AdolescMed. 1997; 151:883-891.
25. Robbins JM, Kirmayer LJ, Cathebras P, Yaffe MJ, Dworkind M. Physician characteristics and the recognition of depression and anxiety in primary care. Med Care. 1994;32: 795-812. PUBMED
26. Stern DT, Linzer M, O'Sullivan PS, Weld L. Evaluating medical residents' literature-appraisal skills. Acad Med.1995; 70:152-154. PUBMED
27. Tracey JM, Arroll B, Richmond DE, Barham PM. The validity of general practitioners' self assessment of knowledge: cross sectional study. BMJ. 1997;315: 1426-1428. FREE FULL TEXT
28. Woods R, McCarthy T, Barry MA, Mahon B. Diagnosing smallpox: would you know it if you saw it? Biosecur Bioterror.2004; 2:157-163. PUBMED
29. Sibley JC, Sackett DL, Neufeld V, Gerrard B, Rudnick KV, Fraser W.A randomized trial of continuing medical education. N Engl JMed. 1982; 306:511-515. PUBMED
30. Gordon MJ. A review of the validity and accuracy of self-assessments in health professions training. AcadMed. 1991; 66:762-769. PUBMED
31. Dunning D, Heath C, Suls J. Flawed self-assessment: implicationsfor health, education, and the workplace. Psychol Sci PublicInterest. 2004; 5:69-106.
32. Falchikov N, Boud D. Student self-assessment in higher education: ameta-analysis. Rev Educ Res. 1989;59: 395-430.
33. Eva KW, Cunnington JP, Reiter HI, Keane DR, Norman GR. How can Iknow what I don't know? poor self assessment in a well-defined domain.Adv Health Sci Educ Theory Pract. 2004;9: 211-224. PUBMED
34. Hodges B, Regehr G, Martin D. Difficulties in recognizing one's own incompetence: novice physicians who are unskilled and unaware of it. Acad Med. 2001;76: S87-S89. PUBMED
35. Kruger J, Dunning D. Unskilled and unaware of it: how difficultiesin recognizing one's own incompetence lead to inflated self-assessments.J Pers Soc Psychol. 1999;77: 1121-1134. PUBMED
36. Ward M, Gruppen L, Regehr G. Measuring selfassessment: current state of the art. Adv Health Sci Educ Theory Pract.2002; 7:63-80. PUBMED
37. Colliver JA, Verhulst SJ, Barrows HS. Self-assessment in medicalpractice: a further concern about the conventional research paradigm.Teach Learn Med. 2005;17: 200-201. PUBMED
38. Epstein RM, Hundert EM. Defining and assessing professional competence. JAMA. 2002;287: 226-235. FREE FULL TEXT
39. Mamede S, Schmidt HG. The structure of reflective practice inmedicine. Med Educ. 2004;38: 1302-1308. PUBMED
40. Hays RB, Jolly BC, Caldon LJ, et al. Is insight important? measuring capacity to change performance. Med Educ.2002; 36:965-971. PUBMED
41. Bandura A. Social cognitive theory: an agentic perspective.Annu Rev Psychol. 2001;52: 1-26. PUBMED
42. Moret L, Tequi B, Lombrail P. Should selfassessment methods be used to measure compliance with handwashing recommendations? a study carried out ina French university hospital. Am J Infect Control.2004; 32:384-390. PUBMED
43. Simon FA, Aschenbrener CA. Undergraduate medical education accreditation as a driver of lifelong learning. J Contin EducHealth Prof. 2005; 25:157-161.
44. Greiner AC, Knebel E, eds. Health Professions Education:A Bridge to Quality. Washington, DC: National Academy Press;2003.
45. Sherman CD Jr, Davis DA. CME in oncology–from where we were to where we are going. J Cancer Educ.1995; 10:131-136. PUBMED
46. Sachdeva AK. The new paradigm of continuing education in surgery.Arch Surg. 2005;140: 264-269. FREE FULL TEXT
47. Lockyer J. Multisource feedback in the assessment of physician competencies. J Contin Educ Health Prof.2003; 23:4-12. PUBMED
48. Conlon M. Appraisal: the catalyst of personal development.BMJ. 2003; 327:3890-3891.

| | | | Le JAMA-français

| |