Skip to main content
. 2007 Autumn;12(3):195–203. [Article in French] doi: 10.1155/2007/705616

TABLEAU 1.

Grille d’évaluation des instruments

Validité de contenu
1.1 La définition de la douleur est-elle uniforme tout au long de l’étude (sans confusion avec un autre concept comme l’autonomie) ?
1.2 Tous les énoncés respectent-ils les limites propres à la fois aux personnes âgées et aux personnes ayant des capacités limitées à communiquer ?
1.3 Un groupe d’experts indépendants a-t-il vérifié la pertinence du contenu de l’instrument ?
Y a-t-il un ou plusieurs énoncés qui entrent dans la catégorie (8)
1.4 Facial expressions (slight frown, sad, frightened face; grimacing, wrinkled forehead, closed or tightened eyes; any distorted expression; rapid blinking)
1.5 Verbalizations, vocalizations (sighing, moaning, groaning; grunting, chanting, calling out; noisy breathing; asking for help; verbally abusive)
1.6 Body movements (rigid, tense body posture, guarding; fidgeting; increased pacing, rocking; restricted movement; gait or mobility change)
1.7 Changes in interpersonal interactions (aggressive, combative, resisting care; decreased social interaction; socially inappropriate; disruptive; withdrawn)
1.8 Changes in activity patterns or routines (refusing food, appetite change; increase in rest periods, sleep, rest pattern changes; sudden cessation of common routines; increased wandering)
1.9 Mental status changes (crying or tears; increased confusion; irritability or distress)
1.10 Les énoncés servent-ils exclusivement à décrire la douleur (pas de confusion avec autre construit) ?
1.11 Les énoncés ont-ils été produits correctement (par observation clinique, groupe de travail, analyse bibliographique) ?
1.12 Une analyse d’énoncés est-elle présentée ? Dans l’affirmative, est-ce que touts les énoncés semblent importants (p. ex., est-ce que touts les énoncés contribuent à la modification du score entre une situation calme ou douloureuse, ou entre avant et après le traitement). Les scores sont-ils étendus ? A-t-on observé des scores élevés proches du maximum ?
Validité de construit (discriminante)
2.1 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
2.2 Le statut cognitif des sujets est-il établi ?
2.3 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
2.4 Résultats : L’instrument permet-il de discriminer de façon statistiquement significative entre un événement douloureux et non douloureux ? Permet-il de détecter un changement statistiquement significatif du niveau de douleur après un traitement ?
Validité de construit (convergente)
2.5 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
2.6 Le statut cognitif des sujets est-il établi ?
2.7 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
2.8 Résultats : Les résultats de l’instrument sont-ils corrélés de façon statistiquement significative avec ceux d’un ou de plusieurs autres instruments d’hétéroévaluation ? Remarque : aucun point n’est alloué à la comparaison du score de l’instrument avec ceux obtenus par mesure d’autoévaluation.
Validité de construit (divergente)
2.9 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
2.10 Le statut cognitif des sujets est-il établi ?
2.11 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
2.12 Résultats : A-t-on comparé l’instrument à un instrument servant à mesurer un construit différent (p. ex., agressivité, autonomie) ? Dans l’affirmative, y a-t-il absence de corrélation statistiquement significative entre les deux instruments ?
Fiabilité (cohérence interne)
3.1 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
3.2 Le statut cognitif des sujets est-il établi ?
3.3 La taille de l’échantillon est-elle pertinente pour les analyses (n = 5 nombre d’énoncés) ?
3.4 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
3.5 Résultats : La cohérence interne (α de Cronbach) est-elle supérieure à 0,70 ?
Fiabilité interobservateurs
3.6 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
3.7 Le statut cognitif des sujets est-il établi ?
3.8 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
3.9 Résultats : La fiabilité interobservateurs est-elle supérieure à rp = 0,70 ? L’ICC est-il supérieur à 0,60 ? Le pourcentage d’accord est-il supérieur à 70 % ? Le coefficient Kappa est-il supérieur à 0,60 ?
Fiabilité test-retest
3.10 Échantillon : Ratio homme-femme pertinent ? Représente-t-il toute la population visée ou seulement une partie (origine ethnique, classe sociale, etc.) ?
3.11 Le statut cognitif des sujets est-il établi ?
3.12 Les méthodes d’évaluation et techniques statistiques sont-elles pertinentes ?
3.13 Résultats : La fiabilité test-retest est-elle supérieure à rp = 0, 70 ? (idem question n° 3.9) ?
Utilité clinique
4.1 Les qualifications des observateurs sélectionnés pour la mise au point sont-elles pertinentes dans un contexte d’utilisation clinique de l’instrument ?
4.2 La méthode d’administration est-il bien décrite et facile à reproduire ?
4.3 Le mode d’attribution des scores est-elle bien décrite et reproductible ?
4.4 Des directives ou consignes adéquates sont-elles proposées pour l’interprétation des scores ?
4.5 Existe-t-il des données satisfaisantes pour établir une norme pour l’instrument ? Les auteurs présentent-ils un score moyen avec écart-type (et distribution normale), obtenus sur un échantillon de taille appropriée (>100), constitué de personnes représentatives de la population visée ?
4.6 Les énoncés sont-ils bien décrites et faciles à comprendre ?
4.7 Les énoncés sont-ils de format uniforme ?
4.8 La durée requise pour administrer l’instrument est-elle pertinente (c.-à-d. ≤ 10 minutes) ? Si la durée n’est pas précisée, on essaie de l’estimer à partir de l’information disponible.
4.9 L’entraînement requis pour l’observateur est-il convenable (c.-à-d. ≤ 3 heures) ? Si l’entraînement n’est pas précisé, on essaie de l’estimer à partir de l’information disponible.
4.10 L’instrument a-t-il été bien reçu (et perçu comme utile) par les soignants ?

Pour chaque question, une réponse « oui » donne un point et une réponse « non » ne donne pas de point, avec un score maximum de 47 points