Bonjour,
Je travaille actuellement sur ma thèse de master en santé publique et j'utilise les données collectées dans le cadre d'un test de contrôle randomisé en grappe basé sur une communauté, en Angola. L'étude a consisté à mettre en œuvre différentes interventions pour réduire la malnutrition infantile en Angola, sur une période de 2 ans. Je regarde les données recueillies au départ et les suivis, afin de voir l'efficacité de l'intervention au fil du temps et les différences entre les interventions. Mon problème actuel en nettoyagant des données est que j'ai trouvé des enfants avec HAZ de -7, -6, -5, etc, et de 8, 7, 6, etc. Comme je ne faisais pas partie de l'équipe de collecte des données, je peux ne pas être certain que ces z-scores résultent de mesures et d'enregistrements précis. Ainsi, je suis à la recherche de références / lignes directrices qui pourraient m'aider à identifier les valeurs aberrantes et les mesures impossibles / extrêmement improbables. Je comprends que regarder la longueur / ou la hauteur peut être difficile et il peut y avoir des cas extrêmes, mais je soupçonne que j'ai un trop grand nombre de «valeurs aberrantes», dont certaines que je considère comme extrêmement aberrantes.
Est-ce que quelqu'un a déjà rencontré ce problème dans le passé ? Comment le "résoudre" ? Que puis-je utiliser comme référence pour me guider et justifier l'exclusion de ces cas ?
Merci d'avance et passez un bon week-end.
Bonjour
Selon l'OMS, l'extrême (c.-à-d. biologiquement invraisemblable) de z-score longueur / taille-pour-âge est> 6 ou < -6
Vous trouverez plus d'informations via http://www.who.int/childgrowth/en/
Répondu:
6 années il y a"Biologiquement invraisemblable" ne signifie pas impossible. Un exemple: au cours d'une série de travaux sur le terrain au Zimbabwe, nous avons tenu à analyser les données anthropométriques avant toute autre chose. Cela nous a permis de repérer les données aberrantes ou extrêmes automatiquement par le logiciel que nous utilisions (Anthro), puis de revenir sur le terrain la semaine suivante pour évaluer si les mesures étaient exactes. Sur un seul site de village, nous avions 23 valeurs aberrantes. La réévaluation a montré que, en tenant compte de la croissance d'une semaine, 21 des 23 étaient des mesures fiables. Cela correspond à 91%. L'exclusion de ces cas signalés aurait biaisé sérieusement nos résultats et mené à des sous-estimations de l'ampleur de la dénutrition. Autrement dit, ces enfants n'auraient pas dû être vivants ... mais ils l'étaient.
Mais vous n'avez pas la possibilité de réévaluer les enfants. Deux suggestions. Premièrement, étant donné que la mesure de la taille des très jeunes enfants est difficile, vous pouvez stratifier votre échantillon en fonction de l'âge pour voir s'il y a une tendance à la baisse chez les très jeunes enfants. S'il existe un modèle de tendance, cela pointe à des erreurs de mesure. Deuxièmement, vous devriez avoir au moins deux observations pour chaque enfant - référence et suivi. Vérifiez et voyez si le même enfant est enregistré comme cas aberrant, ou presque aberrant, aux deux moments d'observation dans le temps. (Si > 2 points, encore mieux.) S'il y a une tendance avec les mêmes enfants d'être enregistré scomme valeurs aberrantes dans le temps, cela suggère que les mesures inexactes ne sont pas susceptibles d'être le problème principal.
Enfin, vérifiez simplement la distribution statistique des z-scores sauvages - à travers l'espace et le temps ... et entre les enquêteurs si vous avez cette information. Cette analyse devrait vous aider à affiner la source des valeurs extrêmes.
J'espère que cela pourra vous aider.
Répondu:
6 années il y aChère Diana, c'est l'un des problèmes auxquels j'ai été confronté en Ethiopie. Ici, « l'estimation de l'âge » par les soignants est basée sur le « rappel » et elle est sujette aux erreurs. Cela réduit la validité des données d'enquête pour calculer les indicateurs liés à l'âge. De telles découvertes peu plausibles peuvent aussi en découler. Je ne suis pas sûr que l'obtention d'un âge précis soit difficile en Angola.
Répondu:
6 années il y aSalut Diana
Nous avons travaillé sur des ensembles de données d'enquête, y compris le DHS, et nous voyons souvent de telles valeurs. C'est un vrai problème parce que si nous voyons vraiment les enfants à environ -8Z d' HAZ (indice taille-âge) (et que nous avons mesuré ces enfants à nouveau pour être sûrs) il devrait normalement y en avoir très peu au dessus de HAZ + 3Z, en fait la plupart des LMIC ne devraient pas avoir beaucoup d' HAZ au-dessus de + 1Z. Lorsque nous avons examiné les jeux de données du DHS, les valeurs périphériques sont regroupées par dates et lieux, ce qui suggère que les mesureurs individuels commettent des erreurs majeures. Je soupçonne que c'est ce qui peut arriver dans vos données. Pour votre MS, vous pouvez d'abord faire des nuages de points de dispersion par date, et si vous avez l'information, par mesureur. Ensuite, vous pouvez également rechercher des valeurs aberrantes sur un terrain de HAZ contre WAZ (indice poids-âge). Les erreurs de mesure sont plus susceptibles d'avoir lieu avec les nourrissons, donc vous pouvez également grouper par âge. Nous avons déjà pu remarquer que si l'évaluation de la fiabilité du poids individuel et de la longueur / hauteur ne semblait pas trop mauvaise, quand ils sont convertis en scores Z, les erreurs (très probablement en longueur / hauteur) ont été massivement amplifiées. Voir: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4282477/
Bonne chance
Jay
Répondu:
6 années il y aCher Franck, Bill et Jay,
Merci beaucoup pour vos idées très utiles et de partager des connaissances.
Après quelques considérations, vos sugestions, et en regardant à nouveau mes données, j'ai décidé d'exclure tous les enfants avec un HAZ > 6 SD et < -6 SD. De plus, j'ai remarqué des cas avec des chiffres de mesure sortant de la norme pendant les suivis, donc j'ai exclus de l'analyse tous les enfants qui avaient une différence de z-score entre 2 mesures consécutives (intervalles de 6 mois) égales ou supérieures à 4 (souvent cela correspondait à une mesure entre 2 valeurs très différentes).
Encore une fois, merci pour le conseil.
Sincères amitiés,
Diane
Répondu:
6 années il y aBonjour
J'apprécie vraiment le conseil de Bill (parfois une résultat aberrant n'est pas une mauvaise donnée) et encore une fois, je veux juste vous faire savoir que vous devez faire une analyse avec et sans valeurs aberrantes avant de les laisser tomber. Et vous devez prendre en compte combien de personnes après l'exclusion des valeurs aberrantes.
Merci et bonne chance
Répondu:
6 années il y a