Salut à tous, je suis entrain de revoir des mesures PB et je vois des mesures aberrantes de hauteur en cm. Quelqu'un a-t-il un document de recherche ou un texte qui spécifie à quels points en cm les données doivent être considérées comme des valeurs aberrantes ?
Merci d'avance !!
Salut Emily,
Si vous avez l'âge, la meilleure chose est de calculer les scores Z du PB par rapport à l'âge (PB/A) pour chaque individu. L'OMS définit les scores Z PB/A biologiquement invraisemblables comme étant > 5 ou < -5.
Vous pouvez les calculer à l'aide du package de l'OMS WHO iGrowup disponible sur Stata, SAS ou R. Si vous recherchez "who igrowup macro" sur Google, vous trouverez ce que vous recherchez.
J'espère que cela vous sera utile.
—Trenton
Répondu:
4 années il y aSalut Emily,
Bien que je ne connaisse aucun papier sur le sujet, les éléments suivants me viennent à l'esprit: vérifiez la plage en mm de la bande PB et utilisez-la comme première indication de ce qui est considéré comme probable (gardez à l'esprit la longueur de la bande pour les enfants vs. adultes). Je ne sais pas où vous avez mené l'enquête, ni à quels défis la population est confrontée, mais essayez de ne pas sous-estimer la présence du double fardeau où vous pourriez trouver des valeurs à la fois très faibles et extrêmement élevées. Je ne sais pas non plus si votre enquête concerne les enfants ou les adultes, je pense qu'il existe différents types de bandes pour adultes et certaines pourraient, en fait, être trop courtes (j'ai vécu cela dans un milieu urbain pauvre). Si vous avez confirmé des mesures avec des valeurs extrêmes ('Je l'ai vu, nous avons recoupé plusieurs fois par différents recenseurs "...), je les examinerais également attentivement et ne les exclurais pas vraiment comme des valeurs aberrantes (sauf si vous avez une raison analytique particuliére). Nous ne devons pas essayer de manipuler l'ensemble de données pour avoir une distribution normale ou quelle que soit la distribution souhaitée, mais avoir un ensemble de données avec des valeurs correctes et ajuster nos méthodes d'analyse et notre interprétation en conséquence ...
Parlez-vous de la valeur réelle du PB ou des extrêmes d'indicateurs liés au PB comme le PB-pour-l'âge? Pour ce dernier, vous pouvez travailler avec des plages de score Z.
Bonne chance,
Gudrun
Répondu:
4 années il y aJe pense que vous pouvez utiliser une méthode comme celle utilisée dans SMART / ENA qui utilise les données collectées pour définir les valeurs aberrantes. SMART utilise la moyenne et l'écart type des indices anthropométriques calculés à partir des données collectées pour décider quelles observations sont plus susceptibles d'être des valeurs aberrantes que des valeurs véritables. Dans ce schéma, nous excluons (par un drapeau indicateur) qui se trouvent en dehors de +/- 3 z-scores du z-score moyen de sorte que les valeurs (par ex.) de score z Poids/Hauteur (WHZ) qui sont inférieures :
moyenne (WHZ) - 3
et :
moyenne (WHZ) + 3
sont signalées comme des valeurs aberrantes.
Je pense que cette approche peut être problématique car elle suppose que l'écart type SD (WHZ) = 1 et suppose que la distribution de WHZ est normale. Le travail effectué par les membres de l'équipe SMART montre que ces hypothèses sont raisonnables avec WHZ généralement distribué normalement (avec seulement de légers écarts par rapport à la normalité) et SD (WHZ) tendant à être limité entre 0,8 et 1,2 z-scores et centré autour de 1 z- score
Cependant, cela ne nous aide pas beaucoup avec votre problème car nous avons tendance à utiliser des valeurs de mesure brutes plutôt que des z-scores avec le PB. Une approche analogue consiste à marquer les valeurs de PB qui se situent en dehors de la moyenne (PB) +/- 3 * SD (PB). Le problème ici est que la moyenne et l'écart-type sont fortement influencés par les valeurs aberrantes. Il pourrait donc être préférable d'utiliser des mesures récapitulatives plus robustes telles que la médiane (comme alternative à l'utilisation de la moyenne) et l'écart absolu médian (multiplié par 1,4826) comme alternative à l'utilisation de l'écart-type).
Une alternative courante consiste à utiliser la méthode utilisée avec les boxplots. La «boîte» sur les boxplots se situe entre les quartiles supérieur et inférieur des données.
Les «moustaches» sur les boxplots s'étendent généralement à 1,5 fois l'intervalle interquartile à partir des extrémités de la boîte (c'est-à-dire les quartiles inférieur et supérieur). Ceci est connu comme la «clôture intérieure». Les points de données situés à l'extérieur de la clôture intérieure sont considérés comme des valeurs aberrantes légères. Le "1.5" peut être augmenté à 3.0. Ceci définit la «clôture extérieure» qui peut être utilisée pour identifier les valeurs aberrantes extrêmes. J'ai tendance à penser que des valeurs aberrantes légères sont des valeurs aberrantes possibles et des valeurs aberrantes graves comme des valeurs aberrantes probables.
Consultez ces sections :
Quelles sont les valeurs aberrantes dans les données?
Détection des valeurs aberrantes
du Manuel des méthodes statistiques NIST / SEMATECH. Les liens sur ces pages mènent à des tests qui peuvent aider à identifier les valeurs aberrantes.
Vous pouvez utiliser la méthode SMART avec les z-scores PB / A.
J'espère que cela vous sera utile.
Répondu:
4 années il y aSalut Emily,
Je ne conteste rien de ce qui a été dit dans les articles précédents sur le nettoyage des données de vos mesures de PB. D'un point de vue pratique, vous devez également tenir compte du contexte. Chez les enfants extrêmement malnourris (par exemple dans certaines situations de famine) avec un PB très bas et très peu de graisse corporelle, il devient très difficile de mesurer le PB sans plier la peau, affectant ainsi la précision.
Dans un contexte normal, les PB mesurés avec précision chez les enfants de 6 à 59 mois < 9 cm devraient être très rares (et tendent vers de mauvais résultats). Les PB mesurés avec précision, inférieurs à 8 cm, sont rares. La plupart des exemples de PB entre 7 et 8 cm que j'ai personnellement vérifiés sur le terrain étaient de fausses lectures (bande PB trop serrée). J'ai mesuré un enfant avec un PB d'environ 7,5 cm + dans une situation d'urgence mais il était difficile d'obtenir une lecture précise en raison du pliage de la peau.
S'il s'agissait de données d'enquête et si les recenseurs étaient normalisés, jetez un œil aux données de l'exercice de normalisation et voyez si l'exactitude se situait dans les paramètres énoncés. S'il s'agit de données de terrain brutes, vous pouvez considérer le contexte et la fiabilité de la source de mesure et émettre un jugement.
Répondu:
4 années il y aSalut à tous,
Merci beaucoup pour votre suivi rapide ! Dans mon article, nous rapportons les scores z de PB qui étaient des seuils de l'OMS faciles à utiliser pour nettoyer et utiliser des plages de cm.
J'ai trouvé un fil de discussion similaire de Severine https://www.en-net.org/question/233.aspx à la recherche de seuils / valeurs extrêmes appropriés. Je crois qu'elle a fini par utiliser 8,5 et 20 cm ? Je ne travaille pas avec des données issues d'un contexte d'urgence, donc je ne m'attends pas à voir beaucoup d'enfants sévèrement ou même modérément malnutris dans cette population. Quelle serait la limite supérieure des valeurs en cm attendues pour les enfants de 6 mois à 5 ans ? Cette population peut avoir des enfants en surpoids, mais je ne sait pas à quel point une valeur est improbable et devrait être retirée de l'analyse.
De plus, y a-t-il des critères aberrants / seuils qu'ils ont utilisés pour les données PB des enfants de 5 à 18 ans ? Nous envisageons également une analyse pour les enfants plus âgés.
Merci beaucoup!!
Répondu:
4 années il y aSalut Emily
D'après notre expérience, les seuils sont plus simples pour les enquêtes sur une population relativement normale. Pour une population anormale attendue, nous utilisons la même méthode suggérée par Mark Myatt pour calculer l'écart type (sd) au sein de notre population échantillon pour rechercher les valeurs aberrantes. Pour le PB, il y a un certain changement avec l'âge, donc l'idéal est d'utiliser le score z PB et de calculer la moyenne et l'écart type (sd) pour ces valeurs. Pour les nourrissons et les enfants sous-alimentés, bon nombre des valeurs faibles sont vraies lors de la revérification, de sorte que nous appliquons généralement un seuil plus libéral sur le côté bas, par exemple -5. Nous appliquons la même méthode aux changements entre deux points temporels dans les études longitudinales.
Veuillez me faire savoir si vous avez besoin de plus amples informations.
Salutations
Geai
Répondu:
4 années il y aJe pense que Jay fait un bon point. Les règles de marquage pour SMART et les règles de marquage de l'OMS utilisées dans DHS / MICS sont adaptées aux données d'enquête. Elles ne sont pas adaptées aux données provenant (par exemple) des admissions au programme PCMA car celles-ci incluront probablement un grand nombre de valeurs extrêmement basses ... même en dessous des valeurs biologiquement plausibles de l'OMS ... car nous traitons des enfants à très haut risque de décès à court terme.
Répondu:
4 années il y a