Name La saisie des données individuelles des données de mortalité de l'ENA fixés pour la taille HH> 20

Salut à tous, nous faisons actuellement enquête SMART et problème rencontré pour entrer des données individuelles dans les données de mortalité fixés pour la taille de la famille plus de 20. Le jeu de données individuelles ont une option p1-p20 pour les variables dans la version 27 ENA Juin 2013 et nous sommes incapable d'insérer des données de la personne depuis plus de 20 HH members.Would vous s'il vous plaît nous partager votre opinion façon de traiter ces cas?

Une option consiste à diviser le HH dans deux dossiers.

Toutes ces données d'entrée semble que beaucoup de bruit depuis (généralement) nous voulons seulement (et peut obtenir compte tenu des limites de taille de l'échantillon) d'une simple estimation du taux brut de mortalité. Dans ce cas, il vous suffit de saisir résumés de niveau cluster. Les calculs nécessaires peuvent être effectuées dans une feuille de calcul. Les calculs sont présentés dans ce Field Exchange article. Vous pouvez trouver cette spreadhseet utile.

Anonymous

Répondu:

il y a 11 années

En effet, la seule solution est de poursuivre les individus de la grande maison sur une ligne séparée avec un certain nombre de ménages différents. Cette question a été portée à l'attention du développeur Logiciel ENA et, malheureusement, il est très compliqué d'ajouter plusieurs lignes dans l'écran de saisie individuelle de l'ENA. Plusieurs enquêtes en Afrique de l'Ouest ont rencontré ce même problème avec de grands ménages et l'analyse des données sur la mortalité au niveau individuel n'a pas été affectée.

Pour la dernière version du logiciel de l'ENA (Version 16th Novembre, 2013) ou d'autres questions relatives à la méthodologie SMART, s'il vous plaît consulter le site Web SMART: www.smartmethodology.org

Anonymous

Répondu:

il y a 11 années

Cher Mark et Victoria merci beaucoup pour votre perspicacité.

Anonymous

Répondu:

il y a 11 années

De Juergen Erhardt:

Cher Marc, Merci pour la suggestion de scinder les ménages. Je pense que cela est la solution la plus simple jusqu'à ce que nous avons étendu le nombre de personnes par ménage. Dans l'ENA il ya aussi une section où les données sont saisies sur le niveau de la grappe. Il est presque identique à la feuille de calcul Excel à partir de votre lien, mais donne également les intervalles de confiance ajusté pour l'échantillonnage en grappes et l'effet de la conception qui est pas possible de calculer dans Excel. Il est bon de savoir que le simple estimation sur le niveau de la grappe est souvent suffisante.

Parfois, je suis poussé par les démographes professionnels de supprimer cette section de l'ENA. Ils ont pensé à offrir cette option, la meilleure procédure en entrant les données sur le niveau des ménages sera moins utilisé.

Tamsin Walters

Modérateur du forum

Répondu:

il y a 11 années

La feuille de calcul calcule la SE comme:

où «P» est la proportion de l'échantillon, 'Pi' est la proportion dans chaque groupe, et «k» est le nombre de grappes. Cela ne donne "les intervalles de confiance ajusté pour l'échantillonnage en grappes et l'effet de la conception". Cela fonctionne parce que l'incidence cumulative peut être traitée comme une proportion. Le mieux que l'on puisse dire à propos de cette procédure est qu'elle retourne une participation d'environ 95% CI.

Je ne vois aucun avantage à la saisie de données au niveau des ménages. Ai-je raté quelque chose.

Anonymous

Répondu:

il y a 11 années

Cher Mark

Je ne suis pas un statisticien et donc je ne sais pas exactement pourquoi une procédure de SUDAAN est recommandé pour le calcul de l'intervalle de confiance de l'échantillonnage en grappes. Il est assez compliqué et seulement possible de calculer avec un logiciel spécial. Depuis, nous avons intégré ce il ya quelques années dans ENA je pensais, il est utile de le mentionner. Dans la feuille de calcul Excel pour lequel vous avez fait un lien Je pourrais aussi ne trouvez pas le calcul de l'effet de la conception. Pour autant que je sais qu'il ne peut pas être fait dans Excel ou seulement sous une forme simplifiée.

Pour la collecte des données de mortalité Cour Robinson (l'un des auteurs de l'article que vous citez) m'a toujours dit que la collecte de données sur la mortalité sur le niveau de la grappe ne devrait pas être fait. Par conséquent, nous avons ajouté dans ENA la collecte de données sur la mortalité au niveau des ménages. Il est censé être plus précis et permet une analyse plus détaillée. Probablement, il peut donner plus d'informations à ce sujet.

Anonymous

Répondu:

il y a 11 années

Salut tout le monde,
Comme Mark Unis, les données de mortalité pourraient être résumées et saisies au niveau de la grappe et analysés. Vous pouvez prendre en compte la conception de cluster en utilisant une feuille de calcul - une modification Je voudrais ajouter à la formule de Mark est l'utilisation des statistiques t avec k-1 degrés de liberté plutôt que de 1,96. La feuille de calcul de Mark utilise l'approche de la variance en supposant que l'échantillonnage PPT, mais de nombreux programmes statistiques seraient analyser les données comme une enquête en grappes à un étage et donc les résultats peuvent différer, habituellement par une petite quantité. Aussi je ne suis pas sûr au sujet de l'approche de la conversion aux taux dans le tableur - aurait besoin d'approfondir cette question, mais il semble à peu près correcte. Je l'ai mis au point des feuilles de calcul qui peuvent effectuer ces types d'analyses et de permettre à l'utilisateur d'entrer le nombre de grappes car il pourrait y avoir plus ou moins de 30 grappes.
Le problème d'origine traite de la façon dont les données sont saisies à l'aide ENA - si il ya plus de 20 personnes du ménage, semble comme ils pourraient placer les individus supplémentaires dans un ménage différent - en termes d'analyses, cela ne semble pas que ce serait l'effet de la mortalité des estimations.

Anonymous

Répondu:

il y a 11 années

La formule:

est mis en œuvre dans la feuille de calcul (qui était mon intention de toute façon). Les composants spécifiques au cluster de l'erreur standard (SE) sont dans les cellules E4: E33. Ceux-ci sont résumés dans la cellule E34. L'erreur standard est calculée en H18 de cellules. La SE est calculée directement plutôt que par le calcul d'un effet de la conception et de l'aide que pour corriger le SE calculée pour un échantillon aléatoire simple. Je suppose que vous pourriez obtenir à l'effet de conception (qui vous pouvez pour la taille de l'échantillon des calculs connexes) en calculant la SE que pour un échantillon aléatoire simple, puis en divisant ce dans le SE calculée selon la formule ci-dessus.

Kevin est juste, l'utilisation de la distribution t (plutôt que la normale standard) permettrait d'améliorer la couverture de l'IC à 95%. Cela pourrait être fait par la modification de ces cellules:
H19 ... changement à ... = H17-T.INV (0,975, H3-1) * H18 H20 ... changement à ... = H17-T.INV (0,975, H3-1) * H18
Quelqu'un devrait le vérifier. Peut-être que Kevin ou Juergen devraient vérifier et d'examiner la feuille de calcul afin que nous puissions être sûrs que je ne propose pas l'utilisation d'un outil "cassé". Je ferai ensuite des correctifs au besoin.

Je suppose que la question des données au niveau de la grappe est qu'il est généralement une mauvaise idée d'enquêter sur un phénomène en cluster avec un échantillon à grappes et nous nous attendons la mortalité causée par des facteurs tels que les maladies infectieuses et la violence intercommunautaire au cluster. Je suis confus, cependant, par la distinction faite par la collecte de données à la grappe, puis au niveau des ménages depuis (dans la plupart des enquêtes SMART) vous avez encore un échantillon de cluster. La plupart des estimateurs seront agréger les données au niveau de la grappe de toute façon. Je ne peux pas voir comment la saisie de données au niveau des ménages peut changer le fait que nous avons un échantillon de cluster. Ai-je raté quelque chose? Peut-être la Cour peut clarifier cette question.

Anonymous

Répondu:

il y a 11 années

Oops!

Aurait du être: H19 ... changement à ... = H17-T.INV (0,975, H3-1) * H18 H20 ... changement à ... = H17 + T.INV (0,975, H3-1) * H18

Anonymous

Répondu:

il y a 11 années

Je viens de téléchargé une version correcte de la feuille de calcul de taux de mortalité qui utilise t [distribution avec des clusters - 1 degrés de liberté plutôt que la distribution normale standard pour calculer l'intervalle de confiance de 95%. Cette modification était suggèrent par Kevin (voir ci-dessus) et devrait améliorer la couverture ou de l'intervalle de confiance calculé.

Vous pouvez obtenir la nouvelle version ici.

Anonymous

Répondu:

il y a 11 années