Name Intervalles de confiance pour échantillonnage complexe

Pouvez-vous calculer les intervalles de confiance pour l'échantillonnage en grappes dans ouvrir Epi?

OpenEpi (www.OpenEpi.com) fonctionne comme une calculatrice en ce que des données sommaires sont entrés et certains calculs sont présentés. Pour le calcul des limites de confiance pour une proportion ou le pourcentage basé sur un échantillonnage en grappes, l'information est nécessaire pour chaque groupe, afin de calculer l'effet du plan de sondage (EPS). OpenEpi ne procède pas à ces calculs. Cependant, si vous avez une estimation de l'effet du plan, il ya un lien dans le menu OpenEpi vers le bas qui peut conduire à un programme basé sur le Web qui peut faire ce calcul:

OpenEpi Prototypes

qui vous amène à www.sph.emory.edu/~cdckms~~V

Sur ce site, cliquez sur:

Les intervalles de confiance pour une proportion avec DEFF

Dans ce module si vous fournissez la il va calculer diverses limts de confiance pour une proportion suivante:

Numérateur:
Dénominateur:
Nombre de clusters:
Conception Effet (DEFF):

Anonymous

Répondu:

il y a 12 années

Le terme «échantillonnage complexe" est très large couvrant à la fois stratifié et l'échantillonnage en grappes (et de l'échantillonnage en grappes stratifié). La procédure requise pour analyser (par exemple) un échantillon de cluster PPS (tels que SMART) sont tout à fait différents de ceux requis pour les analyses d'un échantillon stratifié.

Il ya un certain nombre de paquets qui peuvent gérer les données de sondage complexe, y compris EpiInfo (CSAMPLE), SPSS (module d'échantillons complexes), STATA (commandes "svy»), R / S-Plus ("enquête" bibliothèque), SUDAAN, & c. Ceux-ci ont tendance à mettre en œuvre des procédures basées sur des modèles et donner des résultats approximatifs. Une alternative (non-paramétrique) approche consiste à utiliser des estimateurs bootstrap / jack-knife.

Ouvrez-Epi ne prévoit pas de procédures pour les données d'échantillons complexes. Le module EpiTable dans la version MSDOS de EpiInfo qui est disponible ici fournit quelques installations simples pour l'estimation des proportions des enquêtes en grappe échantillonnée.

Je espère que cela est d'une certaine utilité.

Anonymous

Répondu:

il y a 12 années

Vous avez oublié de mentionner que le logiciel SMART (ENA pour SMART) gère également grappe échantillonnée données de l'enquête à deux étages produisant de SIC avec une couverture et d'efficacité acceptable. Ce logiciel est, cependant, spécialement conçu pour les enquêtes de type SMART et ne constitue pas un paquet d'analyse de l'enquête générale. Si votre besoin est d'estimer la prévalence de la dénutrition à l'aide de deux enquêtes grappes à un degré échantillonnés puis ENA est un outil utile. Vous pouvez le trouver ici.

Anonymous

Répondu:

il y a 12 années

Cher Dr Mark Myatt et le Dr Kevin Sullivan,

Vous remercie tous les deux pour la réponse détaillée.

Je voudrais poser une question de suivi. Pourriez-vous s'il vous plaît indiquer si le calcul de la CI est la seule différence entre les enquêtes utilisant méthode simple / échantillonnage systématique et complexe (à la fois stratifié et cluster) méthode d'échantillonnage? D'autres estimations telles que odds ratio, ratio de taux, etc., et chi squaretest est le même entre les 2 dessins?

Anonymous

Répondu:

il y a 12 années

Comme je l'ai déjà écrit ci-dessus ... "Le terme 'échantillonnage complexe» est très large couvrant à la fois stratifié et l'échantillonnage en grappes (et de l'échantillonnage en grappes stratifié). La procédure requise pour analyser (par exemple) un cluster échantillon PPS (tels que SMART) sont tout à fait différents de ceux requis pour les analyses d'un échantillon stratifié ".

En termes généraux ... pour l'estimation:

Cluster / PPS: estimations ponctuelles (. Odds ratios, le ratio de risque, des moyens, et c) à partir d'échantillons provenant des échantillons en grappes PPS sera le même que calculé comme si provenaient d'un échantillon aléatoire simple des données. L'intervalle de confiance autour de l'estimation ne sera pas le même (il sera généralement plus large). Cela est dû à la perte de variation d'échantillonnage. Il est possible de réduire cette perte par la conception de l'échantillon attention (en augmentant le nombre de grappes et / ou en utilisant un système intra-échantillonnage en grappes qui aide à maintenir la variation d'échantillonnage) mais il y aura un moment où des économies (la raison principale échantillonnage en grappes) sont perdus.

Échantillon stratifié: estimations ponctuelles seront généralement différents de ceux calculés comme si les données provenaient d'un échantillon aléatoire simple. Ceci est parce que les résultats de chaque strate doivent être pondérées par une certaine fonction de la population de la strate avant d'être combinés pour former une estimation globale. Les intervalles de confiance autour de l'estimation ne sera pas le même (il sera généralement plus étroite).

Dans le cas de tests d'hypothèses (tests par exemple Chi-carrés), la plupart des procédures d'essai ne sont pas optimales lorsque les données sont autocorrélées. Ceci est souvent le cas avec des échantillons complexes. Les erreurs associées à un essai peuvent être différents de spécifié (c.-à p <0,05 peut ne pas être p <0,05). Il ya des cas spéciaux comme un test de chi carré pour observations jumelées (par exemple, une personne a deux yeux) - vous pourriez être la chance de trouver un cas particulier qui applique. voici un certain nombre d'approches pour traiter ce problème. La plus courante est, sans doute, de l'ignorer et de traiter les données comme si à partir d'un échantillon aléatoire simple. Une approche (modélisation) utilise des procédures pour corriger corrélation. Ces procédures varient en complexité et entre le test utilisé. Une autre approche consiste à utiliser des approches de ré-échantillonnage (par exemple, le bootstrap). L'approche de ré-échantillonnage est cohérente et simple et fonctionne bien dans la plupart des cas. Tant de modélisation et de ré-échantillonnage exigent familiarité faire correctement. Il est probablement plus facile à refondre un problème de tests d'hypothèses comme un problème d'estimation. La plupart des problèmes se prêtent à cette apprach. Par exemple, la différence entre deux proportions (test du chi carré couramment utilisé) peut être reformulée comme un rapport de risque (ou odds ratio) avec un IC à 95% (90%) pour un test simple face) qui ne comprend pas zéro. Vous pouvez faire ce genre d'analyse avec (par exemple) CSAMPLE.

Je espère que cela est d'une certaine utilité.

Anonymous

Répondu:

il y a 12 années

Chers Dr Mark Myatt et Dr Kevin Sullivan,
Je m'appelle Odund - je suis un chercheur en nutrition travaillant au Kenya. Je fais une analyse - Analyse des zones critiques de malnutrition aiguë, en regardant des données historiques sur plus de 10 ans.
Les données proviennent principalement d'enquêtes SMART et ambitionnent d'estimer les IC en tenant compte de la méthodologie d'échantillonnage (échantillonnage en grappes). Idéalement, je souhiate faire des graphiques avec des barres d'erreur - les données sont stockées dans des fichiers MS Excel et je voudrais configurer un formulaire dans Excel pour me donner les IC.
Pourriez-vous m'aider avec cela ?
En utilisant MS Excel, j'ai calculé l'IC pour des proportions, mais elles sont évidemment plus sérrées que les IC obtenus auprès du logiciel ENA pour SMART. Je voudrais prendre en compte la marge d’erreur due aux clusters. J'ai les paramètres tels que ## de clusters, DEFF etc. J'évite d'utiliser le logiciel ENA car cela serait trop manuel et prendrait beaucoup de temps étant donné la nécessité de granuler / désagréger les résultats.
Merci d'avance!

Anonymous

Répondu:

il y a 4 années

Cher Odundo,

Puisque ni Mark ni Kevin n’ont répondu à votre question, laissez-moi essayer. La formule la plus simple pour calculer les intervalles de confiance à 95% en supposant un échantillonnage aléatoire simple (ou son équivalent) est la suivante :

Intervalle de confiance inférieur = moyenne ou proportion - (1,96 x erreur standard )

Intervalle de confiance supérieur = moyenne ou proportion + (1,96 x erreur standard )

Cependant, comme vous le dites correctement, les intervalles de confiance doivent tenir compte d'un échantillonnage complexe. L'effet de design (DEFF pour Design Effect) est le multiplicateur permettant de déterminer de combien la taille de l'échantillon doit être gonflée pour maintenir la même position si un échantillonnage complexe est choisi à la place d'un simple échantillonnage aléatoire. Mais lors du calcul des mesures de précision, telles que les intervalles de confiance, nous utilisons la racine carrée du DEFF. Par conséquent, l'équation pour calculer les intervalles de confiance pour les enquêtes d'échantillonnage complexes est la suivante :

Intervalle de confiance inférieur = Moyenne ou proportion - (1,96 x erreur standard x racine carrée de DEFF )

Intervalle de confiance supérieur = Moyenne ou proportion + (1,96 x erreur standard x racine carrée de DEFF )

Ainsi, si vous avez la moyenne ou la proportion, l'erreur standard calculée en supposant un échantillonnage aléatoire simple et le DEFF, vous pouvez calculer les intervalles de confiance à 95% appropriés pour les estimations dérivées de données obtenues par échantillonnage complexe.

Il existe d'autres formules pour calculer les intervalles de confiance qui peuvent ou non être plus précises et appropriées à votre situation. Ma recommandation générale serait d'utiliser un logiciel d'analyse statistique capable de prendre en compte l'échantillonnage en grappes et de calculer automatiquement les intervalles de conférence appropriés à 95%. Ces logiciels incluent Epi Info, SAS, SPSS, STATA et R.

J'espère que ceci vous sera utile.

Bradley A. Woodruff

Expert technique

Répondu:

il y a 4 années

Merci beaucoup Bradley
Ceci est profondément utile!

Anonymous

Répondu:

il y a 4 années