Je veux analyser les associations entre gaspillage et (morbidité, le sexe et le groupe d'âge .... etc) dans une enquête sur la nutrition - 30X24 deux échantillonnage en grappes de scène. Je l'ai essayé différents programmes; Epi info ne donne odds ratio mais aucune Chi 2 et pas de valeurs p (quand le design de l'échantillon complexe est utilisé), SPSS ne peut pas analyser des plans d'échantillonnage complexes (seulement RS simples et systématiques), ENA SMART calculateur statistique suppose également SRS.
Y at-il des recommandations sur ce type d'analyse? Tests statistiques déductives à utiliser? et des lignes directrices (le cas échéant) de l'exécuter en utilisant STATA.
Voici quelques infos:
Epi Info, en utilisant le "échantillon complexe ..." commandes, peut rendre compte de l'enquête stratification, les grappes et les pondérations d'échantillon. Pour un tableau 2x2, il peut fournir le rapport de cotes de prévalence, la prévalence rapport, et la différence de prévalence des limites de confiance et DEFF. Il ne fournit pas une valeur p. Je faire avoir une feuille de calcul qui calcule les statistiques de Wald qui peuvent être utilisées pour calculer une valeur p - envoyez-moi un e-mail et je vais vous l'envoyer.
SAS peut faire ces analyses avec son enquête PROCS - PROC SURVEYFREQ, PROC SURVEYLOGISTIC.
SPSS peuvent faire analyser les données de l'enquête avec le module des échantillons complexes en option.
Stata peut traiter les données d'enquêtes complexes que peut R.
Répondu:
13 années il y aCher Kevin Sullivan,
Je me demandais si vous me partager la feuille de calcul.
Répondu:
13 années il y aSalut Kiross - Je viens envoyé par courriel à vous. Kevin
Répondu:
13 années il y aSoyez conscient que ce genre d'analyse est susceptible d'être très faible puissance par rapport à (par exemple) d'une étude cas-contrôle parce que (1) vous vous retrouvez souvent avec de petits nombres dans les cellules de la table parce que le résultat est relativement rare et l'exposition peut également être rares, et (2) parce que la conception de l'échantillon réduit la taille effective de l'échantillon. Cette analyse sera limitée à trouver les plus grands effets.
Ceci est un problème commun avec l'analyse des données provenant d'enquêtes transversales que les cohortes rétrospectives.
Répondu:
13 années il y a Merci Kevin, je ne pouvais pas trouver votre adresse e-mail, espérons que vous pouvez transmettre à moi à abdu.ff@gmail.com
Merci Mark, définitivement son un point crucial. Je pensais que lorsque aucune valeur de la cellule <5 l'on peut utiliser chi2 (malgré les limitations de conception bien sûr), une autre chose si p-valeur est très faible par exemple 0.000 ce que cela change quelque chose de la mesure que le pouvoir est concerné? est-il des recommandations claires si vous souhaitez exécuter ce type d'analyse (dans une section 2 conception de grappes à un degré croix) ou non?
Merci encore tellement
Répondu:
13 années il y aLe nombre de cellules> = 5 règle est une question technique concernant les hypothèses derrière utilisant des tests de ch-carré. Avec le nombre de cellules <5, vous pouvez utiliser quelque chose comme le test de Fisher-Irwin, qui est basée sur la probabilité hypergéométrique exacte plutôt que des approximations normales à binôme.
Il est plus d'une taille de l'échantillon et enjeu de pouvoir. Les basses fréquences des résultats et des expositions signifie que vous pouvez aurez variable et souvent faible puissance statistique. Vous pouvez faire l'analyse, mais il peut ne pas trouver des associations faibles ou modérés résistance.
Répondu:
13 années il y aEst-il exact de dire qu'il est OK pour utiliser la commande «Tableau» sous la rubrique «Statistiques» dans EPI INFO pour exécuter chi carré de test et obtenir des résultats pour une enquête en grappes comme la conception de l'enquête ne porte pas atteinte cette résultats des tests ici?
Répondu:
12 années il y aNon, il est incorrect d'utiliser le chi carré de la "Tables" commande normale dans EpiInfo pour juger de la signification statistique d'une différence de certains résultats entre deux ou plusieurs sous-groupes de l'échantillon de l'enquête si l'échantillonnage comprenait l'échantillonnage en grappes. Chi carré est destiné à vous dire la probabilité qu'une différence entre les sous-groupes dans l'échantillon de l'enquête a eu lieu uniquement à la suite de l'erreur d'échantillonnage; qui est, il n'y a aucune différence réelle dans la population enquêtée. Toute mesure de l'erreur d'échantillonnage ou mesure l'erreur d'échantillonnage, comme les intervalles de confiance ou des valeurs de p, sera affectée par l'augmentation de la variance induite par l'échantillonnage en grappes par rapport à l'échantillonnage aléatoire simple. La commande "Tables" suppose un échantillonnage aléatoire simple. En conséquence, le chi carré de la commande "Tables" va sous-estimer la valeur de variance et p, et donc surestimer votre confiance qu'il ya une réelle différence dans la population, et pas seulement une différence due à l'erreur d'échantillonnage. Cela pourrait conduire à des conclusions erronées. Dans EpiInfo, vous devez utiliser la commande "exemples de tableaux complexes" et spécifiez la variable contenant les codes de bloc d'alimentation et, le cas échéant, les variables contenant les poids et les codes statistiques identifiant les strates.
Répondu:
12 années il y aVous pouvez utiliser des tests de chi-carré avec les données de la grappe échantillonnée mais ceux-ci doivent être corrigées pour la conception de l'échantillon. Un test non corrigée, avec des effets de conception ci-dessus l'un, est susceptible de faire une erreur de type I (c.-à rejeter à tort l'hypothèse nulle) plus souvent que prévu.
Logiciel commun (par exemple EpiInfo, STATA) fournissent des méthodes pour corriger les tests chi carré. Vous devez spécifier les procédures d'échantillonnage complexes ... si vous ne le faites pas, alors le logiciel signale le test (non corrigé) standard. Veillez à spécifier la conception de l'échantillon correctement. Ce sera, pour une enquête de type SMART, être simplement une question de dire le logiciel la variable qui identifie le cluster. Il peut être assez compliqué de préciser la conception pour plus de conceptions complexes.
Je espère que cela est d'une certaine utilité.
Répondu:
12 années il y aMerci beaucoup pour les précisions.
Le problème est que Tables exemples complexes dans EPI INFO ne donnent pas de résultats de test khi-carré (seulement fournissent un taux de risque, odds ratio, et la différence de risque). Tous les autres logiciels courants sont assez cher!
Merci encore.
Répondu:
12 années il y aExactement. Voilà pourquoi je l'ai arrêté en utilisant Epi Info pour l'analyse des grands ensembles de données enquête. Bien qu'il soit un peu lourd, vous pouvez utiliser le module de CSample dans le vieux DOS EpiInfo v. 6.04d qui peut être téléchargé à partir http://wwwn.cdc.gov/epiinfo/html/ei6_downloads.htm. Si vous utilisez Windows 7, vous aurez besoin d'utiliser l'environnement Windows XP virtuel, comme EpiInfo pour DOS ne fonctionnera pas dans Windows 7, au moins la version 64-bit. Et vous aurez également à exporter les données au format Microsoft Access utilisée par EpiInfo pour Windows dans un fichier .REC lisible dans DOS EpiInfo.
Je pensais qu'ils allaient ajouter carrés chi ajustés à la sortie des statistiques pour les exemples des tableaux complexes avec la sortie de EpiInfo 7, mais, hélas, ils ne l'ont pas. Je suggère de contacter le support EpiInfo et se plaindre de ce problème; elle entrave sérieusement l'utilité du programme. Je l'ai entendu dire que un autre programme appelé "R" peut gérer échantillonnage complexe, et il est libre. Je ne l'ai jamais utilisé, mais de ce que je l'entends, il est pas très convivial. Il peut être téléchargé à partir de: http://www.r-project.org/. Mais étant donné le coût de SPSS, STATA, SUDAAN, etc., il peut être utile de la douleur d'apprendre à l'utiliser.
Bon chance.
Répondu:
12 années il y aMerci.
Je ne savais pas que vous pourriez chi test de carré dans le PEV 6. je vous donnerai un essai tout aussi envoyer un courriel à EPINFO helpdesk. (Si le test du chi carré est disponible dans le PEV 6, pourquoi était-il sorti dans la version de Windows? Je me demande...)
Peut-être d'autres utilisateurs, en particulier ceux qui utilisent EPI-ENA pour analyser les données non anthropométriques pourrait aussi envoyer des demandes similaires pour exhorter CDC d'ajouter cette fonctionnalité?
Répondu:
12 années il y aQuelques choses ...
Il ya très peu de différence entre l'utilisation de la CI sur le ratio de risque ou la différence de risque comme un test des hypothèses et en utilisant un test du chi-carré avec une p-valeur fixe pour le rejet de l'hypothèse nulle (c.-à p <0,05). Le test est que le CI sur le taux de risque ne comprend pas une ou que l'industrie de la différence de risque ne comprend pas zéro.
Je ne suis pas un utilisateur de Windows, mais je ne cours parfois EpiInfo v6.04d sur Mac OS X et BSD UNIX utilisant un utilitaire appelé DOSBOX. Vous pouvez obtenir DOSBOX pour Windows gratuitement à partir de ce site.
R fournit complexe l'analyse de l'échantillon de l'enquête à travers le paquet "de l'enquête". Cela fonctionne très comme les commandes "svy» dans STATA. Le paquet a été testé contre SUDAAN SAS, STATA, SPSS, & c. et donne les mêmes résultats avec des ensembles de données de référence. R est un langage de programmation extrêmement puissant (basé sur S et S-Plus) avec une courbe d'apprentissage assez raide. Je ai un (légèrement daté) mise en place ici. Ce tutoriel ne couvre pas l'utilisation de l'emballage "de l'enquête", mais les 20 premières pages devrait être suffisant pour vous permettre de travailler avec R.
Ce logiciel tout adopter une approche basée sur un modèle au problème. Il est possible d'utiliser des techniques de ré-échantillonnage (par exemple le bootstrap) pour résoudre ce problème. Avec un échantillon de cluster PPS vous auriez à utiliser un "blocage" approche pour créer des répétitions avec les blocs étant clusters individuels échantillonnés avec remplacement. Le "p-valeur» serait, pour une association positive, quelque chose comme:
p = (nombre de répétitions avec RR <= 1) / (nombre de répétitions + 1)
R peut également être utilisé pour mettre en œuvre ces procédés. Nous utilisons un bootstrap de bloc dans la méthode d'enquête PSM (il donne les mêmes résultats que dans EpiInfo v6.04d CSAMPLE). Nous utilisons un bloc pondéré bootstrap dans la méthode d'enquête S3M et dans la méthode de RAM. L'avantage de l'amorce est qu'il peut être utilisé pour des statistiques de test, comme un CI sur la différence entre deux valeurs médianes, qui ne peuvent pas être utilisés avec des approches classiques.
Répondu:
12 années il y a