nous sommes sur le processus de mener des soignants satisfaction envers les services par échantillonnage aléatoire systématique. Le plan est de mener dans cinq établissements de santé. nous avons calculé la taille de l'échantillon (403). La population et la charge de travail dans les cinq établissements est différente. De la population totale, la proportion de clinique A, B, C, D et E est respectivement 19%, 16%, 17%, 40% et 8%. Compte tenu de cette différence, pouvons-nous attribuer ou répartir l'échantillon total selon la taille de la population? si cela est possible, l'échantillon dans chaque établissement sera 78, 65, 70, 160 et 30 respectivement.

Ceci est une approche. Il donne un échantillon auto-pondéré sur les cinq installations.

Une autre approche serait d'utiliser un échantillon de taille fixe qui permettrait une estimation ou la classification à effectuer pour chaque installation. Par exemple, m = 5 et n = 96 donnerait une taille globale de l'échantillon de m * n = 480. Ce ne diffère pas beaucoup de votre n = 403 mais donnerait des estimations avec un IC à 95% de ± 10% ou plus de chaque installation. Vous pouvez ensuite pondérer les échantillons selon la taille de la population pour obtenir une moyenne globale (ce qui est pas mal). Cette dernière approche est préférable si vous soupçonnez que la satisfaction variera considérablement entre les cliniques.

Mark Myatt
Technical Expert

Répondu:

11 années il y a

Salut Mark, je me demande comment nous pouvons calculer la taille de l'échantillon si nous ne l'avons confirmé les données récentes de la population pour une région frappée par la catastrophe et beaucoup de gens ont déménagé.

Anonymous

Répondu:

10 années il y a

Il ya un certain nombre de questions ici. Je vais essayer d'aller à travers eux un par un.

Si vous avez des données raisonnablement précises et actuelles population alors vous pouvez utiliser l'approche PPS (comme dans SMART) pour sélectionner les communautés à inclure dans l'échantillon. Comme les populations peuvent être petits vous devrez peut envisager de prendre des grappes plus petites que d'habitude et plusieurs d'entre eux.

Si vous ne disposez pas des données démographiques nécessaires pour un échantillon PPS alors vous pouvez prendre un échantillon systématique de communautés. Je voudrais utiliser une méthode d'échantillonnage spatial systématique comme SCCS ou d'échantillonnage à partir de listes de collectivités triées par un facteur spatiale (par exemple sous-districts, chefferies, localités, clinique bassins versants et c.) Pour ce faire. Vous pouvez ensuite déguster dans les communautés, comme d'habitude, mais vous aurez également besoin de recueillir des données qui vous permettront d'estimer les populations des communautés de l'échantillon. Ce besoin ne soit quelque chose comme compter Toits / portes, l'estimation de la proportion de logements vides, et (en option) l'estimation du nombre moyen de vivre sous chaque toit / derrière chaque porte. Les populations sont que des estimations, soit:
w = toits (ou portes) * proportion vide
ou:
w = toits (ou portes) * proportion vide * taille moyenne HH
Ces populations (étiquetés "w" pour "poids" ci-dessus) sont ensuite utilisés lors de l'analyse des données. La méthode PPS (en vigueur) applique poids de la population avant l'échantillonnage (pondération avant). Cette méthode applique ces poids après l'échantillonnage (échantillonnage postérieure). Compte tenu des données de la population raisonnablement précise les deux méthodes donnent des résultats comparables. La procédure d'analyse requise est pas, je pense, disponible dans ENA pour SMART, mais peut être fait dans SUDAAN, M-Plus, SAS, R, S-Plus, STATA, SPSS, dans un tableur, ou à la main. Si vous avez besoin de plus amples informations à ce sujet, puis poster une demande de suivi à ce fil.

L'accès peut également être un problème. Si vous n'êtes pas pressé par le temps (par exemple, un "état d'urgence" prévue déclaration peut fermer l'accès), alors vous devriez prendre des «grappes d'urgence". Cela signifie que vous sélectionnez un peu plus de grappes que vous avez besoin et les utiliser pour remplacer les grappes que vous ne pouvez pas y aller. Assurez-vous de documenter ce qui est arrivé afin que les utilisateurs de données savent ce qui est et non représenté. Si le temps est un problème, vous pouvez utiliser une méthode telle que la RAM qui utilise moins de grappes (par exemple m = 16) que SMART, une méthode plus de main-d'œuvre au sein de-échantillonnage en grappes, et une procédure d'estimation différente (PROBIT) pour estimer GAM / la prévalence SAM. La taille des échantillons sont relativement petits (par exemple, nous avons utilisé n = 192 en Sierra Leone et n = 200 au Soudan). Si vous avez besoin de plus d'informations sur la RAM puis poster une demande de suivi à ce fil.

Si votre population totale est petite (moins de 5000), alors vous pourriez être en mesure d'utiliser un échantillon plus petit. L'approche classique consiste à calculer votre taille de l'échantillon comme vous le faites habituellement, puis multiplier par une «correction de la population finie" (FPC). L'analyse des données peut être fait avec les outils usuall mais les intervalles de confiance sur les estimations sont ajustées par un second FPC. Si vous avez besoin de plus amples informations à ce sujet, puis poster une demande de suivi à ce fil.

Vous aurez aussi besoin d'être prudent avec certains indicateurs, si on a (par exemple) la violence communale été (une raison commune pour le déplacement), car cela peut conduire à des regroupement considérable (par exemple, de la mort et de la destruction) qui peut entraîner d'importants effets du plan de sondage.

J'espère que cela aide. Poster un message de suivi à ce fil si vous avez besoin de plus amples informations ou si je l'ai manqué le point.

Mark Myatt
Technical Expert

Répondu:

10 années il y a

Je l'ai reçu une demande pour plus de détails concernant les calculs statistiques pour les méthodes décrites ci-dessus.

Je vais essayer de donner plus de détails, aussi brièvement que possible.

TAILLE DE L'ÉCHANTILLON

Un calcul typique de taille de l'échantillon pour une seule proportion dans une enquête est:
n = DEFF * [(p * (1 - p)) / (précision / 1,96) ^ 2]
où:
DEFF = effet du plan prévu (généralement 2.0 à moins que nous savons mieux) p = proportion prévue (choisissez 50%, sauf si nous savons mieux) précision = largeur souhaitée de l'intervalle de confiance 1,96 = constante pendant un intervalle de confiance de 95%
Par exemple, si nous voulons estimer une proportion de 10% avec un IC à 95% de +/- 3% avec un effet de conception prévue de 1,5, nous aurions besoin d'une taille de l'échantillon:
n = 1,5 * [(0,1 * (1 - 0,1)) / (0,03 / 1,96) ^ 2] = 576
Ce calcul suppose une grande population (par exemple N> c. 5000). Si vous avez une population plus petite, alors vous pouvez appliquer une correction de la population finie. C'est:
new.n = (old.n * population) / (old.n + (population - 1))
où "old.n" est la taille de l'échantillon calculé en utilisant la première formule ci-dessus.

En reprenant l'exemple ... si (par exemple), nous étions échantillonnage d'une population de 1000 habitants nous aurions besoin d'une taille de l'échantillon:
new.n = (576 * 1000) / (576 + (1,000 - 1)) = 366
tout à fait une économie!

ANALYSE DE DONNEES AVEC une population finie

La plupart des logiciels statistiques et des formules d'estimation Supposons une population importante et présentera les intervalles de confiance qui ne sont pas corrigées pour la taille de la population. La FPC dans ce cas est:
FPC = sqrt ((population - n) / (population - 1))
En reprenant l'exemple, nous avons une FPC:
FPC = sqrt ((1000 - 366) / (1000 - 1)) = 0,7966
nous corrigeons les limites de confiance non corrigées par l'escalader par ce facteur. Si (par exemple), nous avions:
estimation ponctuelle = 10,67% Limite inférieure de confiance = 7,71% Limite supérieure de confiance = 14,21%
nous serions à l'échelle les limites de confiance que:
LCL corrigée = 10.67 - (10,67 - 7,71) * 0,7966 = 8,31% UCL corrigée = 10,67 + (de 14,21 à 10,67) * 0,7966 = 13,49%

POSTERIOR PONDÉRATION

La première étape consiste à calculer le poids de chaque communauté échantillonnée. L'approche la plus simple est:
w = N / sum (N)
où:
N = population (par exemple nombre de toits) dans une communauté échantillonnée sum (N) = population totale dans toutes les communautés échantillonnées
Nous pouvons alors calculer une estimation de point comme suit:
p = somme (w * (c / n))
où:
p = estimation ponctuelle w = poids (calculé comme ci-dessus) c = nombre de cas n = taille de l'échantillon dans une communauté échantillonnée
Voici quelques exemple des données de couverture avec huit villages échantillonnés (vous auriez plus):
Village Pop WCNC / NW * c / n ------- --- ------------ ---- ---- ---------- ---------- ------ 115 115 1 / 0,13 = 900 29 38 29/38 * 0,13 = 0,76 0,76 = 0,0988 91 91 2 / 0,10 = neuf cents 18 32 18/32 * 0,10 = 0,56 0,56 = 0,0560 121 121 3/900 = 0,13 36 43 36/43 = 0,84 0,13 * 0,84 = 0,1092 114 114 4/900 = 0,13 15 35 15/35 * 0,13 = 0,43 0,43 = 0,0559 98 98 5/14 = 0,11 neuf cents 42 14/42 * 0,11 = 0,33 0,44 = 0,0363 104 105 6/900 = 0,12 10 37 10/37 = 0,27 0,12 * 0,27 = 0,0324 132 132 7/900 = 0,15 5 39 5/39 = 0,13 0,15 * 0,13 = 0,0195 125 125 8/900 = 1,14 23 42 23/42 * 0,14 = 0,55 0,55 = 0,0770 ------- --- ------------ ---- --- ----------- ---------- ------ Sommes 900 1,00 150 308 NA 0,4851
L'estimation ponctuelle est 0,4851 (48,51%).

Ce genre de calcul peut être effectué dans un tableur.

Le calcul de l'intervalle de confiance de 95% est également un peu impliqué:
1,96 +/- p * sqrt (((2 ^ w * (C / N) * (1 - a / n)) / n)
Poursuivant en utilisant les données ci-dessus:
Village w ^ 2 c / n 1- (C / N) ((w ^ 2 * (C / N) * (1-c / n)) / n) ------- ----- ------ ------- ----------------------- 1 0,0169 0,76 0,24 0,00008112 2 0,0100 0,56 0,24 0,00007700 3 0,0169 0,84 0,16 0,00005282 4 0,0169 0,43 0,57 0,00011835 5 0,0121 0,33 0,67 0,00006370 6 0,0144 0,27 0,73 0,00007671 7 0,0225 0,13 0,87 0,00006525 8 0,0186 0,55 0,45 0,00011550 ------- ----- ------ ------- ----------------------- SUM = 0.00065045 SQRT (SUM) = 0,02550392 ----------------------
L'IC à 95% est alors:

Basse 95% CL = 0,4851 à 1,96 * = 0,02550392 0,4351 (43,51%)
Supérieure à 95% CL = 0,4851 + 1,96 * 0,02550392 = 0,5351 (53,51%)

Ce genre de calcul peut également être effectué dans un tableur.

Je souhaite que cela est utile.

Quelqu'un doit vérifier mon travail.

Ai-je raté quelque chose?

Mark Myatt
Technical Expert

Répondu:

10 années il y a
Veuillez vous connecter pour poster une réponse:
Se connecter