En regardant les matériaux sur SCCS, il ya plusieurs références à S3M mais je ne trouve rien qui explique réellement. Quelqu'un at-il des ressources pour cela?
S3M est un développement du SCCS. Elle porte sur un procédé de mise en correspondance dans une vaste zone. Nous (c. Valid International, Brixton Santé, l'inquiétude, l'UNICEF) ont de l'expérience avec l'aide S3M pour la couverture de la PCMA et les indicateurs IYCN dans deux pays du Sahel. Nous avons travaillé sur l'adaptation de plusieurs indicateurs pour une utilisation avec le cadre d'échantillonnage S3M et avons récemment achevé un projet pilote dans un pays du Sahel. La question clé est que nous avons besoin que les indicateurs peuvent travailler avec de petits échantillons (ce qui leur permet d'être mappés à des échelles fines). Nous avons fait des progrès avec (par exemple) la méthode PROBIT GAM / MAM / SAM prévalence, analyse de survie approches pour poursuivre l'allaitement, et les indicateurs simplifiées pour IYCN mais plus de travail est nécessaire et est en cours. Nous voyons maintenant S3M comme méthode générale d'enquête de santé publique plutôt que d'une méthode d'enquête de couverture (bien qu'il puisse être utilisé pour cela aussi). Nous avons encore à travailler sur (ou de commencer à travailler sur) comment estimer la mortalité de la période récente avec S3M.
Nous travaillons aussi à l'intérieur-PSU méthodes d'échantillonnage et nous avons eu un certain succès avec les techniques de carte-segment échantillon (adapté de travaux antérieurs sur des enquêtes de prévalence du trachome (Malawi et le Viet Nam) et les évaluations conjointes ASEAN post-Nargis au Myanmar qui ont utilisé un S3M-type d'échantillon de la première étape) dans les essais au Niger, en Ethiopie, et en Sierra Leone.
Notre expérience est que S3M promet d'être une méthode de cartographie vaste zone rentable adaptée à utiliser avec indicateur multiple. Il ya quelques problèmes et les bords rugueux à l'heure actuelle mais elles sont traitées. Méthodes nouvelles et modifiées sont dus être testé dans deux pilotes.
Je ne suis pas en mesure, sans chercher des autorisations, de divulguer des informations ou des résultats plus détaillés des enquêtes S3M le moment, mais ...
Ici est une présentation rapide.
Voici un guide des mots simples et des images (il comprend un exemple de carte à partir d'une enquête S3M).
Les deux sont des premières œuvres et ne reflètent pas les évolutions récentes. Ils devraient, cependant, vous donner une idée de la façon dont l'échantillon de la première étape est prise.
J'espère que cela aide.
Répondu:
12 années il y aCher Mark,
Pouvez-vous s'il vous plaît décrire la Validy statistique des S3M sur l'estimation de l'émaciation, poids insuffisant, stunding, certains indicateurs de ANJE clés tels que l'initiation en temps opportun de la nourriture gratuite, l'adéquation / fréquence de la nourriture gratuite, etc. Merci
Répondu:
11 années il y aJe peux vous donner une idée de S3M ...
Vue d'ensemble: Le S3M est une méthode d'enquête de grappe échantillonnée (tout comme SMART) mais avec des grappes sélectionnées en utilisant une méthode d'échantillonnage spatial plutôt que PPS (comme on le fait souvent avec SMART). Les estimations et les classifications sont faites pour la superficie totale de l'enquête et sur des zones beaucoup plus petites dans la zone globale de l'enquête. L'échantillon PPS est problématique car il tend (par la conception) pour concentrer l'échantillon dans les communautés les plus peuplées. PPS est également problématique si les données exactes sur la population ne sont pas disponibles. Cela est généralement le cas dans les situations d'urgence.
Les estimations globales: PPS est un schéma de pondération préalable. S3M utilise un système de pondération a posteriori que pourrait être utilisé avec un échantillon stratifié au moyen d'un contingent fixé à chaque strate. Cela permet S3M pour produire des estimations globales avec les communautés les plus peuplées recevant pondération plus élevée que les communautés les moins peuplés. La différence entre les deux approches est que les poids PPS avant l'échantillonnage et S3M poids après le prélèvement. La question de la perte de variation d'échantillonnage (effet du plan) est abordée dans la conception au sein de l'échantillon-PSU (voir ci-dessous) et en utilisant des techniques d'analyse de données appropriées. Les données des enquêtes S3M peuvent être analysés en utilisant des approches basées sur des modèles (comme par exemple dans les commandes "svy» Stata ou le module d'échantillons complexes SPSS). Nous utilisons bloqué et estimateurs bootstrap pondérés parce que ceux-ci permet une plus grande flexibilité en termes de statistiques qui peuvent être utilisés avec des méthodes classiques (par exemple, une exacte IC à 95% sur une période médiane - utilisé dans HDDS analyse - est extrêmement difficile en utilisant des approches basées sur des modèles, mais trivial en utilisant les données d'amorçage). La taille de l'échantillon utilisé pour l'estimation globale est habituellement imposée à nous par la nécessité de faire des estimations et des classifications locales plus. Cela signifie que nous avons tendance à avoir de plus grandes tailles globales de l'échantillon (et une meilleure précision) qu'une enquête de type SMART.
Dans PSU-échantillonnage: La carte-segment échantillon (MSS) technique produit un échantillon qui est beaucoup plus proche d'un échantillon aléatoire simple de l'échantillon de proximité utilisée par SMART. Cela conduit à des effets de conception inférieurs (meilleure précision) moins de partialité. Le travail effectué pendant le développement et le test de la méthode d'enquête EPI indique que le SMART type d'échantillon de proximité ne sont pas appropriées pour les variables montrant un gradient centre-à-bord ou le regroupement au sein de la communauté. Ceux-ci comprennent l'éducation, l'état de grossesse, les variables relatives à la garde des enfants, les maladies épidémiques, les facteurs socio-économiques et des variables liées aux soins de santé. Cela signifie que l'échantillon SMART est un mauvais choix pour de nombreux indicateurs. Il n'y a rien pour arrêter toute personne utilisant MSS comme une stratégie au sein-PSU échantillonnage avec SMART.
/ Estimations des classifications locales: Une des principales raisons d'utiliser S3M est d'exploiter l'échantillon spatiale pour cartographier les valeurs des indicateurs au niveau local. La question clé ici est la taille des échantillons. Un local est représenté par trois unités qui comprennent des données provenant entre un et six communautés voisines (le nombre exact est ici définie par la taille du village moyen et la population cible). Aléatoire (échantillonnage) variation est amorti par le lissage de données qui découle de la conception de l'échantillon. Nous avons développé et testé un certain nombre d'indicateurs de petits échantillons. Ce sont des indicateurs qui sont conçus pour bien fonctionner avec de petits échantillons (par «petite», nous entendons n = 60 à n = 96 au total de trois unités d'alimentation). Ce sont parfois des indicateurs standards (par exemple HDSS de FANTA). Parfois, ils sont des adaptations de MICS et EDS indicateurs (par exemple WASH ensemble d'indicateurs de JMP, l'indicateur set S3M / RAM ANJE). Parfois, ils sont entièrement nouveaux indicateurs (par exemple PROBITS GAM). Nous avons maintenant des indicateurs qui couvrent la plupart des applications. Beaucoup d'entre eux sont des indicateurs standards. En mai 2013, nous prévoyons de piloter une méthode IM révisé pour la mortalité (CMR) estimation. Où nous ne pouvons pas estimer avec précision utile, nous utilisons classificateurs d'échantillonnage séquentiels avec une précision utile et la fiabilité (comme nous le faisons souvent avec SQUEAC et SLEAC) avec des tailles de de n <50 total de trois UPE.
Cela ne répond pas vraiment à votre question. Peut-être un coup d'oeil au pedigree des composants pourrait ...
Échantillonnage sur une grille hexagonale: Ceci est une modification si la méthode SCCS / quadrat d'échantillonnage standard pour améliorer la régularité de l'échantillonnage. Cela a été utilisé dans les évaluations de l'ASEAN PONJA et dans un certain nombre d'enquêtes S3M au Niger, au Soudan, en Ethiopie avec de bons résultats.
Utilisation de techniques de tessellation spatiales: Voronoi polygonisation est une technique courante datant de trois des quatre cents cents ans. Sa première utilisation épidémiologique était dans le travail de pionnier de la neige sur le choléra. L'utilisation des réseaux irréguliers triangulés est une technique courante en géostatistique et épidémiologie spatiale.
Pondération postérieur est une technique d'enquête standard. Il est souhaitable dans tous les manuels de base sur la conception de l'enquête.
Amorçage est une technique statistique moderne (ie non-classique). Nous avons étendu l'approche générale de l'analyse de données provenant de l'échantillonnage en grappes par des techniques d'emprunt (c.-à-bloquants) à partir de l'analyse des séries chronologiques. La pondération est réalisée par un algorithme "de roue de la roulette" standard. Nous avons testé notre approche en utilisant les mêmes données (Niger de données ANJE) analysés par nous en utilisant le bootstrap et par la CDC en utilisant SAS. Résultats convenu de 4 décimales.
La méthode d'échantillonnage dans les MSS-PSU est tiré de la littérature associée à l'essai et au développement de la méthode de conception de l'enquête EPI. MSS a été utilisé et testé dans les enquêtes ASTRA trachome.
Classificateurs d'échantillonnage progressif utilisent des méthodes standards. La taille des échantillons sont trouvés en utilisant des simulations d'échantillonnage informatiques des populations finies.
L'échantillon petit indicateur IYCF jeu est développé à partir des indicateurs de l'EDS.
L'indicateur PROBIT a été développé sur la recommandation d'un comité d'experts de l'OMS. La méthode a été testée et publiée. Nous utilisons maintenant un estimateur amélioré. Cette technique est actuellement testé sur une autre base de données des enquêtes SMART par la CDC.
La méthode IM a été développé et testé par FANTA et LSHTM. Nous améliorons la recherche de cas de sensibilité en utilisant plusieurs informateurs. Nous sommes préoccupés par un biais en raison de petits nombres mais le biais serons cohérents et permettre ainsi la cartographie / identification des points chauds de la mortalité.
S3M est (comme de nombreuses méthodes d'enquête) une combinaison de composants bien compris et testés.
La preuve du pudding est dans l'alimentation ...
(1) Vous êtes invités à nous rejoindre en tant qu'observateur à l'un de nos enquêtes S3M à venir.
(2) Vous êtes invités à communiquer avec l'un de nos partenaires pour discuter de leurs expériences avec la méthode.
Vous pouvez essayer vous-même.
BTW: Je suis l'un des développeurs de S3M donc je ne suis probablement pas la meilleure personne pour demander un point de vue objectif. Je suis heureux de rencontrer avec votre équipe ou avec des statisticiens de votre choix pour discuter de ce travail. Je ne suis pas vraiment bien que la validité de la méthode globale était un problème ... Je dois plus préoccupés par la praticabilité et la validité / utilité des indicateurs spécifiques.
Répondu:
11 années il y aJuste une petite précision. Marc dit "L'échantillon PPS est problématique car il tend (par la conception) pour concentrer l'échantillon dans les communautés les plus peuplées." Je trouve cette déclaration plutôt vague et quelque peu trompeur. Oui, la sélection des unités primaires d'échantillonnage (UPE) probabilité proportionnelle à la taille ne donne une plus grande probabilité de sélection à une plus grande UAR. Cela ne signifie pas nécessairement que les UPE dans les villes et grandes villes ont une plus grande probabilité d'être sélectionné. La probabilité relative de la sélection dépend entièrement de la taille de ces UPE dans la population groupements plus importants par rapport à la taille des UPE dans les petits groupes de population, tels que les villages ruraux. En fait, de nombreux types de UAR, tels que les unités de recensement, sont souvent de taille remarquablement uniforme, tant dans les zones urbaines et rurales.
En outre, si la taille de chaque groupe est le même (qui est, si vous sélectionnez le même nombre de ménages dans chaque UPE sélectionnée), la sélection des UPE probabilité proportionnelle à la taille dans la première étape d'échantillonnage donne à chaque ménage de la population exactement la même probabilité de sélection, ce qui supprime la nécessité d'attribuer des poids statistiques pour chaque groupe au cours de l'analyse des données. Maintenant, si vous êtes déjà Calcul des pondérations statistiques en raison de l'échantillonnage stratifié avec probabilités inégales, ce ne pas ajouter trop de travail. Cependant, je l'ai entendu (et quelqu'un s'il vous plaît me corriger si je me trompe) que la précision statistique diminue avec une augmentation du nombre de poids statistiques différentes utilisées.
En bref, la sélection des UPE avec probabilité proportionnelle à la taille produit un échantillon qui est représentatif de l'ensemble de la population par rapport à la taille du village ou de la ville dans laquelle les ménages sont situés. Il ne produit pas un échantillon biaisé ou disproportionnée moins que quelque chose est mal fait.
Répondu:
11 années il y aDésolé d'avoir été vague et je eu aucune intention d'induire en erreur. Je savais que ce poste a été longue.
Clarifier ...
Dans notre domaine, nous parlons vraiment adaptations / dérivations du Programme élargi de vaccination (PEV) méthode d'enquête de couverture lorsque nous parlons de «SMART» ou «30-en-30» ou «PPS».
La méthode PEV utilise un cluster méthode d'échantillonnage en deux étapes qui commence par diviser une population en grappes pour lesquelles des estimations de la population sont disponibles. Un sous-ensemble de grappes est sélectionné dans la première étape d'échantillonnage. La probabilité d'un groupe particulier étant sélectionné est proportionnelle à la taille de la population dans cette grappe.
Clusters avec de grandes populations sont plus susceptibles d'être sélectionnés que les clusters avec de petites populations. Cette procédure d'échantillonnage, appelée probabilité proportionnelle à la taille (PPT), permet d'assurer que les personnes dans la zone du programme ont une chance égale d'être échantillonné quand un échantillon de quotas est prise dans la deuxième étape de l'enquête.
En reconnaissance des difficultés de prélèvement d'un échantillon aléatoire dans de nombreux pays en développement, la méthode PEV (et ses dérivés tels que SMART) utilise une méthode d'échantillonnage non aléatoire dans la deuxième étape. La deuxième méthode d'échantillonnage de phase la plus utilisée est une technique de proximité. Le premier ménage à échantillonner est choisi par la sélection d'une direction aléatoire à partir du centre de l'amas, en comptant les maisons le long de cette voie, et en choisir un au hasard. Ménages ultérieures sont échantillonnées par leur proximité physique du ménage échantillonnés antérieurement. L'échantillonnage continue jusqu'à une taille de l'échantillon fixe comme été recueillies. L'échantillonnage est simple et ne nécessite ni cartographie, ni énumération des ménages. Il est, par conséquent, à la fois plus rapide et moins cher que par échantillonnage aléatoire simple dans la deuxième étape de l'enquête.
Tout cela prend en charge l'utilisation de la méthode EPI. Il, cependant, ont des problèmes:
(1) Le processus PPS devrait aboutir à un échantillon auto-pondéré, mais il ne peut pas être invoquée pour faire si les estimations des munitions tailles de population sont inexactes. Le manque de données exactes sur la population peut être fréquemment le cas dans les situations d'urgence. En outre, lors de l'estimation (par exemple) la couverture d'un programme d'alimentation sélective comme PCMA les données de la population que nous devrions utiliser est le nombre de cas dans chaque UPE potentiel (pas la population à chaque PSU). Prévalence d'une affection comme SAM qui est fortement influence par des phénomènes infectieux qui regroupent spatialement va regrouper spatialement. Si nous ne savons le motif de la prévalence et de la population totale à l'avance, nous ne serons pas en mesure de prendre un échantillon PPS correctement pris en charge.
(2) PPS localise l'essentiel de la collecte de données dans les communautés les plus peuplées. Woody semble suggérer que cette une filiale bonne chose. Lorsque l'on étudie la couverture (par exemple) PPS peut quitter les zones de faible densité de population non échantillonnée (à savoir ceux des zones comprenant des communautés susceptibles d'être éloignés des centres de santé, centres d'alimentation, et des points de distribution). Cela peut provoquer des sondages pour évaluer la couverture comme étant suffisante même lorsque la couverture est mauvaise ou inexistante dans les zones en dehors des centres urbains.
(3) À l'exception du premier enfant, aucune des observations de l'échantillon au sein du cluster sont sélectionnés en utilisant une méthode de sélection de probabilité égale (une «expérience» rapide avec la géométrie va montrer que, sous tous, mais condition restrictive la méthode est pas EPSEM même pour le premier enfant). Ceci, combiné avec le fait que la taille de l'échantillon intra-cluster est généralement trop petit pour estimer ou de classer dans un cluster avec exactitude et une précision raisonnable, signifie que la méthode PEV peut retourner uniquement une seule estimation de la couverture ou de la prévalence, même lorsque la couverture ou la prévalence est spatialement inhomogène. Ceci est une limitation importante depuis l'identification des zones à faible couverture (ou prévalence élevée) est une étape essentielle vers l'amélioration de la couverture du programme et, par conséquent, l'impact du programme.
(4) La méthode d'échantillonnage dans les UPE décrit ci-dessus est connue pour produire des estimations biaisées pour un large éventail d'indicateurs que nous pourrions être intéressés. Preuves Publié suggère que ce ne sont pas un problème pour GAM.
(5) Les résultats au sein-PSU méthode d'échantillonnage à grande perte de variation d'échantillonnage. Ceci est des effets importants de conception et de petites tailles d'échantillon efficaces. Ceci est seulement un réel problème lorsque les coûts de mesure sont importantes par rapport à l'échantillonnage coûts ou lorsque les indicateurs relatifs aux sous-échantillons (par exemple, dans certains ensembles d'indicateurs de ANJE) sont utilisés.
(6) PPS ne cherche pas à prendre un échantillon représentatif spatialement. PPS (contrairement SCCS, S3M, ou des échantillons spatialement stratifiées à base de liste) ne garantit pas un échantillon même spatiale. En fait, il fait le contraire en ce qu'il aura tendance à sélectionner les plus grandes collectivités qui auront tendance à être regroupés le long des routes, les rails, les rivières, les ports naturels, & c. L'accent est mis sur la taille du village non l'emplacement du village. Cela signifie que PPS ne peut pas être utilisé pour cartographier des phénomènes en détail.
Tous ces problèmes sont là, même si tout est fait correctement.
Les partisans de PPS critiquent souvent des schémas alternatifs de ne pas être représentatif de la population (je ne pense pas que Woody fait cela). Ces critiques ne sont pas fondées comme un échantillon représentatif spatiale peut être faite représentative de la population par l'utilisation de pondération postérieur (la transformation inverse est pas possible). Le nombre de poids statistiques différentes utilisées par S3M et PPS est le même. La différence est quand les poids sont utilisés (c.-à-avant ou après le prélèvement). Dans certains cas, les pondérations utilisées dans S3M seront plus précis, car ils peuvent être collectées ou confirmées comme un processus d'enquête. Dans de nombreux cas, les pondérations utilisées seront identiques. L'analyse globale d'un échantillon S3M produit un résultat représentatif de la population. ... BTW la même approche est utilisée dans le procédé de la RAM.
Si vous regardez la liste des problèmes ci-dessus, vous verrez que S3M (et des méthodes similaires) sont conçus pour répondre à ces problèmes:
(A) Pas de données de population sont nécessaires à l'avance. Poids de la population peuvent utiliser (par exemple) les chiffres de la cabane recueillies lors de l'enquête.
(B) L'échantillon spatiale est agnostique en matière de population pour les petites et les grandes collectivités sont échantillonnés. Si il ya plus petite que les grandes collectivités de la région de l'enquête puis de plus petites communautés seront échantillonnés.
(C) La carte-segment échantillon (MSS) technique EPSEM rapproche plus que la technique de proximité. MSS est une innovation qui pourrait être adoptée par SMART aujourd'hui.
(D) MSS ne produit des estimations partiales.
(E) en tant que (C) ci-dessus.
(F) S3M est conçu comme une méthode de cartographie. Voici un exemple d'une enquête S3M.
Je souhaite que cela soit moins vague et non trompeur.
Répondu:
11 années il y aSalut Marc,
Je l'ai vu ce poste il ya quelque temps mais il a envoyé une question qui n'a pas passer, maintenant je suis poster à nouveau si un différent de la précédente.
Je l'ai essayé d'obtenir des informations détaillées sur la composante spatiale du processus d'échantillonnage S3M; Cependant, pas beaucoup est expliqué, je l'ai regardé à ce http://www.validinternational.org/coverage/workshop/day_two_files/caseNigerS3M.pdf.
Veuillez expliquer comment fondamentalement le processus d'échantillonnage de données géospatiales est mis en œuvre jusqu'à ce que vous avez l'échantillon requis montrant les aspects quantitatifs de l'échantillon de l'spatiale. Compte tenu de la couverture massive des terres pour les points de données géoréférencées illisibles de la plupart des pays et en tant que telle la distribution de population autour des grilles génèrent, comment tout cela facteurs sont abordés; Aussi ce qui est de la qualité des données géospatiales ensembles utilisé jusqu'à présent et comment ils ont été générés? Je sais qu'il ya beaucoup de travail / discussions sur les questions d'assurance de la qualité dans les données faisant autorité et fait du bénévolat géospatiales et des données spatiales créées par les communautés non-spatiales, comment est-il assuré dans le contexte humanitaire avec beaucoup de défis évidents à générer des données d'échantillonnage et dans ce cas spatiale (communautés mobiles, nous pouvons considérer plus tard)?
Répondu:
10 années il y a