Tipos de muestreo de datos

Anuncio
Materia: Planificación de Transporte
Profesor: Jorge Rivera
Elaborado por:
Jeffri Josué Escoto Alaniz
Milton Enmanuel Melgara Gonzales
Richard Raphael Martínez
Stefany Alexandra Ventura Ponce
Rodrigo Osejo Cárdenas
María Fernanda Centeno Paz
Sábado 11 de marzo del 2023
Índice
Introducción
La correcta planificación de transporte supone una buena recolección de datos
(Muestreo) que faciliten de manera optima el flujo de trabajo, de manera que los
proyectos se concluyan en tiempo y forma. Es de suma importancia conocer los
distintos métodos de recopilación de datos y su correcta aplicación, de manera
que en el presente documento nos hemos propuesto mostrar algunos de los mas
en la ingeniería de tránsito y transporte.
Objetivo General
࿊ Entender la relación que existe entre los métodos de recopilación de datos
con la planificación de transporte, para así comprender, y tener una visión
más amplia y detallada de las distintas técnicas que existen.
Objetivos específicos
࿊ Conocer los diferentes métodos de recopilación de datos.
࿊ Referir las técnicas de muestreo con la planificación de transporte.
࿊ Conocer los conceptos básicos para el análisis estadístico de datos,
cuando estos son muy numerosos.
࿊ Entender los parámetros necesarios para establecer una muestra en base
al tamaño de la población.
Consideración.
La representatividad de una muestra, permite extrapolar y por ende generalizar
los resultados observados en esta, a la población accesible; y a partir de esta, a
la población blanco. Por ende, una muestra será representativa o no; solo si fue
seleccionada al azar, es decir, que todos los sujetos de la población blanco
tuvieron la misma posibilidad de ser seleccionados en esta muestra y por ende
ser incluidos en el estudio; y, por otro lado, que el numero de sujetos
seleccionados representen numéricamente a la población que le dio origen
respecto de la distribución de la variable en estudio em la población, es decir, la
estimación o cálculo del tamaño de la muestra. Es así como el análisis de una
muestra permite realizar inferencias, extrapolar o generalizar conclusiones a la
población blanco con un alto grado de certeza; de tal modo que una muestra se
considera representativa de la población blanco, cuando la distribución y valor
de las diversas variables se pueden reproducir con márgenes de error
calculables.
Definiciones:
 Muestreo: es una herramienta de la investigación científica, cuya función
básica es determinar que parte de una población debe examinarse, con
la finalidad de hacer inferencias sobre dicha población.
 Población o universo: conjunto de unidades o elementos que presentan
una característica común; también se le considera como un conjunto de
medidas. Si la característica observada ha sido medida recibe el nombre
de variable continua; si, por el contrario, tan solo se hace el recuento, se
le denomina atributo o puede ser una variable discreta. Considerar a la
población como conjunto de unidades o elementos, puede entenderse
como un grupo de personas, familias, establecimientos, manzanas,
barrios, objetos, pero en realidad es un conjunto de medidas obtenidas
con las características estudiadas.
 Unidad: hace referencia a una persona, una familia, una vivienda, una
manzana, un barrio, un establecimiento, una tarjeta o ficha académica y
se denomina unidad elemental o elemento, cuando con de ella se obtiene
la información necesaria. Es el individuo, entidad u objeto del cual se
desea observar todas o algunas de sus características para ser medidas
o contadas. La unidad o elemento debe ser clara, es decir, de fácil
identificación por todos los que intervengan en el proceso de
investigación; además, debe ser adecuada al objeto de la investigación.
 Unidades de selección: diferentes grupos o subgrupos que pueden
formarse de la población total o universo.
 Unidades parciales de selección: se obtienen del proceso de selección de
las unidades que conformaran la muestra, constituyéndose en
subdivisiones de la población a través de la cual se llega a la unidad final
de selección.
 Unidad final de selección: tiene características definidas de permanencia
y puede ser identificada con facilidad en el transcurrir del tiempo.
 Unidades de observación: en conjunto, conforman la población o
universo, dada una característica común.
 Unidades de análisis: elementos o unidades sobre las cuales se concentra
el estudio.
 Muestra: conjunto de medidas pertenecientes a una parte de la población.
También es una parte de la población o conjunto de elementos que resulta
de la aplicación de algún proceso, generalmente de selección aleatoria,
con el objeto de investigar todas o parte de las características de estos
elementos.
 Censo: tipo especial de muestreo donde se observa la población
completa. Por ejemplo: Zonas DANE, viviendas, estratos, población
motorizada entre otros.
Tipos de muestreo
Esta sección se precisa los distintos métodos de recolección de datos que se
pueden involucrar en la toma de información de campo, para el desarrollo de
análisis posteriores en el campo del tránsito y el transporte.
Métodos de muestreo probabilístico
Son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos
en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y, consiguientemente, todas las posibles muestras
de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilístico nos aseguran la representatividad de la
muestra extraída y son, por tanto, los mas recomendables. Dentro de los
métodos de muestreo probabilísticos encontramos los siguientes tipos:
Muestreo aleatorio irrestricto. Es un caso especial del muestreo
probabilístico, también conocido con el nombre de muestreo aleatorio
simple. Es un procedimiento que se utiliza para seleccionar n unidades,
una a la vez, de una población de n unidades, de manera que cada unidad
seleccionada tenga la misma probabilidad de ser elegida en muestra.
Cada combinación posible de n unidades muestrales tiene la misma
probabilidad de ser elegida. La selección de una unidad muestral a la vez,
con igual probabilidad, puede llevarse a cabo ya sea con remplazo o sin
remplazo. Casi todas las muestras se eligen sin remplazo. El uso de tablas
de números aleatorios para la selección de este tipo de muestreo aleatorio
simple.
Muestreo aleatorio sistemático. Requiere numerar todos los
elementos de la población, pero en lugar de extraer números aleatorios
solo se extrae uno. Se parte de ese número aleatorio i, que es un numero
elegido al azar, y los elementos que integran la muestra son los que
ocupan los lugares i, i+k, i+2k, i+3k,…,i+(n-1)k, es decir, se toman los
individuos de k en k, siendo k el resultado de dividir el tamaño de la
población entre el tamaño de la muestra: k=N/n. El número i que
empleamos como punto de partida será un numero al azar entre 1 y k. El
problema de este muestreo es que es posible que se incurra es un error,
por ejemplo, al seleccionar una muestra sobre listas de 10 individuos en
los que los 5 primeros son varones y las 5 últimas mujeres, si se emplea
un muestreo aleatorio sistemático con k= 10 siempre se seleccionaría o
solo hombres o solo mujeres, con lo cual no podría haber una
representación de los dos sexos.
Muestreo aleatorio estratificado. Trata de obviar las dificultades que
presentan los anteriores ya que simplifican los procesos y suelen reducir
el error muestral para un tamaño dado de la muestra. Consiste en
considerar categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el
sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo
es asegurarse de que todos los estratos de interés estarán representados
adecuadamente
en
la
muestra.
Cada
estrato
funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formaran parte de la muestra. En ocasiones las dificultades que plantean
son demasiado grandes, pues exige un conocimiento detallado de la
población. (Tamaño geográfico, sexos, edades…)
La distribución de la muestra en función de los diferentes estratos se
denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos
muestrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión del resultado, de
modo que se considera la proporción y la desviación típica. Tiene poca aplicación
ya que no se suele conocer la desviación.
Muestreo aleatorio por conglomerados. Los métodos presentados
hasta ahora están pensados para seleccionar directamente elementos de
la población, es decir, que las unidades muestrales son los elementos de
la población. En el muestreo por conglomerados la unidad muestral es un
grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos
universitarios,
una
caja
de
determinado
producto,
etc.,
son
conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son áreas geográficas suele hablarse de
“muestreo por áreas”. El muestreo por conglomerados consiste en
seleccionar aleatoriamente un cierto número de conglomerados (el
necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados
elegidos.
Métodos de muestreo no probabilísticos
Es un muestreo que no permite generalizar ni tener certeza que la muestra
sea representativa, pues no todos los miembros de la población tienen la misma
probabilidad de ser elegidos.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo, los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.
Muestreo por cuotas. También denominado en ocasiones
“accidental”. Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos mas
“representativos” o “adecuados” para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado,
pero no tiene el carácter de aleatoriedad de aquel.
En este tipo de muestreo se fijan unas “cuotas” que consisten en
un numero de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en
Gijón. Una vez determinada la cuota se eligen los primeros que se
encuentren que cumplan esas características. Este método se utiliza
mucho en las encuestas de opinión.
Muestreo intencional o de conveniencia. Este tipo de muestreo se
caracteriza
por
un
esfuerzo
deliberado
de
obtener
muestras
“representativas” mediante la inclusión en la muestra de grupos
supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado
tendencias de voto.
También puede ser que el investigador seleccione directa e
intencionalmente individuos de la población. El caso mas frecuente de
este procedimiento el utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos).
Bola de nieve. Se localiza a algunos individuos, los cuales
conducen a otros, y estos a otros, y así hasta conseguir una muestra
suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios
con
poblaciones
“marginales”,
delincuentes,
sectas,
determinados tipos de enfermos, etc.
Muestreo Discrecional. A criterio del investigador los elementos son
elegidos sobre lo que el cree que pueden aportar al estudio.
Muestreo
casual
o
incidental.
Se
selecciona
directa
e
intencionalmente los individuos de la población. Normalmente se usan
individuos a los que se tiene fácil acceso; un caso particular son los
voluntarios.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
CARACTERÍSTICAS
VENTAJAS
Se selecciona una muestra de
࿊
tamaño n de una población de N
Aleatorio simple
unidades, cada elemento tiene
y
de
fácil
comprensión.
࿊
una probabilidad de inclusión
igual y conocida de n/N
Sencillo
INCONVENIENTES
Calculo
antemano
rápido
de complejo
un
de
listado
toda
la
población. Cuando se trabaja
medias y varianzas.
࿊
Requiere que se posea de
Se basa en la teoría con muestras pequeñas es
estadística, y por tanto posible que no represente a
paquetes la población adecuadamente.
existen
informáticos
para
analizar los datos.
Conseguir un listado de los N
࿊
Fácil de aplicar.
elementos de la población.
࿊
No siempre es necesario está
Si la constante de muestreo
asociada
con
el
Sistemático
Determinar tamaño muestral n.
tener un listado de toda fenómeno de interés, las
Definir un intervalo k=N/n.
la población.
Elegir un número aleatorio, r,
࿊ Cuando
la
estimaciones
obtenidas
a
población partir de la muestra pueden
entre 1 y k (r=arranque aleatorio).
está ordenada siguiendo contener sesgo de selección.
Seleccionar los elementos de la
una tendencia conocida,
lista.
asegura una cobertura
de unidades de todos los
tipos.
En ciertas ocasiones resultará
conveniente
muestra
estratificar
según
࿊
la
ciertas
variables de interés. Para ello
debemos
conocer
la
Estratificado
muestreo. Una vez calculado el
tamaño muestral apropiado,
࿊
adecuadamente
la
población
de
población en función de
variables
utilizadas
unas
para la estratificación.
a
variables
Se
obtienen
más
estimaciones
precisas.
࿊ Su
objetivo
conseguir
proporcional entre los distintos
muestra
usando una simple regla de tres.
Se ha de conocer la
distribución
este se reparte de manera
estratos definidos en la población
࿊
la muestra represente
seleccionadas.
composición estratificada de la
población objetivo a hacer un
Tiende a asegurar que
es
una
lo
más
semejante posible a la
población en lo que a la
o
las
estratificadoras
refiere.
variables
se
en
la
las
Se
realizan
varis
fases
de
࿊
Es muy eficiente cuando
࿊
El error estándar es
Conglomerados
muestreo sucesivas (polietápico)
la población es muy
mayor
La necesidad de listados de las
grande y dispersa.
muestreo
unidades de una etapa se limita a
࿊ No es preciso tener un
que
en
el
aleatorio
simple o estratificado.
aquellas unidades de muestreo
listado
la
࿊ El cálculo del error
seleccionadas
población, sólo de las
estándar es complejo.
anterior.
en
la
etapa
de
toda
unidades primarias de
muestreo.
Conclusión
Descargar