5.4. Muestreo aleatorio. - Departamento de Matemáticas

Anuncio
Tema I.
I. Introducción
Para mucha gente la estadística significa descripciones numéricas. Sin embargo, en términos más precisos,
la estadística está constituida por un conjunto de principios y procedimientos para el estudio de los
fenómenos aleatorios. En este sentido la ciencia estadística tiene virtualmente un alcance ilimitado de
aplicaciones en un espectro tan amplio de disciplinas que van desde las ciencias, ingeniería, economía
hasta las leyes, medicina y la mercadotecnia. La estadística como una ciencia aplicada constituye una
vasta rama del conocimiento para la investigación, dado que la finalidad de toda investigación es obtener
conclusiones válidas que permiten establecer y dejar en un espacio específico y concreto la importancia
que un problema conlleva. Los tipos de estudios estadísticos tienen vital importancia en la investigación,
ya que la finalidad de ésta es que a partir de la recolección de “buenos datos”, proyectar conclusiones
claras y de gran significancia, por ello se hace distinción en la forma de obtener los datos; y que para
lograrlo están las técnicas de diseño estadístico, las cuales comprende: 1) los estudios observacionales,
donde el investigador es el observador y se utiliza principalmente para describir lo suficiente respecto al
problema. 2) estudios experimentales, donde se hacen interpretaciones bastantes claras de diferencias, por
medio de procedimientos aleatorios. 3) estudio de muestreo, donde una investigación empieza a tomar
forma de tal, debido a que dependiendo de la obtención de muestras significativas se obtienen resultados
significativos que para una investigación es el objetivo primordial en su desarrollo y conclusión. Por tanto,
el muestreo es imprescindible en la investigación, ya sea ésta de cualquier ciencia aplicada, también ha
sido el proceso por medio del cual algunas disciplinas han podido introducir en ellas metodologías y
procedimientos para su consolidación como tal, una de las grandes benefactoras es la mercadotecnia.
La mercadotecnia tuvo su desarrollo a partir de la segunda mitad del siglo XIX y en las dos primeras
décadas del siglo XX. La estadística en la mercadotecnia aparece en la fase en que ésta se caracteriza
como un proceso de investigación, aquí es cuando la estadística se convierte en la piedra angular para esta
disciplina. Con el desarrollo de la mercadotecnia también surgió la literatura referente a la metodología
aplicada para cerciorarse de los hechos en la mercadotecnia, denominada investigación de mercados; que
es la fase donde realmente aparece la estadística, ya que para que la investigación de mercados cumpla los
propósitos de proporcionar información, reunir información, proporcionar datos y reunir los datos
estadísticos se basa en los diseños estadísticos, esencialmente de los diseños de muestreo. En la vida
cotidiana los diseños de muestreos constituyen la base fundamental para una buena toma de decisiones en
la investigación de mercados, ya que dependiendo de ello es como se consolida y se resuelve cualquier
problema por muy difícil que sea.
Mercadotecnia e investigación de mercados
Sin duda la apertura comercial que se gestó en nuestro país a finales de la década de los ochenta y a
principios de los noventa, encontrándose hoy ya muy consolidada, favoreció a que las más diversas
actividades empresariales tienen una nueva perspectiva, se fomentaron actividades de planeación, de
organización, de mercadotecnia, de publicidad, entre muchas más. En el mundo una de las principales
ramas para la economía es sin duda alguna la mercadotecnia. La investigación de mercados o
mercadotecnia es un caso particular de la investigación científica, y por tal motivo requiere de
conocimientos teóricos, metodológicos y técnicos. La mercadotecnia se empezó a desarrollar a partir de la
segunda mitad del siglo XIX y en las primeras dos décadas del siglo XX. Todo el interés se centraba en el
aumento de la producción de los bienes y servicios. Su evolución hasta la fecha está definida en cuatro
etapas:

Orientada hacia la producción. Orientada hacia las ventas. Orientada hacia el
mercado
Con el desarrollo de la mercadotecnia al mismo tiempo que aparecieron obras de análisis de las
costumbres de la mercadotecnia, también surgió la literatura referente a la metodología empleada para
cerciorarse de los hechos de la mercadotecnia, denominada algunas veces análisis de mercado,
investigación de mercados, y otras, investigación de la distribución. Su tema era el método no solo la
mercadotecnia. Existen distintas maneras de definir la investigación de mercados.
Ejemplo: La American Marketing Association la define como: Investigación de Mercados es La función
que relaciona al consumidor, al cliente, y al público con especialista de mercadeo a través de la
información. La investigación de mercados especifica la información requerida para enfrentar problemas;
nos señala el método para la recolección de información; analiza los resultados y nos informa sobre los
hallazgos y sus complicaciones. Otra definición que se centra en la esencia de una adecuada
conceptualización de mercado; que para su propósito tienen que existir 4 términos que son: sistemático,
objetivo, información y toma de decisiones.
Es el enfoque sistemático y objetivo para el desarrollo y el suministro de información para el proceso de la
toma de decisiones por parte de la gerencia del mercadeo.

Investigación de Mercados:
¿Para qué sirve la investigación de mercados?
La necesidad de la investigación de mercados va paralela con la aceptación del concepto de Mercadeo. La
cual consiste en repartir o hacer llegar a los consumidores los bienes y servicios.
La definición de la investigación de mercados puede ser útil en todas las fases del proceso de la toma de
decisiones. Esto va desde la información para llegar a reconocer que existe una decisión, hasta la
información que guiará la selección de un curso de acción. La investigación de mercados puede
suministrar información sobre muchos aspectos del sistema de mercadeo. Este aspecto va desde el
monitoreo y la descripción de los factores situacionales, hasta la evaluación de los programas de mercadeo
y la medida del desempeño de estos programas.
Proceso de investigación.
En ningún otro campo es el conflicto tan obvio entre consideraciones de carácter científico y del mundo
real, que la selección de un diseño de investigación. Si se desea rigor científico, este habrá de ser tan
costoso, que la investigación se hace más una carga pesada que un beneficio; ignorar un diseño apropiado
habrá de reducir los costos de manera drástica, pero, también reduce el valor de la investigación pudiendo,
quizá llegar a cero. La clave respecto del diseño de investigación será entonces, hacer un equilibrio
inteligente entre la exactitud científica y la factibilidad. En un estudio de investigación se llevan a cabo las
siguientes etapas, para poder desarrollarla: Determinación de las necesidades de información.
Establecimientos de los objetivos de investigación. Diseño de la recopilación de datos. Desarrollo de un
plan de análisis. Análisis e interpretación de resultados. Reporte final. Donde los primeros seis puntos se
les conoce como diseño de la investigación y los cuatros últimos son los que representan la ejecución de la
investigación.
La estadística en la investigación de mercados.
Los métodos estadísticos tienen tantas aplicaciones en la mercadotecnia como uno pueda imaginarse, la
aplicación de la estadística en la mercadotecnia aparece en la etapa de la investigación de mercados.
Definitivamente el desarrollo de la investigación de mercados se presenta con el siglo XX ya que en 1911
en WINSCOSIN en la Unión Americana se realizó un primer estudio de mercado asociando implementos
industriales en la agricultura. La Estadística por su parte, es considerada como: la ciencia que se encarga
del diseño adecuado para la obtención de datos, del análisis de estos, y de la apropiada interpretación y
representación de los resultados. En el diseño adecuado para la obtención de datos se sugiere definir una
metodología para obtener los datos de acuerdo a las necesidades de la información, buscando que los datos
se colecten de la manera más rápida, barata y menos laboriosa. En el análisis se brinda una serie de
procedimientos y métodos para explotar los datos. En la interpretación y representación de datos, la
Estadística les brinda una serie de principios y procedimientos que se encarga de proporcionar guías para
el diseño de formatos de representación y de gráficos, además da elementos para construir juicios válidos,
seguidos de los análisis estadísticos. Por todo esto, entre las distintas metodologías estadísticas y la
investigación de mercados existe una relación muy directa con la mercadotecnia. Ya que una alternativa
viable de conocer las operaciones o características de un mercado en particular, las herramientas
estadísticas lo ofrecen.
La importancia del muestreo para la investigación de mercados
El muestreo juega un papel muy importante en la investigación de mercados, ya que este proporciona una
serie de datos que contienen informaciones relevantes para esta disciplina; la cual recopila, analiza,
interpreta y representa los resultados obtenidos. Con el desarrollo de la investigación en el siglo XX, los
estudios de mercado vinieron siendo una parte fundamental del desarrollo de una empresa. En las décadas
de los cuarenta el desarrollo de la mercadotecnia, tuvo su mayor auge; y centralmente en la investigación
de mercados. Esto a través del análisis por métodos de muestreo aplicando encuestas. Se publicaron
materiales sobre Estadística descriptiva, prueba de hipótesis, estimación y correlación simple y múltiple.
Así, en las décadas posteriores han tenido un mejor desarrollo y consolidación de los métodos estadísticos
aplicados al análisis de mercado.
Escrito por Uribel Cruz Hernández
Referencia:
http://mx.geocities.com/cruz_uri/InvMercados.html
Tarea de investigación.
1) ¿Qué es un análisis de Mercado?
2) ¿Qué es una investigación de Mercado?
3) ¿Qué diferencia hay entre un análisis de Mercado y una investigación de mercado?
1.1. Estadística en la vida diaria.
a. Importancia y aplicaciones de la estadística.
La Importancia de las Mediciones.
No se puede gestionar lo que no se mide. Las mediciones son la clave. Si usted no puede medirlo, no
puede controlarlo. Si no puede controlarlo, no puede gestionarlo.
Si no puede gestionarlo, no puede mejorarlo. La falta sistemática o ausencia estructural de estadísticas en
las organizaciones impide una administración científica de las mismas. Dirigir sólo en base a datos
financieros del pasado, realizar predicciones basadas más en la intuición o en simples extrapolaciones, y
tomar decisiones desconociendo las probabilidades de éxito u ocurrencia, son sólo algunos de los
problemas o inconvenientes más comunes hallados en las empresas.
Carecer de datos estadísticos en cuanto a lo que acontece tanto interna como externamente, impide decidir
sobre bases racionales, y adoptar las medidas preventivas y correctivas con el suficiente tiempo para evitar
daños, en muchos casos irreparables, para la organización.
Peter Drucker hace dos afirmaciones básicas. Primero, afirma que pocos factores son tan importantes para
la actuación de la organización como la medición. Segundo, lamenta el hecho de que la medición sea el
área más débil de la gestión en muchas empresas.
Prácticamente todos los autores de libros de gestión han lamentado que la medición sea crítica para el
éxito y que la mayoría de los directores no tengan habilidades cuantitativas adecuadas.
En otras épocas disponer de los datos y luego analizarlos resultaba una labor costosa y agotadora, pues
ella se basaba en la labor manual de los empleados. Pero hoy se cuenta con computadoras cada día más
veloces y económicas, al tiempo que se dispone de programas más potentes y flexibles, por lo cual las
empresas que utilicen dicho potencial obtendrán una fuerte diferencia competitiva en relación a sus
adversarios, pero más aún podrán mejorar continuamente la performance en los diversos ratios y
mediciones que hacen a los procesos y actividades de la empresa.
Las empresas que no hagan uso de estas nuevas potencialidades y afronten debidamente éstas nuevas
exigencias, no sólo perderán capacidad competitiva, sino que quedarán desacoplados ante los continuos
cambios del entorno, poniendo en serio riesgo su propia continuidad.
En otras épocas con lentos procesos de cambios, los cuales resultaban casi imperceptibles en el tiempo, se
podía administrar una empresa con pocos datos estadísticos. Hoy en un mundo de profundos y veloces
cambios en todos los órdenes ya no es posible actuar con displicencia. Hoy un empresario necesita
predecir a tiempo los niveles de demanda de sus productos, necesita reconocer a tiempo los cambios de
tendencia, debe no sólo saber en qué se gasto, sino como se gasto en el tiempo y en que conceptos.
Para negociar, para tomar decisiones, para corregir problemas de calidad, para aumentar la productividad,
para fijar precios, para mejorar el mantenimiento y disponibilidad de las máquinas e instalaciones, para
mejorar la concesión y cobranza de los créditos se requiere sí o sí contar con datos estadísticos.
Toda decisión, todo análisis, todo presupuesto, está prácticamente en el aire si no se cuenta con datos
estadísticos suficientes y fiables.
No sólo a nivel empresa, sino también a nivel país, los que más han avanzado han sido aquellos que
hicieron de las estadísticas una herramienta fundamental. W. Edwards Deming, un pionero en métodos
estadísticos para el control de calidad, señaló que en Japón se pone mucho énfasis en las estadísticas para
directores de empresa. En parte fue la aplicación de las técnicas estadísticas enseñadas por Deming lo que
hizo que Japón pasara de ser un fabricante de imitaciones baratas a líder internacional en productos de
primera calidad.
Sin estadísticas una empresa carece de capacidad para reconocer que actividades o productos le generan
utilidades, y cuales sólo pérdidas. No contar con datos e interpretarlos correctamente es para los
administradores como caminar en la oscuridad. Contar con los datos les ilumina, les permite ver lo que
está aconteciendo y en consecuencia tomar las medidas más apropiadas.
Un minuto para pensar.
Podrías responder a las siguientes preguntas:
 ¿Qué clientes les generan los mayores beneficios a las empresas?
 ¿Qué zonas o regiones geográficas son las que generan mayores ventas en unidades
monetarias y volúmenes? (en total y por producto)
 ¿Cuáles son las reparaciones que más se han producido en el último trimestre?
 ¿En qué día de trabajo de cada mes logra llegar al punto de equilibrio cierta empresa?
 ¿Qué tipo de reparaciones han generado mayores egresos?
 ¿Puedes decirme cuáles son la capacidad de los diferentes procesos en materia de costos,
productividad y calidad en una empresa?
 ¿Cuál es su nivel en sigma de cada una de las actividades?
 ¿Cuál es el nivel de rotación o permanencia de clientes?
 ¿Sabes en qué etapa del ciclo de vida se encuentra cada uno de sus productos o servicios?
 ¿Cuál es el nivel de satisfacción de los clientes?
 Si diriges un sanatorio ¿cuáles son las enfermedades que más clientes reportan? ¿Cuáles son
los problemas que más consultas originan?
 Si posees un restaurante ¿cuáles son los platos más pedidos durante el año y por temporada?
¿Cuáles son los vinos más pedidos y cuáles los más vendidos?
 Si diriges una librería ¿cuáles son los temas más vendidos? ¿Cuál es la rentabilidad que le
aporta cada tema? ¿Cómo contribuye cada tema a lograr el punto de equilibrio?
 Si diriges un hotel ¿cuál es el tiempo promedio de estadía? ¿La cantidad de clientes por zona
o región? ¿La cantidad de tiempo por región y su relación con la cantidad de tiempo de
estadía? ¿La facturación por profesión, zona, motivo de su visita (turismo, negocios, salud,
profesionales, capacitación, otros)?
Estás son sólo unas pocas preguntas de las cuales estoy seguro usted no podrá responder, o para hacerlo
deberá destinar de una gran cantidad de tiempo en personal, aparte de generar una información poco
confiable, costosa y fuera de tiempo.
Si no cuenta con estos datos, ¿cómo hace usted? para: adoptar a tiempo las medidas correctivas;
confeccionar un presupuesto viable y efectivo; administrar eficazmente su flujo de fondos; evitar los
excesos de stock y la obsolescencia de inventarios; gestionar la mejora de los diversos procesos; saber
cuando está mejorando la productividad; negociar un incremento de precios; detectar la causa de un
problema y solucionarlo.
En pocas palabras: ¿usted realmente sabe que está ocurriendo en su organización?
Para poder saber que pasa en su organización es necesario contar con datos en tiempo y forma,
sabiéndolos interpretar correctamente. Es aquí donde la estadística y los sistemas de información
convergen para posibilitar al directivo gestionar con mucha mayor eficiencia y eficacia su organización.
Para qué la estadística.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
14.
Las estadísticas son fundamentales a los efectos de gestionar y mejorar temas o actividades tales
como:
1.
El control de calidad.
El nivel de averías y sus frecuencias.
Los tiempos para cambios o preparación de herramientas.
Los niveles de productividad de distintos procesos, actividades y productos.
Los costos correspondientes a distintos tipos de conceptos y actividades.
La gestión de créditos y cobranzas.
El seguimiento del flujo de fondos.
Los niveles de satisfacción de los clientes y usuarios.
Los tipos de accidentes y sus frecuencias.
El análisis mediante diagramas de Pareto de defectos, costes, rentabilidades, ventas.
Ventas por clientes, vendedores, zonas y productos.
Predicciones de ventas por zonas, productos, servicios o sucursales.
13. Capacidad de los procesos en cuanto a generación de niveles de costes, calidad y productividad.
Tiempos totales de ciclos productivos.
15.
16.
17.
18.
19.
20.
22.
23.
25.
26.
28.
29.
30.
31.
32.
Tiempos de respuestas.
Gestión de inventarios.
Cumplimiento de aprovisionamiento por parte de los proveedores.
Predicción de ventas por canales de comercialización.
Proyectos de inversión.
Probabilidades para la construcción del “Árbol para la Toma de Decisiones”.
21. Evolución de los distintos ratios económicos – financieros y patrimoniales a lo largo del tiempo.
Estudios e investigación de mercado.
Tiempos de máquinas y personas por actividad.
24. Cantidad y representación porcentual de distintos problemas y sus efectos económicos en la
organización.
Tasa de polivalencia del personal.
Productos más demandados, a nivel global, por zona y por canal de comercialización.
27. Porcentajes de actividades generadoras de valor agregado para los clientes finales, de valor
agregado para la empresa y carentes de valor agregado.
Tiempos promedios, máximos y mínimos de reparaciones por tipo de averías.
Cálculos de costes y en especial para el Costeo Basado en Actividades.
Para los cálculos de productividades.
Coeficientes de correlación.
Estadística del personal (directivos y empleados).
¿Por qué aplicamos tan poco la estadística?
En parte por una cuestión cultural de parte de los empresarios, pero en mayor medida a la falta de
preparación de los profesionales, en materia estadística, sobre todo de aquellos que asesoran en cuanto a la
gestión de las empresas.
Lo antes descrito es menos frecuente en los países anglosajones, los cuales tienen una fuerte cultura e
inclinación por las estadísticas y las probabilidades. Otro tanto se da en Japón o Corea, países que dan a la
educación de las estadísticas y matemáticas una fuerte preponderancia en sus planes de estudios y luego
en la aplicación práctica.
Sin lugar a dudas la cuestión no es disponer de datos estadísticos, si los mismos no son debidamente
interpretados, o ni siquiera son tenidos en consideración. Por lo tanto es menester concientizar y formar a
los directivos y empleados acerca de la fundamental y trascendental importancia de la información
estadística a la hora de planificar, dirigir y controlar la marcha de la empresa.
Qué debemos hacer.
El primer paso como se expresara antes, es concientizar, para luego pasar a capacitar. El tercer paso
consiste en la implementación. Diagnosticar para saber qué datos necesita la organización es un paso
fundamental, pues a partir de allí se diseñarán los software más apropiados a las actividades, procesos y
requerimientos específicos de cada empresa.
Si bien la intuición nunca dejará de perder importancia, el tener el respaldo de datos confiables le
permitirá poder adoptar decisiones sobre una base más apropiada. Es esto lo que se da en llamar la Gestión
Moderna Basada en Estadísticas (GMBE).
Conclusiones
Si estamos en la oscuridad, mejor disponer de una vela aunque ésta sea pequeña, que atropellarnos todo en
la oscuridad.
Las modernas estadísticas acompañadas de las poderosas herramientas informáticas permiten a los
directivos, asesores y personal, contar con la suficiente información para mejorar a partir de ella los
procesos de la empresa, tomar mejores decisiones comerciales, mejorar la seguridad y hacer un uso mucho
más productivo y provechoso de los recursos.
Las estadísticas son fundamentales tanto para la administración financiera, como para la administración de
operaciones, las ventas, el marketing, las cobranzas, la logística y la gestión de personal entre otras áreas y
actividades de toda corporación.
Cada día se exige ser más productivos, eliminando sistemáticamente los despilfarros. Hacer ello posible
exige de información.
Pretender dirigir una empresa como hace cincuenta años ya no es válido ni posible. El empresario tiene en
sus manos la decisión de mejorar la empresa a través de una GMBE, o seguir conduciendo su empresa en
la oscuridad.
Bibliografía.



Estadística para negocios – Hanke – Editorial Irwin – 1995
Métodos de Pronósticos – Makridakis – Editorial Limusa – 1998
Informática para Gestores y Economistas – Casas Luengo / García – Editorial
Anaya - 2000
Extraído de: http://www.wikilearning.com/monografia/estadistica_aplicada_a_los_negociospara_que_la_b_estadistica_b/12550-3
Referencia.
http://www.wikilearning.com/monografia/estadistica_aplicada_a_los_negociosbibliografia/12550-7
Cuestionario.
1. ¿Qué es la estadística?
2. ¿Para qué es útil la estadística en las empresas?
3. ¿Por qué es importante realizar estudios estadísticos en las empresas?
4. Mencione las maneras de obtener datos o información para realizar un estudio estadístico.
5. ¿Cómo se relaciona la mercadotecnia con la estadística?
6. Defina la Investigación de mercados (IM)
7. ¿Cuál es el propósito de la IM?
8. Menciona las cuatro etapas de la evolución de la mercadotecnia.
9. ¿Cómo es considerada la estadística en la IM?
10. ¿Por qué es importante la estadística para la IM?
11. ¿Qué sugiere un diseño adecuado para la obtención de datos o información?
12. ¿Qué papel juega el muestreo en la IM?
13. ¿Por qué es importante realizar mediciones en una empresa?
14. ¿Cuál es la opinión de Peter Ducker (padre de la Administración), acerca de las
mediciones?
15. ¿Qué ventajas ofrece la tecnología para la realización de mediciones o estadísticas?
16. ¿Cómo pueden usar la estadística los empresarios actuales?
17. ¿Qué repercusiones puede haber en una empresa que carece de estadísticas o mediciones?
18. Menciona por lo menos 6 usos de la estadística en el sector empresarial.
19. ¿Por qué la aplicación de la estadística en las empresas mexicanas es casi nula?
20. ¿Qué debemos hacer para estimular el uso de la estadística en las empresas?
21. ¿Cuál es tu opinión personal acerca del uso de la estadística en la vida diaria?
22. ¿Cuál es tu opinión personal acerca del contenido de la lectura?
Conceptos Básicos.
Habitualmente el propósito de la Estadística Aplicada es el de sacar conclusiones de una población en
estudio, examinando solamente una parte de ella denominada muestra. Este proceso, denominado
Inferencia Estadística, suele venir precedido de otro, denominado Estadística Descriptiva, en el que los
datos son ordenados, resumidos y clasificados con objeto de tener una visión más precisa y conjunta de las
observaciones, intentando descubrir de esta manera posibles relaciones entre los datos, viendo cuales
toman valores parecidos, cuales difieren grandemente del resto, destacando hechos de posible interés, etc.
Al hablar de estadística descriptiva, uno se refiere a cualquier tratamiento de datos que esté diseñado para
resumir o describir algunas de sus características más importantes sin intentar deducir nada que escape al
alcance de los datos.
También está entre los objetivos de la Estadística Descriptiva el presentar los datos de tal modo que
permitan sugerir o aventurar cuestiones a analizar en mayor profundidad, así como estudiar si pueden
mantenerse algunas suposiciones necesarias en determinadas inferencias como la de simetría,, normalidad,
homocedasticidad, etc.
El propósito de este capítulo es el de dar conceptos y explicar técnicas que permitan realizar ambos
procesos, a los cuales de forma conjunto se les suele denominar Análisis de Datos.
1. Conceptos preliminares.
En esta sección se mencionan algunas definiciones importantes y se resalta la relación existente entre el
análisis estadístico y la deducción o inferencia estadística con el propósito de utilizar estos conceptos para
una buena toma de decisión en el manejo de una empresa.
1.1. Análisis estadístico.

Utilizar el término estadística es bastante común. Podemos escucharlo en la radio, la televisión o
leerlo en periódicos o revistas con bastante frecuencia. Con seguridad hemos leído frases como
“Las estadísticas nos muestran que el pueblo de México está a favor de la globalización en la
economía” o bien, las estadísticas nos muestran que “El nivel adquisitivo de los mexicanos ha
disminuido en los últimos 10 años al menos un 50%” y así en general podemos leer o escuchar
información semejante acerca de los deportes, población, espectáculos, etc.
Aunque estos ejemplos realmente forman parte del concepto total de “Estadística”, la palabra tiene un
sentido más amplio para aquellas personas cuyo trabajo requiere un conocimiento de los aspectos más
técnicos de la estadística. Para estas personas la palabra “Estadística” tiene relación con aquellos
conceptos y técnicas que se emplean en la recopilación, organización, presentación, análisis,
interpretación y comunicación de información numérica.
La estadística, surge de la necesidad que tiene los seres humanos de conocer y transformar la realidad. La
estadística, con sus métodos modernos, contribuye al análisis e interpretación de la realidad así como
también a la toma de decisiones para su transformación.
La aplicación de los métodos estadísticos los podemos clasificar en tres etapas:
a) Planeación de un proceso eficaz de búsqueda y registro de la información.
b) Organización, sistematización y resumen de la información para facilitar su manejo, presentación
y descripción.
c) Análisis de la información obtenida, verificación de hipótesis, obtención de conclusiones y toma
de decisiones.
En la planeación y diseño de búsqueda y recolección de la información, así como en la estimación de las
características de interés de la población a partir de la información contenida en una porción de esta, la
estadística aporta los métodos de muestreo, estimación y diseño de experimentos.
La estadística, según los métodos que aporta, se puede dividir en dos ramas a saber, la estadística
descriptiva y la inferencial.

Estadística descriptiva.- Es la parte de la estadística que proporciona los métodos que permiten
organizar, resumir, presentar y describir los resultados de las observaciones de la característica de
interés, contenida en una muestra, con el objeto de hacer estimaciones, por lo general puntuales,
sobre las características principales de la población (su distribución, media poblacional,
variabilidad, etc.)

Estadística inferencial. Es la parte de la estadística que proporciona los métodos que permiten la
estimación de los parámetros poblacionales, y corroborar hipótesis sobre uno o más parámetros
poblacionales, a partir de una o más muestras aleatorias extraídas de la población.
La estadística es una herramienta científica. Su valor depende de cómo se utilice como herramienta. Sin
embargo, la estadística es frecuentemente mal utilizada. Los siguientes son algunos de los malos usos
comunes de datos estadísticos:

Datos estadísticos inadecuados. Tales como cuando el tamaño de la muestra no es el adecuado o
bien, no es representativo de la población. Existen muchas otras clases de datos inadecuados. Por
ejemplo, algunos datos son respuestas inexactas de una encuesta, porque las preguntas usadas en
la misma son vagas o engañosas, algunos datos son toscas imitaciones porque no hay disponibles
datos exactos o es demasiado costosa su obtención, y algunos datos son irrelevantes en un
problema dado, porque el estudio estadístico no está bien planeado. y en algunas ocasiones los
datos son inventados por el encuestador al no encontrar personas que quieran responder a la
encuesta por larga o tendenciosa.

Un sesgo del usuario. Significa que un usuario de los datos perjudicialmente dé más énfasis a
ciertos hechos, los cuales son empleados para mantener su predeterminada posición u opinión.
Existen dos clases de sesgos; conscientes e inconscientes. Ambos son comunes en el análisis
estadístico. Hay numerosos ejemplos de sesgos conscientes. Por ejemplo un anuncio de
publicidad, frecuentemente utiliza estadística para probar que su producto es muy superior al
producto de su competidor. Un político usa la estadística como herramienta para querer mostrar la
preferencia a su candidatura, etc. Es casi imposible que un sesgo inconsciente esté completamente
ausente de un trabajo estadístico. En lo que respecta al ser humano, es difícil obtener una actitud
completamente objetiva al abordar un problema, aun cuando un científico debe tener una mente
abierta. Un estadístico debe estar enterado del hecho de que su interpretación de los resultados del
análisis estadístico está influenciado por su propia experiencia, conocimiento y antecedentes con
relación al problema dado.

Supuestos falsos. En el análisis estadístico frecuentemente se hacen supuestos. Un estadístico debe
ser extremadamente cuidadoso para evitar supuestos falsos. Supuestos falsos pueden ser hechos
por quien usa los datos, o bien quien: a) está tratando deliberadamente de confundir a los oyentes,
b) carece de conocimiento de métodos estadísticos o c) es simplemente descuidado. No es raro
que un anunciante proponga deliberadamente que no existe mercancía de primera clase fuera de
su producto o bien que no está enterado de ello. Una línea de tendencia no debería ser dibujada
para el propósito de pronosticar las ventas futuras si los datos estadísticos están limitados a un
corto período de tiempo, especialmente cuando se trata de un período de sólo tres meses.
Supuestos falsos hechos por descuidos son numerosos. Muchos experimentados hombres de
negocios, por ejemplo, saben que nuestra economía es dinámica y que el poder de compra del
dinero o el valor del dólar cambia año tras año. Sin embargo, frecuentemente cuando uno hace una
proyección para futuras transacciones, la persona hará un supuesto descuidado que el valor del
dólar y las condiciones económicas son de esperarse que sean exactamente las mismas en el
futuro.

Indicación falsa de relación. En el análisis de correlación, la relación de dos o más conjuntos de
datos estadísticos son analizados. Cuando los valores en un conjunto de datos están creciendo y
los valores correspondientes en otro conjunto, están también creciendo, matemáticamente
hablando, una correlación positiva entre los dos conjuntos de datos puede ser encontrada. Si la
conclusión está basada solamente en los resultados matemáticos puede llegar a una indicación
falsa de relación. Por ejemplo, un estadístico puede tener dos conjuntos de datos. Un conjunto
muestra la producción anual de vehículos de la planta Ford, y el otro indica el número de
accidentes anuales en un pequeño poblado. Ambas cifras se incrementaron si se tomó en un
mismo período casi a la misma tasa año con año. Si los dos conjuntos de datos son analizados
conjuntamente, los cálculos matemáticos indicarán que están estrechamente relacionados. Si una
conclusión se basa sólo en la indicación matemática, uno puede establecer que el incremento de
accidentes en carretera en ese pequeño poblado fue debido a que se incremento la producción de
los vehículos de la planta Ford durante el mismo período. El enunciado es obviamente falso. Un
resultado matemático sirve como una guía para quien tenga que hacer una conclusión; no es en sí
misma una conclusión.

Comparación impropia. Es la comparación entre dos cosas, las cuales no son realmente
comparables porque son básicamente diferentes. Por ejemplo, si comparamos los pesos de los
estudiantes de una universidad y los pesos de los estudiantes de una escuela primaria. Por
comparación, podemos encontrar que los pesos de los estudiantes universitarios son mayores que
los pesos de los alumnos de la escuela primaria. Si extraemos una conclusión basada en la
comparación que los estudiantes universitarios son "obesos" en comparación con los estudiantes
de primaria, podemos encontrar que la comparación carece de sentido.

Errores en operaciones matemáticas. El razonamiento estadístico basado en respuestas
equivocadas de operaciones matemáticas frecuentemente conduce a conclusiones falsas.
1.2. Clasificación de datos.
Para hablar de cómo se clasifican los datos estadísticamente, es necesario primero tener el concepto de
variable y los tipos en que éstas se dividen. La finalidad de las siguientes secciones es dar un panorama
general de los tipos de variables que existen y su forma de medición
1.2.1. Tipos de variables.

Variable. Es una característica de interés observable en cada elemento de una población o de una
muestra.

Dato. Es el valor que toma la variable.

Variable aleatoria. Es aquella variable cuyos resultados provienen de factores fortuitos o sea,
toma valores al azar.
Las variables se clasifican en cuantitativas y en cualitativas. Las variables cuantitativas pueden ser
continuas o discretas.

Variable continua. Es aquella que teóricamente puede tomar cualquier valor dentro de un
intervalo de valores. Es decir, una variable continua se mide uniformemente y puede tomar
valores fraccionarios. Ejemplos de variables continuas es la estatura humana, el tiempo realizado
en la fabricación de un artículo, la distancia recorrida por un automóvil en la entrega de un cierto
producto, la longitud de un trozo de madera, etc.

Variable discreta. Es aquella que solamente puede tomar una cantidad numerable de valores
distintos. Estos es, una variable discreta sólo puede tomar valores enteros y, entre un valor y otro
siempre existirá un vacío o interrupción. Ejemplos de este tipo de variables es, el número de
artículos fabricados por una empresa un día determinado, el número de pedidos tomados en una
pizzería de la localidad, el número de hijos en una familia, el número de alumnos de un aula etc.
Las variables cualitativas, tal como su nombre lo indica, son las que presentan una cierta cualidad. Por
ejemplo, al referirse a la cantidad fabricada de un cierto producto, puede ser que existan dos fabricantes y
se tiene que categorizar en el productor A y el productor B para poder mencionar su volumen anual de
producción. O bien, al referirse al sexo de una persona, se tienen dos cualidades o categorías, femenino y
masculino.
1.2.2. Escalas de medición.
La escala de medición es la característica de los objetos a manera de que cada dato sea una función simple
de las variables estudiadas. Las escalas de medición pueden ser clasificadas en "débiles" y "fuertes" según
sea la característica de cada una. Las ideas sobre las escalas de medida han tenido un tremendo impacto en
el pensamiento estadístico, sobre todo en lo que se refiere a los dominios propios de las técnicas
paramétricas y no paramétricas.
La medición debe permitir una objetividad absoluta; por ello el investigador debe enfocar críticamente
todas las variables y no tratar de imponer determinadas escalas sólo porque le sean de diseño familiar. A
cada categoría que se utilice para estudiar la variable se le puede asignar a un valor numérico. Las reglas
para hacerlo están determinadas por los niveles de medición.
Los niveles de medición posibles son: el nominal, el ordinal, el de intervalo y el de razón.

Escala nominal. Como el nombre lo indica, consiste en clasificar las observaciones con nombres
o categorías, las cuales deben ser mutuamente excluyentes. Es posible asignar números a las
distintas clases pero hay que tener presente que no existe una relación de orden entre ellos. Como
ejemplo de mediciones en esta escala es: el estado civil, nacionalidad, sexo de las personas,
material del envase que más le atrae al consumidor etc.
La única medida centralizadora posible es la moda. También se puede describir por conteos. Gráficamente
se representa con barras o gráficas sectoriales llamados diagramas de pastel.

Escala ordinal. En esta escala las observaciones, además de cumplir con las características de la
escala nominal, mantienen, de acuerdo a cierto criterio, una relación de orden. Son muy utilizadas
cuando manejamos información no cuantitativa. En esta escala las categorías están ordenadas y,
por lo tanto, no pueden intercambiarse porque el orden se rompería. Además, en ellas no pueden
faltar categorías intermedias porque se rompería el orden secuencial. Ejemplos que caen en esta
escala son: el nivel socioeconómico, tamaño del producto con mayor consumo, niveles en los
puestos de las empresas, etc.
Las medidas convenientes son la moda y la mediana. También son útiles los cuartiles, deciles y
percentiles. Las gráficas convenientes son las de barras y las sectoriales (de pastel).

Escala de intervalo. La escala de intervalo trabaja con valores numéricos, tiene todas las
características de una escala ordinal y en ella se conoce la distancia entre dos números
cualesquiera. Está caracterizada por una unidad de medida común y constante que asigna un
numero real a todos los elementos de un conjunto ordenado. En esta clase de medida, la
proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto
cero, por lo tanto, el punto cero y la unidad de medida son arbitrarios. El ejemplo clásico de esta
escala es la medición de temperaturas con las escalas Celsius y Fahrenheit. La unidad de medida y
el punto cero en ellas son arbitrarios y son diferentes en ambas escalas.

Escala de razón. Esta escala tiene todas las características de una escala de intervalo y además
tiene un punto cero real en su origen. La proporción de un punto a otro de la escala es
independiente de la unidad de medida. Su diferencia básica con la escala de razón es que el cero
no es arbitrario sino inherente al sistema. Por ese hecho podemos comparar significativamente dos
mediciones mediante su razón, y es decir, por ejemplo, que una persona con un peso de 120 kg.
tiene el doble de peso de una persona con un peso de 60 kg. Ejemplos para esta escala son: el
peso, edad, velocidad, etc.
1.3. Conceptos Fundamentales.
Toda rama de la investigación científica tiene su vocabulario propio y la estadística no es su excepción. En
esta sección se definirán algunos conceptos propios de la terminología de la Estadística Descriptiva.
1.3.1. Caracteres.
Cada uno de los individuos de la población en estudio posee uno o varios caracteres. Así por ejemplo, si la
población en consideración es la de los trabajadores de una determinada empresa de Hermosillo, Sonora,
éstos poseen una serie de caracteres, o si se quiere características, que permiten describirlo. Los
caracteres en este ejemplo puede ser "departamento en el que labora", "sueldo que gana", "sexo", "edad",
"estado civil", etc. Precisamente la observación de uno o más de esos caracteres en los individuos de la
muestra es lo que dará origen a los datos.
Los caracteres pueden ser de dos clases: cuantitativos, cuando son tales que su observación en un
individuo determinado proporciona un valor numérico como medida asociada, como ocurre por ejemplo
con los caracteres "edad" o "sueldo que gana", y cualitativos, cuando su observación en los individuos no
suministra un número, sino la pertenencia a una clase determinada, como por ejemplo el "sexo", o el
"departamento en el que labora".
1.3.2. Modalidades de los caracteres.
Consideremos un carácter cualquiera, como por ejemplo la "satisfacción del cliente". Este carácter, al ser
observado en un individuo (grado de satisfacción), puede presentar tres posibilidades, es decir, es posible
recibir tres respuestas diferentes: insatisfecho, satisfecho, muy satisfecho. Pues bien, a las posibilidades,
tipos o clases que pueden presentar los caracteres las denominaremos modalidades.
Las modalidades de un carácter deben ser a la vez incompatibles y exhaustivas. Es decir, las diversas
modalidades de un carácter deben cubrir todas las posibilidades que éste puede presentar y además deben
ser disjuntas, un individuo no puede presentar a la vez más de una de ellas y además debe presentar alguna
de ellas)
Así, al estudiar algún carácter, como por ejemplo el " servicio al cliente", el investigador deberá
considerar todas las posibles modalidades del carácter (todas las posibles respuestas; excelente, bueno,
regular, malo, pésimo.), con el objetivo de poder clasificar a todos los individuos que observe.
1.3.3. La matriz de datos.
Habitualmente, la información primaria sobre los individuos, es decir, la forma más elemental en la que se
expresan los datos es la de una matriz, en la que aparecen en la primera columna los individuos
identificados de alguna manera y en las siguientes columnas las observaciones de los diferentes caracteres
en estudio para cada uno de los individuos, tal y como aparece en la tabla 1.1. Dicha matriz recibe el
nombre de matriz de datos.
carácter 1 carácter 2 . . . carácter m
individuo 1
*
*
...
*
individuo 2
*
*
...
*
...
...
...
...
...
individuo n
*
*
...
*
Tabla 1.1. Matriz de Datos
Por ejemplo, los datos correspondientes a una investigación llevada a cabo para el estudio de los
trabajadores de una empresa galletera de Cd. Obregón, Sonora, produjeron como resultado la matriz de
datos, en donde se recopilaron las observaciones de los caracteres "edad", "sexo", "estatura",
"peso",antigüedad, escolaridad y "estado civil" en los 100 individuos seleccionados en la muestra.
Estatura Peso Antigüedad Escolaridad Estado
Mts.
Kg.
(años)
civil
Edad
Sexo
individuo 1
32
masculino
1.76
80
4
secundaria
individuo 2
29
femenino
1.66
58
2
bachillerato soltera
...
...
...
...
...
...
...
...
individuo 100
61
masculino
1.78
90
15
primaria
viudo
casado
Tabla 1.2. Estudio de 100 obreros en una empresa galletera de Cd. Obregón, Son.
En algunas ocasiones se reserva el nombre de matriz de datos a la obtenida de la anterior eliminando la
primera columna.
1.3.4. Clases de datos.
Es habitual denominar a los caracteres variables estadísticas o simplemente variables, calificándolas de
cualitativas o cuantitativas según sea el correspondiente carácter, y hablar de los valores de la variable al
referirnos a sus modalidades, aunque de hecho solamente tendremos verdaderos valores numéricos cuando
analicemos variables cuantitativas.
En ocasiones, con objeto de facilitar la toma de los datos, el investigador los agrupa en intervalos. Así por
ejemplo, resulta más sencillo averiguar cuántos individuos hay en una muestra con una estatura, por
ejemplo, entre 1.70 y 1.80 metros que medirlos a todos, en especial si tenemos marcas en la pared cada 10
cm.
Obsérvese que siempre se producirá una pérdida de información al agrupar los datos en intervalos y, dado
que hoy en día la utilización del ordenador suele ser de uso corriente, un agrupamiento en intervalos es en
general no aconsejable.
Sin embargo, por razones docentes admitiremos esta posibilidad, ya que precisamente el agrupamiento en
intervalos traerá complicaciones adicionales en el cálculo de algunas medidas representativas de los datos.
Consideraremos, por tanto, tres tipos posibles de datos:
1. Datos correspondientes a un carácter cualitativo
2. Datos sin agrupar correspondientes a un carácter cuantitativo
3. Datos agrupados en intervalos correspondientes a un carácter cuantitativo
2. Análisis de estudios estadísticos.
a) Identificación de las etapas de un estudio estadístico.
1) Planteamiento del problema: definir objetivo de la investigación y precisar el universo o
población de la misma y planear los métodos por los que se recogerán los datos.
2) Relevamiento de la información, mediante técnicas que permitan luego aplicar criterios para
codificar esos datos.
3) Presentación de los datos: los cuales deben expresarse de forma que su lectura sea sencilla.
Existen 3 formas de presentación: con palabras –para pocos datos-, mediante tablas estadísticas y
mediante gráficos estadísticos.
4) Inferencia estadística: en los casos en los que se trabaja con muestras.
5) Interpretación: explicar el sentido de todos los datos obtenidos.
b) Diferencia entre estadística descriptiva e inferencia estadística, en estudios
ya realizados.
La Estadística se divide en dos ramas:
1) Estadística descriptiva. Se ocupa de los métodos de recolección, descripción, visualización y
resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser
resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son: la media y
la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.

Ejemplos de este tipo de análisis descriptivo pueden encontrarse en la prensa diaria, en la parte de
información económico-social: series de tiempo, gráfica de barras, diagramas circulares, índices
de precios, resultados de una encuesta y más elaborado, para más de una variable, en pirámide de
edades, comparativas, etc. También puede encontrarse el uso de la estadística descriptiva en
tablas de consumo, resultados deportivos, Accidentes laborales, Ventas anuales realizadas y, en
general, hechos cuantificados en valores absolutos (tal cual), porcentajes (%) o índices (con un
periodo base inicial = 100).
2) Inferencia estadística. Se encarga de la generación de los modelos, inferencias y
predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e
incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la población de estudio. Los gobiernos y las organizaciones utilizan estos
modelos para tomar decisiones que afectan directamente nuestras vidas.
Ahora, veamos dos ejemplos que nos aclaren estos dos tipos de Estadística:
EJEMPLO 1: Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las
elecciones generales, es muy frecuente que los medios de comunicación, nos adelanten los
resultados de encuestas o sondeos en los que se nos indica el resultado final de dichas elecciones
con una precisión específica y con un error determinado. Estos sondeos son realizados por
distintas técnicas sobre un grupo (muestra) más o menos numeroso de personas. Naturalmente,
cuanto mayor sea el número de mexicanos encuestados con derecho al voto, mayor será la
fiabilidad de la encuesta, pero también mayor será el costo del sondeo. El estudio de esta muestra
se haría mediante estadística descriptiva, pero lo que nos interesa no es el resultado de este
estudio reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de
la muestra a toda la población, se hace mediante técnicas de la Inferencia estadística. La elección
de la muestra debe hacerse mediante métodos de muestreo para que el estudio resulte lo más
fiable posible.
Ejemplo 2. Supongamos que estamos en un instituto con un número muy elevado de
alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio estadístico sobre su altura.
Un método sería pasar clase por clase y medirlos a todos, esto nos podría llevar un tiempo
considerable pero sería la forma más exacta de hacer dicho estudio, aunque es fácil encontrarnos
con ausencias y tendríamos que volver varios días y pasar lista para conseguir la estatura de todo
el alumnado. Una vez que tengamos todos los datos en nuestro poder los resultados los
obtendríamos mediante Estadística descriptiva.
Otra posibilidad podría ser pasar clase por clase, y decirle a los alumnos y alumnas que anoten su
estatura en un papel y recogerlos todos. También así tendríamos un estudio de Estadística
descriptiva, aunque seguramente menos fiable que con el método anterior, pues casi con toda
seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a cálculo y otros, con
ganas de bromas, muy por encima o muy por debajo de la realidad.
Y otra posibilidad sería escoger una muestra, es decir un grupo de por ejemplo 50 personas, hacer
el estudio descriptivo sobre ellas y después generalizarlo a todo el instituto con Estadística de
inferencia. En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más
trabajo tendremos, pero más fiable será el resultado final y por otra, que la elección de la muestra
debe hacerse de manera que permita también fiarnos del resultado obtenido.
Preguntas:
1. Si estamos en segundo de bachillerato, ¿podríamos tomar como muestra los 50 alumnos
de este curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre?
2. En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más fiables?
Ejercicios:
Con tus propias palabras,
1. Describe las etapas de un estudio estadístico.
2. Explica la diferencia existente entre la estadística descriptiva y la estadística de
Inferencia.
Lectura recomendada
www.eduardobuesa.es/Tema11.pdf
Referencias:
http://descartes.cnice.mec.es/materiales_didacticos/unidimensional_lbarrios/definicion_est.htm
http://es.wikipedia.org/wiki/Estad%C3%ADstica_descriptiva
3. ejemplos del uso indebido de la estadística.
3.1. Usos y abusos de la Estadística.
En la estadística, pueden hacerse las aplicaciones a casi cualquier agregado de observaciones o
mediciones. Por esta razón, es muy útil en los negocios, en la economía, sociología, biología, psicología,
educación, física, química, agricultura y campos similares.
Todos los campos de la estadística tratan el mismo problema básico, que es el problema de la toma de
decisiones ante la incertidumbre. Todas las reglas de decisiones deben evaluarse por sus consecuencias.
Estas consecuencias se pueden expresar en términos de riesgo o, más intrínsecamente, en términos de las
probabilidades de tomar cualquiera de las acciones posibles que son inducidas por el experimento, las
reglas de decisión, y los posibles estados del sistema. En resumen no es en los hechos visibles, sino más
bien en las decisiones derivadas de las observaciones, en las que debiera ponerse el énfasis principal de las
observaciones estadísticas elementales.
Hoy en día, la dirección, en todos sus niveles, se guía generalmente por los datos obtenidos mediante
el análisis de registros, más que por conocimientos obtenidos meramente de la observación personal y la
experiencia. Por medio de la aplicación de métodos estadísticos apropiados se puede medir el rendimiento
diario, estudiar las relaciones significativas, analizar las experiencias pasadas y prever las tendencias
futuras probables.
El uso de métodos estadísticos y la realización del trabajo analítico que es fundamentalmente de
carácter estadístico – ya sea que se le dé o no el nombre distintivo de estadística – ocupa un lugar
conspicuo en el trabajo de todos los departamentos de una compañía.
El verdadero significado de los hechos se puede distorsionar fácilmente. Por lo tanto, el investigador
estadístico debe estar alerta para evitar malas interpretaciones de los datos y detectar usos erróneos de las
estadísticas. Es esencial mantener una actitud crítica.
Hay muchas personas que por carencia de sentido crítico de carácter estadístico, se impresionan muy
fácilmente por coincidencias sorprendentes que a la luz de la teoría de la probabilidad y de la estadística
nada tienen de sorprendentes.
Enseguida mencionamos algunos ejemplos del uso impropio de datos (el gran arte de “mentir” con
estadísticas) que habrán de alertar sobre ciertos errores comunes.

Las estadísticas muestran que casi todos los accidentes de circulación se producen entre vehículos
que ruedan a velocidad moderada. Muy pocos ocurren a más de 150 km/h. ¿Significa esto que
resulta más seguro conducir a gran velocidad? No, de ninguna manera. Con frecuencia, las
correlaciones estadísticas no reflejan causas y efectos. Casi todo el mundo circula a velocidad
moderada, y como es natural, la mayoría de los accidentes se producen a estas velocidades.

Si las estadísticas mostrasen que la mortalidad por tuberculosis es mayor en Segovia que en las
demás provincias, ¿significaría esto que el clima segoviano favorece el contagio tuberculoso?
Todo lo contrario. El clima segoviano es tan beneficioso para los tuberculosos que muchos acuden
allí para restablecerse. Naturalmente, ésta es la causa de que aumenten allí los fallecimientos
provocados por el mal.
Referencias.


http://books.google.com.mx/books?id=w2bWNWaWCZUC&pg=PA10&lpg=PA10&dq=%22usos+y+abus
os+de+la+estad%C3%ADstica%22&source=bl&ots=uAZtyfl63p&sig=3b6JD6S8Ik3VLZXCWTfwFckZw
Uo&hl=es&ei=4uSNSr7kLYKkswPJ25nkCQ&sa=X&oi=book_result&ct=result&resnum=6#v=onepage&q
=%22usos%20y%20abusos%20de%20la%20estad%C3%ADstica%22&f=false
http://books.google.com.mx/books?id=qEeK5IZR6IsC&pg=PA94&lpg=PA94&dq=El+arte+del+enga%C3
%B1o+estad%C3%ADstico&source=bl&ots=QCcz9EdoMR&sig=sOkK97HjS2aOeTlPRlb8Ozdgtw&hl=es&ei=ko2OSrPDIorgtgOWtqWECw&sa=X&oi=book_result&ct=result&resnum=4#v=onepage
&q=&f=false
Trabajo de investigación por equipos.
1. Realizar un resumen de cada una de las lecturas mencionadas abajo, y
2. Redactar un ensayo titulado "usos y abusos de la Estadística" que retome la información de la
lectura realizada.
 Leer la sección del libro de
Chao, Lincoln L. (1995), "Usos y abusos de la estadística", en Introducción a la estadística, México,
CECSA, pp. 24-28.
 Leer la sección de libro de
Johnson, Robert y Patricia Kuby (1999), "El arte del engaño estadístico", en Estadística elemental.
Lo esencial, España, Internacional Thomson Editores, pp. 85-90.
 Leer la sección: 5.2. Cómo mentir con estadísticas (pp. 186-194) del libro:
Arias G., F. (comp). Lecturas para el Uso de Metodología de la Investigación. Capítulo 5
"Procesamiento de datos". Editorial Trillas. México.
 Leer la sección: XXII.8. Precauciones relativas al uso de la estadística (pp. 514-516) del libro:
Kline, M. Matemáticas para Estudiantes de Humanidades. Capítulo XXII "Métodos estadísticos en
las ciencias sociales y las biológicas" y capítulo XXIII "La teoría de las probabilidades". Fondo de
Cultura Económica. México.
 Leer la sección 2.5 “El arte del engaño estadístico” (pp.65-70) del libro
Johnson, R. Estadística Elemental. Editorial Trillas. México.
 Leer el tema 3 ¿Cómo se miente con estadística? (pp.24-29) del libro
Alatorre F., S., et.al. Introducción a los Métodos Estadísticos. Universidad Pedagógica Nacional.
México. (3 volúmenes. Sistema de Educación a Distancia.)
 Leer el tema 2-7 “Uso y abuso de gráficas” (pp.73-81) de libro
Wonnacott, Thomas H. y Ronald J. Wonnacott (1998) Introducción a la estadística. Limusa/IPN.
México. (Colección "Textos Politécnicos", serie Matemáticas.)
Lectura recomendada.


José Jimeno Agius. Usos y abusos de la Estadística. Universitat de València. 1999.
Triola, Mario F. Probabilidad y Estadistica. 9ed. – Pearson; México, 2004.
Artículos recomendados.
Mentiras, pecados y abusos estadísticos.
http://www.dmae.upm.es/WebpersonalBartolo/articulosdivulgacion/estadistica.html
Uso y abuso de los datos estadísticos.
http://www.formapyme.com/reportajes/55/10/540/Politica-y-Gobierno/Uso-y-abuso-de-los-datosestadisticos-.html
4. Nociones básicas sobre muestreo.
Introducción al Muestreo
5.1. Introducción.
El propósito de un estudio estadístico suele ser, extraer conclusiones acerca de la naturaleza de una población. Al ser
la población grande y no poder ser estudiada en su integridad en la mayoría de los casos, las conclusiones obtenidas
deben basarse en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la justificación,
necesidad y definición de las diferentes técnicas de muestreo mejor conocidas como diseños de experimentos.
Los primeros términos obligados a los que se debe hacer referencia, definidos en el primer capítulo, serán los de
estadístico o estimador y parámetro. Dentro de este contexto, será necesario asumir un estadístico o estimador como
una variable aleatoria con una determinada distribución, y que será la pieza clave en las dos amplias categorías de la
inferencia estadística: la estimación y el contraste de hipótesis.
El concepto de estimador, como herramienta fundamental, lo caracterizamos mediante una serie de propiedades que
nos servirán para elegir el “mejor” para un determinado parámetro de una población, así como algunos métodos para
la obtención de ellos, tanto en la estimación puntual como por intervalos.
¿Cómo deducir la ley de probabilidad sobre determinado carácter de una población cuando sólo conocemos una
muestra?
Este es un problema al que nos enfrentamos cuando, por ejemplo, tratamos de estudiar la relación entre las visitas
realizadas de un individuo a un negocio determinado, y el monto de las compras realizadas por éste e intentamos
extender las conclusiones obtenidas sobre una muestra, al resto de individuos de la población.
La tarea fundamental de la estadística inferencial, es hacer deducciones acerca de la población a partir de una
muestra extraída de la misma.
5.2. Técnicas de muestreo sobre una población.
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter
en dicha población y las distribuciones de dicho carácter en todas sus muestras.
Las ventajas de estudiar una población a partir de sus muestras son principalmente:
Costo reducido: Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de
la población, los gastos de recopilación y tratamiento de los datos serán menores. Por ejemplo, cuando se
realizan encuestas previas respecto a la preferencia de un cierto producto, es más barato preguntar a 4 mil
personas su gusto, que a 30 millones de personas;
Mayor rapidez: últimamente, Estamos acostumbrados a ver cómo con los resultados del escrutinio de las
primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas
elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más posibilidades: Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de
bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada
que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.
De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas:


Elección de la muestra (muestreo), que es a lo que nos dedicaremos en este capítulo.
Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).
En la investigación científica, es habitual que se empleen muestras como medio de acercarse al conocimiento de la
realidad. Sin embargo, para que esto sea posible, para que a través de las muestras sea posible reproducir el universo
con la precisión que se requiera en cada caso es necesario que el diseño muestral se atenga a los principios recogidos
en las técnicas de muestreo. Antes de pasar a describir algunos de los métodos de muestreo más habituales,
introduzcamos algunos conceptos importantes en este contexto:
Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que gozan
todos los elementos que lo componen, y sólo ellos. En muestreo se entiende por población a la totalidad del universo
que interesa considerar, y que es necesario que esté bien definido para que se sepa en todo momento que elementos
lo componen.
No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre población teórica u objetivo: conjunto
de elementos a los cuales se quiere extrapolar los resultados, y población estudiada: conjunto de elementos
accesibles en nuestro estudio. Lo que se desea es que la población objetivo y la población estudiada sean iguales.
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población, realizándose lo
que se denomina un censo, es decir, el estudio de todos los elementos que componen la población. La realización de
un censo no siempre es posible, por diferentes motivos: a) economía: el estudio de todos los elementos que
componen una población, sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero, esfuerzo,
etc; b) que las pruebas a las que hay que someter a los sujetos sean destructivas; c) que la población sea infinita o tan
grande que exceda las posibilidades del investigador.
Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no sobre la población teórica,
entonces el proceso recibe el nombre de marco o espacio muestral.
Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con
una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y
por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las
características de la misma. Cuando decimos que una muestra es representativa indicamos que reúne
aproximadamente las características de la población que son importantes para la investigación.
Ejemplo 5.1. supongamos que deseamos medir el grado de preferencia de los habitantes de Hermosillo, hacia los
restaurantes locales, pero por problemas económicos sólo es posible acceder a los consumidores de ciertas colonias
de Hermosillo
- ¿A quién deseo generalizar los resultados? : Todos los habitantes de Hermosillo (población teórica).
- ¿A quien puedo acceder en el estudio? : Todos los habitantes en las colonias visitadas (población
estudiada).
-¿Cómo puedo acceder a ellos? : Numerando los sujetos accesibles (espacio o marco muestral).
-¿Quién forma parte del estudio? : Un grupo elegido de los sujetos enumerados (muestra).
5.3. Tipos de muestreo.
Algunos autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir,
aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una
muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.
Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:


Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u ordenador, etc) se eligen tantos
sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo
por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy
grande.
Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número
aleatorio i , que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan
los lugares i , i  k , i  2k ,
i  3k , , i  n  1k , es decir, se toman los individuos de k en k,
N
. El número
n
i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo de este tipo de
muestreo, está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de
la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la
población. Por ejemplo, imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio
sistemático con k = 10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una
representación de los dos sexos.
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que
simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en
considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el
estado civil, etc). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades,...). La
distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de
diferentes tipos:
siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k 

Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada
estrato.
Afijación Optima: Se
tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la
desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.
Ejemplo 5.2. Suponga que la administración de una empresa sonorense, está interesada en estudiar el grado de
aceptación de un nuevo plan de pensiones propuesto por la compañía. Para tal efecto selecciona una muestra de 600
trabajadores. Se sabe por los datos de la administración que de los 10,000 trabajadores de la firma, 6,000 trabajan en
el área de producción, 3,000 en el área de mantenimiento y 1,000 en el área administrativa. Como la administración
está interesada en que en la muestra estén representados todos los tipos de trabajadores, debe realizarse un muestreo
estratificado empleando como variable de estratificación el área de trabajo.
Si empleamos una afijación simple, elegiríamos 200 trabajadores de cada área, pero en este caso parece más
razonable utilizar una afijación proporcional pues, hay bastante diferencia en el tamaño de los estratos. Por
consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para poder
reflejarlo en la muestra.
Area de producción :
6 000
 0.60
10 000
Area de Mantenimiento:
Area administrativa:
3 000
 0.30
10 000
1 000
 0.10
10 000
Para conocer el tamaño de cada estrato en la muestra, no tenemos más que multiplicar esa proporción por el tamaño
muestral.
Area de producción : 0.60600  360 trabajadores
Area de Mantenimiento: 0.30600  180trabajadores
Area administrativa:

0.10600  60 empleados
Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora, están pensados para
seleccionar directamente los elementos de la población, es decir, que las unidades muestrales son los
elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc, son conglomerados naturales. En otras
ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando
los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por
conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario
para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a
los conglomerados elegidos.
Ejemplo 5.3. En una investigación en la que se trata de conocer el grado de satisfacción laboral de los profesores de
la Universidad de Sonora, se requiere de una muestra de 700 maestros. Ante la dificultad de acceder individualmente
a estos instructores, se decide hacer una muestra por conglomerados. Sabiendo que el número de profesores por
carrera es en promedio de 35, los pasos a seguir serían los siguientes:
1. Recoger un listado de todas las carreras.
2. Asignar un número a cada una de ellas.
 700

 20 que nos proporcionarán los
3. Elegir por muestreo aleatorio simple o sistemático las 20 carreras 
 35

700 profesores que necesitamos.
Dado lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos, es muy común
emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas
etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
En algunas ocasiones, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se
acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no
se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.

Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la
base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas
"cuotas" que consisten en un número de individuos que reúnen determinadas características, por ejemplo:
20 individuos de 25 a 40 años, de sexo femenino y residentes en Cd. Obregón Una vez determinada la cuota
se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en
las encuestas de opinión.
Ejemplo 5.4. La Administración del Centro Tutelar de Menores de Hermosillo, desea estudiar la incidencia de las
drogas en la adolescencia. Lo que se debe hacer es: conocer por los informes de la Coordinación Estatal de Centros
Tutelares de Menores, cuales son los centros más afectados por el problema, fijar un número de sujetos a entrevistar
proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de
campo a que sujetos concretos se deberá entrevistar.



Muestreo opinático o intencional: Este tipo de muestreo, se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas", mediante la inclusión en la muestra de grupos supuestamente típicos. Es
muy frecuente su utilización en sondeos preelectorales de zonas que, en anteriores votaciones han marcado
tendencias de voto.
Muestreo casual o incidental: Se trata de un proceso en el que el investigador, selecciona directa e
intencionadamente los individuos de la población. El caso más frecuente de este procedimiento, es utilizar
como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con
mucha frecuencia a sus propios alumnos). Un caso particular, es el de los voluntarios.
Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y éstos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
5.4. Muestreo aleatorio.
Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal
que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra,
denominamos al proceso de selección muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:


Sin reposición de los elementos;
Con reposición de los elementos.
5.4.1. Muestreo aleatorio sin reposición.
Consideremos una población E formada por N elementos. Si observamos un elemento particular, e E , en un
muestreo aleatorio sin reposición se da la siguiente circunstancia:
La probabilidad de que e sea elegido en primer lugar es
1
;
N

Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de
1
.
N 1
En el ( i + 1)-ésimo intento, la población consta de N  i 
N 1
), la probabilidad de que
N
sea elegido en el segundo intento es de

elementos, con lo cual si e no ha sido
seleccionado previamente, la probabilidad de que lo sea en este momento es de
1
.
N i
Si consideramos una muestra de n  N elementos, donde el orden en la elección de los mismos tiene importancia, la
probabilidad de elección de una muestra M  e1 , e 2 ,  , e n  cualquiera es
PM   Pe1 , e 2 ,  , e n 
 Pe1  Pe 2 / e1  Pe n / e1 , e 2 ,  e n 1 


1
1
1


N N  1 N  n  1
N  n!
N!
Si el orden no interviene, la probabilidad de que una muestra M  e1 , e2 ,  , e n   E sea elegida, es la suma de las
probabilidades de elegir cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos
sea posible, es decir,
PM   Pe1 , e 2 ,  , e n 
 n!Pe1 , e 2 ,  , e n 

n! N  n !
N!
5.4.2. Muestreo aleatorio con reposición.
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el
elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si
el orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n
elementos es:
1 1
1
1
  
N N N Nn
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas
veces como manera de combinar sus elementos sea posible. Es decir,


Sea n1 el número de veces que se repite cierto elemento e1 en la muestra;
Sea n2 el número de veces que se repite cierto elemento e2;
...

Sea nk el número de veces que se repite cierto elemento ek,
de modo que n  n1  n 2    n k . Entonces la probabilidad de obtener la muestra
 n1  nk
n


e1,  e1 , e 2,  e 2 ,  , e k ,  e k ,


 



n1
n2
nk
es
ad de una  permutaciones de   permutaciones de   permutaciones de 
 P robabilid




 
 muestra cualquiera  las k modalidades   las n1 observaciones   las n k observaciones


  observadas  
 
ordenada
e1
ek



 

es decir,
1
Nn
 k!n1!  nk !
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos
mencionado se caracteriza por que:


Cada elemento de la población tiene la misma probabilidad de ser elegido.
Las observaciones se realizan con reemplazo. De este modo, cada observación es realizada sobre la misma
población (no disminuye con las extracciones sucesivas).
Sea X una variable aleatoria definida sobre la población E, y f(x) su ley de probabilidad entonces
e1  x1 , f1 x1   f x1 

e  x 2 , f 2 x 2   f x 2 / x1 
E  n experimentos aleatorios  2


e n  x n , f n x n   f x n / x1 , x 2 ,  x n 1 
En una muestra aleatoria simple, cada observación tiene la distribución de probabilidad de la población:
f1  f 2    f n  f
Además todas las observaciones de la variable aleatoria son independientes, es decir
f x1 , x 2 ,  , x n   f x1   f x 2   f x n 
Estas dos últimas relaciones caracterizan a las muestras aleatorias simples.
La selección de una muestra aleatoria puede realizarse con la ayuda de los siguientes métodos:
5.4.3 Tablas de números aleatorios: Lotería Nacional.
Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo
largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección
es independiente de las demás extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de k = 5 cifras
(00000-99,999), una población de N = 600 individuos, y deseamos extraer una muestra de n = 6 de ellos. En este
caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada uno de sus elementos le
corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando
en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la
población:
 t  600 
tN 
1   k   1  

 10 
 100,000 
El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10
individuos. Las cantidades
u
t
10k
pueden ser consideradas como observaciones de una variable aleatoria U, que sigue una distribución uniforme en el
intervalo [0,1]. Así,
U  U 0, 1
5.4.4 Método de Montecarlo.
El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una variable aleatoria X, de la
que conocemos su ley de probabilidad (a partir de su función de distribución F.) Con este método, el modo de elegir
aleatoriamente un valor de X utilizando su ley de probabilidad es:
1.
Usando una tabla de números aleatorios, se toma un valor u de una variable aleatoria U  U 0, 1 .
2.
Si X es continua tomar como observación de X, la cantidad x  F 1 u . En el caso en que X sea discreta se
toma x como el percentil 100 u de X, es decir el valor más pequeño que verifica que F x   u .
Este proceso se repite n veces para obtener una muestra de tamaño n.
Ejemplo 5.5. Si se desea extraer n =10 muestras de una distribución N 0, 1 , podemos recurrir a una tabla de
números aleatorios de k = 5 cifras en las que, por ejemplo, observamos las cantidades:
t  76 293, 31 776, 50 803, 71 153, 20, 271, 33 177, 17 979, 52 125 , 41 330, 95 141
A partir de ellas, podemos obtener una muestra de X  N 0, 1 usando una tabla de la distribución normal:
Números aleatorios Muestra U 0, 1 Muestra N 0, 1
ui 
ti
ti
105
xi  F 1 u i .
76 293
0.76
0.71
31 776
0.32(=1-0.68)
-0.47
50 803
0.51
0.03
71 153
0.71
0.55
20 271
0.20(=1-0.80)
-0.84
33 717
0.34(=1-0.66)
-0.41
17 979
0.18(=1-0.82)
-0.92
52 125
0.52
0.05
41 330
0.41(=1-0.59)
-0.23
95 141
0.95
1.65
Tabla 1.
Obsérvese que como era de esperarse, las observaciones xi tienden a agruparse alrededor de la esperanza matemática
de X t  N   0,  2  1 . Por otra parte, esto no implica que el valor medio de la muestra sea necesariamente


x  0 . Sin embargo como sabemos por el teorema de Fisher que:
10
X
X
i 1
i

 N  x  0,  x2  101

su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor medio x estará
muy próximo a 0, como se puede calcular:
x
1
 0.71   1.65  0.012
10
Obsérvese que si el problema fuera el inverso, donde únicamente se conocieran las observaciones xi y que el
mecanismo que generó esos datos hubiese sido una distribución normal de parámetros desconocidos, con x obtenida
hubiésemos tenido una buena aproximación del ``parámetro desconocido''  . Sobre esta cuestión se volverá más
adelante cuando se aborde el problema de la estimación puntual de parámetros.
5.4.5. Muestreo aleatorio estratificado.
Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos, en k subpoblaciones
o estratos, atendiendo a criterios que puedan ser importantes en el estudio, de tamaños respectivos N1 , N 2 ,  , N k
donde,
N  N1  N 2    N k
y realizando en cada una de estas subpoblaciones muestreos aleatorios simples de tamaño ni con i  1,  , k donde
n  n1  n2    nk es el tamaño total de la muestra.
Ahora, nos planteamos el problema de cuántos elementos de muestra se han de elegir de cada uno de los estratos.
Para ello tenemos fundamentalmente dos técnicas: la asignación proporcional y la asignación óptima.
Ejemplo 5.6. Supongamos que realizamos un estudio sobre la población de estudiantes de la Universidad de
Sonora, en el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de barras de
labios.
En primera aproximación lo que procede es hacer un muestreo aleatorio simple, pero en su lugar podemos
reflexionar sobre el hecho de que el comportamiento de la población con respecto a este carácter no es homogéneo, y
atendiendo a él, podemos dividir a la población en dos estratos:


Estudiantes masculinos (60% del total);
Estudiantes femeninos (40% restante).
de modo que se repartan proporcionalmente ambos grupos el número total de muestras, en función de sus respectivos
tamaños (6 varones y 4 mujeres). Esto es lo que se denomina asignación proporcional.
Si observamos con más atención, nos encontramos (salvo sorpresas de probabilidad reducida) que el comportamiento
de los varones con respecto al carácter que se estudia es muy homogéneo y diferenciado del grupo de las mujeres.
Por otra parte, con toda seguridad la precisión sobre el carácter que estudiamos, será muy alta en el grupo de los
varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que en el grupo de las mujeres habrá
mayor dispersión. Cuando las varianzas poblacionales son pequeñas, con pocos elementos de una muestra se obtiene
una información más precisa del total de la población que cuando la varianza es grande. Por tanto, si nuestros medios
sólo nos permiten tomar una muestra de 10 alumnos, será más conveniente dividir la muestra en dos estratos, y tomar
mediante muestreo aleatorio simple cierto número de individuos de cada estrato, de modo que se elegirán más
individuos en los grupos de mayor variabilidad. Así probablemente obtendríamos mejores resultados estudiando una
muestra de


1 varón.
9 hembras.
Esto es lo que se denomina asignación óptima.
5.4.5.1. Asignación proporcional.
Sea n el número de individuos de la población total que forman parte de alguna muestra:
n  n1  n 2    n k
Cuando la asignación es proporcional el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato
correspondiente con respecto a la población total:
ni  n 
Ni
N
5.4.5.2. Asignación óptima.
Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos, ni, los elige quién
hace el muestreo, y para ello puede basarse en alguno de los siguientes criterios:


Elegir los ni de tal modo que se minimice la varianza del estimador, para un costo especificado, o bien,
Habiendo fijado la varianza que podemos admitir para el estimador, minimizar el costo en la obtención de
las muestras.
Así en un estrato dado, se tiende a tomar una muestra más grande cuando:



El estrato es más grande;
El estrato posee mayor variabilidad interna (varianza);
El muestreo es más barato en ese estrato.
Para ajustar el tamaño de los estratos cuando conocemos la dispersión interna de cada uno de los mismos, tenemos el
siguiente resultado:
Teorema 5.1[Asignación de Neyman] Sea E una población con N elementos, dividida en k estratos,
con Ni elementos cada uno de ellos, i  1,  , k
E  E1  E 2    E k
N  N1  N 2    N k
Sea n el número total de elementos al realizar el muestreo, y que se dividen en cada estrato como
n  n1  n 2    n k
Sea X la variable aleatoria que representa el carácter que intentamos estudiar. Sobre cada estrato puede definirse
entonces la variable aleatoria X i como el valor medio de X obtenida en una muestra de tamaño ni en el estrato Ei.
Sea Var X i  , la varianza de dicha variable aleatoria. Entonces
k
 VarX 
i
i 1
se minimiza cuando

ni  n 
N i  Si
k
N

j
S j
j 1
donde

Si 
1
N 1
Ni
 x
j 1
ij
 xi
2

xij  j  ésimo elementode Ei


l de Ei
x i  media poblaciona
es la cuasi-varianza del estrato Ei.
5.4.6. Muestreo sistemático.
Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de muestrear consiste en



N
;
n
Elegir aleatoriamente un número m, entre 1 y k;
Tomar como muestra los elementos de la lista:
Sea k 
em , emk , em2k , , emn1k 
Esto es lo que se denomina muestreo sistemático. Cuando el criterio de ordenación de los elementos en la lista es tal
que los elementos más parecidos tienden a estar más cercanos, el muestreo sistemático suele ser más preciso que el
aleatorio simple, ya que recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil no
cometer errores con un muestreo sistemático que con este último.
5.4.6.1. Observación.
N
no es entero, ya que los últimos elementos de la
n
lista nunca pueden ser escogidos. Un modo de evitar este problema consiste en considerar la lista como si fuese
circular (el elemento N +1 coincide con el primero) y,
El método tal como se ha definido anteriormente es sesgado si



N
;
n
Se selecciona un número al azar m, entre 1 y N;
Se toma como muestra los elementos de la lista que consisten en ir saltando de k elementos en k, a partir de
m, teniendo en cuenta que la lista es circular.
Sea k el entero más cercano a
Se puede comprobar que con este método todos los elementos de la lista tienen la misma probabilidad de selección.
5.4.7. Muestreo por conglomerados.
Si intentamos hacer un estudio sobre los habitantes de la ciudad de Hermosillo, el muestreo aleatorio simple puede
resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los encuestadores a n puntos
distintos de la misma, de modo que en cada uno de ellos se realiza sólo una entrevista. En esta situación es más
económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertas
colonias dentro de la ciudad, para después elegir calles, casas o edificios. Una vez elegido la casa o edificio, se
entrevista a todos los vecinos. Resulta fácil observar que es muy posible tomar una muestra de conglomerados que
tenga varias veces el tamaño de una muestra aleatoria simple, por el mismo costo. Es mucho más económico visitar y
entrevistar a familias que viven cerca, en conglomerados, que a familias seleccionadas al azar, en una misma área
Otro ejemplo ilustrativo del muestreo de conglomerados es el siguiente: Suponga que la administración de la
organización de una gran cadena de supermercados desea entrevistar a una muestra de sus empleados para
determinar sus actitudes ante un nuevo plan de pensiones propuesto por la empresa. Si se utilizan métodos aleatorios
para seleccionar, por ejemplo, cinco almacenes de la lista y si alguno o todos los empleados son entrevistados, la
muestra resultante es de conglomerados.
Aunque las estimaciones basadas en muestras de conglomerados no suelen ser tan confiables como las basadas en
muestras aleatorias simples del mismo tamaño, suelen resultar más utilizadas por su costo unitario.
Lecturas recomendadas:
 Carl McDaniel, Roger Gates. Investigación de mercados. Thomson . Sexta Edición. 2005
http://books.google.com.mx/books?id=tAUM5u2Y9EC&pg=PT79&dq=definicion+de+muestreo#v=onepage&q=&f=false
 Naresh K. Malhotra Investigación de mercados. Pearson prentice Hall. Cuarta Edición
http://books.google.com.mx/books?id=bLnONjl5IBIC&printsec=frontcover#v=onepage&q=&f=false
Preguntas sobre muestreo.
1.
2.
3.
4.
5.
6.
7.
8.
¿Por qué es necesario tomar una muestra?
¿Qué es la representatividad de la muestra?
¿Qué diferencia existe entre un muestreo probabilístico y uno no probabilístico?
¿Qué ventajas y desventajas plantean los muestreos no probabilísticos?
¿Qué tipos de errores se pueden cometer en la elección de una muestra?
¿Qué factores se consideran para determinar el tamaño de muestra?
¿Cuál es el principal inconveniente del muestreo de juicio?
El muestreo de juicio y el muestreo de probabilidad, ¿son mutuamente excluyentes por necesidad?
Explique su respuesta.
9. Dé una lista de las ventajas del muestreo de probabilidad en comparación
Con una enumeración completa o censo.
10. ¿cuáles son algunas desventajas del muestreo de probabilidad en relación con el muestreo de
juicio?
Lecturas recomendadas
Levin, Rubin,Balderas, Del Valle, Gómez. Estadística para Administración y Economía. Pearson/Prentice Hall.
Séptima edición. 2004. Pags. 236-242.
Liga del Libro:
http://books.google.com.mx/books?id=uPhtNCqC4isC&pg=PP1&dq=Levin,+Rubin,Balderas,+Del+Valle,+G%C3%
B3mez#v=onepage&q=&f=false
Patricio Bonta, Mario Farber. 199 preguntas sobre marketing y publicidad. Grupo Editorial Norma. 2004. Pags. 8795
Liga del Libro:
http://books.google.com.mx/books?id=sJikTspq7iUC&pg=PA88&lpg=PA88&dq=preguntas+sobre+muestreo&sour
ce=bl&ots=gD-ftkQL5h&sig=bHLmkslIiEEtrHJjrUCycyNriQw&hl=es&ei=1hWYSphE8WGtgegof3BBA&sa=X&oi=book_result&ct=result&resnum=6#
Descargar