unidad 1 - Expreso Sideral SA

Anuncio
COLEGIO FRANCISCANO AGUSTIN
GEMELLI
AREA MATEMATICAS
“Las matemáticas son el lenguaje con el cual Dios a escrito el universo”.
Galileo Galilei
ESTADISTICA
GRADO UNDECIMO
2012
PGF03-R03
Contenido
UNIDAD 1 ................................................................................................................................. 5
TENDENCIAS Y PRONOSTICOS ............................................................................................ 5
CLASIFICACION DE LOS PRONOSTICOS .......................................................................... 7
METODOS CON SERIES DE TIEMPO ............................................................................... 10
UNIDAD 2 ............................................................................................................................... 16
REGRESION LINEAL SIMPLE Y MULTIPLE ........................................................................ 16
METODOS CAUSALES....................................................................................................... 17
UNIDAD 3 ............................................................................................................................... 24
NORMALIDAD Y TECNICAS DE CONTEO ........................................................................... 24
ERROR DE PRONÓSTICO ................................................................................................. 26
DISTRIBUCION NORMAL ................................................................................................... 34
LA DISTRIBUCION NORMAL ESTANDARIZADA O TIPIFICADA ...................................... 36
UNIDAD 4 ............................................................................................................................... 41
PROCESO DE INVESTIGACION ........................................................................................... 41
PROCESO DE INVESTIGACIÓN ........................................................................................ 43
PLANTEAMIENTO Y PREPARACION DE UNA INVESTIGACION ESTADISTICA ............ 44
RECOLECCION DE LOS DATOS ....................................................................................... 47
CRÍTICA Y CODIFICACION ................................................................................................ 48
TABULACION Y PROCESAMIENTO .................................................................................. 48
ANALISIS E INTERPRETACION. ........................................................................................ 49
BIBLIOGRAFIA ....................................................................................................................... 51
MATEMATICAS - Estadística 11
2
PGF03-R03
PRESENTACION
Este módulo de estadística conserva la filosofía y la metodología sobre las cuales se concibió
y desarrollo la primera edición de esta obra, en él se cubren los conceptos básicos y
métodos estadísticos en forma clara y concisa, las explicaciones se han reducido al mínimo
a favor de la exposición de ejemplos concretos, pretendiendo que el estudiante tome parte
activa en la clase, lo cual ayuda muchísimo en el análisis de situaciones propuestas.
El módulo aborda un conocimiento matemático que desde los comienzos de la civilización
ha existido en forma sencilla. En la estadísticas ya se utilizaban representaciones gráficas y
otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número
de personas, animales o ciertas cosas. Hacia el año 3000 A.C. los babilonios usaban ya
pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de
los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la
población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los
libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El
primero contiene dos censos de la población de Israel y el segundo describe el bienestar
material de las diversas tribus judías. En China existían registros numéricos similares con
anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se
utilizaba hacia el año 594 A.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios bajo su control. Durante la edad media
sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el
Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la iglesia
en los años 758 y 762 respectivamente.
MATEMATICAS - Estadística 11
3
PGF03-R03
Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra
encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se
recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en
Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable
de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las
partidas de defunción en Londres).
En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el
proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha
aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se
pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas;
los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es
útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadístico.
Comité Área de Matemáticas
MATEMATICAS - Estadística 11
4
PGF03-R03
UNIDAD 1
TENDENCIAS Y PRONOSTICOS
PROPOSITO
Reconocer el concepto y clasifica el pronóstico cualitativo e interpretar los
métodos causales en pronósticos mediante la solución de problemas de
Series de Tiempo.
MATEMATICAS - Estadística 11
5
PGF03-R03
EL CASO HENREDON
Antes de la recesión de 1930, el tiempo promedio necesario para fabricar y embarcar un
pedido era de 11 semanas. A fin de satisfacer la exigencia de rapidez en la entrega, Tomas
Henredon tuvo que reducir el tiempo necesario para fabricar y embarcar los pedidos. De
esta manera, la precisión de los pronósticos de demanda se convirtió en un factor
fundamental para llegar a satisfacer esa prioridad competitiva. En el sistema de pronósticos
anterior a la recesión, los programas de producción e inventarios se basaban en el promedio
de la demanda que cada producto había tenido durante los últimos 4 meses anteriores. Sin
embargo, ese método no resulto eficaz por que
más del 10% de los productos
comercializados por Henredon cada año eran nuevos y por consiguiente no tenían historial
de pedidos.
En el nuevo sistema de pronósticos, los productos nuevos se consideran en forma diferente a
los productos con historia. Los pronósticos productos nuevos se basan en una curva creada
a partir de los pedidos generados durante las exposiciones semestrales de muebles y por la
experiencia de Henredon con productos similares en el pasado. Gracias a la eficacia de los
pronósticos ha sido posible reducir el tiempo necesario para fabricar y embarcar un pedido a
solo 5 semanas. Esta mejora favoreció el servicio al cliente y redujo los inventarios. Durante
la recesión, los pedidos de Henredon aumentaron un 5% con respecto a al periodo anterior
a pesar de una disminución de las ventas en toda la industria.
PRONÓSTICOS
Un pronóstico es una predicción de eventos futuros que se utiliza con propósitos de
planificación, y en la cual se utilizan variables cualitativas y cuantitativas que permitan
corroborarlos.
En el mundo de los negocios donde el rápido cambio tecnológico y las crecientes
preocupaciones por el medio ambiente han ejercido presiones para mejorar su
competitividad, los pronósticos se convierten en un elemento auxiliar planear la producción
y/o comercialización de los productos.
Las observaciones de la demanda de un producto o servicio tomando como base el orden en
que se presentan, forman un patrón que se conoce como SERIE DE TIEMPO.
MATEMATICAS - Estadística 11
6
PGF03-R03
CLASIFICACION DE LOS PRONOSTICOS
Para pronosticar la demanda de productos y/o servicios se utilizan dos tipos generales de
métodos, los cualitativos y los cuantitativos: cada uno es apropiado dependiendo del entorno
en que se encuentre, el plazo que se quiera pronosticar y los datos históricos con los que se
cuente.
Pronósticos cualitativos:
Este método es apropiado cuando los datos confiables son escasos o difíciles de emplear.
Por ejemplo: cuando se introduce un nuevo producto o tecnología, no se cuenta con datos
históricos adecuados y cuando la experiencia pasada no constituye un criterio seguro para
estimar cuáles serán los efectos a corto plazo.
Este pronóstico implica el uso de juicios subjetivos y esquemas de clasificación para
transformar la información cualitativa en estimaciones cuantitativas.
Los elementos de juicio del pronóstico cualitativo son sobre todo, resultado del pensamiento
intuitivo, el juicio y la acumulación de conocimientos y experiencia.
Dentro de los métodos cualitativos de pronósticos encontramos:
 Estimación de la fuerza de ventas: A veces la mejor información sobre la demanda
futura proviene de las personas que están más cerca de los clientes. Las estimaciones
de la fuerza de ventas son pronósticos compilados a partir de conjeturas acerca de la
demanda futura, elaboradas periódicamente por miembros del equipo de ventas de las
compañías.
 Opinión ejecutiva: Cuando se lanza un nuevo producto servicio, la fuerza de ventas no
siempre es capaz de hacer estimaciones precisas de la demanda. La opinión ejecutiva, es
un método de pronóstico en el cual se hace un resumen de las opiniones, la experiencia,
y los conocimientos técnicos de uno o varios gerentes, con el fin de llegar a un solo
pronóstico.
 Investigación de mercados: Consiste en un enfoque sistemático para determinar el
grado de interés del consumidor por un producto o servicio, mediante la creación y
puesta a prueba de diversas hipótesis por medio de encuestas encaminadas a la
recopilación de datos.
 Método Delphi: Es un proceso para obtener el consenso de un grupo de expertos al
tiempo que se respeta el anonimato de sus integrantes. Esta forma de pronostico es útil
cuando no existen datos históricos sobre los cuales puedan desarrollarse modelos
MATEMATICAS - Estadística 11
7
PGF03-R03
estadísticos y cuando los gerentes de la compañía no tienen experiencia en la cual
fundamentar sus proyecciones.
Pronósticos cuantitativos:
Este hace una extrapolación del pasado o se utiliza cuando se cuenta con suficientes datos
estadísticos o confiables para especificar las relaciones existentes entre variables
fundamentales.
El pronóstico basado en la extrapolación, como un análisis de series de tiempo, recurre a las
tendencias pasadas o presentes a fin de proyectar los acontecimientos futuros. Así, los
registros de ventas en los últimos años podrían servir para proyectar el patrón de ventas para
el próximo año.
El pronóstico cualitativo no exige datos numéricos ni estadísticos en la misma forma que el
cuantitativo. Este último puede aplicarse si se cuenta con información sobre el pasado, si se
le puede especificar numéricamente y si es posible suponer que continuará el patrón del
pasado.
Los pronósticos cuantitativos se clasifican en:
Métodos causales: Se emplean cuando se dispone de datos históricos y la relación entre el
factor que se intente pronosticar y otros factores externos o internos puede identificarse.
Estos métodos proveen instrumentos de pronóstico más refinados y exactos, son excelentes
para la pronosticar la demanda a largo plazo y utilizan datos históricos de variables
independientes, como campañas de promoción, condiciones económicas y actividades de los
competidores.
Métodos con series de tiempo: En lugar de emplear variables independientes para el
pronóstico, como en los modelos de regresión lineal, los métodos con series de tiempo usan
información histórica que solo proviene de la variable dependiente. Estos métodos están
basados en la suposición de que el patrón de la variable dependiente en el pasado habrá de
continuar en el futuro.
MATEMATICAS - Estadística 11
8
PGF03-R03
Responde en tu cuaderno las siguientes preguntas:
1. Investiga las causas y consecuencias de la crisis económica de los años 30, conocida
como “La gran depresión”.
2. ¿Cómo cree usted que un sistema de pronósticos ayudaría a una empresa o industria?
3. Aun sin conocer a fondo los métodos o sistemas de pronóstico, ¿cuales consideraría usted
que se deben aplicar para obtener mejores resultados? ¿Los cualitativos, los cuantitativos?
¿Por qué?
4. De los métodos cualitativos expuestos en la lectura, cual consideraría usted conveniente
para su empresa. Si usted fuera un empresario ¿Por qué?
5. Según lo expuesto en el caso Henredon, ¿cuál cree que hubiese sido el impacto en la
economía durante la recesión de 1930, si más industrias hubiesen aplicado algún sistema de
pronóstico adecuado?
MATEMATICAS - Estadística 11
9
PGF03-R03
METODOS CON SERIES DE TIEMPO
PROMEDIO MOVIL SIMPLE:
S
e usa para estimar el promedio de una serie de
tiempo de demanda y, por lo tanto, para suprimir los
efectos de las fluctuaciones al azar. Este método
resulta más útil cuando la demanda no tiene tendencias
pronunciadas ni influencias estacionales. El método
consiste en calcular la demanda promedio de los n
periodos más recientes, con el fin de usarla como
pronostico para el siguiente periodo. Para el periodo
siguiente, una vez se conoce la demanda real, la demanda
más antigua del promedio anterior se sustituye por la
demanda mas reciente y luego se vuelve a calcular el
promedio. De esta manera se usan las n demandas más recientes, por los cuales promedio
se “mueve” de un periodo a otro.
En términos específicos, el pronóstico correspondiente al periodo t+1 se puede calcular en la
siguiente forma:
Ft 1
Sum ade las ultim asn dem andas Dt  Dt 1  Dt  2  ...... Dtn 2


n
n
Donde: t = Periodo de tiempo.
Dt = Demanda real en el periodo t
n =Numero de periodos incluidos en el promedio.
Ft+1 =Pronostico para el periodo t+1
MATEMATICAS - Estadística 11
10
PGF03-R03
EJERCICIO DE SIMULACIÓN
Elabore un pronóstico de promedio móvil de 3 semanas para estimar la llegada de pacientes
a la clínica médica durante la semana 4. Los números correspondientes a las llegadas de
pacientes durante las 3 últimas semanas fueron:
Semana
1
2
3
No
Pacientes
400
380
411
El promedio móvil al final de la semana 3 es:
411  380  400
F4 
 397 Pacientes
3
Si el número real de pacientes durante la semana 4 fue de 415 ¿Cuál será el pronóstico para
la semana 5?
F5 
415  411  380
 402 Pacientes
3
PROMEDIO MOVIL PONDERADO:
En el promedio móvil simple, todas las demandas tienen la misma ponderación (Valen igual).
En el promedio móvil ponderado, cada una de las demandas históricas que intervienen en el
promedio puede tener su propio valor o ponderación. El resultado de la suma de las
ponderaciones es igual a 1.0 por ejemplo, en un modelo de promedio móvil ponderado de 3
periodos; al periodo más reciente se le puede asignar un ponderación de 0.50; al segundo
más reciente, un ponderación de 0.3 y el tercero más reciente, una ponderación de 0.20. El
promedio se obtiene multiplicando la ponderación de cada periodo por el valor
correspondiente a dicho periodo y sumando finalmente los productos.
Ft 1  0.50Dt  0.30Dt 1  0.20Dt 2
MATEMATICAS - Estadística 11
11
PGF03-R03
EJERCICIO DE MODELACIÓN
Semana
1
2
3
4
No
Pacientes
400
380
411
415
El analista que está a cargo de la clínica médica ha asignado ponderaciones de 0.70 a la
demanda de la semana más reciente; 0.20 a la demanda de hace una semana y 0.10 a la
demanda de hace 2 semanas. Use los datos correspondientes a las 3 primeras semanas del
ejemplo anterior para calcular el pronóstico para las semanas 4 y 5.
F4 = 0.70 (411) + 0.20 (380) + 0.10 (400)
F4 = 403.7 ≈ 404 Pacientes
F5 = 0.70 (415) + 0.20 (411) + 0.10 (380)
F5 = 410.7 ≈ 411 Pacientes.
EJERCICIO DE MODELACIÓN
Katty’s Pizza es un pequeño restaurante. Una de sus especialidades es la pizza Premium. El
gerente de la empresa debe pronosticar la demanda semanal de pizzas, para saber que
cantidad de ingredientes pedir cada semana. A últimas fechas la demanda ha sido la
siguiente:
Semana del
2 de junio
9 de junio
16 de junio
23 de junio
30 de junio
7 de julio
No Pizzas
50
65
52
56
55
60
a. Pronostique la demanda de pizzas para el periodo comprendido entre el 23 de junio y el 14
de julio, usando el promedio móvil simple con n 0 3.
b. Pronostique los mismos periodos, utilizando el promedio móvil ponderado con n=3 y
ponderaciones de 0.50, 0.30 y 0.20.
MATEMATICAS - Estadística 11
12
PGF03-R03
Solución: Podemos sintetizar los resultados en el siguiente cuadro:
Semana
del
23 de
junio
Pronostico con promedio móvil
ponderado
0.50 (52) + 0.30 (65) + 0.20 (50) =55.5 ≈
52  65  50
 55 .7  56 56
3
30 de
junio
0.50 (56) + 0.30 (52) + 0.20 (65) =56.6 ≈
56  52  65
 57 .7  58 57
3
7 de julio
0.50 (55) + 0.30 (56) + 0.20 (52) =54.7 ≈
55  56  52
 54 .3  54 55
3
14 de
julio
Pronostico con
promedio móvil simple
60  55  56
 57
3
0.50 (60) + 0.30 (55) + 0.20 (56) =57.7 ≈
58
1. Las temperaturas máximas diarias en la ciudad de Ibagué la semana pasada fueron
así: 26º, 32º, 20º, 22º, 19º, 35º, 24º (Ayer).
a. Pronostique la temperatura máxima a partir del cuarto día, utilizando el promedio móvil de
tres días.
b. Pronostique la temperatura máxima para los mismos días, utilizando un promedio móvil de
dos días.
2. Para los datos que están a continuación, desarrollar un pronóstico de promedio móvil a
partir del mes de abril.
Mes
1(Enero)
2(Febrero)
Ventas
de autos
20
21
MATEMATICAS - Estadística 11
13
PGF03-R03
3 (Marzo)
4 (Abril)
5 (Mayo)
6 (Junio)
7 (Julio)
8 (Agosto)
9(Septiembre)
10(Octubre)
11(Noviembre)
12(Diciembre)
15
14
13
16
17
18
20
20
21
23
a. De tres meses.
b. Luego pronostique los mismos meses con un promedio móvil ponderado con
ponderaciones de 0.4 el más reciente, 0.35 el segundo más reciente y 0.25 para el tercero
más reciente.
3. La demanda para cirugías de trasplante de corazón en el hospital militar ha crecido
constantemente en los últimos años, como se aprecia en la siguiente tabla:
Año
1
2
3
4
5
6
7
8
9
10
No de
cirugías
45
50
52
56
58
61
55
63
63
59
El médico de servicios desea saber cuáles serian los pronósticos de cirugías desde el año
cuatro si se utilizara el método del promedio móvil simple de cuatro periodos. Y luego
compararlos con los resultados que mostraría un pronóstico calculado con el promedio móvil
ponderado donde el año más reciente vale 0.35, el segundo vale 0.30, el tercero 0.25 y el
cuarto 0.20
MATEMATICAS - Estadística 11
14
PGF03-R03
4. Un nadador profesional realiza entrenamientos semanales de preparación para
competencia internacional, arrojando los siguientes datos.
Semana # Piscinas
1
150
6
11
16
21
2
3
4
90
110
95
7
8
9
12
13
14
17
18
19
22
23
24
10
15
20
25
5
a. Hallar el valor de la semana 5 a 25
b. Graficar.
5. Las temperaturas máximas diarias en la ciudad de Ibagué la semana pasada fueron así:
Día
Temperatura
1
26º
6
11
16
2
3
4
32º
20º
19º
7
8
9
12
13
14
17
18
19
5
35º
10
15
20
a. Realizar promedio móvil ponderado para el primer día 0.1, segundo día 0.3, tercer día
0.15, cuarto día 0.25, quinto día 0.2 hallar el valor de las temperaturas hasta la
semana 20
b.
Graficar
MATEMATICAS - Estadística 11
15
PGF03-R03
UNIDAD 2
REGRESION LINEAL SIMPLE Y
MULTIPLE
MATEMATICAS - Estadística 11
16
PGF03-R03
PROPOSITO
Reconocer el concepto y clasifica el pronóstico cualitativo e interpretar los
métodos causales en pronósticos mediante la solución de problemas de
regresión lineal simple.
METODOS CAUSALES
REGRESIÓN LINEAL SIMPLE.
En este método una variable, conocida como dependiente, está relacionada con una o más
variables independientes por medio de una ecuación lineal, la variable dependiente es la que
se desea pronosticar.
En el modelo de regresión lineal simple, la variable dependiente es función de una sola
variable independiente y, por lo tanto la relación teórica es una línea recta.
Formula:
Y  a  bx
donde: Y = Variable dependiente
x = Variable independiente
a = intersección de la recta con el eje Y
MATEMATICAS - Estadística 11
17
PGF03-R03
b = pendiente de la recta
El objetivo del análisis de regresión lineal consiste en encontrar los valores de a y b que
minimicen la suma de las desviaciones al cuadrado de los puntos de la línea de regresión, y
que corresponden a datos reales, es decir que los datos que se pretende pronosticar no
estén alejados de los datos históricos y reales que se han venido presentando.
Formulas necesarias en un modelo de regresión lineal simple:
b
 XY  n( X )(Y )
 X  n( X )
2
a  Y  bX
2
Coeficiente de correlación lineal (r): Es un valor entre -1 y 1 y dice que tan bien se relacionan
las variables dependiente e independiente en el modelo de regresión lineal. Si r tiende a 1
significa que hay mucha relación entre las variables (En forma directa y proporcional); Si r
tiende a -1 hay una relación inversamente proporcional entre las variables (Si la una
aumenta, la otra disminuye); y si r tiende a 0 significa que no hay ningún tipo de relación
entre las variables.
r
n xy   x  y 
(n x 2   x  ) * (n y 2   y  )
2
Error de estimación estándar (
de regresión.
S xy 
2
S xy ): mide la dispersión de los datos con relación a la recta
y
2
 a( y)  b( xy)
n2
COEFICIENTE DE DETERMINACIÓN:
Mide la cantidad de variación que presenta la variable dependiente con respecto al valor
medio ( Y ). Es igual a r2. Si tiende a 1.0, significa que las variables están estrechamente
relacionadas
EJERCICIO DE SIMULACIÓN
MATEMATICAS - Estadística 11
18
PGF03-R03
La siguiente es la informaron de las ventas de los últimos 3 años de una empresa productora
de carros a nivel nacional expresados en trimestres.
Trim. (X)
1
2
3
4
5
6
7
8
9
10
11
12
∑= 78
X 
b
X
n

Dda.(Y)
4800
3500
4300
3000
3500
2700
3500
2400
3200
2100
2700
1700
37.400
78
 6.5
12
XY
4800
700
12900
12000
17500
16200
24500
19200
28800
21000
29700
20400
214000
Y 
X2
1
4
9
16
25
36
49
64
81
100
121
144
650
Y2
23.040.000
12.250.000
18.490.000
9.000.000
12.250.000
7.290.000
12.250.000
5.760.000
10.240.000
4.410.000
7.290.000
2.890.000
125.160.000
Y
n

37400
 3116.66
12
214000 12(6.5)(3116.66) 214000 243099.48  29099.48


 203.49
650 507
143
650 12(6.5) 2
a = 3116,66 – (-203,49) (6,5) = 4439,34
La ecuación de pronóstico es la siguiente:
Y = 4439,34 + (-203,49) (X)
Pronosticar la demanda para los trimestres 13 y 14
Y13 = 4439,34 + (-203,49) (13)
Y13 = 4439,34 – 2645,37 = 1793,97 ≈ 1794 Carros (Pronostico Para el trimestre 13)
Y14 = 4439,34 + (-203,49) (14)
Y14 = 4439,34 – 2848,86 = 1590,48 ≈1590 Carros (Pronostico Para el trimestre 14)
Hallar los coeficientes de correlación y determinación y el error de estimación estándar, e
interpretar los resultados:
MATEMATICAS - Estadística 11
19
PGF03-R03
12(214000)  (78)(37400)
r
((12)(650)  (78) 2 ) * ((12)(125.160.000)  (37400) 2 )
2.568.000 2.917.000
r
r
(7800 6084) * ((1501.920.000 1398.760.000) )
 349 .200
 0,82
420 .740
(Tiende
a
-1
lo
que
indica
que
las
variables
son
inversamente proporcionales)
r2 = (-0.82)2 = 0.67 (Indica que las variables están medianamente relacionadas).
S xy 
125.160.000  (4439,34)(37400)  (203,49)(214000)
 517.25
12  2
1. La demanda de cambios de aceite registrada en el autoservicio. El Canguro ha sido la
siguiente:
Mes (X) Dda.(Y)
1(Enero)
41
2 (Febrero)
46
3 (Marzo)
57
4 (Abril)
52
5 (Mayo)
59
6 (Junio)
51
7 (Julio)
60
8 (Agosto)
62
a. Aplicar un análisis de Regresión lineal simple.
MATEMATICAS - Estadística 11
20
PGF03-R03
b. Pronostique la demanda de los meses faltantes del año.
c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar.
d. Interprete los resultados obtenidos
Mes (X)
1(Enero)
2(Febrero)
3 (Marzo)
4 (Abril)
5 (Mayo)
6 (Junio)
7 (Julio)
8 (Agosto)
9(Septiemb.)
10(Octubre)
11(Noviemb.)
12(Diciemb.)
13(Enero)
14(Febrero)
15(Marzo)
Ventas(Y1) Alquiler(Y2)
80
32
102
19
105
15
59
40
95
53
78
12
63
24
100
32
45
58
81
34
70
28
66
50
97
22
101
12
88
18
2. Una compañía vende equipos industriales, y además ofrece el servicio de alquiler, a bajos
costos y bajo depósito. El reporte de ventas y alquileres en los últimos 15 meses es el
siguiente:
a. Aplicar un análisis de Regresión lineal simple, para las dos variables dependientes (Y1 y
Y2).
b. Pronostique la demanda de ventas y alquileres de los meses Abril a Julio del año
siguiente.
c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar,
de las dos variables dependientes.
d. Interprete los resultados obtenidos, en ambos casos.
MATEMATICAS - Estadística 11
21
PGF03-R03
1. El palacio del pollo ofrece almuerzos que incluyen cinco piezas de pollo para llevar a casa,
a precios especiales. Sea Y el numero de almuerzos vendidos y X el precio. A partir de las
observaciones históricas y los cálculos que se presentan en la siguiente tabla, determine la
ecuación de regresión, el coeficiente de correlación, y de determinación y el error de
estimación estándar. ¿Cuántos almuerzos piensa el gerente que lograra vender a $2500,
$3000, $3500, y $4000 cada uno?
Observación
1
2
3
4
5
6
7
8
9
0
Precio Almuerzos
(X)
(Y)
2700
760
3500
510
2000
980
4200
250
3100
320
4200
480
2700
370
3800
210
3000
550
2700
490
2. Con los siguientes datos utilice el método de regresión lineal para desarrollar la relación
entre el número de días con lluvia en verano y el número de juegos perdidos por el Deportes
Tolima
Año
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
Días de lluvia
en verano (X)
15
25
10
10
30
20
20
15
10
25
Juegos perdidos por el
Dep. Tolima(Y)
25
20
10
15
20
15
20
10
5
20
MATEMATICAS - Estadística 11
22
PGF03-R03
a. Aplicar un análisis de Regresión lineal simple, para la variable dependiente.
b. Pronostique la cantidad de partidos que podría perder el Deportes Tolima en los años
2007 a 2010.Si se cree que lo días de lluvia serán 22, 14, 18, y 25
c. Calcule los coeficientes de correlación y determinación, y el error de estimación estándar,
de la variable dependiente.
d. Interprete los resultados obtenidos.
INVESTIGAR:
INVESTIGACION:
CUALITATIVO:
CUANTITATIVO:
PROCESO:
DATOS:
MATEMATICAS - Estadística 11
23
PGF03-R03
ENCUESTA:
TABULACION:
GRAFICACION:
ANALISIS:
UNIDAD 3
NORMALIDAD Y TECNICAS DE CONTEO
MATEMATICAS - Estadística 11
24
PGF03-R03
PROPOSITO
Establece matemática y gráficamente las áreas correspondientes baja la curva
normal con o sin ayuda de la tabla de distribución normal, Despejando así
adecuadamente el coeficiente Z en los límites inferior y superior en la
probabilidad uno o varios sucesos.
MATEMATICAS - Estadística 11
25
PGF03-R03
ERROR DE PRONÓSTICO
Los pronósticos casi siempre tienen errores. Los errores de pronóstico se clasifican en dos
formas: ya sea como errores de sesgo o como errores aleatorios. Los errores de sesgo
son el resultado de equivocaciones sistemáticas, por lo cual se observa que el pronóstico
siempre es demasiado alto o siempre es demasiado bajo. Con frecuencia esos errores son
el resultado de ignorar o no estimar correctamente ciertos patrones de demanda, como los
de tendencia, los estacionales o cíclicos. Por ejemplo si la demanda de tiempo para jugar en
las canchas de tenis de un club aumenta continuamente y el gerente de la institución aplica
el método de promedio móvil simple, tomando simplemente las últimas semanas como
componentes del pronóstico, entonces el pronóstico siempre será bajo porque el gerente no
tomo en cuenta la tendencia.
El otro tipo de error de pronóstico, es el error aleatorio, es el resultado de factores
imprevisibles que obligan al pronóstico a desviarse de la demanda real. Los analistas de
pronósticos intentan minimizar los efectos de los errores de sesgo y los errores aleatorios,
seleccionando modelos de pronóstico apropiados, pero en realidad es imposible suprimir los
errores en todas sus formas.
MEDICIONES DEL ERROR DE PRONÓSTICO:
Antes de pensar en minimizar el error de pronóstico, es necesario que los gerentes
dispongan de algún medio adecuado para medirlo. El error de pronóstico es simplemente la
diferencia entre el pronóstico para un periodo determinado y la demanda real registrada
durante el mismo, es decir:
Et = Dt - Ft, donde: Et = Error de pronóstico para el periodo t
Dt = Demanda real para el periodo t
Ft = Pronostico para el periodo t.
Sin embargo, los gerentes están más interesados en medir el error de pronóstico durante un
periodo de tiempo relativamente largo.
La suma acumulativa de errores de pronostico CFE (del inglés cumulative sum of forecast
errors) mide el error total de un pronóstico.
CFE = ∑Et
Los grandes errores positivos tienden a compensarse con grandes errores negativos en la
CFE de una medición. Sin embargo la CFE resulta útil para evaluar el sesgo de un
pronóstico. Por ejemplo, si un pronóstico siempre resulta mas bajo que la demanda real, el
valor de la CFE será cada vez más grande. Este error de magnitud creciente indica que
MATEMATICAS - Estadística 11
26
PGF03-R03
existe una deficiencia sistemática en el enfoque del pronóstico. Es posible que el analista
haya omitido un elemento de tendencia o un patrón cíclico.
ERROR DE PRONÓSTICO PROMEDIO:
Es simplemente el cociente entre la suma de todos los errores de pronóstico y el número de
periodos estudiados.
E 
CFE
n
CUADRADO DE ERROR MEDIO MSE
(del inglés mean squared error): es la sumatoria de los cuadrados de los errores de
pronóstico dividido en el número de periodos pronosticados.
E
MSE 
2
t
n
DESVIACION ESTANDAR (S):
Es la raíz cuadrada de la sumatoria de las desviaciones entre el error de pronóstico y el error
de pronóstico promedio elevadas al cuadrado sobre el total de periodos de pronóstico
menos uno.
S 
 ( Et  E )
2
n 1
DESVIACION MEDIA ABSOLUTA DMA:
Consiste en la sumatoria de los valores absolutos de los errores de pronóstico divididos entre
el número de periodos de pronóstico.
MAD 
E
t
n
MATEMATICAS - Estadística 11
27
PGF03-R03
El símbolo I I se usa para indicar el valor absoluto; es decir, indica que no se deben
considerar los signos negativos. Si el valor de MSE, la S o la MAD es pequeño, indica que el
pronostico se aproxima generalmente a la demanda real; un valor grande anuncia la
posibilidad de errores de pronostico considerables. Los errores grandes reciben una
ponderación mucho mayor en el MSE y la S porque en estos casos los errores se elevan al
cuadrado. La MAD es una medición muy común del error de pronóstico porque se
comprende muy fácilmente, se trata simplemente de la media de los errores de pronóstico en
una serie de periodos de tiempo, sin considerar si dichos errores consistieron en
estimaciones excesivas o en subestimaciones. La MAD también se usa en señales de
rastreo y control de inventarios.
ERROR PORCENTUAL MEDIO ABSOLUTO MAPE:
Del inglés (Mean absolute percent error), relaciona el error de pronóstico con el nivel de la
demanda, y es útil para colocar el rendimiento del pronóstico en su correcta perspectiva:
MAPE 
 E
t
(100)/ DT
n
EJERCICIO DE SIMULACIÓN
La siguiente tabla muestra las ventas reales de sillas tapizadas que realizo un fabricante de
muebles y los pronostico correspondientes a cada uno de los últimos ocho meses. Calcule la
CFE, el MSE, la S, la MAD y el MAPE para este producto.
Mes
t
Dda.
Dt
Pronostico
Ft
Error
Et
Cuadrado
Del error Et2
1
2
3
4
5
6
7
8
TOTAL
200
240
300
270
230
260
210
275
XXX
225
220
285
290
250
240
250
240
XXXXXX
-25
20
15
-20
-20
20
40
35
-15
625
400
225
400
400
400
1600
1225
5275
Error
Absoluto
│Et│
25
20
15
20
20
20
40
35
195
Error porcentual
Absoluto
(│Et│/Dt) (100)
12.5%
8.3%
5.0%
7.4%
8.7%
7.7%
19.0%
12.7%
81.3%
Usando las formulas correspondientes a cada una de las mediciones tenemos:
Error de pronostico acumulativo: CFE = -15
MATEMATICAS - Estadística 11
28
PGF03-R03
Error de pronóstico media:
E 
Cuadrado del error medio:
MSE =
 15

8
-1,875
5275

8
659,4
Desviación Estándar:
S 
 E
Desviación Media Absoluta:
 ( 1,875 ) 
2
t
8 1
MAD 
Error Porcentual Medio Absoluto:
 27,4
195
 24,4
8
MAPE 
81,3%

8
10,2%
ANALISIS: Una CFE con valor de -15 indica que el pronóstico tiene la tendencia de
sobreestimar la demanda. Las estadísticas del MSE, la S y la MAD proporcionan mediciones
de la variabilidad del error de pronóstico. Una MAD de 24,4 significa que el error de
pronóstico fue de 24,4 unidades en valor absoluto. El valor de S de 27, 4, indica que la
distribución de los errores de pronostico dentro de la muestra tiene una desviación estándar
de 27,4 unidades, un MAPE de 10,2% implica que, en promedio, el error de pronostico fue de
mas o menos el 10% de la demanda real observada. Estas mediciones se vuelven más
dignas de confianza a medida que aumenta el número de periodos observados.
MATEMATICAS - Estadística 11
29
PGF03-R03
1. Explique con sus propias palabras que importancia tienen los sistemas de pronóstico
dentro
de
la
economía
o
el
sector
industrial
de
un
país.______________________________________________________________________
__________________________________________________________________________
__________________________________________________________________________
__________________________________________________________________________
__________________________________
2. De los métodos vistos en clase. ¿Cuál cree usted que es el método más eficiente para
determinar pronósticos? Explique su respuesta.
__________________________________________________________________________
__________________________________________________________________________
__________________________________________________________________________
_________________________________
3. De los métodos cualitativos de pronóstico, ¿Cuál considera usted que es el más eficiente
y confiable?, ¿Por qué?
__________________________________________________________________________
__________________________________________________________________________
__________________________________________________________________________
__________________________________________
4. ¿Qué importancia cree usted que tienen las medidas de error de pronósticos? Explique.
__________________________________________________________________________
__________________________________________________________________________
__________________________________________________
5. Elabore las tablas de las mediciones de error, calcule las medidas de error e intérprete los
resultados de los ejercicios del método de regresión lineal simple si se supone que los
pronósticos fueron:
MATEMATICAS - Estadística 11
30
PGF03-R03
A.
Observación
1
2
3
4
5
6
7
8
9
10
Precio
(X)
2700
3500
2000
4200
3100
4200
2700
3800
3000
2700
Almuerzos Pronostic
(Y)
o
760
823
510
485
980
894
250
250
320
306
480
465
370
250
210
311
550
495
490
500
B.
Mes (X)
1(Enero)
2(Febrero)
3 (Marzo)
4 (Abril)
5 (Mayo)
6 (Junio)
7 (Julio)
8 (Agosto)
9(Septiembre)
10(Octubre)
11(Noviembre)
12(Diciembre)
13(Enero)
14(Febrero)
15(Marzo)
Venta
(Y1)
80
102
105
59
95
78
63
100
45
81
70
66
97
101
88
Pronostico
75
96
108
63
95
88
52
111
56
81
79
63
87
99
100
Alquiler
(Y2)
32
19
15
40
53
12
24
32
58
34
28
50
22
12
18
Pronostico
35
24
12
33
52
10
30
29
50
38
28
55
25
11
15
C.
MATEMATICAS - Estadística 11
31
PGF03-R03
Mes (X)
1(Enero)
2 (Febrero)
3 (Marzo)
4 (Abril)
5 (Mayo)
6 (Junio)
7 (Julio)
8 (Agosto)
Dda.(Y)
41
46
57
52
59
51
60
62
Pronostico
46
55
52
47
64
60
58
53
6. Completar el siguiente mentefacto conceptual
MENTEFACTO CONCEPTUAL
MATEMATICAS - Estadística 11
32
PGF03-R03
PRONOSTICO:
SERIES DE TIEMPO:
METODOS CAUSALES:
INVESTIGACION DE MERCADOS:
REGRESION LINEAL:
PROMEDIO MOVIL SIMPLE:
PROMEDIO MOVIL PONDERADO:
MEDIDAS DE ERROR:
DESVIACION MEDIA ABSOLUTA:
DESVIACION ESTANDAR:
MATEMATICAS - Estadística 11
33
PGF03-R03
DISTRIBUCION NORMAL
Es una distribución de probabilidad de variable continua, la cual se define como aquella que
puede asumir cualquier valor dentro de un intervalo de valores por ejemplo valores que se
pueden medir en unidades de altura, peso, tiempo o temperatura.
En las distribuciones de probabilidad discretas, se determina la probabilidad de que la
variable aleatoria asuma un valor particular X. En la variable continua deseamos saber
determinar la probabilidad de que X asuma valores dentro de algún intervalo comprendido
entre un valor Xa y un valor Xb.
Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos
se comportan según una distribución normal.
La formula de esta aplicación fue descubierta por Abraham Demoivre en 1733 como forma
limite de la Distribución Binomial. Otros matemáticos que figuran en la historia inicial de la
distribución normal son Pierre Simón Laplace (1749 – 1827) y Carl Friederich Gauss (1777 –
1855). Es por eso que se le suele denominar: Gaussiana, Laplaciana, Distribución de
Laplace – Gauss o de Gauss – Laplace o bien la segunda ley de Laplace.
Algunas características o propiedades de la distribución normal son:
1. El área total comprendida bajo la curva normal o campana de Gauss y por encima del
eje horizontal es igual a 1 ó 100%.
2. La distribución es simétrica con respecto a su media. Es decir el 50% del área está a
la derecha y el 50% está a la izquierda.
MATEMATICAS - Estadística 11
34
PGF03-R03
3. La media, mediana y moda son iguales.
4. La distribución normal es una “familia de distribuciones”, puesto que existe una
distribución diferente para cada valor de la media (μ) y la desviación estándar (σ).
5. La curva de una distribución normal se extiende desde
  ,hasta  
6. Si trazamos líneas perpendiculares a una distancia de una σ de la media μ en cada
uno de los dos lados, el área comprendida entre estas dos líneas es igual a 0.68
(68%) aproximadamente. De igual manera podemos encerrar el 95%
aproximadamente del área total, trazando líneas perpendiculares a una distancia de
2σ de la media μ en cada uno de los lados. Y podemos encerrar el 99.7% del área
total si trazamos las líneas perpendiculares a una distancia de 3 σ de la media en
cada uno de los lados. Las siguientes figuras nos ilustra mejor la situación:
MATEMATICAS - Estadística 11
35
PGF03-R03
Si una variable aleatoria X está normalmente distribuida, podemos calcular la probabilidad
de que X asuma valores entre Xa y Xb es decir P (Xa < X < Xb )
Como lo indica la figura:
LA DISTRIBUCION NORMAL ESTANDARIZADA O TIPIFICADA
Para determinar probabilidades en la distribución normal, es necesario acudir a una
aplicación especial de esta: “LA DISTRIBUCION NORMAL ESTANDARIZADA”, la cual
tiene por regla que la media μ = 0 y la desviación estándar σ = 1. Las áreas de la
distribución normal estandarizada se encuentran tabuladas. El cuerpo de esta tabla da las
áreas bajo la curva normalmente distribuida con media 0 y varianza 1.
MODELACIÓN 1: Hallar el área bajo la curva normal estandarizada entre 0 y Z = 2.05
Solución: El área que se busca es el área sombreada en la figura. Para hallar el valor
numérico del área, localizamos el número 2.0 en la columna izquierda de la tabla y el número
0.05 en la fila superior. El numero que aparece en la intersección de la columna y la fila, es el
área que se está buscando.
MATEMATICAS - Estadística 11
36
PGF03-R03
0
2.05
Lo cual indica que la probabilidad de encontrar un valor de Z entre 0 y 2.05 es del 47,98%.
MODELACIÓN 2: ¿Cuál es la probabilidad de que un valor de Z sacado al azar este entre 0
y -2.05?
Solución: En virtud de la simetría de la distribución normal, el área entre 0 y -2.05 es
exactamente igual al área entre 0 y 2.05, es decir de 0.4798 que es igual a 47.98%. La
diferencia radica en que el área sombreada no se ubica a la derecha sino a la izquierda de la
campana.
MODELACIÓN 3: Cual es la probabilidad de encontrar un valor de Z entre -1.78 y 1.52, es
decir P (-1.78 < Z < 1.52)
Solución: Es posible determinar el área que en este caso consta dos partes una a la
izquierda y otra a la derecha de la campana de Gauss. Primero se debe determinar el área
de la izquierda, buscando en la tabla el valor 1.78 (0.4625) y luego se hace lo mismo con el
lado derecho con el valor 1.52 (0.4357). Finalmente se unen las dos áreas sumando los
valores encontrados en la tabla:
P (-1.78 < Z < 1.52) = 0.4357 + 0.4625 = 0.8982 lo que equivale al 89.82%.
MATEMATICAS - Estadística 11
37
PGF03-R03
MODELACIÓN 4: Hallar P (Z > 1.67)
Solución: En la figura se muestra el área a encontrar, esta no está directamente implícita en
la tabla ya que no se trata de un valor exacto sino de mucho de ellos, ya que pide ser mayor
que 1.67. Recordemos que el área a la derecha de la campana es 0.5000. Para el área a la
derecha de 1.67 se busca el área entre 0 y 1.67 (0.4525) y lo restamos de 0.5000,
obtenemos 0.5000 – 0.4525 = 0.0475.
Tabla: Áreas bajo la curva normal estándar. La cifra entera y el primer decimal de z se
buscan en la primera columna, y el segundo decimal en la cabecera de la tabla.
MATEMATICAS - Estadística 11
38
PGF03-R03
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
Segunda cifra decimal del valor de z
.02
.03
.04
.05
.06
0.0080 0.0120 0.0160 0.0199 0.0239
0.0478 0.0517 0.0557 0.0596 0.0636
0.0871 0.0910 0.0948 0.0987 0.1026
0.1255 0.1293 0.1331 0.1368 0.1406
0.1628 0.1664 0.1700 0.1736 0.1772
0.1985 0.2019 0.2054 0.2088 0.2123
0.2324 0.2357 0.2389 0.2422 0.2454
0.2642 0.2673 0.2704 0.2734 0.2764
0.2939 0.2967 0.2995 0.3023 0.3051
0.3212 0.3238 0.3264 0.3289 0.2315
0.3461 0.3485 0.3508 0.3531 0.2554
0.3686 0.3708 0.3729 0.3749 0.2770
0.3888 0.3907 0.3925 0.3944 0.2962
0.4066 0.4082 0.4099 0.4115 0.4131
0.4222 0.4236 0.4251 0.4265 0.4279
0.4357 0.4370 0.4382 0.4394 0.4406
0.4474 0.4484 0.4495 0.4505 0.4515
0.4573 0.4582 0.4591 0.4599 0.4608
0.4656 0.4664 0.4671 0.4678 0.4686
0.4726 0.4732 0.4738 0.4744 0.4750
0.4783 0.4788 0.4793 0.4798 0.4803
0.4830 0.4834 0.4838 0.4842 0.4846
0.4868 0.4871 0.4875 0.4878 0.4881
0.4898 0.4901 0.4904 0.4906 0.4909
0.4922 0.4925 0.4927 0.4929 0.4931
0.4941 0.4943 0.4945 0.4946 0.4948
0.4956 0.4957 0.4959 0.4960 0.4961
0.4967 0.4968 0.4969 0.4970 0.4971
0.4976 0.4977 0.4977 0.4978 0.4979
0.4982 0.4983 0.4984 0.4984 0.4985
0.4987 0.4988 0.4988 0.4989 0.4989
.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989
.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990
MATEMATICAS - Estadística 11
39
PGF03-R03
1. Determinar el área bajo la curva normal, y graficar.
a) a la izquierda de Z = -1,78
b) a la izquierda de Z = 0,56
c) correspondiente a Z < 2,16
d) correspondiente a – 0,80 < Z < 1,53
2. Encontrar el valor de Z:
a) El área a la derecha de Z es igual a 0,2266
b) El área a la izquierda de Z es 0,0314
c) El área entre –0,23 y Z es igual a 0,5722
d) El área entre 1,15 y Z es 0,0730
3. Hallar Z si el área bajo la curva normal:
a) entre 0 y Z es 0,4515
b) a la derecha de Z es 0,3121
c) a la derecha de Z es 0,8023
d) a la izquierda de Z es 0,4562
4. Hallar el área bajo la curva normal:
a) A la derecha de Z = 2,68
b) a la derecha de Z = -0,66
c) a la izquierda de Z = -1,88
d) entre Z = 1,25 y Z = 1,67
e) entre Z = 0,90 y Z = -1,85
f) entre Z = -1,45 y Z = 1,45
5. Completa el siguiente mentefacto conceptual .
MENTEFACTO CONCEPTUAL
MATEMATICAS - Estadística 11
40
PGF03-R03
UNIDAD 4
PROCESO DE INVESTIGACION
MATEMATICAS - Estadística 11
41
PGF03-R03
PROPOSITO
Tabular, graficar, analizar críticamente los datos provenientes de las encuestas
realizadas, plantear soluciones al problema inicial y proponer planes de acción
para ponerlos en práctica.
MATEMATICAS - Estadística 11
42
PGF03-R03
PROCESO DE INVESTIGACIÓN
¿Qué es investigar?
Es el proceso, organizado y objetivo destinado a responder una pregunta. En otras palabras
es preguntar, cuestionar, ejercer el pensamiento especulativo, dar respuestas en forma
rigurosa y metódica para esclarecer interrogantes y resolver problemas es el cometido de las
diversas ciencias y de las instituciones en las que se generan y transmiten los nuevos
conocimientos.
Investigar es seguir un proceso para obtener una información, no conocida hasta el
momento, sobre un asunto determinado.
Para realizar una investigación es muy importante tener bien definido el proceso a seguir.
Esto ayudará a no perder de vista el objeto, y a elegir los métodos más eficaces.
Nos centraremos ahora en la preparación y ejecución de una investigación de tipo
estadístico, en la que se realzara una especie de investigación de mercados en la que se
deberán seguir una serie de pasos los cuales nos permitirán darle solución a un problema
que se planteara dentro de un marco empresarial.
Para realizar una investigación estadística se debe tener en cuenta los siguientes pasos:
1.
2.
3.
4.
5.
6.
7.
Planeamiento y preparación.
Recolección de datos.
Crítica y codificación.
Tabulación y procesamiento.
Análisis e interpretación.
Publicación de resultados.
Planeamiento y preparación.
8.
Recolección de datos.
9. Crítica y codificación.
10. Tabulación y procesamiento.
11. Análisis e interpretación.
12. Publicación de resultados.
A continuación veremos cada uno de los pasos que se deben seguir en un proceso de
investigación de tipo estadístico.
MATEMATICAS - Estadística 11
43
PGF03-R03
PLANTEAMIENTO Y PREPARACION DE UNA INVESTIGACION
ESTADISTICA
Toda recolección de datos estadísticos, requiere el establecimiento precio de un plan que
detalle los aspectos que la investigación va a abarcar, que fije los procedimientos que se van
a seguir.
En general, un proyecto o plan de investigación estadística debe contemplar los siguientes
aspectos:
1. El objeto de la investigación: nos referimos al hecho o fenómeno que vamos a observar
y registrar numéricamente. En una investigación de salarios, el salario; en un censo de
población, los habitantes; en una estadística industrial, la empresa; en una investigación de
mercados, el cliente.
En el proyecto, al analizar qué es lo que vamos a investigar, nos proponemos:
1.1 Definir el objeto o unidad de investigación: Vamos a emprender un censo de
edificios: ¿Qué es un edificio para efectos de la recolección de los datos?. En una
investigación de salarios: ¿a qué salarios nos referimos?. En una investigación industrial:
¿Qué hemos de entender como industria ó empresa ó fábrica? La primera cuestión por
tanto, al tratar el objeto de la investigación es la fijación precisa del concepto de lo que se
aspira a indagar. Decir con claridad y exactitud qué es lo que la estadística va a
investigar.
1.2 Determinar la naturaleza cualitativa y cuantitativa del objeto de investigación: Es
decir, advertir que aspectos del fenómeno que se va a investigar son cuantitativos y
consecuentemente pueden registrarse por medio de números y cuales otros por ser
cualitativos, se han de recoger mediante anotaciones literarias.
1.3 Determinar la posibilidad de la investigación: De los aspectos establecidos en el
punto anterior, no basta con saber cuál es el objeto a investigar, y cuales sus
modalidades cuantitativas y cualitativas; se necesita examinar si una y otras pueden ser
reconocidas con precisión.
1.4 Limitar el objeto investigable: Conocemos lo que vamos a investigar, sus modalidades
cuantitativas y cualitativas, y la posibilidad de registrarlas. A continuación el proyecto
tiene que delimitar la investigación. Todo objeto a investigar en si, en el tiempo y en el
espacio, y a veces en el número. La estadística reduce sus trabajos a un doble aspecto:
a. Limitando el objeto mismo de la investigación.
b. limitando el campo de acción de la investigación.
2. La finalidad de la investigación: El proyecto de investigación estadística tiene que
atender, los fines que se persiguen con la investigación, porque así como sean estos, habitan
de ser los demás puntos del proyecto: la fuente de información, los procedimientos, el
material, y en consecuencia el presupuesto.
MATEMATICAS - Estadística 11
44
PGF03-R03
MODELACIÓN:
se organiza una estadística de natalidad. Se puede aspirar a muy diferentes fines; por
ejemplo se trata de conocer la proporción de los sexos con un propósito biológico, o si no (y
este es otro fin), con un propósito demográfico de la población que entra a la vida. En el
primer caso, el fin nos obliga a preguntar por el sexo de los hijos nacidos, muertos o vivos; en
el segundo caso, nos bastara con indagar los nacidos vivos.
3. Las fuentes de información: Hasta ahora se ha analizado lo que se desea investigar y el
por qué de la investigación. Lo siguiente es preguntarse: ¿Dónde es posible recoger alguna
información sobre el fenómeno a estudiar?, ¿en donde podremos registrar los datos que
obtenemos?. Las fuentes de información se clasifican en:
3.1 Fuentes primarias: son aquellos datos obtenidos ya sea por encuesta directa o
mediante la utilización de cuestionarios, o como resultado de la observación directa; es
una técnica muy utilizada en estudios de carácter científico o de investigación de
mercados. Se puede decir también que son datos publicados por quien recoge
directamente de la fuente de información primaria. Son fuentes primarias: Personales;
(entrevistas, correo, llamadas telefónicas), Unipersonales (auditoria, análisis de rastreo,
simulación); Simulaciones.
3.2 Fuentes secundarias: En estas, los datos se obtienen de publicaciones, las cuales
pueden ser reproducciones totales o parciales. Son valiosas para cualquier tipo e
investigación. Son fuentes secundarias: bibliotecas, centros de documentación, folletos,
revistas archivos etc.
3.3 Series temporales: Denominadas como series de tiempo o series cronológicas. Son las
obtenidas y ordenadas en forma cronológica, siendo el resultado de investigaciones y
observaciones periódicas: días, meses, años. Cuando las investigaciones son aisladas,
es decir, no presentan periodicidad continuada, las estadísticas se llaman atemporales o
aisladas.
4. Los procedimientos de la investigación: ¿Qué características debe reunir una
investigación? ¿Bajo qué formas haremos la recolección del os datos?
En este aspecto del proyecto, comúnmente los autores incluyen varias consideraciones, que
se ajusten a estos interrogantes: ¿Cómo investigaremos?, ¿Quién debe hacer la
investigación y porque sistema?, es decir ¿Cuáles deben ser las normas generales y
particulares de la estadística que proyectamos?
4.1 Claridad y publicidad: Toda investigación, en sus pormenores, debe ser clara y
conocida por todos los que en ella vayan a intervenir: observadores y observados.
4.2 Sencillez: En todo. En los formularios, en las instrucciones, en proyecto, en la finalidad,
en los tablas y graficas, en los comentarios y/o el análisis, en las operaciones de calculo.
MATEMATICAS - Estadística 11
45
PGF03-R03
4.3 Utilidad: Todo proyecto estadístico que se inicie debe tener alguna aplicación práctica de
interés. De otro modo nos hallaremos ante una acumulación de datos que perjudicaran,
por muchos motivos, a la información realmente aprovechable, a los negocios y al
política económica de un país.
¿Cuándo deberá efectuarse la recopilación de los datos estadísticos? En el denominado
momento estadístico. Las investigaciones pueden ser:
a. Ocasional: Cuando se realiza en circunstancias extraordinarias, cuando eventualmente se
presenta un problema, o se agita su solución. Ej. Una investigación sobre el consto de
vida cuando se plantea una huelga general.
b. Continua: Es decir, que se produce sin interrupción. Ej. Las informaciones demográficas
(La natalidad, la mortalidad, la nupcialidad); las de criminalidad, etc.
5. El material estadístico: Está constituido por todos los útiles, documentos o instrumentos
necesarios para llevar a buen fin la investigación.
El proyecto tiene que enumerarlo en sus clases y en su número. Podemos dividirlo en:
material impreso e instrumental.
5.1 Material impreso: Se refiere a los formularios o cuestionarios, boletines, hojas de
inscripción, registros, circulares, pliegos de instrucciones.
5.2 Material instrumental: son todos los útiles o herramientas que se utilizan tanto para la
recolección de los datos como de la sistematización y posterior impresión de los mismos.
Ej. Lápices, computador, impresora, etc.
6. El presupuesto de la investigación: comprende el cálculo del costo y la financiación de
la investigación; ya que hacer una investigación algunas veces es un procedimiento costoso,
por eso es necesario hacer un plan de gastos (Presupuesto) que permita prever lo que se
gastará durante el proceso las partidas del costo, en general suelen ser las siguientes:
a. ORGANIZACIÓN
 Estudios preliminares
 Asesorías
 Trabajos geográficos
 Formulación del plan
 Plan de propaganda
MATEMATICAS - Estadística 11
46
PGF03-R03
 Impresión del formulario
 Adiestramiento de personal
 Contratación de servicios auxiliares
 Materiales y equipos
b. TRABAJOS DE CAMPO
c. SISTEMATIZACION
d. PUBLICACION
Los seis aspectos anteriormente mencionados, constituyen parte esencial en la planeación
de un proyecto estadístico.
RECOLECCION DE LOS DATOS
Cuando se tiene planeada la investigación, comienza la recolección definitiva de los datos.
La recolección de los datos consiste en un conjunto de operaciones de observación y
anotación o registro de los hechos en formularios para este efecto. La traducción de los
fenómenos aislados a expresiones numéricas.
De la tarea de recolección depende todo el resultado posterior de la estadística.
Si está mal hecha, la elaboración resultará incorrecta e incluso imposible de efectuar, y si se
realiza, dará origen a un análisis erróneo y a interpretaciones con muy distintos fines.
Su valor como medio de control, porque los datos previstos, su distribución y su
peculiaridades indican la calidad del material (Formularios), el personal indispensable, la
propaganda conveniente, la duración, los sistemas de datos.
La etapa de recolección comprende varios aspectos:
a. Distribución del material
b. La recolección propiamente dicha.
c. Control del número de formularios recolectados.
d. Control sobre la calidad de las informaciones recogidas.
MATEMATICAS - Estadística 11
47
PGF03-R03
CRÍTICA Y CODIFICACION
De la investigación se obtienen los datos individuales, colectivos o aislados. Cada cifra
presenta la intensidad de un hecho particular; el salario de un obrero, la producción de una
fabrica o los préstamos otorgados por una entidad crediticia.
Todo ese conjunto de información recogido en los formularios antes de ser totalizado y
utilizado, requiere de un examen crítico, severo, con el objeto de comprobar si cumple con
estas condiciones indispensables; ¿son exactos o erróneos, completos o incompletos,
precisos o imprecisos, representativos o no representativos?
El objeto de la crítica, es clasificar el material primario que procede de la misma
investigación, en tres grupos: material bueno, material incorrecto pero corregible, y material
incorregible o desechable.
La clase y la importancia del error cometido, determinan la admisión o no del dato primitivo
resultante de la observación. Además se critican los datos numéricos directos, para
establecer las causas de los errores y modificar o perfeccionar las fuentes y los métodos de
observación.
Difícilmente se consigue, por primera vez, que las informaciones sean prefectas, en cuanto a
la exactitud, al a extensión y consecuencialmente en cuento a la responsabilidad de las
investigaciones parciales.
TABULACION Y PROCESAMIENTO
Se puede hacer manual o sistematizadamente y la elección del método dependerá:
a. De la cantidad de formularios que se van a utilizar.
b. Del número de preguntas que tenga el formulario.
c. Del tiempo y de los recursos, ya sea financieros o de equipo disponibles.
La tabulación consiste en introducir los datos obtenidos de las encuestas o formularios dentro
de tablas de frecuencias que permitan un entendimiento más fácil de los datos, y su posterior
graficación consiste en traducir los datos de las tablas graficas de frecuencias, como los de
barras o circular, permitiendo un impacto visual que ayude a interpretar los datos con mayor
facilidad.
MATEMATICAS - Estadística 11
48
PGF03-R03
ANALISIS E INTERPRETACION.
Esta etapa se puede considerar como la más importante que tiene el informe, ya que el
análisis de los datos tendrá que ver con la formulación del objetivo mismo de la investigación;
sin embargo, este proceso de análisis tendrá menos dificultad, si el investigador tiene pleno
conocimiento de los problemas que son inherentes al planeamiento de una investigación
Dentro del análisis esta el interpretar críticamente los datos extraídos de las tablas y graficas
de frecuencias, conectar las preguntas, relacionar y comparar resultados, determinar causas
y consecuencias. Además es en esta etapa donde se formulan soluciones al o los problemas
planteados y se dan sugerencias para su solución.
De esta última fase de la metodología se puede decir que encierra dos aspectos:
a. Análisis y evaluación estadística de los resultados.
b. Análisis y evaluación técnica de acuerdo con la naturaleza de la investigación.
PUBLICACIÓN
Corresponde a la fase final de la investigación, y con ella se propone hacer llegar a las
personas interesadas el resultado total del estudio, teniendo en cuenta todos los aspectos
considerados en el proceso, de tal forma que los datos sean comprensibles, con la
correspondiente validez que merezcan las conclusiones.
El informe (Trabajo final de la investigación), además de presentarse cumpliendo los
requerimientos de las normas ICONTEC, debe contener lo siguiente:
1. ANTECEDENTES.
1.1 Reseña histórica.
1.2 Sector económico.
2. OBJETIVOS
2.1 Objetivo general.
2.2 Objetivos específicos.
3. JUSTIFICACION
4. PROBLEMA
4.1 Planteamiento del problema.
5. DESCRIPCION DEL PRODUCTO O SERVICIO
5.1 Características del producto o servicio.
5.2 Tipología de la demanda.
MATEMATICAS - Estadística 11
49
PGF03-R03
5.2.1 Según criterio de la oportunidad
5.2.2 Según criterio de la temporalidad.
5.2.3 Según criterio de la necesidad.
5.2.4 Según criterio del destino.
6. ESTUDIO DEL MERCADO CONSUMIDOR
6.1 Mezcla de mercadeo.
6.1.1 Producto.
6.1.2 Precio.
6.1.3 Promoción.
6.1.4 Plaza.
6.2 Análisis de la población (N)
6.2.1 Análisis cualitativo de la población.
6.2.2 Análisis cuantitativo de la población.
6.3 Muestra.
6.4 Encuestas
6.4.1 Diseño del formulario.
6.4.2 Aplicación.
7. RESULTADOS
7.1 Tabulación y graficas
7.2 Análisis e interpretación.
7.3 Planteamiento de soluciones.
8. PRESUPUESTO
9. ANEXOS
10. BIBLIOGRAFIA
La publicación del informe se hará en una exposición de los resultados en la que intervendrá
además del docente de la asignatura, dos jurados quienes emitirán un concepto que hará
parte de la nota final de estadística.
MATEMATICAS - Estadística 11
50
PGF03-R03
BIBLIOGRAFIA
 Estadística Y Muestreo. Martínez, Bencardino Ciro. Editorial. MC Graw Hill.
 Estadística aplicada a las ciencias sociales y a la educación. Editorial Mc Graw Hill.
 Estadística y probabilidad para ingenieros. Editorial Shawm.
 www. Wikipedia.com
 www.uaq.com
 www.hyru.com
“El poder se nutre de la información y el conocimiento”
MATEMATICAS - Estadística 11
51
Documentos relacionados
Descargar