PRÁCTICA 2 : PRINCIPALES DISTRIBUCIONES 1

Anuncio
Departamento de Estatística e Investigación Operativa
Prácticas de SPSS
Estatística Básica
Facultade de Ciencias de Ourense
PRÁCTICA 2 : PRINCIPALES DISTRIBUCIONES
1. Crea el fichero de muestras muestra1.sav.
a) Genera una muestra aleatoria simple de tamaño 500 de una variable Bi(10,0.5) llamada bin1
y una muestra aleatoria simple de tamaño 500 de una variable Bi(50,0.5) llamada bin2.
Procedimiento:
Define la variable bin1 en Vista de variables.
Posiciónate en la fila 500 de Vista de datos e introducimos un valor.
Transformar + Calcular. En Variable de destino introducimos bin1 y en Expresión numérica
RV.BINOM(10,0.5).
Transformar + Calcular. En Variable de destino introducimos bin2 y en Expresión numérica
RV.BINOM(50,0.5).
b) Calcula la media y la varianza para ambas variables.
Procedimiento:
Analizar + Estadísticos descriptivos + Descriptivos.
c) Compara estas distribuciones con la distribución normal mediante una representación
gráfica.
Procedimiento:
Gráficos + Histograma.
En Variable introducimos bin1 y seleccionamos la opción de Mostrar curva normal.
Hacemos lo mismo con bin2.
2. En este ejercicio vamos a estudiar la distribución Bi(25,0.5). Para ello definimos el fichero
binomial.sav. Seguiremos los siguientes pasos:
a) Definimos la variable valores que variará de 0 a 25.
Procedimiento: En Vista de variables introducimos la variable valores, que será una variable
tipo numérico, y en Vista de datos introducimos en los números enteros del 0 a 25 en cada una
de las celdas hasta la fila 25.
b) Creamos otra variable llamada disbin para obtener la función de distribución de una
Bi(25,0.5).
Procedimiento
Transformar + Calcular.
En Variable de destino introduce disbin y en Expresión numérica introduce
CDF.BINOM(valores,25,0.5).
c) Representa gráficamente esta variable.
Procedimiento: Gráficos + Dispersión.
Selecciona Dispersión simple y elige Definir.
En Eje Y introduce disbin y en Eje X introduce valores.
d) Creamos la variable probin para obtener la función de masa de probabilidad de la
Bi(25,0.5).
1
Procedimiento: Transformar + Calcular.
En Variable de destino introduce probin y en Expresión numérica introduce
PDF.BINOM(valores,25,0.5).
e) Representa gráficamente la variable probin.
Procedimiento: Gráficos + Barras.
Selecciona Simple y Resúmenes para grupos de datos. Elige Definir.
Elegir Las barras representan otro estadístico tomando la variable probin. En Eje de categorías
elegimos valores.
f) Considera la variable X=Bi(25,0.5). Calcula:
1. P(X>12)
Procedimiento: Calculamos P(X>12)=1-P(X≤12)=1-F(12).
Transformar + Calcular.
En Variable de destino ponemos prob1 y en Expresión numérica ponemos 1CDF.BINOM(12,25,0.5).
2. P(X≤20/X>12)
Procedimiento: Calculamos P(X≤20/X>12)=P(12<X≤20)/P(X>12)=(P(X≤20)-P(X≤12))/P(X>12).
Transformar + Calcular.
En Variable de destino ponemos prob2 y en Expresión numérica ponemos
(CDF.BINOM(20,25,0.5)-CDF.BINOM(12,25,0.5))/CDF.BINOM(12,25,0.5).
3. La mediana.
Procedimiento: Se obtiene viendo los valores de la función de distribución.
3. Genera una muestra aleatoria simple de tamaño 500 de una variable X que sigue una
distribución N(30,20). Para ello crearemos el fichero muestra2.sav.
a) Calcula la media y la varianza correspondiente a esta muestra.
Procedimiento: En Vista de variables definimos la variable x.
Nos posicionamos en la última fila de Vista de datos y pulsamos enter hasta que tengamos 500
filas. Ponemos en la primera celda de esa fila cualquier valor.
Transformar + Calcular.
En Variable de destino ponemos x y en Expresión numérica ponemos RV.NORMAL(30,20).
Para obtener la media y la varianza ponemos Analizar + Estadísticos descriptivos +
Descriptivos.
b) Representa los datos mediante un histograma y compáralos con la distribución normal.
Procedimiento: Gráficos + Histograma.
En Variable ponemos x y seleccionamos la opción Mostrar curva normal.
c) Representa los datos mediante un diagrama de caja.
Procedimiento: Gráficos + Diagramas de caja + Simples + Resúmenes para distintas variables.
4. En este ejercicio vamos a estudiar las distribuciones N(0,0.5), N(0,1) y N(0,2). Para ello
creamos el fichero de datos normales.sav.
a) Genera una muestra aleatoria simple de tamaño 300 de una variable llamada valores que
sigue una distribución uniforme en el intervalo (-5,5).
2
Procedimiento: Define la variable valores en Vista de variables.
Posiciónate en la fila 300 de Vista de datos e introducimos un valor.
Transformar + Calcular.
En Variable de destino introducimos valores y en Expresión numérica ponemos
RV.UNIFORM(-5,5).
b) Ordena los datos correspondientes a la variable valores de menor a mayor.
Procedimiento: Datos + Ordenar casos. En Ordenar por introduce valores.
En Orden de clasificación selecciona Ascendente.
c) Crea las variables normal1, normal2 y normal3 donde:
• normal1 corresponde a la función de densidad de la N(0,0.5) evaluada en los puntos
que nos da la variable valores.
• normal2 corresponde a la función de densidad de la N(0,1) evaluada en los puntos que
nos da la variable valores.
• normal3 corresponde a la función de densidad de la N(0,2) evaluada en los puntos que
nos da la variable valores.
Procedimiento para N(0,0.5): Hay dos formas diferentes de hacerlo:
1ª) Mediante la función PDF.
Transformar + Calcular.
En Variable de destino introduce normal1 y en Expresión numérica introduce
PDF.NORMAL(valores,0,0.5)
2ª) Directamente. Para ello recordemos que la función de densidad de una variable N(μ,σ)
viene dada por
f ( x) =
1
2πσ 2
−
e
1 ( x − μ )2
2 σ2
Transformar + Calcular.
En Variable de destino introduce normal1 y en Expresión numérica introduce
1/SQRT(2*3.14159*0.25)*EXP(-0.5*(valores**2)/0.25).
d) Representa gráficamente las tres variables normal1, normal2 y normal3 superponiendo los
gráficos.
Procedimiento: Gráficos + Dispersión.
Selecciona Superpuesto y elige Definir.
En Pares Y-X introduce normal1-valores, normal2-valores y normal3-valores.
En Editor de gráficos elige Elementos y selecciona Línea de interpolación y Ocultar marcadores
de líneas.
e) Crea la variable disnor, correspondiente a la función de distribución de la N(0,1) evaluada
en los puntos que nos da la variable valores.
Procedimiento: Transformar + Calcular.
En Variable de destino introduce distribn y en Expresión numérica CDF.NORMAL(valores,0,1).
f) Representa gráficamente esta variable.
Procedimiento: Gráficos + Dispersión.
Selecciona Dispersión simple y elige Definir.
En Eje Y introduce la variable disnor y en Eje X la variable valores.
En Editor de gráficos elige Elementos y selecciona Línea de interpolación y Ocultar marcadores
de líneas.
g) Considera la variable X=N(0,1) y calcula:
1. P(0.5<X<1)
3
Procedimiento: Transformar+Calcular.
En Variable de destino introduce prob1 y en Expresión numérica CDF.NORMAL(1,0,1)CDF.NORMAL(0.5,0,1).
2. P(X>2)
Procedimiento: Transformar + Calcular.
En Variable de destino introduce prob2 y en Expresión numérica 1-CDF.NORMAL(2,0,1).
3. el punto a tal que P(X≤a)=0.95
Procedimiento: Transformar + Calcular.
En Variable de destino introduce a y en Expresión numérica IDF.NORMAL(0.95,0,1).
EJERCICIOS
5. Representa gráficamente las densidades de las distribuciones Chi-cuadrado χ2 de 2, 4 y 6
grados de libertad. Para ello crearemos el fichero chi2.sav y generaremos una muestra
aleatoria simple de tamaño 300 de una U(0,10).
6. En este ejercicio vamos a estudiar la distribución Exp(6). Para ello creamos el fichero
expo.sav. Para ello debes generar una muestra aleatoria simple de tamaño 300 de una
U(0,10).
a) Obtén la variable denexp, que será la función de densidad exponencial evaluada en los
puntos que hemos obtenido. Haz la representación gráfica.
b) Obtén la variable disexp, que será la función de distribución exponencial evaluada en los
puntos que hemos obtenido. Haz la representación gráfica.
c) Considera X=Exp(6). Calcula P(X<2), P(X>5/X<3) y la mediana.
7. En una centralita telefónica se reciben una media de 30 llamadas por hora. Sea X=”Número
de llamadas que se reciben en 1 hora”. Calcula con ayuda del SPSS:
a) La probabilidad de que se reciban más de 35 llamadas en 1 hora.
b) La probabilidad de recibir menos de 5 llamadas en 5 minutos.
c) La probabilidad de que transcurran más de 5 minutos entre dos llamadas consecutivas.
4
Descargar