Departamento de Estatística e Investigación Operativa Prácticas de SPSS Estatística Básica Facultade de Ciencias de Ourense PRÁCTICA 2 : PRINCIPALES DISTRIBUCIONES 1. Crea el fichero de muestras muestra1.sav. a) Genera una muestra aleatoria simple de tamaño 500 de una variable Bi(10,0.5) llamada bin1 y una muestra aleatoria simple de tamaño 500 de una variable Bi(50,0.5) llamada bin2. Procedimiento: Define la variable bin1 en Vista de variables. Posiciónate en la fila 500 de Vista de datos e introducimos un valor. Transformar + Calcular. En Variable de destino introducimos bin1 y en Expresión numérica RV.BINOM(10,0.5). Transformar + Calcular. En Variable de destino introducimos bin2 y en Expresión numérica RV.BINOM(50,0.5). b) Calcula la media y la varianza para ambas variables. Procedimiento: Analizar + Estadísticos descriptivos + Descriptivos. c) Compara estas distribuciones con la distribución normal mediante una representación gráfica. Procedimiento: Gráficos + Histograma. En Variable introducimos bin1 y seleccionamos la opción de Mostrar curva normal. Hacemos lo mismo con bin2. 2. En este ejercicio vamos a estudiar la distribución Bi(25,0.5). Para ello definimos el fichero binomial.sav. Seguiremos los siguientes pasos: a) Definimos la variable valores que variará de 0 a 25. Procedimiento: En Vista de variables introducimos la variable valores, que será una variable tipo numérico, y en Vista de datos introducimos en los números enteros del 0 a 25 en cada una de las celdas hasta la fila 25. b) Creamos otra variable llamada disbin para obtener la función de distribución de una Bi(25,0.5). Procedimiento Transformar + Calcular. En Variable de destino introduce disbin y en Expresión numérica introduce CDF.BINOM(valores,25,0.5). c) Representa gráficamente esta variable. Procedimiento: Gráficos + Dispersión. Selecciona Dispersión simple y elige Definir. En Eje Y introduce disbin y en Eje X introduce valores. d) Creamos la variable probin para obtener la función de masa de probabilidad de la Bi(25,0.5). 1 Procedimiento: Transformar + Calcular. En Variable de destino introduce probin y en Expresión numérica introduce PDF.BINOM(valores,25,0.5). e) Representa gráficamente la variable probin. Procedimiento: Gráficos + Barras. Selecciona Simple y Resúmenes para grupos de datos. Elige Definir. Elegir Las barras representan otro estadístico tomando la variable probin. En Eje de categorías elegimos valores. f) Considera la variable X=Bi(25,0.5). Calcula: 1. P(X>12) Procedimiento: Calculamos P(X>12)=1-P(X≤12)=1-F(12). Transformar + Calcular. En Variable de destino ponemos prob1 y en Expresión numérica ponemos 1CDF.BINOM(12,25,0.5). 2. P(X≤20/X>12) Procedimiento: Calculamos P(X≤20/X>12)=P(12<X≤20)/P(X>12)=(P(X≤20)-P(X≤12))/P(X>12). Transformar + Calcular. En Variable de destino ponemos prob2 y en Expresión numérica ponemos (CDF.BINOM(20,25,0.5)-CDF.BINOM(12,25,0.5))/CDF.BINOM(12,25,0.5). 3. La mediana. Procedimiento: Se obtiene viendo los valores de la función de distribución. 3. Genera una muestra aleatoria simple de tamaño 500 de una variable X que sigue una distribución N(30,20). Para ello crearemos el fichero muestra2.sav. a) Calcula la media y la varianza correspondiente a esta muestra. Procedimiento: En Vista de variables definimos la variable x. Nos posicionamos en la última fila de Vista de datos y pulsamos enter hasta que tengamos 500 filas. Ponemos en la primera celda de esa fila cualquier valor. Transformar + Calcular. En Variable de destino ponemos x y en Expresión numérica ponemos RV.NORMAL(30,20). Para obtener la media y la varianza ponemos Analizar + Estadísticos descriptivos + Descriptivos. b) Representa los datos mediante un histograma y compáralos con la distribución normal. Procedimiento: Gráficos + Histograma. En Variable ponemos x y seleccionamos la opción Mostrar curva normal. c) Representa los datos mediante un diagrama de caja. Procedimiento: Gráficos + Diagramas de caja + Simples + Resúmenes para distintas variables. 4. En este ejercicio vamos a estudiar las distribuciones N(0,0.5), N(0,1) y N(0,2). Para ello creamos el fichero de datos normales.sav. a) Genera una muestra aleatoria simple de tamaño 300 de una variable llamada valores que sigue una distribución uniforme en el intervalo (-5,5). 2 Procedimiento: Define la variable valores en Vista de variables. Posiciónate en la fila 300 de Vista de datos e introducimos un valor. Transformar + Calcular. En Variable de destino introducimos valores y en Expresión numérica ponemos RV.UNIFORM(-5,5). b) Ordena los datos correspondientes a la variable valores de menor a mayor. Procedimiento: Datos + Ordenar casos. En Ordenar por introduce valores. En Orden de clasificación selecciona Ascendente. c) Crea las variables normal1, normal2 y normal3 donde: • normal1 corresponde a la función de densidad de la N(0,0.5) evaluada en los puntos que nos da la variable valores. • normal2 corresponde a la función de densidad de la N(0,1) evaluada en los puntos que nos da la variable valores. • normal3 corresponde a la función de densidad de la N(0,2) evaluada en los puntos que nos da la variable valores. Procedimiento para N(0,0.5): Hay dos formas diferentes de hacerlo: 1ª) Mediante la función PDF. Transformar + Calcular. En Variable de destino introduce normal1 y en Expresión numérica introduce PDF.NORMAL(valores,0,0.5) 2ª) Directamente. Para ello recordemos que la función de densidad de una variable N(μ,σ) viene dada por f ( x) = 1 2πσ 2 − e 1 ( x − μ )2 2 σ2 Transformar + Calcular. En Variable de destino introduce normal1 y en Expresión numérica introduce 1/SQRT(2*3.14159*0.25)*EXP(-0.5*(valores**2)/0.25). d) Representa gráficamente las tres variables normal1, normal2 y normal3 superponiendo los gráficos. Procedimiento: Gráficos + Dispersión. Selecciona Superpuesto y elige Definir. En Pares Y-X introduce normal1-valores, normal2-valores y normal3-valores. En Editor de gráficos elige Elementos y selecciona Línea de interpolación y Ocultar marcadores de líneas. e) Crea la variable disnor, correspondiente a la función de distribución de la N(0,1) evaluada en los puntos que nos da la variable valores. Procedimiento: Transformar + Calcular. En Variable de destino introduce distribn y en Expresión numérica CDF.NORMAL(valores,0,1). f) Representa gráficamente esta variable. Procedimiento: Gráficos + Dispersión. Selecciona Dispersión simple y elige Definir. En Eje Y introduce la variable disnor y en Eje X la variable valores. En Editor de gráficos elige Elementos y selecciona Línea de interpolación y Ocultar marcadores de líneas. g) Considera la variable X=N(0,1) y calcula: 1. P(0.5<X<1) 3 Procedimiento: Transformar+Calcular. En Variable de destino introduce prob1 y en Expresión numérica CDF.NORMAL(1,0,1)CDF.NORMAL(0.5,0,1). 2. P(X>2) Procedimiento: Transformar + Calcular. En Variable de destino introduce prob2 y en Expresión numérica 1-CDF.NORMAL(2,0,1). 3. el punto a tal que P(X≤a)=0.95 Procedimiento: Transformar + Calcular. En Variable de destino introduce a y en Expresión numérica IDF.NORMAL(0.95,0,1). EJERCICIOS 5. Representa gráficamente las densidades de las distribuciones Chi-cuadrado χ2 de 2, 4 y 6 grados de libertad. Para ello crearemos el fichero chi2.sav y generaremos una muestra aleatoria simple de tamaño 300 de una U(0,10). 6. En este ejercicio vamos a estudiar la distribución Exp(6). Para ello creamos el fichero expo.sav. Para ello debes generar una muestra aleatoria simple de tamaño 300 de una U(0,10). a) Obtén la variable denexp, que será la función de densidad exponencial evaluada en los puntos que hemos obtenido. Haz la representación gráfica. b) Obtén la variable disexp, que será la función de distribución exponencial evaluada en los puntos que hemos obtenido. Haz la representación gráfica. c) Considera X=Exp(6). Calcula P(X<2), P(X>5/X<3) y la mediana. 7. En una centralita telefónica se reciben una media de 30 llamadas por hora. Sea X=”Número de llamadas que se reciben en 1 hora”. Calcula con ayuda del SPSS: a) La probabilidad de que se reciban más de 35 llamadas en 1 hora. b) La probabilidad de recibir menos de 5 llamadas en 5 minutos. c) La probabilidad de que transcurran más de 5 minutos entre dos llamadas consecutivas. 4