Aplicaciones de la hoja de cálculo excel a la estadística

Anuncio
APLICACIONES DE LA HOJA DE CÁLCULO EXCEL
A LA ESTADÍSTICA
Llorente, F.
Marín, S.
Carrillo, M
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
INDICE
Introducción................................................................................................................. 3
Nociones de utilización del Excel................................................................................ 4
Tablas Dinámicas........................................................................................................16
Análisis de datos.........................................................................................................34
 Llorente, F. ; Marín, S. ; Carrillo, M.
2
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Introducción
Hasta el presente momento el alumno ha ido aprendiendo un conjunto de métodos y
técnicas de la Estadística Descriptiva, tanto a nivel teórico como práctico, realizando
diversos ejercicios en los que su instrumento tecnológico está siendo la calculadora. Sin
embargo, las empresas disponen de un conjunto de programas informáticos que facilitan
enormemente los cálculos operativos que son necesarios en la búsqueda del valor de
diversos indicadores, así como efectuar las respectivas presentaciones gráficas de las
variables que pueden analizar, bien sean cuantitativas o cualitativas. Su adecuada
utilización implica obtener superior productividad en la obtención de los resultados que se
buscan.
Por tales cuestiones, el profesorado de Estadística Empresarial I en ADE ha decidido que
de los diferentes software disponibles en el mercado, el más aconsejable a conocer y
utilizar en diversas prácticas en nuestra asignatura, será el Microsoft Excel que está
incluido dentro del Microsoft Office. Entre los factores que más han incidido en nuestra
selección son que su utilización es sencilla, recoge las técnicas estadísticas estudiadas, y
porque está al alcance de cualquier persona que disponga de ordenador actualmente.
El objetivo de las práctica que vamos a realizar con el programa Microsoft Excel es que el
alumno verifique las posibilidades de rapidez de cálculo que ofrecen un conjunto de
herramientas incluidas en el programa Microsoft Excel, así como que vaya aprendiendo a
utilizar un programa que entendemos que es básico para cualquier economista.
 Llorente, F. ; Marín, S. ; Carrillo, M.
3
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Nociones de utilización del Excel
Abril Exel
Para conseguir entrar en el programa Microsoft Excel, como cualquier programa que se
instala sobre Windows, se puede abrir mediante la opción PROGRAMAS del menú
INICIO. De la variedad de programas disponibles en Windows hay que seleccionar
Microsoft Excel. Es decir, seleccione sucesivamente con un clic:
•
Inicio
•
Programas
•
Microsoft Excel
En la imagen siguiente se indica con las respectivas flechas tales pasos.
2
3
1
Al hacer clic en la opción Microsoft Excel (paso 3), aparece la ventana principal de Excel.
 Llorente, F. ; Marín, S. ; Carrillo, M.
4
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Una vez dentro del programa, para disponer de los datos necesita abrir el fichero donde se
encuentran. Para ello seleccione menú y haga clic primero en Archivo, luego clic en
Abrir, en donde dispone del conjunto de archivos de Excel (tienen la extensión .xls). En la
unidad C usted debe elegir el archivo, que en nuestro caso es: Estadística I (prueba).xls,
para lo que debe posicionarse encima del mismo y haga clic.
A continuación le aparece el documento de Microsoft Excel, que en el argot informático se
denomina libro de trabajo. Un libro se compone de varias hojas de cálculo. En el libro
nuevo que usted ha creado dispone de tres hojas de cálculo, aunque inicialmente la que está
activa por defecto es la Hoja 1. Observe en la imagen siguiente que en la parte inferior
izquierda de la hoja, donde señala la flecha, aparece Hoja 1 (las letras en negrito y el
entorno en blanco).
 Llorente, F. ; Marín, S. ; Carrillo, M.
5
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Si quisiera pasar a alguna de las otras dos hojas debería hacer un clic en la etiqueta de la
Hoja 2 o bien de la Hoja 3. Por ejemplo, si hacemos clic en la etiqueta de la Hoja 2, al
activarse ésta deja de estar en gris y pasa a estar en negrito y en blanco su contorno. En
cambio la hoja 1 se desactiva y pasa a estar en gris.
Cada hoja activada se divide en 65.536 filas y 256 columnas (desde A hasta IV).
La intersección de una fila y una columna se denomina celda. Cada una de ellas la
identificamos con la letra de la columna a la que pertenece y por el número de fila. Por
ejemplo, la primera celda de una hoja es A1. Asimismo la celda C15, se refiere a la
columna C y la fila 15.
En una celda usted puede escribir un texto, un valor, e incluso una fórmula que haga
referencia a otras celdas que dispongan de valores.
Supongamos que a una empresa le interesara establecer una tabla donde aparezca el origen
geográfico de sus compras de cierto artículo y el precio unitario asociado a cada uno de los
mismos. Los datos de la citada tabla son los siguientes.
Origen
Nº artículos Precio unitario
España
40
1700
Alemania 15
1500
Francia
35
2000
Suecia
6
1600
 Llorente, F. ; Marín, S. ; Carrillo, M.
6
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Al escribir esta tabla en la hoja del Excel, debe diferenciar el texto y los números. Como
establece la siguiente imagen observe que se ha escrito texto en las Celdas: A1, A2, A3,
A4, B1 y C1. Por ejemplo, en la celda A1 hemos escrito Origen. En cambio, tenemos
valores en las celdas: B2, B3, B4, B5, C2, C3, C4 y C5. Obsérvese que en la imagen se
refleja que la celda que está activa es C5, y que incorpora el valor 1600.
Podemos también incorporar en las celdas fórmulas, utilizando diversas operaciones, como
son la suma, resta multiplicación y división. Como ejemplo, de los datos anteriores puedo
buscar el número de artículos totales, haciendo referencia a las celdas donde están los
respectivos valores. Para ello se posiciona el cursor en la celda B6, hacemos clic, y en tal
celda escribimos la fórmula: =SUMA(B5:B6) que es equivalente a sumar B2+B3+B4+B5.
Al presionar Intro nos sale en la celda B6 el resultado de la fórmula escrita, que es 96.
La barra de fórmulas es donde usted puede editar el contenido de una celda,
estableciendo las fórmulas que desee. En la imagen anterior corresponde al espacio que
indican las respectivas puntas de las flechas. Observe que en la barra de fórmulas aparece
escrita la fórmula anterior con el signo de igualdad delante =SUMA(B2:B5). En la parte
izquierda de tal barra de fórmulas, usted puede visualizar la referencia de la celda que está
activa (B6).
 Llorente, F. ; Marín, S. ; Carrillo, M.
7
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
También podría buscar los Importes asociados a cada Origen. Utilizando, por ejemplo, las
celdas paralelas de la columna D. En tal caso, para los artículos de origen de Alemania
debe colocar el puntero en D2, hacer clic, y después escribir la fórmula que recoge el
Importe, que es Cantidad multiplicada por Precio, por lo que para nuestro caso concreto
es: =B2*C2. Observe que en la celda D2 aparece el valor: 68000. En cambio, en la barra de
fórmulas aparece a la izquierda D2 y a la derecha la fórmula =B2*C2.
Para obtener el importe del resto de artículos asociado a los otros orígenes, puede escribir
en cada celda las respectivas fórmulas a mano. Por ejemplo, en D3 escribir: =B3*C3 o bien
utilizar otra opción que es mantener el cursor en D2, seleccionar EDICIÓN con un clic, y
escoger COPIAR. A continuación se pone el cursor en la celda o bien un rango de celdas
(para ello se pincha con el cursor en la celda original del rango y luego ser arrastra hasta la
última celda), como en nuestro ejemplo, se elige nuevamente EDICIÓN y se termina
haciendo clic a PEGAR. Se puede usar los iconos de la Barra de Herramientas asociados a
las funciones de los menus desplegables – COPIAR ; PEGAR -
Otra opción equivalente sería usar el Llenado automático (copiar fórmulas). Para ello
debemos seleccionar la celda que contiene la formula a copiar y en la esquina inferior
derecha aparece el botón de llenado automático, pincharemos dicho botón y sin soltar
arrastraríamos hasta la ultima celda de destino.
Cuadro o botón de
llenado
 Llorente, F. ; Marín, S. ; Carrillo, M.
8
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Se podría buscar una nueva columna que recoja los importes relativos: Para ello en primer
lugar debe sumarse la columna de los importes, es decir, SUMA(D2:D5).
Creamos una nueva columna que denominamos Importes relativos y buscamos la
proporción que representa cada importe individual, según origen, respecto al importe total.
Así en E2 establecemos la fórmula: (D2/D6 )*100.
Para el resto podríamos copiar esa fórmula, pero como el denominador va a ser común,
sobre D6 apretamos F4, de forma que esa celda se convierte en una referencia absoluta,
quedando (D2/$D$6)*100, es decir, no cambiará el denominador al copiar la celda E2 y
pegar en otras.
El procedimiento es posicionar el cursor en E2, que es donde está la fórmula a copiar, y en
la esquina inferior derecha aparece el botón de llenado automático, pincharemos dicho
botón y sin soltar arrastraríamos hasta la ultima celda de destino.
 Llorente, F. ; Marín, S. ; Carrillo, M.
9
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
A continuación se suma todos los importes relativos para comprobar que la suma vale 100.
Podríamos crear diagramas de barras que recojan en el eje de abcisas los países y en las
ordenadas los importes respectivos. Para ello, del menú seleccionamos con un clic
INSERTAR, después hacemos clic a GRÁFICOS,
 Llorente, F. ; Marín, S. ; Carrillo, M.
10
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
A continuación escogemos en Tipo de gráfico a COLUMNAS, escogemos siguiente
 Llorente, F. ; Marín, S. ; Carrillo, M.
11
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Tengo las barras que reflejan los importes, pero falta que en la base de los rectángulos se
etiqueten los orígenes, porque hasta ahora aparecen números: de 1 a 4. Para ello hacemos
clic en Serie (que está en la parte superior).
Si se pincha el icono que aparece en la parte derecha de Rótulos del eje de categorías (X),
nos aparece de nuevo la hoja y seleccionamos el rango donde están los nombres de los
países de origen, damos otra vez clic en el icono y nos aparece el diagrama de barras.
 Llorente, F. ; Marín, S. ; Carrillo, M.
12
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Se hace clic en siguiente y entonces tenemos:
Si dentro de Rótulo de datos hacemos clic en MOSTRAR VALOR, se reflejan los
importes de compras respecto cada país.
 Llorente, F. ; Marín, S. ; Carrillo, M.
13
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Si ahora seleccionamos Títulos, podemos establecer el título del gráfico y dar nombre al
eje de abcisas y al eje de ordenadas.
Rellenando las tres casillas queda:
 Llorente, F. ; Marín, S. ; Carrillo, M.
14
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Si seleccionamos Terminar obtenemos el siguiente diagrama de barras:
Importes por origen
80000
70000
70000
68000
Importes
60000
50000
40000
Serie1
30000
22500
20000
9600
10000
a
a
Su
ec
i
Fr
an
ci
an
ia
em
Al
Es
pa
ña
0
Países
 Llorente, F. ; Marín, S. ; Carrillo, M.
15
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Tablas dinámicas
Las Tablas dinámicas son una herramienta para resumir y analizar datos procedentes de
listas de datos .
Para crear una Tabla dinámica , se selecciona menú DATOS / INFORME DE TABLAS
Y GRÁFICOS DINÁMICOS que activa el asistente para la creación de Tablas
Dinámicas
que consta de tres pasos diferentes – Paso 1: seleccionar el origen de los datos (Lista o
base de datos de Microsoft Excel) y el tipo de informe (Tabla dinámica), y presionar
SIGUIENTE,
Paso 2: se indica la posición que ocupan los datos incluido el rótulo que indica el nombre
de la variable y se hace clic en SIGUIENTE,
 Llorente, F. ; Marín, S. ; Carrillo, M.
16
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Paso 3: en este paso se Diseña y se determina la posición de la Tabla dinámica (celda E3)
Para diseñar la Tabla se hace clic en DISEÑO, y aparece una VENTANA DE DATOS sin
completar. Esta tabla se completará arrastrando las variables X y/o Y a los campos FILA
y/o COLUMNA, que definirán la variable o variables objeto de estudio. Al completar la
zona de DATOS estableceremos el tipo de análisis a realizar sobre la variable.
 Llorente, F. ; Marín, S. ; Carrillo, M.
17
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Por ejemplo, si la intención es establecer las Frecuencias Absolutas de la variable X,
procederemos de la siguiente forma:
1. arrastrar la variable X hasta la zona de FILA
2. arrastrar la variable X hasta la zona de DATOS, por defecto en la zona de DATOS
aparecerá SUMA de X,
pero que podemos modificar a continuación haciendo doble clic sobre SUMA de X,
entonces aparece una nueva ventana CAMPO DE LA TABLA DINÁMICA sobre la que
 Llorente, F. ; Marín, S. ; Carrillo, M.
18
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
modificaremos el NOMBRE y RESUMIR POR. Como la intención es buscar la
frecuencia Absoluta de la variable X escribimos frec absoluta en el campo NOMBRE y
en el campo RESUMIR POR seleccionamos CONTAR. A continuación presionaremos
ACEPTAR para validar y salir de la ventana de CAMPO y de nuevo ACEPTAR en la
ventana de DISEÑO
 Llorente, F. ; Marín, S. ; Carrillo, M.
19
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
por último se hace clic sobre FINALIZAR de la ventana del asistente y el resultado es una
tabla situada a partir de la celda E3 en que aparecen los valores de la variable y su
frecuencia de aparición
También podemos incorporar más información a esta Tabla de frecuencias, para ello nos
situaremos encima de la Tabla Dinámica y presionaremos el botón derecho del ratón,
apareciendo un menú en el que debemos seleccionar ASISTENTE, y volveremos a la
ventana del Asistente, y una vez allí entraremos de nuevo en DISEÑO
 Llorente, F. ; Marín, S. ; Carrillo, M.
20
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Una vez dentro de diseño incorporamos de nuevo la variable X al campo de DATOS tantas
veces como información queramos incorporar en la Tabla.
Por ejemplo podemos incorporar la Frecuencia relativa,
para conseguirlo haremos doble clic sobre SUMA de X, y modificaremos tanto el
NOMBRE: frec Relativa como el RESUMIR POR: Contar, y hacemos clic sobre
OPCIONES para desplegar un menú ampliado MOSTRAR DATOS COMO
 Llorente, F. ; Marín, S. ; Carrillo, M.
21
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
abrimos el cuadro desplegable y seleccionamos % DE LA COLUMNA
Por ejemplo podemos incorporar las siguientes magnitudes:
Media
aritmética,
para
conseguirlo haremos doble clic
sobre SUMA de X2, y
modificaremos
tanto
el
NOMBRE: Media como el
RESUMIR POR: Promedio
 Llorente, F. ; Marín, S. ; Carrillo, M.
22
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Máximo, para conseguirlo
haremos doble clic sobre
SUMA de X3, y modificaremos
tanto el NOMBRE: Máximo
como el RESUMIR POR:
Máximo,
Mínimo,
para
conseguirlo
haremos doble clic sobre
SUMA de X4, y modificaremos
tanto el NOMBRE: Mínimo
como el RESUMIR POR:
Mínimo,
Varianza, para conseguirlo
haremos doble clic sobre
SUMA de X5, y modificaremos
tanto el NOMBRE: Varianza
como el RESUMIR POR:
Varp,
 Llorente, F. ; Marín, S. ; Carrillo, M.
23
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Desviación estándar, para
conseguirlo haremos doble clic
sobre SUMA de X6, y
modificaremos
tanto
el
NOMBRE: Desviación como el
RESUMIR POR:,
Y obtenemos cada una de las informaciones seleccionadas para cada variable
Como la variable está muy atomizada podemos agrupar los valores en intervalos, para ello
debemos seguir los siguientes pasos,
1º debemos situarnos sobre los valores de la variable y presionamos el botón derecho del
ratón y seleccionamos – AGRUPAR Y ESQUEMA, y a continuación AGRUPAR
2º se abre una ventana en que nos piden desde que valor empezamos a agrupar
(COMERZAR EN) y hasta que valor (TERMINAR EN), y además la amplitud de los
intervalos que vamos a formar (POR). Dejamos los dos primeros en su valor inicial y
modificamos la amplitud de los intervalos de 10 a 30.
 Llorente, F. ; Marín, S. ; Carrillo, M.
24
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Y hacemos clic sobre ACEPTAR, y la Tabla Dinámica nos presenta la misma información
que antes pero Tabulada en intervalos,
Información sobre los
valores que forman este
Intervalo
Información sobre el
Total de observaciones
Hasta este momento hemos trabajado utilizando una sola variable, pero las Tablas
Dinámicas nos dan la oportunidad de realizar el análisis conjunto de dos variables. Así
pues podremos establecer la distribución de frecuencias CONJUNTA, MARGINAL y
CONDICIONADA de las variables seleccionadas.
Vamos a empezar con la distribución CONJUNTA de las variables, en concreto con la
frecuencias absolutas conjuntas. Realizaremos los mismos pasos iniciales que hemos
seguido en el análisis unidimensional: DATOS / INFORME DE TABLAS Y
GRÁFICOS DINÁMICOS. Una vez se abra la nueva ventana escogeremos GRÁFICO
DINÁMICO (CON TABLA DINÁMICA), porque nos interesa representar la relación
entre las dos variables para poder decidir sobre el posterior ajuste lineal entre las variables,
y a continuación hacemos clic sobre SIGUIENTE,
 Llorente, F. ; Marín, S. ; Carrillo, M.
25
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
La nueva ventana que se abrirá nos pide información sobre la posición que ocupan las
variables dentro de la hoja de Excel, y presionamos SIGUIENTE
en esta ocasión la nueva ventana nos solicita en qué posición deseamos colocar la Tabla
Dinámica, seleccionaremos HOJA DE CÁLCULO EXISTENTE y la celda de destino en
nuestro ejemplo se ha seleccionado E1
a continuación haremos clic sobre DISEÑO, para empezar a diseñar el contenido de la
Tabla. En esta ocasión incorporaremos una variable en el campo FILA y la otra en el
campo COLUMNA, puesto que queremos establecer la relación existente entre las dos
variables, y colocaremos en el campo DATOS cualquiera de las dos variables, puesto que
vamos a contar las apariciones conjuntas (frecuencia absoluta) nos es indiferente cuál de
ellas escojamos,
por defecto sale SUMA DE X, pero que podemos modificar haciendo doble clic sobre el
mismo, entonces aparece una nueva ventana CAMPO DE LA TABLA DINÁMICA
sobre la que modificaremos el NOMBRE y RESUMIR POR. Como la intención es
buscar la frecuencia Absoluta Conjunta de las variables XY escribimos frec abs conj en el
campo NOMBRE y en el campo RESUMIR POR seleccionamos CONTAR. A
continuación presionaremos ACEPTAR para validar y salir de la ventana de CAMPO y
 Llorente, F. ; Marín, S. ; Carrillo, M.
26
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
de nuevo ACEPTAR en la ventana de DISEÑO, y si a continuación presionamos
FINALIZAR,
entonces, nos aparece una hoja nueva que contiene el GRÁFICO, que aparece por defecto
y que podremos editar y modificar si nos interesa.
y en la misma hoja de los datos en la posición seleccionada (E1) está la Tabla dinámica,
 Llorente, F. ; Marín, S. ; Carrillo, M.
27
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
como la distribución resulta unitaria, y a diferencia del ejemplo de agrupación presentado
anteriormente, vamos a agrupar los valores de ambas variables de forma manual. Para ello
nos situamos sobre la variable, seleccionamos los valores a agrupar, hacemos clic sobre el
botón derecho del ratón, y seleccionamos dentro del menú AGRUPAR Y ESQUEMA y
AGRUPAR, entonces los valores seleccionados aparecen con el nombre de GRUPO 1.
Esta operación la repetiremos tantas veces como creamos oportuno, por ejemplo el
resultado final podría ser el siguiente,
podemos cambiar los nombres de los grupos, para ello nos situamos sobre el grupo a
modificar y escribimos en la barra de fórmulas la nueva denominación,
Barra de fórmulas
 Llorente, F. ; Marín, S. ; Carrillo, M.
28
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
así mismo, podemos hacer desaparecer los detalles sobre los grupos, para ello nos
situaremos sobre cada grupo y haremos botón derecho del ratón, AGRUPAR Y
ESQUEMA, OCULTAR DETALLE. No es necesario hacerlo uno por uno, podemos
seleccionar los grupos de una variable con el ratón y hacer desaparecer todos los detalles
con una sola operación.
Al modificar la estructura de la Tabla conjunta automáticamente se ha modificado el
gráfico que hemos generado, y con los cambios introducidos ha quedado de la siguiente
forma,
Si nos interesa analizar la Frecuencias relativas conjuntas podemos aprovechar la tabla
ya construida e incorporar en el campo DATOS de nuevo una variable. Para ello nos
situamos sobre el cuerpo de la tabla, hace clic con el botón derecho y seleccionamos
ASISTENTE, entonces se abrirá la ventana del ASISTENTE y hacemos clic sobre
DISEÑO
 Llorente, F. ; Marín, S. ; Carrillo, M.
29
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
por defecto sale SUMA DE Y, que podemos modificar haciendo doble clic sobre el
mismo.Como la intención es buscar la frecuencia relativa conjunta de las variables XY
escribimos frec rel conj en el campo NOMBRE y en el campo RESUMIR POR
seleccionamos CONTAR, y presionamos OPCIONES para definir los valores relativos.
Para conseguirlo debemos presionar sobre el cuadro desplegable para ver las diferentes
opciones de relativizar las frecuencias.
Como queremos presentar las frecuencias relativas conjuntas debemos seleccionar % DEL
TOTAL. A continuación presionaremos ACEPTAR para validar y salir de la ventana de
CAMPO y de nuevo ACEPTAR en la ventana de DISEÑO, y si a continuación
presionamos FINALIZAR,
 Llorente, F. ; Marín, S. ; Carrillo, M.
30
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Como la visión conjunta de las dos frecuencias en la misma tabla puede resultar un tanto
pesada, podemos separar las dos frecuencias poniéndolas cada una en una tabla. Para ello
hay dos posibles formas de actuación. Primera, construimos cada una de las Tablas por
separado, siguiendo los pasos enunciados hasta el momento.
O la segunda opción es copiar y pegar la tabla que ya tenemos, y eliminar la información
que sobra en cada una de las tablas. Para eliminar las frecuencias que no deseamos en cada
tabla debemos editar – botón derecho del ratón / ASISTENTE / DISEÑO – presionar sobre
el campo a eliminar y arrastrarlo fuera de la zona de DATOS.
Vamos ahora con la distribución MARGINAL correspondiente a cada variable y partiendo
de las tablas anteriores.
Frecuencia marginal absoluta de Y
Frecuencia marginal relativa de Y
 Llorente, F. ; Marín, S. ; Carrillo, M.
31
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Frecuencia marginal absoluta de X
Frecuencia marginal relativa de X
Si nos interesa la distribución CONDICIONADA debemos seleccionar los valores
condicionantes, por ejemplo vamos a hacer la distribución de frecuencias absolutas de X
condicionada a que Y tome un valor entre 64-82. Para conseguirlo nos situamos sobre el
desplegable de Y2 y desmarcamos “Mostrar Todos” y marcamos “64-82”
Si por el contrario queremos establecer la distribución de frecuencias relativas de Y
condicionada a que X tome un valor superior a 77, nos situamos sobre el desplegable de
X2 y desmarcamos “6-26” y “27-69”
 Llorente, F. ; Marín, S. ; Carrillo, M.
32
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Por último comentar que las Tablas dinámicas incorporan una opción que permite
comprobar la independencia directamente, siempre y cuando los datos estén sin tabular
como en nuestro caso. Así tenemos que construir una Tabla dinámica con las dos variables
situadas en el campo FILA y COLUMNA incorporar cualquiera de las dos variables al
campo DATOS y editar el cuerpo de la tabla para cambiar el NOMBRE: frec esperada,
SUMA X por la opción CONTAR, y MOSTRAR DATOS COMO: Índice
Donde en cada celda aparece el valor
N ·nij
ni· ·n· j
Si ambas variables fuesen independientes en todas las celdas de esta tabla debería aparecer
el valor 1. En el supuesto de que alguna de las celdas presente un valor distinto 1, esto
significará que ambas variables son estadísticamente dependientes. Situación que podemos
ratificar haciendo un gráfico de DISPERSIÓN, en el cual podemos visualizar la existencia
de una relación entre ambas variables.
Y
120
100
80
60
Y
40
20
0
0
5
10
15
20
25
X
 Llorente, F. ; Marín, S. ; Carrillo, M.
33
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Análisis de datos
Otra forma de realizar el análisis descriptivo es utilizar la HERRAMIENTA PARA
ANÁLISIS. La misma nos permite reducir los pasos a realizar para obtener determinados
instrumentos estadísticos.
Antes de empezar a utilizar esta herramienta se debe confirmar que tenemos este
Complemento cargado, puesto que no viene instalado por defecto. Para comprobarlo se
debe desplegar el menú HERRAMIENTAS y confirmar que aparece ANÁLISIS DE
DATOS.
Si no aparece el módulo ANÁLISIS DE DATOS seguiremos los siguientes pasos:
Desplegar el menú HERRAMIENTAS y hacer clic sobre COMPLEMENTOS.
 Llorente, F. ; Marín, S. ; Carrillo, M.
34
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
A continuación se abrirá una nueva ventana en la deberemos marcar HERRAMIENTAS
PARA ANÁLSIS y pulsar ACEPTAR.
Al desplegar de nuevo el menú HERRAMIENTAS ya aparece el complemento
ANÁLISIS DE DATOS. Si hace clic sobre este complemento se abre una nueva ventana
en que se visualiza todos los instrumentos que nos ofrece este complemento.
A partir de las diferentes opciones disponibles en este complemento, vamos a seleccionar
las siguientes: Estadística descriptiva, Histograma, Covarianza, Coeficiente de
correlación y Regresión.
Para empezar la exploración de los diferentes instrumentos seleccionados comenzamos
marcando ESTADÍSTICA DESCRIPTIVA, y a continuación pulsando ACEPTAR nos
aparecerá una nueva ventana en la que tendremos que completar una serie de campos.
 Llorente, F. ; Marín, S. ; Carrillo, M.
35
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Los campos son:
Rango de entrada
Introduzca la referencia de celda correspondiente al rango de datos que desee analizar. La referencia
deberá contener dos o más rangos adyacentes organizados en columnas o filas.
Agrupado por
Haga clic en el botón Filas o Columnas para indicar si los datos del rango de entrada están
organizados en filas o en columnas.
Rótulos en la primera fila y rótulos en la primera columna
Si la primera fila del rango de entrada contiene rótulos, active la casilla de verificación Rótulos en la
primera fila. Si los rótulos están en la primera columna del rango de entrada, active la casilla de
verificación Rótulos en la primera columna. Esta casilla de verificación estará desactivada si el
rango de entrada carece de rótulos; Microsoft Excel generará los rótulos de datos correspondientes
para la tabla de resultados.
Nivel de confianza para la media
Active esta casilla si desea incluir una fila correspondiente al nivel de confianza de la media en la
tabla de resultados. En el cuadro, escriba el nivel de confianza que desee utilizar. Por ejemplo, un
valor de 95 % calculará el nivel de confianza de la media con un nivel de importancia del 5 %.
K-ésimo mayor
Active esta casilla si desea incluir una fila correspondiente al valor k-ésimo mayor de cada rango de
datos en la tabla de resultados. En el cuadro, escriba el número que va a utilizarse para k. Si escribe
1, esta fila contendrá el máximo del conjunto de datos.
K-ésimo menor
Active esta casilla si desea incluir una fila correspondiente al valor k-ésimo menor de cada rango de
datos en la tabla de resultados. En el cuadro, escriba el número que va a utilizarse para k. Si escribe
1, esta fila contendrá el mínimo del conjunto de datos.
Rango de salida
Introduzca la referencia correspondiente a la celda superior izquierda de la tabla de resultados. Esta
herramienta genera dos columnas de información por cada conjunto de datos. La columna de la
izquierda contiene los rótulos de estadística y la columna de la derecha contiene las estadísticas.
Excel escribirá una tabla de estadísticas de dos columnas por cada columna o fila del rango de
entrada, dependiendo de la opción que se haya seleccionado en el cuadro Agrupado por.
En una hoja nueva
Haga clic en esta opción para insertar una hoja nueva en el libro actual y pegar los resultados
comenzando por la celda A1 de la nueva hoja de cálculo. Para darle un nombre a la nueva hoja de
cálculo, escríbalo en el cuadro.
En un libro nuevo
Haga clic en esta opción para crear un nuevo libro y pegar los resultados en una hoja nueva del libro
creado.
Resumen de estadísticas
Seleccione esta opción si desea que Excel genere un campo en la tabla de resultados por cada una de
las siguientes variables estadísticas: Media, Error típico (de la media), Mediana, Moda, Desviación
estándar, Varianza, Curtosis, Coeficiente de asimetría, Rango, Mínimo, Máximo, Suma, Cuenta,
Mayor (#), Menor (#) y Nivel de confianza.
 Llorente, F. ; Marín, S. ; Carrillo, M.
36
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Una vez completados todos los campos y tras presionar ACEPTAR obtenemos esta salida
con toda la información relativa a los descriptivos implantados en este bloque.
Aparece este valor
porque no existe
una Moda, al ser
una distribución
unitaria
Continuando con los complementos asociados al ANÁLISIS para DATOS vamos a
explorar a continuación el HISTOGRAMA.
Seguimos los mismos pasos que en el caso anterior: HERRAMIENTAS / ANÁLISIS DE
DATOS y seleccionamos HISTOGRAMA y después ACEPTAR. Se abre una nueva
ventana en la cual debemos completar diferentes campos para diseñar una Tabla de
Frecuencias y un gráfico representativo de éstas.
Rango de entrada: Introduzca la referencia de celda correspondiente al rango de datos que desee
analizar.
Rango clases (opcional): Introduzca la referencia de celda para un rango que contenga un conjunto
opcional de valores límite que definan rangos de clase. Estos valores deberán estar en orden
ascendente. Microsoft Excel contará el número de puntos de datos que hay entre el número de clases
actual y el número de clases mayor, si lo hay. Se contará un número de una clase determinada si es
 Llorente, F. ; Marín, S. ; Carrillo, M.
37
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
igual o menor que el número de clase situado por debajo de la última clase. Todos los valores por
debajo del primer valor de clase se contarán juntos, como los valores por encima del último valor de
clase.
Si omite el rango de clase, Excel creará un conjunto de clases distribuidas uniformemente entre los
valores mínimo y máximo de los datos.
Rótulos: Active esta casilla si la primera fila y la primera columna del rango de entrada contienen
rótulos. Esta casilla de verificación estará desactivada si el rango de entrada carece de rótulos; Excel
generará los rótulos de datos correspondientes para la tabla de resultados.
Rango de salida / En una hoja nueva / En un libro nuevo (ver explicación anterior)
Pareto (Histograma ordenado): Active esta casilla para presentar los datos en orden de frecuencia
descendente en la tabla de resultados. Si esta casilla está desactivada, Excel presentará los datos en
orden ascendente y omitirá las tres columnas situadas más a la derecha que contienen los datos
ordenados.
Porcentaje acumulado: Active esta casilla para generar una columna de tabla de resultados con
porcentajes acumulados y para incluir una línea de porcentaje acumulado en el gráfico de
histograma. Desactívela para omitir los porcentajes acumulados.
Crear gráfico: Active esta casilla para generar un gráfico de histograma incrustado con la tabla de
resultados.
Por ejemplo, si rellenamos los campos con información referida a la variable X, como se
muestra a continuación, obtendremos la distribución de frecuencias de la variable
estratificada en intervalos según la información referida al Rango de clases y el
histograma de frecuencias absolutas correspondiente
Rango de clases
Dist. frecuencias
Histograma
Podemos mejorar el aspecto del Histograma que sale por defecto editando el gráfico y
cambiando algunos aspectos del diseño.
Frecuencia
Histograma
10
5
0
Frecuencia
25
50
75
100
y
mayor...
Rango de Clase
 Llorente, F. ; Marín, S. ; Carrillo, M.
38
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Podemos agrandarlo – hacer clic sobre el gráfico y estirar simplemente del extremo inferior derecho
hasta obtener el tamaño deseado –
Podemos cambiar las fuentes (color, tamaño, tipo), el
color del fondo y los bordes del gráfico utilizadas en el
diseño - botón izquierdo del ratón sobre el gráfico / Formato
de área de gráfico / Tramas o Fuentes
Podemos situar la Leyenda en otra posición - botón
izquierdo del ratón sobre el gráfico / Opciones de gráfico /
Leyendas / Ubicación –
Podemos añadir el valor junto a cada rectángulo el valor
(frecuencia) o su rótulo (intervalo) - botón izquierdo del
ratón sobre el gráfico / Opciones de gráfico / Rótulos de
datos / Mostrar valor o Mostrar rótulo –
Podemos añadir la Tabla de valores debajo del gráfico
junto a la Leyenda correspondiente - botón izquierdo del
ratón sobre el gráfico / Opciones de gráfico / Tabla de datos
/ Mostrar tabla de datos y/o Mostrar clave de leyenda -
Este sería el aspecto del gráfico inicial tras modificar los aspectos que acabamos de
mencionar.
Histograma
Frecuencia
10
8
6
4
5
2
0
0
25
50
75
100
y mayor...
6
2
4
8
0
Frecuencia
Rango de Clase
También podemos mejorar el aspecto del Área de Trazado, para ello nos situaremos dentro
del gráfico (en la zona sombreada en gris) y haremos clic con el botón izquierdo del ratón
Es posible cambiar el fondo modificando el color que aparece en la sección Área
 Llorente, F. ; Marín, S. ; Carrillo, M.
39
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Histograma
Frecuencia
10
8
8
6
6
4
4
2
2
0
0
25
50
75
100
y mayor...
Rango de Clase
Podemos mejorar el aspecto de la serie de datos cambiando el color de la serie, la amplitud
de la base de los rectángulos, añadir el rótulo de datos con el valor o el rótulo y otras
opciones que serán de utilidad según la información que nos dispongamos a representar,
por ejemplo, el orden de la serie cuando representemos más de una variable.
Histograma
10
Frecuencia
8
6
8
6
4
4
2
2
0
0
25
50
75
100
y mayor...
Rango de Clase
O podemos cambiar incluso de Tipo de gráfico. Para llegar a esta opción podemos seguir
diferentes vías para acceder a la ventana de Tipos de gráficos – Formato área de gráfico,
Formato de área de trazado o Formato serie de datos. Sea cual sea la opción escogida se
nos abrirá la siguiente ventana, que nos permite transformar el gráfico inicial en cualquiera
de los que aparecen en la lista de opciones,
 Llorente, F. ; Marín, S. ; Carrillo, M.
40
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Frecuencia
0
y mayor...
8
100
4
75
2
50
6
25
0
1
2
3
4
5
6
7
8
9
Frecuencia
Frecuencia
8
7
6
5
4
3
2
1
0
25
50
75
100
y mayor...
Si en lugar de optar por un Histograma clásico nos interesa más representar un Diagrama
de Pareto hubiéramos seguido los siguientes pasos: HERRAMIENTAS / ANÁLISIS DE
DATOS / HISTOGRAMA. Una vez en la ventana del Histograma y rellenados los
campos que contienen los valores hubiéramos escogido la opción PARETO
(HISTOGRAMA ORDENADO)
 Llorente, F. ; Marín, S. ; Carrillo, M.
41
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Que una vez hacemos clic sobre ACEPTAR nos define la siguiente salida, en la que
aparece en primer lugar las frecuencias ordenadas y a continuación el Diagrama de Pareto,
Gráfico que podremos mejorar, al igual que hicimos anteriormente con el Histograma de
frecuencias, siguiendo los mismos pasos allí expuestos.
Frecuencia
Histograma
10
100.00%
8
80.00%
6
60.00%
4
40.00%
2
20.00%
0
.00%
y mayor...
28.75
76.25
52.5
5
Clase
Frecuencia
% acumulado
Una vez explorada la vía unidimensional nos queda por comentar aquellos aspectos del
Análisis de datos que hacen referencia a variables bidimensionales y la valoración de la
relación lineal existente entre las mismas a través de la COVARIANZA, COEFICIENTE
DE CORRELACIÓN y REGRESIÓN.
 Llorente, F. ; Marín, S. ; Carrillo, M.
42
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Así que haremos los mismos pasos que en el caso anterior: HERRAMIENTAS /
ANÁLISIS DE DATOS. Seleccionamos COVARIANZA y después ACEPTAR. Se abre
una nueva ventana en la cual debemos completar diferentes campos para obtener la
Varianza y Covarianza entre las variables que incluyamos en el análisis.
Varianza X
Covarianza XY
Varianza Y
Si hacemos los mismos pasos que en el caso anterior: HERRAMIENTAS / ANÁLISIS
DE DATOS, seleccionamos COEFICIENTE DE CORRELACIÓN y después
ACEPTAR. Se abre una nueva ventana en la cual debemos completar diferentes campos
para obtener la correlación lineal entre las variables que incluyamos en el análisis.
Coef de X con X
Coef de X con Y
 Llorente, F. ; Marín, S. ; Carrillo, M.
Coef de Y con Y
43
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
Por último, si hacemos HERRAMIENTAS / ANÁLISIS DE DATOS, seleccionamos
REGRESIÓN y después ACEPTAR, verificamos que se abre una nueva ventana, en la
cual debemos completar diferentes campos para obtener el ajuste lineal entre las variables
que incluyamos en el análisis.
Rango Y de entrada: Introduzca la referencia correspondiente al rango de datos dependientes. El
rango debe constar de una única columna o una única columna de datos.
Rango X de entrada: Introduzca la referencia correspondiente al rango de datos independientes.
Microsoft Excel ordenará las variables independientes de este rango en orden ascendente de
izquierda a derecha. El número máximo de variables independientes es 16.
Rótulos: Active esta casilla si la primera fila o la primera columna del rango (o rangos) de entrada
contienen rótulos. Desactívela si el rango de entrada carece de rótulos; Microsoft Excel generará los
rótulos de datos correspondientes para la tabla de resultados.
Nivel de confianza: Active esta casilla para incluir más niveles en la tabla de resumen de
resultados. En el cuadro, introduzca el nivel de confianza que desee aplicar además del nivel
predeterminado del 95%.
Constante igual a cero: Active esta casilla para que la línea de regresión pase por el origen.
Residuos: Active esta casilla para incluir residuos en la tabla de resultados de residuos.
Residuos estándares: Active esta casilla para incluir residuos estándares en la tabla de resultados de
residuos.
Gráficos de residuos
Active esta casilla para generar un gráfico por cada variable independiente frente al residuo.
Curva de regresión ajustada
Active esta casilla para generar un gráfico con los valores pronosticados frente a los observados.
Trazado de probabilidad normal: Active esta casilla para generar un gráfico con probabilidad
normal.
 Llorente, F. ; Marín, S. ; Carrillo, M.
44
APLICACIONES DEL EXCEL A LA ESTADÍSTICA
 Llorente, F. ; Marín, S. ; Carrillo, M.
45
Descargar