Subido por JHOAN VALENTIN TRUJILLO LOPEZ

P F Tema 1

Anuncio
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Preguntas más Frecuentes: Tema 1
Pulse sobre la pregunta para acceder directamente a la respuesta
1. No acabo de entender la diferencia entre estadística descriptiva e inferencial.
¿Podría poner algún ejemplo?
2. ¿En qué escala se mide la temperatura?
3. ¿Cómo distinguir una escala ordinal de una de intervalo? ¿Y de una de razón?
4. La diferencia entre una escala de intervalo y una escala de razón está en el valor
cero de la escala, pero no consigo distinguir entre cero absoluto y cero relativo.
5. ¿Cuál es la escala de medida de las puntuaciones de tests psicológicos?
6. En las escalas de intervalo y de razón, ¿se pueden encontrar indistintamente
variables discretas y variables continuas? Me ayudaría contar con un ejemplo de cada
caso.
7. ¿Cuál es la diferencia entre variable independiente, dependiente y extraña?
8. ¿Cómo se determinan los límites reales o exactos?
9. ¿Cómo se calcula el punto medio (o marca de clase) de un intervalo?
10. ¿Por qué en las variables cuantitativas discretas se utiliza el diagrama de barras
en lugar del histograma? No acabo de ver la diferencia entre ambas representaciones
gráficas.
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1. No acabo de entender la diferencia entre estadística descriptiva e inferencial.
¿Podría poner algún ejemplo?
Respuesta
Cuando disponemos de un conjunto de datos necesitamos organizarlos,
representarlos gráficamente y obtener una serie de índices (media, varianza,..) que
nos faciliten información sobre ellos. De esto se ocupa la estadística descriptiva.
Habitualmente, el conjunto de personas sobre el que deseamos obtener información
es tan grande que resulta imposible, o muy costoso, obtener información. Por ejemplo,
si deseamos conocer a qué partido político van a votar los universitarios españoles mayores de 18 años- en las próximas elecciones no es posible preguntar a cada uno
de ellos sobre su intención de voto. En este caso se selecciona una muestra,
preguntamos a cada uno de los universitarios de la muestra y -utilizando la estadística
descriptiva- determinamos el porcentaje de voto a cada partido político. Realmente lo
que nos interesa no es el voto de esta muestra sino extender los resultados a toda la
población (el conjunto de todos los universitarios españoles) y para esto se utiliza la
estadística inferencial.
En otros casos, por ejemplo un profesor que desea conocer la opinión de sus alumnos
sobre su forma de impartir las clases, es posible disponer fácilmente de todos los
datos de sus alumnos (población). En este caso no tiene sentido utilizar los datos de
una muestra puesto que se dispone de los datos de la población. Aquí la estadística
descriptiva nos servirá para organizar, representar y obtener índices (que en este caso
se llaman parámetros) y no tenemos que recurrir a la estadística inferencial.
[ Arriba ]
2. ¿En qué escala se mide la temperatura?
Respuesta
Cuando se indica que la temperatura se encuentra en una escala de intervalo nos
referimos, habitualmente, a la temperatura ambiental que se mide con un termómetro
de mercurio en grados centígrados (ºC). En esta escala se asigna el valor 0 a la
temperatura de congelación del agua y el valor 100 a su punto de ebullición. Se
denomina escala CELSIUS y es la más ampliamente utilizada.
En algunos países anglosajones se usa la escala Fahrenheit. En esta escala al punto
de congelación del agua se le asigna el valor 32 y al punto de ebullición el valor 212.
Por tanto, la relación entre ambas escalas es la siguiente:
TF 
9
TC  32
5
Donde TF indica la temperatura en la escala Fahrenheit y TC indica la temperatura en
ºC.
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
El concepto de temperatura en el ámbito de la Física es mucho más complejo (no es el
momento ni el lugar de tratarlo aquí) y se consideran dos tipos de escalas: unas con el
valor 0 relativo (convencional, no absoluto) que corresponden a las dos señaladas
anteriormente (Celsius y Fahrenheit) y otra con valor 0 absoluto (escala KELVIN). Esta
última escala ha surgido posteriormente a las anteriores cuando se descubrió que la
temperatura (entendida como movimiento entre partículas) tiene un valor mínimo
insuperable (no hay movimiento) en un punto, estimado en -273,15ºC, que se ha
denominado cero absoluto y que se toma como referencia en la denominada escala
absoluta o de KELVIN. Para un psicólogo, no parece relevante entrar en tanto detalle.
[ Arriba ]
3. ¿Cómo distinguir una escala ordinal de una de intervalo o razón?
Respuesta
En el nivel ordinal los números asignados sólo reflejan relaciones de igualdaddesigualdad y mayor-menor. Por ejemplo, en la variable "nivel de estudios" si
consideramos: estudios primarios, secundarios, diplomatura y licenciatura, podemos
asignarlos los valores 1, 2, 3 y 4, respectivamente. De esta forma si dos personas A y
B tienen el mismo valor podemos decir que tienen igual nivel de estudios (o distinto
nivel de estudios si tienen distinto valor). Además podemos decir que una persona A
con un valor de 3 tiene un mayor nivel de estudios que otra persona B que tiene 1,
pero, a diferencia de la escala de intervalo, no podemos cuantificar las diferencias en
nivel de estudios, ya que no tenemos una unidad constante de medida.
Veámoslo con otro ejemplo. Si consideramos la variable "tiempo de espera del ticket
de supermercado" la situación es la siguiente: los tickets están numerados (por
ejemplo del 0 al 99) y cuando una persona llega al supermercado coge un ticket. Si,
por ejemplo, una persona A tiene el número 8, B el 6 y C el 4 podemos afirmar que su
tiempo de espera es distinto pero, también, podemos afirmar que el tiempo de espera
de B es menor que el de A. Lo que no podemos afirmar es que la diferencia entre el
tiempo de espera entre B y C es el mismo que la diferencia en el tiempo de espera
entre A y B (esto sólo podría afirmarse en un nivel de intervalo, por ejemplo en la
temperatura en ºC medida con un termómetro). Tampoco podemos afirmar que el
tiempo de espera de A es el doble que el tiempo de espera de C (esto sólo es válido
para una escala de razón). Por tanto, la variable "tiempo de espera del ticket del
supermercado" está en un nivel ordinal de medida.
Es muy importante saber cómo está definida la variable y cómo se mide. Así, si para la
variable "tiempo de espera en el supermercado" de un grupo de personas medimos
con un reloj (o cronómetro) el tiempo en minutos que una persona tarda desde que
llega hasta que es atendida estaremos en una escala de razón. Si tres personas A, B y
C tienen los valores 8, 6 y 4 (porque ese ha sido el tiempo en minutos que han tardado
en ser atendidos), respectivamente, podemos afirmar que A ha tardado distinto tiempo
que B, que A ha tardado más tiempo que C, que la diferencia entre el tiempo de A y B
es la misma que la diferencia entre B y C, y que A ha tardado el doble que C.
[ Arriba ]
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
4. La diferencia entre una escala de intervalo y una escala de razón está en el valor
cero de la escala, pero no consigo distinguir entre cero absoluto y cero relativo.
Respuesta
Hay que razonar si el cero supone ausencia de la característica que estamos midiendo
(absoluto) o no (arbitrario).
El tiempo de reacción es un ejemplo típico de escala de razón porque el cero implica
ausencia del rasgo medido. En este caso 0 milisegundos expresa la ausencia total de
tiempo, por eso en el tiempo de reacción el cero es absoluto. Sin embargo, en la
inteligencia, por ejemplo, el 0 no implica ausencia de inteligencia, sino que se ha
obtenido esa puntuación en el test, por lo que el cero es arbitrario y la escala se
considera de intervalo.
Esta diferenciación entre cero absoluto y relativo que se da entre la escala de intervalo
y de razón posibilita que el la escala de razón se puedan dividir los valores de la
variable y en la escala de intervalo no.
Por ejemplo, si en la variable inteligencia, una persona A obtiene 80 puntos en un test
que la mide, una persona B obtiene 40 y una persona C 70, no podemos decir que A
tiene el doble de inteligencia que C porque no tiene sentido dividir 80/40 = 2. Sin
embargo, sí podemos afirmar que la diferencia entre inteligencia entre C y B (70-40 =
30) es tres veces la diferencia entre A y C (80-70 = 10).
En la variable tiempo de reacción, si en detectar un estímulo A se tarda 600 ms. en
detectar a B se tarda 400 y a C 300, podemos afirmar lo dicho para la escala de de
intervalo (la diferencia en TR entre A y B (600-400 =200) es el doble que la diferencia
en TR entre B y C (400-300=100) y además, podemos decir que el estímulo A tarda el
doble en detectarse que el estímulo C (600/300) =2, algo que no podemos afirmar en
una escala de intervalo.
[ Arriba ]
5. ¿Cuál es la escala de medida de las puntuaciones de tests psicológicos?
Respuesta
Se asume para las puntuaciones obtenidas en los tests o pruebas utilizadas para
medir variables psicológicas un nivel de medida de intervalo. Por tanto, variables como
inteligencia, memoria, conservadurismo, liderazgo, etc., medidas con un test diseñado
para ese fin están en una escala de medida de intervalo.
Veámoslo con un ejemplo. La escala "cociente intelectual", medida por un test de
inteligencia, dispone de una unidad constante de medida, eso significa que la
diferencia entre dos valores numéricos cualesquiera siempre equivale a la misma
cantidad de atributo, ya que la unidad de medida es constante, no varía a lo largo de la
escala. En este caso, idénticas diferencias entre los números corresponderán a
idénticas diferencias en la característica que se está midiendo. Esto nos permite no
solo ordenar a los sujetos en la característica evaluada, como sucede en la escala
ordinal, sino dar un paso más y cuantificar sus diferencias, y eso lo podemos hacer
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
sencillamente porque la unidad de medida de la escala no varía sino que es la misma
a lo largo de todo el continuo. Por tanto, podemos decir que la diferencia entre dos
personas con CI de 90 y 80 es igual a la de otras dos con CI de 110 y 100. Sin
embargo, no podemos decir que una persona que tenga un CI de 140 sea el doble de
inteligente que una persona con un CI de 70, ya que para eso sería necesario que el
cero fuera absoluto (como sucede en la escala de razón). Aquí el cero es relativo
porque obtener un cero en un test de inteligencia no significa que el sujeto no sea
nada de inteligente sino que ha tenido un rendimiento nulo en las tareas planteadas
por los ítems de la prueba con la que ha sido calculada dicha medida de la
inteligencia.
[ Arriba ]
6. En las escalas de intervalo y de razón, ¿se pueden encontrar indistintamente
variables discretas y variables continuas? Me ayudaría contar con un ejemplo de cada
caso.
Respuesta
En efecto. Los niveles o escalas de medida de una variable son: Nominal, Ordinal,
Intervalos y Razón. Cuando una variable está medida en una escala de intervalos o de
razón se dice que es una variable cuantitativa (porque indican la cantidad en que una
persona u objeto posee una variable). Las variables cuantitativas (ya sean de intervalo
o de razón) pueden ser discretas o continuas.
Las escalas de intervalo y de razón se distinguen de las otras escalas (nominal y
ordinal) en que ambas presentan un punto cero o punto de referencia. Sin embargo,
en la de intervalo ese "cero" es relativo y en la escala de razón existe un "cero
absoluto" (en la P+F nº 4 se aborda justamente esta diferenciación).
Una variable es cuantitativa discreta si sólo puede tomar, como su nombre indica,
valores discretos y no existe ningún valor posible entre dos valores consecutivos de la
variable (p.e. la variable nº de aciertos en un test de 10 preguntas). Una variable
cuantitativa es continua si entre dos valores dados puede existir un valor intermedio
(p.e. la variable peso).
Ejemplos:
- Variable continua en escala de razón: el peso. Es continua porque entre dos pesos
cualesquiera se pueden considerar valores intermedios (entre 80 Kg y 81 Kg también
existe el 80,5 Kg) y está medida en una escala de razón porque el 0 indica una
ausencia total de la característica medida (implica ausencia de peso).
- Variable continua en escala de intervalos: la temperatura. Es continua porque entre
dos temperaturas cualesquiera se pueden considerar valores intermedios, y está
medida en una escala de intervalo porque el cero no implica ausencia de temperatura
(ver P + F nº 2 para una explicación más detallada del nivel de medida de esta
variable).
- Variable discreta en escala de razón: el número de hijos de la unidad familiar. Es
discreta porque no existen valores intermedios (no se puede tener 1,5 hijos) y se mide
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
en escala de razón porque el cero implica la ausencia de la característica (no tener
hijos).
- Variable discreta en escala de intervalos: el Cociente Intelectual. Es discreta porque
entre dos valores cualesquiera de CI no hay valores intermedios. El motivo es que se
trata de una forma de medir la inteligencia concreta, cuya fórmula es el resultado de
dividir la edad mental (EM) entre la edad cronológica (EC) del sujeto; para evitar
decimales el resultado se multiplica por 100, por lo que en este caso no hay valores
intermedios. Está medida en escala de intervalos porque el cero no implica ausencia
de inteligencia. Hay que tener en cuenta que si hablamos de inteligencia en general
(medida con algún test construido para ese fin) se trataría de una variable continua en
escala de intervalos, según lo explicado en la P+F nº 5.
[ Arriba ]
7. ¿Cuál es la diferencia entre variable independiente, dependiente y extraña?
Respuesta
Se trata de una clasificación de las variables desde el punto de vista metodológico. La
variable independiente es la variable controlada o manipulada por el experimentador
con el fin de analizar su efecto sobre la variable dependiente u observada. La variable
dependiente es la medida utilizada para determinar los posibles efectos de la variable
independiente, y las variables extrañas son aquellas que, sin tener interés directo para
el investigador pueden afectar a la variable dependiente. Posiblemente un ejemplo
ayude a clarificar sus diferencias:
Imaginemos que queremos estudiar la posible diferencia en cuanto al efecto de dos
tranquilizantes, A y B. Nuestra hipótesis sería: ¿Influye el tipo de tranquilizante en la
relajación del sujeto? La variable independiente es el tipo de tranquilizante, que puede
adoptar dos valores, A y B. Escogemos una muestra de sujetos con problemas de
nervios y, de manera aleatoria, los asignamos al grupo 1 (ingesta de tranquilizante A)
o al grupo 2 (ingesta de tranquilizante B). Durante todo el procedimiento controlamos
las variables ajenas a nuestra investigación (que son las variables extrañas), como
pudiera ser la hora a la que se toman el tranquilizante, haciendo que todos los sujetos
se lo tomen a la misma hora. Podríamos medir la relajación del sujeto, que es la
variable dependiente, midiendo la conductividad eléctrica de la piel de los sujetos (que
es inversamente proporcional a su relajación).
Esta clasificación de las variables se basa en la función que tienen en una
investigación para ayudar a contrastar las hipótesis planteadas.
[ Arriba ]
8. ¿Cómo se determinan los límites reales o exactos?
Respuesta
La medida de una variable es siempre un valor impreciso, no exacto (entre otras
razones por las propias limitaciones del instrumento de medida). Si obtenemos el valor
del peso de una persona con una balanza (A) que sólo nos indica los kilogramos
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
podemos obtener, por ejemplo, un valor de 62. En este caso, la unidad de medida es 1
(con esa balanza sólo podemos obtener valores enteros: 62, 58,....).
Si utilizamos una balanza más precisa (B), podemos obtener un valor para esa misma
persona de 62,4. La unidad de medida es 0,1. Si la balanza es aún más precisa C)
podemos obtener, para esa misma persona, el valor 62,48 y la unidad de medida es
0,01.
En el primer caso el valor informado o aparente es 62 y consideramos que su valor
real o exacto está comprendido entre 61,5 (límite exacto inferior) y 62,5 (límite exacto
superior). Es decir, 62  0,5·I
Donde I es la unidad de medida (en este caso 1).
Por tanto, el valor real o exacto de esa persona estará comprendido entre media
unidad por debajo de su peso aparente (se resta 0,5 para obtener el límite exacto
superior, 61,5) y media unidad por encima (se suma 0,5 para obtener el límite exacto
superior, 62,5) de su peso informado o aparente.
En el segundo caso (balanza B), el valor informado o aparente es 62,4 y, por tanto, su
peso real o exacto está comprendido entre 62,4  0,5·0,1 .
Es decir, entre 62,35 y 62,45.
Puede comprobarse que en el tercer caso, utilizando la balanza C, los límites reales o
exactos son: 62,475 y 62,485.
[ Arriba ]
9. ¿Cómo se calcula el punto medio (o marca de clase) de un intervalo?
Respuesta
El punto medio de un intervalo (PM) es la semisuma de sus límites exactos y también
la semisuma de sus límites aparentes. Es decir:
PM 
LES  LEI
2
y PM 
LAS  LAI
2
En ambos casos se obtiene, lógicamente, el mismo resultado.
Por ejemplo, en el ejercicio de 1.19 del manual, la respuesta correcta es 390,5, ya se
utilicen los límites exactos:
PM 
400,5  380,5 781

 390,5
2
2
o los aparentes:
PM 
400  381 781

 390,5
2
2
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
[ Arriba ]
10. ¿Por qué en las variables cuantitativas discretas se utiliza el diagrama de barras
en lugar del histograma? No acabo de ver la diferencia entre ambas representaciones
gráficas.
Respuesta
Las representaciones gráficas tienen que ser bastante intuitivas y siempre es más
apropiada la que permita visualizar mejor los datos.
Visualmente, la diferencia entre un diagrama de barras y un histograma es que en el
primero las barras están separadas y en el segundo están juntas. Las variables
discretas (como el nº de hijos) no pueden tener valores intermedios entre dos valores
consecutivos, por lo que un diagrama de barras, al estar éstas separadas, representa
apropiadamente esta situación. Sin embargo, la edad, o la estatura son variables en
las que siempre puede haber valores intermedios, por lo que representar estas barras
unidas es lo más apropiado en este tipo de variables.
Eso sí, en el caso de utilizar una distribución de frecuencias con datos agrupados en
intervalos, aunque la variable sea discreta ya no tiene sentido separar las barras, por
lo que se utiliza un histograma.
[ Arriba ]
8
Descargar