Conceptos de estadística

Anuncio
Curva normal: Conocida como campana o Curva de Gauss, es un modelo teórico de curva en el caso de que
se de una distribución normal. Es la curva a la que toda distribución normal tiende a dibujar cuando es
representada gráficamente.
Curva Platicúrtica: Presenta una curva más aplastada, con una elevación de la distribución inferior a la curva
normal.
Curva Leptocúrtica: Presenta una distribución más apuntada, con una elevación superior a la curva normal.
Curva Mesocúrtica: Es el que corresponde a la curva normal y presenta un nivel de apuntamiento
considerado como ideal.
Cuantil: Es una forma de interpretar las puntuaciones directas refiriéndolas a diferentes escalas. Si se divide
la serie en varias partes, en función de los porcentajes que incluyen, podemos situar las puntuaciones de los
sujetos a lo largo de la misma, utilizando los porcentajes que permiten cierta comparación. La serie podrá
quedar dividida en cuantas partes se desee, pero generalmente suele hacerse en 4, 10 ó 100, teniendo así los
cuartiles, deciles o percentiles. El proceso de cálculo es idéntico al de la mediana, ya que ésta es, a la vez, el
cuartil 2, el decil 5 o el percentil 50.
Desviación Media: Hace referencia a la media aritmética de las desviaciones tomadas en valor absoluto,
respecto de un promedio. Dicho promedio puede ser la media aritmética, la mediana o la moda, es una medida
poco utilizada, sobre todo porque existen otras que permiten un superior desarrollo estadístico a partir de su
valor.
Desviación Típica: Es una de las medidas más importantes de dispersión y variabilidad, se utiliza más en el
ámbito de la estadística descriptiva, en la caracterización de las muestras y permite un alto desarrollo
estadístico sobre la base de la misma. Es la raíz cuadrada de la varianza.
Diagrama de barras: Consiste en representar los valores de una variable en función de sus frecuencias
absolutas o relativas, por tanto dentro de un eje de coordenadas colocaremos los valores de la variable en el
eje de abscisas y la frecuencia absoluta o relativa en el eje de abscisas. La representación consiste en levantar
alturas para cada valor de la variable iguales a su frecuencia.
Diseño: Un diseño es un esquema o estructura lógica de acción que permite mantener constante el flujo de las
variables experimentales pertinentes y controlar así la influencia de las variables independientes sobre las
variables dependientes. Podemos concretar como objetivos del diseño el maximizar la varianza sistemática,
controlar la varianza sistemática de las variables extrañas o fuentes de variación secundarias, y minimizar la
varianza del error (el azar y los errores de medición).
Diseños Cuasiexperimentales: Se manipula la variable independiente, es decir, se introduce un tratamiento.
Carece de una de dos propiedades del diseño experimental, que son aleatoriedad y grupo control. Son
prácticos, brindan información útil para generalizar, se pueden llevar a cabo en ambientes naturales. La
desventaja es que pueden surgir varias hipótesis rivales que compiten con la hipótesis de manipulación
experimental en la explicación de los resultados observados.
Diseño Experimental Puro: El investigador actúa como un agente activo y no como un observador pasivo, el
investigador puede tener una mayor confianza en la autenticidad e interpretación de las relaciones entre
variables debido a que las ha observado bajo condiciones rigurosamente controladas.
Diseño Factorial: Se manipulan dos o más variables de manera simultánea. Permite probar múltiples
1
hipótesis en un solo experimento. Permite probar no sólo los efectos principales, sin también la interacción
entre las variables manipuladas.
Diseño de Solomon: Fue desarrollado para controlar todas las variables extrañas, y poder observar la varianza
sistemática, consecuencia del tratamiento experimental objeto de estudio. Son cuatro grupos los necesarios y
todos se forman al azar. La variable experimental se representa por X.
Diseños Jerárquicos: Son diseños donde se encuentran factores anidados. Tienen tres potenciales fuentes de
variación. A) Aquella atribuible a la variable experimental. B) El efecto debido a los grupos. C) Las
diferencias individuales, como variación residual, y en consecuencia, la variación del error.
Diseño por bloques al azar: Se utiliza cuando las unidades experimentales no son todas iguales, cuando
existe gran heterogeneidad. Se forman tantos bloques como valores de la variable independiente interesa
contrastar; los tratamientos se asignan igualmente al azar.
Cuadrado Latino: Se distingue de todos los demás porque es cuadrado, ya que los datos nos los
proporcionan a través de una matriz cuadrada. Hay dos variables de bloqueo que lo que hacen es
homogeneizar la muestra pero que no intervienen en el experimento. No es un diseño al azar, se clasifica a los
sujetos según unas condiciones iniciales y luego se aplica el experimento. Las variables de bloqueo, que no
intervienen en el desarrollo del proceso, tienen los mismos niveles que la experimental por ser de diseño
cuadrado.
Estadística descriptiva: Tiene una función simplificadora y descriptiva consistente en procesos estadísticos
que se realizan con datos empíricos, tomados, recogidos y/o medidos en las muestras.
Estadística inferencial: Le corresponde decidir sobre los problemas irresueltos por la estadística descriptiva.
Al informarnos sobre los valores de la población, parámetros, permite establecer hipótesis, plantear leyes y
tomar decisiones.
Estadística Paramétrica: Es la más poderosa siempre que se cumplan estos 3 supuestos. Que los estadísticos
que se estudian existan en la población. Que en ella están distribuidas normalmente y que el estadístico
muestral da una estimación del parámetro.
Estadística No Paramétrica: Es aquella cuyo modelo estadístico no parte de supuestos acerca de la población,
o estos son muy débiles y operan con datos ordinales y hasta nominales.
Estadístico o estimador: Cualquier característica medible calculada sobre una muestra.
Estado de la cuestión: Es conocer la situación actual del problema planteado en un momento determinado con
todas su variables y posibilidades.
Experimento y sus clases: Es una forma de experiencia científica caracterizada por provocar un fenómeno
para mantenerlo bajo control y la utilización de la medición. Clases: Experimento de laboratorio y
experimento de campo.
Frecuencia absoluta fi : ( de un determinado valor xi ) al número de veces que se repite dicho valor .
Frecuencia absoluta acumulada Fi : ( de un determinado valor xi ) Su frecuencia absoluta más la suma de las
frecuencias absolutas de todos los valores anteriores .
Muestreo: El muestreo se ocupa del estudio de las muestras no por sí mismas, sino como un modo de conocer
a la población que representa. En vez de hacer un censo completo, los procedimientos de muestro estadístico
2
se han convertido en la herramienta preferida en la mayoría de las situaciones de investigación.
Existen 3 razones principales para extraer una muestra:
− lleva menos tiempo que un censo completo
− es menos costoso
• es más ágil y eficiente que obtener el completo de la población objeto.
Encuesta: Es una modalidad de investigación destinada a la recogida de información no a través de las
pruebas, sino por medio de preguntas formuladas directamente a los sujetos. Las preguntas, eso sí, pueden
incidir directa o indirectamente en el tema investigado.
Los pasos que se deben seguir a la hora de hacer una encuesta son:
1) Determinación de los objetivos
2) Determinación del tipo de encuesta:
3) Diseño del cuestionario: Es un instrumento que contiene varias preguntas y que trata de una diversidad de
fenómenos o características.
4) Codificación del cuestionario: Una vez diseñado y testado el cuestionario, conviene codificarlo antes de
realizar el trabajo de campo. Con el objeto de evitar posibles errores de diseño. La codificación del
cuestionario facilita la tabulación de los datos resultantes y su análisis posterior a través de un programa
informático de análisis estadístico.
5) Muestreo: En vez de hacer un censo completo, los procedimientos de muestro estadístico se han
convertido en la herramienta preferida en la mayoría de las situaciones de investigación.
6) Trabajo de campo: Una vez desarrolladas las fases anteriores, se realiza el trabajo de campo entrevistando
a todos los integrantes de la muestra seleccionada. El trabajo de campo es controlado y revisado por el
investigador para evitar distorsiones de la información resultante.
7) Tabulación de Datos: Construir tablas. Al finalizar el trabajo de campo, y una vez revisados y depurados
los cuestionarios, se tabulan estadísticamente los datos obtenidos.
8) Análisis de Resultados y Elaboración del Informe: Por último, se analizan los datos tabulados, y en base
a los resultados y las conclusiones se redacta el informe final de la investigación.
Muestra: Es una parte o subconjunto de una población normalmente seleccionada de tal modo que ponga de
manifiesto las propiedades de la población. Su característica más importante es la representatividad.
Probabilística: Son las que utiliza el muestreo al azar, y merced a ello pueden calcular de antemano la
probabilidad de detener cada una de las muestras posibles.
No Probabilística: No usan el muestreo al azar sino que se obtiene por el criterio del investigador, razones de
economía, comodidad, etc. (Muestreo intencional, muestreo accidental, etc.).
Dentro de los muestreos probabilísticos se encuentran:
3
Muestreo aleatorio simple: una vez censado el marco de la población, se asigna un número a cada miembro y
se eligen aleatoriamente las unidades muestrales, es decir que cada individuo o elemento tiene la misma
oportunidad de selección que cualquier otro, y la selección de un individuo o elemento en particular no afecta
la probabilidad de que se elija cualquier otro.
Muestro Sistemático: Es un muestreo aleatorio en el cual se eligen los elementos de la población a intervalos
uniformes a partir de un listado ordenado (dentro del marco, tomar un número y repetirlo varias veces hasta
terminar la lista)
Muestreo estratificado: Lo primero que hace el investigador es clasificar los elementos de la población en
subgrupos separados de acuerdo a una o más características. Después se obtiene por separado una muestra
aleatoria simple o sistemática de cada estrato.
Muestreo por conglomerado: Es un tipo de muestreo aleatorio en el que los elementos de la población se
dividen en forma natural en subgrupos. En éste muestreo, la unidad muestral no son los individuos sino un
conjunto de individuos que, bajo determinados aspectos, se puede considerar que forman una unidad o
conglomerado. En vez de censar toda la población, es necesario censar sólo los conglomerados. El método
consiste en seleccionar aleatoriamente un número de conglomerados cuya suma total de elementos
proporcione el tamaño muestral buscado.
Dentro de los muestreos no probabilísticos se encuentran:
Muestreo por criterio: Éste procedimiento se basa en el criterio o juicio del investigador para seleccionar
unidades muestrales representativas.
Muestreo por conveniencia: Éste procedimiento consiste en seleccionar las unidades muestrales más
convenientes para el estudio, o en permitir que la participación de la muestra sea totalmente voluntaria.
Muestreo por cuotas: En éste método, primero se realiza una estratificación de la muestra que garantice la
variedad de criterios y características de la población objeto en estudio, y luego se aplica un muestreo por
criterio para seleccionar las unidades muestrales de cada estrato. Ej.: divido en sexo y edad.
Además las muestras pueden ser:
Muestras grandes: Son consideradas aquellas cuyo número de sujetos (N) es superior a 30. Cuando más
grande sea una muestra más significativos serán los resultados obtenidos de ella en relación con la población.
Muestras pequeñas: Son consideradas aquellas cuyo número de sujetos (N) es inferior a 30. El problema de las
muestras pequeñas es que debido a su escaso número de representantes de la población a estudiar, puede
ofrecer unos datos menos representativos de dicha población.
Muestras correlacionadas: En muchas ocasiones, se toman muestras donde cada observación está emparejada
con una observación de la otra muestra. Medidas en un mismo sujeto antes y después de someterlo a un
tratamiento , medidas en hermanos gemelos, etc.
Muestras independientes: Son aquellas muestras que no están relacionadas con otras.
Probabilidad: Es la probabilidad que tenemos de que algo suceda. Es muy complejo de definir. Hay dos tipos:
Objetiva: A priori. Es una probabilidad ideal a la que tienden los fenómenos reales.
Subjetiva: Real. Se determina de un modo empírico a través de un número suficiente de pruebas.
4
Problema: un problema existe cuando hay tres elementos, cada uno claramente definido: una situación inicial;
una situación final u objetivo a alcanzar y restricciones o pautas respecto de métodos, actividades, tipos de
operaciones, etc., sobre los cuales hay acuerdos previos.
Pruebas paramétricas: Son las más poderosas siempre que cumplan estos requisitos (1− Que las características
que se estudian existan en la población. 2− Que en ella estén distribuidas normalmente. 3 Que el estadístico
muestral da una estimación del parámetro). Ventajas: Mayor potencia para rechazar Hº falsas o al igual
potencia el ahorro de sujetos en las muestras, desarrollo estadístico superior, permiten hacer estimaciones de
los parámetros indicando el margen de error que les afecta. Inconvenientes: Su uso está limitado a una serie de
restricciones.
Pruebas no paramétricas: Son aquellas cuyo modelo estadístico no parte de supuestos acerca de la población o
éstos son muy débiles y opera con datos ordinales y hasta nominales. Ventajas: Cálculo más sencillo, menos
restrictivas incluso a niveles de medida tan elementales como ordinal o nominal, son especialmente adecuadas
para muestras pequeñas donde suelen ser tan potentes como las paramétricas. Inconvenientes: Menor potencia
y desarrollo estadístico menor.
Prueba bilateral: Bilateral cuando es bidireccional, de dos colas, es indiferente el sentido del orden.
Prueba unilateral: es unidireccional, de una cola, sólo puede mirar en un sentido sin alterar el significado.
Prueba objetiva: Son aquellas pruebas que se realicen intentando evitar cualquier aspecto que pueda ser
interpretado desde una subjetividad, tanto por el que realiza la prueba, como sobre todo, por el que la evalúa.
Prueba Post−hoc: Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de
rango post hoc permiten determinar qué medias difieren. La prueba de rango post hoc identifica subconjuntos
homogéneos de medias que no se diferencian entre sí.
pruebas de bondad de ajuste: Es una prueba no paramétrica que contrasta si las frecuencias observadas en
cada una de las clases de una variable categórica varían de forma significativa de las frecuencias que se
esperaría encontrar si la muestra hubiese sido extraída de una población con una determinada distribución de
frecuencias.
Ji cuadrado: La prueba estadística de X2 para una muestra se emplea frecuentemente como prueba de bondad
de ajuste, sin embargo, en un plan experimental, en el que se cuenta con un grupo muestral, con diversas
subclases y las mediciones están en escala nominal, resulta muy útil este procedimiento.
La eficacia de la prueba está de acuerdo con el tamaño de la muestra, pues con un grado de libertad, si hay dos
subclases, algunos autores consideran que la prueba es insensible, no obstante la información que aporta más
de dos categorías es satisfactoria en función de la fórmula:
X2 = ð HN=l (fo − fe)2
fe
Prueba de McNemar: Prueba que comprueba, para dos variables dicotómicas relacionadas, si los pares de
respuestas desiguales (0,1) y (1,0) tienen la misma probabilidad. Esta prueba es muy útil para detectar
cambios de una categoría a otra en los diseños experimentales de tipo antes−después.
Prueba Binomial: Prueba para contrastar si una muestra procede de una distribución binomial con la
probabilidad especificada de éxito (p).
5
Prueba de Kolmogorov−Smirnoff: Se trata de un modelo no−paramétrico para comprobar bondad de ajuste.
La clasificación de este modelo se debe al hecho que no depende de una distribución original especifica; no se
sabe a priori la forma de la distribución de donde se sacan los datos. El modelo de Kolgomorov−Smirnov se
aplica a distribuciones de tipo ordinal. También se la usa para probar hipótesis acerca de distribuciones
discretas. Se basa en calcular las diferencias, en valor absoluto, entre las frecuencias acumuladas relativas
observadas y las esperadas, en cada clase. Luego se busca la mayor de las diferencias en valor absoluto, y la
diferencia máxima obtenida se compara con el valor critico de tablas.
6
Descargar