Estadística y Método Científico Hugo S. Salinas Fuente: http://dta.utalca.cl/estadistica/ Estadística y Método Científico Podemos definir Estadística como la ciencia de los datos. La palabra ciencia viene del latín “scientia” que significa conocimiento. El método científico es un conjunto de principios yprocedimientos para la búsqueda sistemática del conocimiento. El método científico está compuesto por los siguientes pasos: 1. Formula una teoría (problema). 2. Recoger datos para probar la teoría. 3. Analizar los datos. 4. Interpretar los resultados y tomar una decisión. El método científico es un procedimiento iterativo de aprendizaje. No podemos tener certeza de la veracidad de las teorías que probemos usando el método científico, eso es inherente a la ciencia. La ciencia está, por lo tanto, todo el tiempo revisando sus teorías. La Estadística no es un conjunto de diferentes técnicas aisladas unas de otras, sino que la Estadística, en conjunto con el método científico, nos entrega un procedimiento analítico para tomar decisiones. El lenguaje de toma de decisiones en Estadística Constantemente buscamos información para tomar decisiones. Al levantarnos en la mañana observamos como está el tiempo para decidir como vestirnos o averiguamos si va haber mucho sol para decidir si llevamos ropa ligera, etc. Inconscientemente aplicamos la lógica estadística para tomar ese tipo de decisiones. Además veremos como podemos usar la estadística para situaciones tan diversas como: • Analizar si el tabaquismo se asocia al cáncer al pulmón. • Analizar si la reforma educacional mejoró la calidad de la educación en Chile. • Predecir los resultados de las próximas elecciones. • Predecir si ocurrirá una situación de emergencia ambiental en Santiago. Aprender estadística es como aprender un nuevo idioma. Definiciones: Una población es el grupo de objetos o individuos bajo estudio, acerca de los cuales queremos obtener información. Una muestra es una parte de la población de la cual se obtiene información. Inferencia estadística es el proceso de sacar conclusiones acerca de una población basados en información de una muestra de esa población. ¿Debo tomar Aspirina o Migranol para el dolor de cabeza? Laboratorios A me dice que tome Aspirina Existe teoría (antigua) de que lo mejor es Aspirina Laboratorios B me dice que tome Migranol Existe teoría (nueva) de que lo mejor es Migranol Tenemos dos teorías que compiten. En estadística las vamos a llamar HIPOTESIS. El lenguaje de toma de decisiones en Estadística cont. Definiciones: La hipótesis nula, denotada por H0, es el “status quo”, lo convencional, lo que sabemos de la población, lo aceptado hasta el momento. La hipótesis alternativa, denotada por H1, es una alternativa a la hipótesis nula, implica cambio, es lo que el investigador espera que sea cierto. H0: El nuevo medicamento es tan efectivo como el antiguo. H1: El nuevo medicamento es más efectivo que el antiguo. Durante el curso revisaremos los pasos para tomar una decisión en estadística, por ahora los podemos resumir en: 1. Tenemos una hipótesis, que la asumimos cierta. 2. Obtenemos datos de un experimento relativo a la hipótesis. 3. Tomamos una decisión acerca de la hipótesis a partir de cuán probable son esos datos proviniendo de la hipótesis. Definición: Los datos que obtenemos de una muestra serán estadísticamente significativos, si las observaciones son muy poco probables si H0 es verdadera. Si los datos son estadísticamente significativos, entonces rechazamos H0. El lenguaje de toma de decisiones en Estadística cont. ¿Qué errores podemos cometer? El sistema de justicia tiene como principio básico que un inculpado en un juicio debe ser considerado inocente hasta que se pruebe lo contrario (que es culpable). ¿Cuáles serán las hipótesis nula y alternativa en el contexto de un juicio? H0: El inculpado es H1: El inculpado es Los abogados defensores y el fiscal presentan sus casos. El juez debe ponderar la evidencia presentada y decidir si es suficiente para declarar culpable al inculpado. Pero el sistema de justicia no es perfecto. Si el juez decide que es culpable y en realidad es inocente, ocurre un error. Si el juez decide que la duda es razonable y lo declara inocente y el inculpado era en realidad culpable, ocurre un error. Definición: Error Tipo I: es el error que se comete cuando rechazamos la hipótesis nula (H0) en circunstancia que es la hipótesis verdadera. Error tipo II: es el error que se comete cuando aceptamos la hipótesis nula (H0) en circunstancia que es la hipótesis falsa. El lenguaje de toma de decisiones en Estadística cont. Podemos cometer un Error Tipo I sólo si rechazamos H0 . Podemos cometer un Error Tipo II sólo si no rechazamos H0 . Ejemplo: Probando un test o prueba para detectar el cáncer: H0: El sujeto está sano H1: El sujeto padece cáncer ¿Cuáles son los dos tipos que errores que se pueden cometer al decidir entre las dos hipótesis? Error Tipo I: Error Tipo II: ¿Cuáles son las consecuencias del error tipo I? ¿Cuáles son las consecuencias del error tipo II? ¿Cuál error es más grave desde un punto de vista ético? Generalmente queremos proteger lo que ya conocemos reduciendo la probabilidad de cometer el Error Tipo I. Si el Error Tipo I es considerado grave, ¿por qué no hacerlo cero?. Una posible manera de no cometer el error tipo I sería no rechazar nunca la hipótesis nula. Pero si hacemos esto nunca vamos a aceptar una teoría nueva. Tenemos que correr un pequeño riesgo. El lenguaje de toma de decisiones en Estadística cont. Indicar si son verdaderos o falsos las siguientes proposiciones: 1. Un nivel de significación del 5% significa que, en promedio, 5 de cada 100 veces que rechacemos la hipótesis nula estaremos equivocados. 2. Un nivel de significación del 5% significa que, en promedio, 5 de cada 100 veces que la hipótesis nula es cierta la rechazaremos. El lenguaje de toma de decisiones en Estadística cont. ¿Qué hay en la bolsa? Se tienen dos bolsas idénticas Bolsa A y Bolsa B. Cada bolsa contiene 20 vales. El contenido de cada bolsa es (en miles de pesos): El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont. El lenguaje de toma de decisiones en Estadística cont.