Profesor Jaiver Rodriguez Heras M.Sc en Estadística Aplicada [email protected] Bloque E, Tercer piso DEPARTAMENTO CIENCIAS BASICAS Y BIOMEDICAS Bioestadística Nombre de expositor Probabilidad y su Aplicación en Salud Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos seguir lo que es más probable. Descartes, en su Discurso del Método. Bioestadística. M. Borda P. 2013. • ¿Cuál es la probabilidad de aprobar Bioestadística? • ¿Cuál es la probabilidad de no encontrarme un trancón cuando voy a clase? • Me ganaré el baloto? Conceptos Importantes Experimento aleatorio: Es aquel en el que se conocen todos los posibles desenlaces, pero se desconoce cual va a suceder. Variable aleatoria: Los valores que toma la variable son determinados por el azar. Pueden ser cualitativas o cuantitativas. Evento: es uno o más de los posibles resultados de un experimento aleatorio. Pueden ser mutuamente excluyentes o exhaustivos. Bioestadística. M. Borda P. 2013. Definición y Tipos . Todos los resultados Clásica o Apriori Objetiva Frecuencia Relativa o Aposteriori Probabilidad: Posibilidad de que un evento ocurra o no. Varia entre 0 y 1 o 100 Subjetiva Se da cuando no se tiene datos para realizar cálculos, por lo que se recurre a un experto a fin de que establezca la probabilidad. Bioestadística. M. Borda P. 2013. son probables, mutuamente excluyentes y exhaustivos. Se establece como: Número de resultados favorables / Numero de resultados posibles Se estima por la frecuencia relativa La probabilidad se define (definición de Laplace) como el cociente entre el número de casos favorables y el número de casos totales . • Sucesos Evento Cuando se realiza un experimento aleatorio diversos resultados son • Se llama suceso a un subconjunto de dichos resultados. • Se llama suceso contrario (complementario-complemento) de un suceso A, A’, al formado por los elementos que no están en A • Se llama suceso unión de A y B, AUB, al formado por los resultados experimentales que están en A o en B (incluyendo los que están en ambos. • E espacio muestral posibles. El conjunto de todos los resultados posibles se llama espacio muestral (E). E espacio muestral A A’ Se llama suceso intersección de A y B, A∩B o simplemente AB, al formado por los elementos que están en A y B E espacio muestral E espacio muestral UNIÓN A B E espacio muestral INTERS A . B A B Definición de probabilidad • Se llama probabilidad a cualquier función, P, que asigna a cada suceso A un valor numérico P(A), verificando las siguientes reglas (axiomas) – P(E)=1 E espacio muestral 100% E espacio muestral – 0≤P(A) ≤1 – P(AUB)=P(A)+P(B) si A∩B=Ø • Ø es el conjunto vacío. A B • Puedes imaginar la probabilidad de un subconjunto como el tamaño relativo con respecto al total (suceso seguro) EJEMPLOS E espacio muestral A B P(A)=3/9=1/3 P(A)=? P(B)=5/9P(B)=? P(AUB)=6/9=2/3 P(AUB)=? P(AB)=2/9 P(AB)=? P(A’)=? P(A’)=6/9=2/3 P(B’)=4/9 P(B’)=? E espacio muestral A B E espacio muestral A B P(A)=3/9=1/3 P(A)=? P(B)=2/9P(B)=? P(AUB)=5/9 P(AUB)=? P(AB)=0P(AB)=? P(A’)=6/9=2/3 P(A’)=? P(B’)=7/9 P(B’)=? P(A)=3/9=1/3 P(A)=? P(B)=? P(B)=2/9 P(AUB)=3/9=1/ P(AUB)=? 3 P(AB)=2/9 P(AB)=? P(A’)=? P(A’)=6/9=2/3 P(B’)=7/9 P(B’)=? Probabilidad condicionada • Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B: E espacio muestral P(AÇ B) P(A | B) = P(B) A B Error frecuentíiiiiiisimo: No confundas la probabilidad condicionada con intersección. En ambos medimos efectivamente la intersección, pero… En P(A∩B) con respecto a P(E)=1 En P(A|B) con respecto a P(B) EJEMPLOS P(A)=3/9=1/3 E espacio muestral P(B)=5/9 P(AUB)=6/9=2/3 A P(AB)=2/9 B P(A’)=6/9=2/3 P(B’)=4/9 P(B|A)=? P(A|B)=?P(B|A)=2/3 P(A|B)=2/5 P(A)=3/9=1/3 P(B)=2/9 A P(AUB)=5/9 B P(AB)=0 P(A’)=6/9=2/3 P(B’)=7/9 P(B|A)=0 P(B|A)=? P(A|B)=0 P(A|B)=? E espacio muestral P(A)=3/9=1/3 E espacio muestral P(B)=2/9 A P(AUB)=3/9=1/3 P(AB)=2/9 B P(A’)=6/9=2/3 P(B’)=7/9 P(A|B)=? P(B|A)=2/3 P(B|A)=? P(A|B)=1 Intuir la probabilidad condicionada A A B B P(A) = 0,25 P(B) = 0,10 P(A∩B) = 0,10 P(A) = 0,25 P(B) = 0,10 P(A∩B) = 0,08 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=1 P(A|B)=0,8 Intuir la probabilidad condicionada A A B B P(A) = 0,25 P(B) = 0,10 P(A∩B) = 0,005 P(A) = 0,25 P(B) = 0,10 P(A∩B) = 0 ¿Probabilidad de A sabiendo que ha pasado B? P(A|B)=0,05 P(A|B)=0 Algunas reglas de cálculo prácticas • Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo: – P(A’) = 1 - P(A) – P(AUB) = P(A) + P(B) - P(AB) – P(AB) = P(A) P(B|A) = P(B) P(A|B) • Prob. de que pasen A y B es la prob. de A y que también pase B sabiendo que pasó A. Recuento Ejemplo (I) CLASIFICACION OMS NORMAL OSTEOPENIA OSTEOPOROSIS Total MENOPAUSIA NO SI 189 280 108 359 6 58 303 697 Total 469 467 64 1000 • Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de una población muy grande. El resultado está en la tabla. – ¿Cuál es la probabilidad de que una mujer tenga osteoporosis? • P(Osteoporosis)=64/1000=0,064=6,4% – Noción frecuentista de probabilidad – ¿Cuál es la probabilidad de que una mujer no tenga P(A’) = 1 - P(A) osteoporosis? • P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6% Recuento Ejemplo (II) CLASIFICACION OMS Total NORMAL OSTEOPENIA OSTEOPOROSIS MENOPAUSIA NO SI 189 280 108 359 6 58 303 697 Total 469 467 64 1000 • ¿Probabilidad de tener osteopenia u osteoporosis? P(AUB) = P(A) + P(B) - P(AB) – P(OsteopeniaUOsteoporosis)=P(Osteopenia)+P(Osteoporosis)P(Osteopenia∩Osteoporosis)=467/1000+64/1000=0,531 • Son sucesos disjuntos • Osteopenia ∩ Osteoporosis=Ø • ¿Probabilidad de tener osteoporosis o menopausia? P(AUB) = P(A) + P(B) - P(AB) – P(OsteoporosisUMenopausia)=P(Osteoporosis)+P(Menopausia)-P(Osteoporosis ∩ Menopausia)=64/1000+697/1000-58/1000=0,703 • No son sucesos disjuntos • ¿Probabilidad de una mujer normal? – P(Normal)=469/1000=0,469 – P(Normal)=1-P(Normal’)=1-P(OsteopeniaUOsteoporosis) =1-0,531=0,469 Recuento Ejemplo (III) CLASIFICACION OMS NORMAL OSTEOPENIA OSTEOPOROSIS Total MENOPAUSIA NO SI 189 280 108 359 6 58 303 697 Total 469 467 64 1000 Si es menopáusica… ¿probabilidad de osteoporosis? P(A|B) = P(A∩B)/P(B) – P(Osteoporosis|Menopausia)=58/697=0,098 ¿Probabilidad de menopausia y osteoporosis? P(A∩B) = P(B) P(A|B) – P(Menop ∩ Osteoporosis) = 58/1000=0,058 • Otra forma: P( Menop Osteoporosis ) P( Menop ) P(Osteoporosis | Menop ) 697 58 58 / 1000 0,058 1000 697 Recuento Ejemplo (III) CLASIFICACION OMS NORMAL OSTEOPENIA OSTEOPOROSIS Total MENOPAUSIA NO SI 189 280 108 359 6 58 303 697 • Si tiene osteoporosis… ¿probabilidad de menopausia? – P(Menopausia|Osteoporosis)=58/64=0,906 Total 469 467 64 1000 Independencia de sucesos • Dos sucesos son independientes si el que ocurra uno, no añade información sobre el otro. – A es independiente de B P(A|B) = P(A) P(AB) = P(A) P(B) Recuento A es independiente de B P(A|B) = P(A) Ejemplo (IV) CLASIFICACION OMS P(AB) = P(A) P(B) NORMAL OSTEOPENIA OSTEOPOROSIS Total MENOPAUSIA NO SI 189 280 108 359 6 58 303 697 Total 469 467 64 1000 • ¿Son independientes menopausia y osteoporosis? – Una forma de hacerlo • P(Osteoporosis)=64/1000=0,064 • P(Osteoporosis|Menopausia)=58/697=0,098 – La probabilidad de tener osteoporosis es mayor si ha pasado la menopausia. Añade información extra. ¡No son independientes! – ¿Otra forma? • P(Menop ∩ Osteoporosis) = 58/1000 = 0,058 • P(Menop) P(Osteoporosis)= (697/1000) x (64/1000) = 0,045 – La probabilidad de la intersección no es el producto de probabilidades. No son independientes. Aplicación del Árbol de Probabilidades a las Pruebas de tamizaje. Sensibilidad, verdaderos + VP (+) Enfermo Falsos - FN (-) Individuo Falsos + FP (+) Sano Especificidad, Verdaderos Bioestadística. M. Borda P. 2013. VN (-) Árbol de Probabilidades Efecto (+) Expuestos al riesgo Efecto (-) Población sana a Silicosis No expuestos al riesgo Efecto (+) Efecto (-) Bioestadística. M. Borda P. 2013. Ejemplo (I): En este aula el 70% de los alumnos son mujeres. De ellas el 10% son fumadoras. De los hombres, son fumadores el 20%. T. Prob. Total. Hombres y mujeres forman un sist. Exh. Excl. de sucesos • ¿Qué porcentaje de fumadores hay? – P(F) = P(M∩F) + P(H∩F) = P(M)P(F|M) + P(H)P(F|H) 0,1 Mujer 0,7 Fuma 0,9 No fuma Estudiante =0,7 x 0,1 + 0,3 x 0,2 = 0,13 =13% 0,2 0,3 •Los caminos a través de nodos representan intersecciones. •Las bifurcaciones disjuntas. Tema 4: Probabilidad representan uniones22 Fuma Hombre 0,8 No fuma Ejemplo (II): En un centro hay dos quirófanos. El 1º se usa el 75% de veces para operar. En el 1º la frec. de infección es del 5% y en el 2º del 10%. 0,05 • ¿Qué probabilidad de infección hay? – P(I) = P(Q1∩I) + P(Q2∩I) = P(Q1)P(I|Q1) + P(Q2)P(I|Q2) Q1 0,75 Infec 0,95 No infec Paciente =0,75 x 0,05 + 0,25 x 0,1 = 0,0625 0,1 0,25 T. Prob. Total. Los dos quirófanos forman un sist. Exh. Excl. de sucesos Infec Q2 0,9 No infec Ejemplo (III): El 20% del tiempo que se está en una casa transcurre en la cocina, el 10% en el baño y el resto entre el salón y el dormitorio. Por otro lado, la probabilidad de tener un accidente doméstico estando en la cocina es de 0,30 de tenerlo estando en el baño es de 0,20 y de tenerlo fuera de ambos de 0,10. ¿Cuál es la probabilidad de tener un accidente doméstico? 0,30 Cocina 0,20 Acc No Acc P(A) = P(A∩C) + P(A∩B) + P(A∩R) = 0,70 P(C)P(A|C) + P(B)P(A|B) + P(R)P(A|R) Acc =0,2 x 0,3 + 0,1 x 0,2 + 0,7 x 0,1 = 0,20 Casa 0,10 No Acc Baño 0,80 0,70 0,10 Acc Resto 0,90 No Acc 0,15 = 15% Sensibilidad 0,90 Enferma 0,25 Resultado Positivo 0,10 Resultado Negativo Población 0,20 0.75 Resultado Positivo Sana 0,80 Resultado Negativo Especificidad • Sabiendo que un individuo dio positivo, ¿Cuál es la probabilidad de que tenga la enfermedad? • 𝑃 𝐸𝑃 = 𝑃(𝐸∩𝑃) 𝑃(𝑃) Sensibilidad 0,90 Enferma (E)) 0,25 Resultado Positivo (P) 0,10 Resultado Negativo (N) Población 0.75 Especificidad 0,20 Resultado Positivo (P) Sana (S) 0,80 Resultado Negativo (N) • Primero calculamos la probabilidad de qué el resultado sea positivo: • P(Positivo) = P(E∩P) + P(S∩P) = P(E)P(P|E) + P(S)P(P|S) =(0,25 x 0,90) + (0,75 x 0,2) = 0,225 + 0,15 = 0,375 Sensibilidad 0,90 Enferma (E)) Resultado Positivo (P) 0,10 0,25 Resultado Negativo (N) Población 0.75 0,20 Resultado Positivo (P) Sana (S) 0,80 Resultado Negativo (N) Especificidad • Ahora sabiendo que un individuo dio positivo, la probabilidad de que tenga la enfermedad es: • 𝑃 𝐸𝑃 = 𝑃(𝐸∩𝑃) 𝑃(𝑃) = (0,25∗0,90) 0,375 = 0,225 0,375 = 0,60 Fuman 0,70 Hombres 0,30 0,40 No Fuman Estudiante 0,20 0.60 Fuman Mujeres 0,80 No Fuman • Ahora sabiendo que un individuo fuma, la probabilidad de que sea hombre es: • 𝑃 𝐻𝐹 = 𝑃(𝐻∩𝐹) 𝑃(𝐹) = (0,4∗0,7) 0,4∗0,7 +(0,2∗0,6) = 0,28 0,40 = 0,7 0,0001 Accidente Hombres 0,75 No Acciden 0,9999 Conductor 0,0005 0,25 Accidente Mujeres 0,9995 No Accident • Ahora sabiendo que un individuo sufrió un accidente, la probabilidad de que sea mujer es: • 𝑃 𝑀𝐴 = 𝑃(𝑀∩𝐴) 𝑃(𝐴) = (0,25∗0,0005) 0,75∗0,0001 +(0,25∗0,0005) = 0,000125 0,000200 = 0,625 20% No Fin Enferme 50% Final 80% Final 10% Carrer 30% No Final Medici 90% 20% 5% Final Veteri 95% No Final • Ahora sabiendo que un individuo finaliza su carrera, la probabilidad de que sea enfermería es: • 𝑃 𝐸𝐹 = 𝑃(𝐸∩𝐹) 𝑃(𝐹) = (0,2∗0,5) 0,2∗0,5 + 0,1∗0,3 +(0,05∗0,2) = 0,10 0,14 = 0,714 En una población de mujeres, 4% tienen cáncer de seno, 20% son fumadoras y 3% son fumadoras y tienen cáncer de seno. Si una mujer es elegida al azar de esta población ¿Cuál es la probabilidad de que tenga cáncer de seno o sea fumadora? En un laboratorio se experimenta sobre una enfermedad que puede estar producida por tres virus: A, B y C. Hay tres tubos de ensayo con el virus A, dos tubos con el virus B y cinco tubos con el virus C. La probabilidad de que el virus A produzca la enfermedad es de un tercio, que la produzca B es de dos tercios y que la produzca el virus C es de un séptimo. Se inocula un virus a un animal y este contrae la enfermedad. ¿Cuál es la probabilidad de que el virus inoculado sea el C? • • Un investigador de una clínica de especialistas ha descubierto que durante un periodo de varios años, el 20% de los pacientes que llegaron a la clínica tenían la enfermedad D1, el 30% la enfermedad D2, y el 50% la enfermedad D3. El investigador descubrió también que un conjunto de síntomas bien definidos al que denomino S, se encontraba en un 25% de los pacientes con la enfermedad D1, 60% de los que tenían la enfermedad D2, y 80% de los que tenían la enfermedad D3. El investigador quiere utilizar esta información para hacer rápidamente el diagnostico a los pacientes recién llegados. Supongamos que ha sido admitido un paciente con el conjunto de síntomas S, cuál es la probabilidad de que tenga la enfermedad D3, cuál es la probabilidad de que tenga la enfermedad D1. • La siguiente tabla muestra la distribución de 400 personas según habito de fumar y frecuencia de bronquitis crónica. a) Si de este grupo se elige una persona al azar, haga un esquema del espacio muestral, indicando todos los subconjuntos de sucesos posibles. Use B como símbolo para el suceso de tener bronquitis y F para el suceso de ser fumador. b) Si de este grupo se elige una persona al azar, cuál es la probabilidad de que: • Fume y tenga bronquitis • Fume y no tenga bronquitis • No fume y tenga bronquitis • No fume y no tenga bronquitis c) Cuánto suman las probabilidades calculadas en b) y por qué. d) Calcule la probabilidad de que una persona elegida al azar de este grupo: • Tenga bronquitis • Tenga bronquitis dado que fuma • De acuerdo a los resultados obtenidos en (d). ¿Es el suceso de tener bronquitis independiente del suceso de fumar? ¿Por qué? e) ¿Cuántos fumadores con bronquitis esperaría usted que hubiera en este grupo de 400 personas si el suceso de fumar fuera independiente de tener bronquitis? En una población el 20% de los habitantes son ancianos, el 50% son adultos y el 30% restante son niños. Entre los ancianos sólo el 25% son varones, mientras que entre los adultos son varones el 40% y entre los niños son varones el 50%. Se elige al azar a un habitante de la población y se pide: a. Probabilidad de que sea un varón. 40% b. Si sabemos que es un varón, la probabilidad de que sea un anciano. 12,5% Si se elige al azar a dos habitantes de la población y se pide: c. Probabilidad de que sean ambos del mismo sexo. Un estudio indica que el 10% de la población estadounidense tiene 65 años o más, y que el 1% de la población total padece deficiencia cardiaca moderada. Además, el 10,4% de la población tiene 65 años o más o padece tal deficiencia. Para un individuo seleccionado aleatoriamente, calcular la probabilidad de que padezca la deficiencia, en los siguientes casos: a. Si tiene 65 años o más. b. Si tiene menos de 65 años. RECOMENDACIONES PRÁCTICAS • Cuando se aplica la regla de la adición de probabilidades, determinar previamente si los eventos son excluyentes o no. • Cuando se usa la regla de la multiplicación, determinar si los eventos son dependientes o independientes. • Siempre que sea posible, apoyar la interpretación del problema mediante el empleo de diagramas de Venn. • La probabilidad es un número que nunca puede tener valor negativo, ni ser mayor que 1 . La siguiente tabla recoge las proporciones de adultos en cierta ciudad, clasificadas en aquellos que fuman o no fuman y aquellos que tiene problemas de salud: Problemas Fuman No fuman Sí 0,15 0,09 No 0,18 0,58 a) Cuál es la probabilidad de que un adulto de esta población elegido al azar tenga problemas de salud? b) Cuál es la probabilidad de que un adulto de esta población elegido al azar fume? c) Cuál es la probabilidad de que un adulto de esta población elegido al azar que no fume tenga problemas de salud? • La probabilidad de que un doctor diagnostique en forma correcta una determinada enfermedad es de 0.7. Dado que el doctor hace un diagnostico incorrecto, la probabilidad de que un paciente presenta una demanda es de 0.9. ¿cuál es la probabilidad de que el doctor haga un diagnostico incorrecto y el paciente presente una demanda? • Un científico ha descubierto en un hospital para enfermedades crónicas que el 15% de los pacientes permanecen en el hospital menos de 30 días, mientras que el 85% de los pacientes permanece 30 días o más . También ha descubierto que el 20% de los que se quedan menos de 30 días y el 60% de los que se quedan 30 días o más, presentan cierto grupo de características. ¿Cual es la probabilidad de que un paciente que llega al hospital con esas características permanezca menos de 30 días? Sensibilidad Medidas tradicionales del valor diagnóstico de una prueba VALIDEZ Especificidad Patrón oro (Enfermedad) Positiva (+) Negativa (-) Total Presente (E) Ausente (no E) Total VP FP VP+FP a b FN c d (pruebas positivas) VN FN+VN (pruebas negativas) VP + FN ( a+c ) enfermos FP + VN ( b+d) sanos n=(a+b+c+d) VP = a = Verdaderos Positivos: con P.D. (+) FP = b = Falsos Positivos: no E con P.D.(+) FN = c = Falsos Negativos: E con P.D. (-) VN = d = Verdaderos Neg. : no E con P.D. (-) Negativa 10 100 Enfermos Prueba Positiva 90 Sensibilidad 90% a Sensibilidad ac a 400 Sensibilidad 0.8 ó 80 0 0 a c 400 100 La prueba identifica al 80% de enfermos (positivos verdaderos) y habra 20% de enfermos que no son identificados por la prueba (falsos negativos) Positiva 10 100 Sanos Prueba Negativa 90 Especificidad 90% d Especificidad bd También sea denominada “fracción de verdaderos negativos (FVN)”. d 450 Especificidad 0.9 ó 90 0 0 d b 50 450 La prueba identifica al 90% de sanos (negativos verdaderos) y no identifica a 10% de los sanos (falsos positivos) Valor predictivo Positivo Si la prueba es positiva ¿Cuál es la probabilidad que el individuo tenga la enfermedad? Este es igual a la proporción de individuos con una prueba positiva que padecen la enfermedad. Cuando a un paciente se le realiza alguna prueba, el médico carece de información a priori acerca de su verdadero diagnóstico, y más bien la pregunta se debe plantear en sentido contrario: ante un resultado positivo (negativo) en la prueba, ¿cuál es la probabilidad de que el paciente esté realmente enfermo (sano)? Sanos 10 Prueba 100 Personas Con prueba Positiva Enfermos 90 VP positivo 90% a Valor predictivo positivo ab a 400 Valor predictivo positivo 0.889 ó 88.9 0 0 a b 400 50 Si la prueba es positiva, La probabilidad que el sujeto tenga la enfermedad es de 88.9% Valor predictivo Negativo Si la prueba es negativa ¿Cuál es la probabilidad que el individuo no tenga la enfermedad? Este es igual a la proporción de individuos con una prueba negativa que no padecen la enfermedad enfermos 10 d Valor predictivo negativo cd d 450 Valor predictivo negativo 0.818 ó 81.8 0 0 c d 100 450 Si la prueba es negativa, la probabilidad de que el sujeto no tenga la enfermedad es de 81.1% Observaciones • En el ejemplo anterior, al llegar un individuo a la consulta tenemos una idea a priori sobre la probabilidad de que tenga una enfermedad. -¿Qué probabilidad tengo de estar enfermo? - En principio un 2%. Le haremos unas pruebas. • A continuación se le pasa una prueba diagnóstica que nos aportará nueva información: Presenta glucosuria o no. • En función del resultado tenemos una nueva idea (a posteriori) sobre la probabilidad de que esté enfermo. – Nuestra opinión a priori ha sido modificada por el resultado de un experimento. - Presenta glucosuria. La probabilidad ahora es del 45,6%.