ÍNDICE : Introducción • Número factorial • Variaciones

Anuncio
ÍNDICE :
• Introducción
• Número factorial
• Variaciones
• Permutaciones
• Combinaciones
• Números combinatorios
• Triángulo de Tartáglia
• Binómio de Newton
Introducción : La combinatoria estudia las diferentes formas en que se pueden realizar la ordenación o
agrupamiento de unos cuantos objetos siguiendo unas determinadas condiciones o reglas . Una forma de hacer
estos recuentos es utilizar los diagramas en árbol . Estos recuentos están intimamente relacionados con la
probabilidad .
Número factorial : es el producto de nos consecutivos naturales
n! = (n)·(n−1)·(n−2)·.........3·2·1
Todo producto tiene al menos dos factores , luego debemos admitir que 0! = 1 y que 1! = 1
Variaciones ordinarias :
Se llama variaciones ordinarias de m elementos tomados de n en n ( n
m ) a los distintos grupos formados por n elementos de forma que :
• los n elementos que forman el grupo son distintos ( no se repiten )
• Dos grupos son distintos si se diferencian en algún elemento o en el orden en que están colocados (
influye el orden ) .
Vm,n =
Variaciones con repetición : se llama variaciones con repetición de m elementos tomados de n en n a los
distintos grupos formados por n elementos de manera que :
• los elementos que forman cada grupo pueden estar repetidos
• Dos grupos son distintos si se diferencian en algún elemento o en el orden en que estos están
colocados ( influye el orden ) .
VRm,n = mn
Permutaciones ordinarias : se llama permutaciones de m elementos a las diferentes agrupaciones de esos m
elementos de forma que :
• en cada grupo intervienen los m elementos sin repetirse ninguno (intevienen todos los elementos )
• dos grupos son diferentes si el orden de colocación de alguno de esos m elementos es distinto (
influye el orden ) .
1
Pm = m!
Permutaciones con repetición : se llama permutaciones con repetición de m elementos donde el primer
elemento se repite a veces , el segundo b veces , el tercer c .......... a los distintos qrupos que pueden formarse
con esos m elementos de forma que :
• intervienen todos los elementos
• dos grupos se diferencian en el orden de colocación de alguno de sus elementos .
PRma,b,c... =
Combinaciones : se llama combinaciones de m elementos tomados de n en n ( n
m ) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que :
• cada agrupación está formada por n elementos distrintos entre sí
• dos agrupaciones distintas se diferencian al menos en un elemento , sin tener en cuenta el orden .
Cm,n =
=
= número combinatorio
Combinaciones con repetición : se llama combinaciones con repetición de m elementos tomados de n en n ,
a los distintos grupos formados por n elementos de manera que :
• los elementos que forman cada grupo pueden estar repetidos
• dos agrupaciones distintas se diferencian al menos en un elemento , sin tener en cuenta el orden .
CRm,n =
Por ejemplo las combinaciones con repetición de los elementos (a,b,c,d) tomados de dos en dos son :
aa ab ac ad
bb bc bd
cc cd
dd
Otro ejemplo : en una bodega hay 12 botellas de ron , 12 de ginebra y 12 de anís .Un cliente compró 8 botellas
en total . ¿Cuántas posibilidades hay ?
CR8,3 = 120
Resumen :
2
Intervienen todos los elementos Permutaciones
Influye el orden Variaciones
No intervienen todos los elementos
No influye el orden Combinaciones
Números combinatorios : se llama número combinatorio de índice m y orden n al número de combinaciones
de m elementos tomados de n en n tales que n
m.
=
Propiedades :
•
=
=1
•
=
•
+
=
•
+
+................+
3
=
Triángulo de Tartaglia o Pascal :
1
4
11
121
1331
14641
Binomio de Newton :
(a + b) = a + b
(a + b)2 = a2 + 2ab + b2
(a + b)3 = a3 + 3a2b + 3ab2 + b3
(a + b)4 = a4 + 4a3b + 6 a2b2 + 4ab3 + b4
...........................................
Si nos fijamos atentamente , los coeficientes coinciden con los del triángulo de Pascal , los exponentes de a
van disminuyendo desde n hasta 0 y los de b van aumentando desde 0 hasta n , y en cada término la suma de
los exponentes de a y b es igual a n .
Generalizando :
(a + b)n =
anb0 +
an−1b1 + ......................+
a1bn−1 +
a0bn
ÍNDICE
• Definición de Estadística
• Conceptos generales
• Tratamiento de la información
• Representación de los datos
• Medidas de centralización
• Medidas de dispersión
• Estadística bidimensional
• Correlación
• Regresión
Definición de Estadística : la palabra estadística procede del vocablo "estado" pues era función principal de
los gobiernos de los estados establecer registros de población , nacimientos , defunciones , etc . Hoy en día la
5
mayoría de las personas entienden por estadística al conjunto de datos , tablas , gráficos , que se suelen
publicar en los periodicos .
En la actualidad se entiende por estadística como un método para tomar decisiones , de ahí que se emplee en
multitud de estudios científicos .
La estadística se puede dividir en dos partes :
• Estadística descriptiva o deductiva , que trata del recuento , ordenación y clasificación de los datos
obtenidos por las observaciones . Se construyen tablas y se representan gráficos , se calculan
parámetros estadísticos que caracterizan la distribución , etc.
• Estadística inferencial o inductiva , que establece previsiones y conclusiones sobre una población a
partir de los resultados obtenidos de una muestra . Se apoya fuertemente en el cálculo de
probabilidades .
Población : es el conjunto de todos los elementos que cumplen una determinada característica . Ejemplo :
alumnos matriculados en COU en toda España .
Muestra : cualquier subconjunto de la población . Ejemplo : alumnos de COU del Sotomayor .
Carácter estadístico : es la propiedad que permite clasificar a los individuos , puede haber de dos tipos :
• Cuantitativos : son aquellos que se pueden medir . Ejemplo : nº de hijos , altura , temperatura .
• Cualitativos : son aquellos que no se pueden medir . Ejemplo : profesión , color de ojos , estado civil .
Variable estadística : es el conjunto de valores que puede tomar el carácter estadístico cuantitativo ( pues el
cualitativo tiene "modalidades'' ) . Puede ser de dos tipos :
• Discreta : si puede tomar un número finito de valores . Ejemplo : nº de hijos
• Continua : si puede tomar todos los valores posibles dentro de un intervalo . Ejmplo : temperatura ,
altura .
Frecuencia absoluta fi : ( de un determinado valor xi ) al número de veces que se repite dicho valor .
Frecuencia absoluta acumulada Fi : ( de un determinado valor xi ) a su frecuencia absoluta más la suma de
las frecuencias absolutas de todos los valores anteriores .
Frecuencia relativa hi : es el cociente fi/N , donde N es el número total de datos .
Frecuencia relativa acumulada Hi : es el cociente Fi/N
Si las frecuencias relativas las multiplicamos por 100 obtenemos los % .
Tratamiento de la información : se deben de seguir los siguientes pasos :
• recogida de datos
• ordenación de los datos
• recuento de frecuencias
• agrupación de los datos , en caso de que sea una variable aleatoria continua o bien discreta pero con
un número de datos muy grande se agrupan en clases .
Nº de clases =
6
Los puntos medios de cada clase se llaman marcas de clase .
Además se debe adoptar el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la
derecha .
• construcción de la tabla estadística que incluirá , clases , marca de clase , fi , Fi , hi , Hi .
Ejemplo : Las notas de Matemáticas de una clase han sido las siguientes :
534128987667987710159980888957
Construir una tabla :
xi
0
1
2
3
4
5
6
7
8
9
fi
2
3
1
1
1
3
2
5
7
5
30
Fi
2
5
6
7
8
11
13
18
25
30
hi
2/30
3/30
1/30
1/30
1/30
3/30
2/30
5/30
7/30
5/30
1
Hi
2/30
5/30
6/30
7/30
8/30
11/30
13/30
18/30
25/30
30/30
Representaciones gráficas : para hacer más clara y evidente la información que nos dan las tablas se utilizan
los gráficos , que pueden ser :
• Diagramas de barras ( datos cualitativos y cuantitativos de tipo discreto ) . En el eje y se pueden
representar frecuencias absolutas o relativas .
• Histogramas ( datos cuantitativos de tipo continuo o discreto con un gran número de datos ) . El
histograma consiste en levantar sobre cada intervalo un rectángulo cuyo área sea igual a su frecuencia
absoluta
área = base · altura fi =
luego la altura de cada rectángulo vendrá dada por ni que se llama función de
densidad . Si por ejemplo un intervalo es doble de ancho que los demás su altura ni debe ser la mitad de la
frecuencia absoluta y así no se puede inducir a errores . Normalmente la amplitud de los intervalos es cte por
lo que ni será
proporcional a fi y por tanto podemos tomar fi como la altura ni ya que la forma del gráfico será la misma ,
aunque ahora el área del rectángulo ya no sea exactamente la frecuencia absoluta ( a no ser que la amplitud del
intervalo sea igual a 1 ) .
7
• Polígono de frecuencias
• Diagrama de sectores
• Cartogramas
• Pirámides de población
• Diagramas lineales
• Pictogramas
CÁLCULO DE PARÁMETROS :
Medidas de centralización :
• Media aritmética :
si son pocos datos
si son muchos valores pero se repiten mucho
En el caso de que los datos estén agrupados en clases , se tomará la marca de clase
como xi .
No siempre se puede calcular la media aritmética como por ejemplo cuando los
datos son cualitativos o los datos están agrupados en clases abiertas .
Ejemplo : hacer los cálculos para el ejercicio de las notas
• Moda : es el valor de la variable que presenta mayor frecuencia absoluta . Puede haber más de una .
Cuando los datos están agrupados en clases se puede tomar la marca de clase o utilizar la fórmula :
M0 = Linf +
donde : Linf = límite inferior de la clase modal ,
=amplitud
del intervalo , d1= diferencia entre la fi de la clase modal y la fi de la clase anterior y
d2 = diferencia entre la fi de la clase modal y la fi de la clase posterior .
También se puede hacer gráficamente :
8
La moda si sirve para datos cualitativos , pero no tiene por qué situarse en la zona
central del gráfico .
Ejemplo : en el ejercicio de las notas la moda sería x=8
• Mediana : es el valor de la variable tal que el número de observaciones menores que él es igual al
número de observaciones mayores que él . Si el número de datos es par , se puede tomar la media
aritmética de los dos valores centrales .
Cuando los datos están agrupados la mediana viene dada por el primer valor de la variable cuya Fi excede a la
mitad del número de datos . Si la mitad del número de datos coincide con Fi se tomará la semisuma ente este
valor y el siguiente .
Cuando los datos estén agrupados en clases se puede utilizar reglas de tres o la fórmula :
M = Linf +
Gráficamente se hace a partir del polígono de frecuencias acumuladas .
Ejemplo : En el caso de las notas podrías ordenar de menor a mayor los datos y obtendríamos : 0 0 1 1 1 2 3 4
5556677777888888899999
dato número 15−16 (por ser par)
luego la mediana sería 7
También se podría observar las Fi y ver que en el 7 se excede a la mitad del nº de datos , es decir , sobrepasa
el 15 .
• Cuantiles : son parámetros que dividen la distribución en partes iguales , así por ejemplo la mediana
los divide en dos partes iguales , los cuartiles son tres valores que dividen a la serie de datos en
cuatro partes iguales , los quintiles son cuatro valores que lo dividen en 5 partes , los deciles en 10 y
los percentiles en 100 . Se calculan de la misma manera que la mediana .
También se puede utilizar la fórmula : Cn = Linf +
donde n es el valor que deja el n% de valores por debajo de él .
Medidas de dispersión :
• Rango o recorrido : es la diferencia entre el mayor valor y el menor . Depende mucho de los valores
extremos por que se suele utilizar el rango intercuartílico =
Q3 − Q1 o el rango entre percentiles = P90 − P10
Ejemplo : Para el caso de las notas sería 9 − 0 = 9
9
• Varianza s2 : es la media aritmética de los cuadrados de las desviaciones respecto a la media (
desviación respecto a la media d = xi −
).
s2 =
=
s2 =
=
Al igual que la media en el caso de que los datos estén agrupados en clases , se tomará la marca de clase como
xi .
Otra forma de calcular s2 es :
s2 =
=
=
Se llama desviación típica s a la raíz cuadrada de la varianza . Es más útil que la varianza ya que tiene las
mismas dimensiones que la media
Ejemplo : Hacer los cálculos para el ejercicio de las notas
• Coeficiente de variación : es el cociente entre la desviación típica y la media aritmética . Valores
muy bajos indican muestras muy concentradas .
C.V. =
DISTRIBUCIONES BIDIMENSIONALES :
Variables estadísticas bidimensionales : es cuando al estudiar un fenómeno obtenemos dos medidas x e y ,
en vez de una como hemos hecho hasta ahora .
Ejemplo : pulso y tª de los enfermos de un hospital , ingresos y gastos de las familias de los trabajadores de
una empresa , edad y nº de días que faltan al trabajo los productores de una fábrica .
10
Tipos de distribuciones bidimensionales :
• cualitativa − cualitativa
• cualitativa − cuantitativa ( discreta o continua )
• cuantitativa ( discreta o continua ) − cuantitativa ( discreta o continua )
Tipos de tablas :
• Tabla de dos columnas xi , yi ( pocos datos )
• Tabla de tres columnas xi , yi , fi ( muchos datos y pocos valores posibles )
• Tablas de doble entrada ( muchos datos y muchos valores posibles )
x1
y1
f11
y2
f12
.....
.....
ym
f1m
fi*
f1*
Diagramas de dispersión :
x2
f21
f22
......
f2m
f2*
......
......
......
......
......
......
xn
fn1
fn2
......
fnm
fn*
f*j
f*1
f*2
......
f*m
f**=N
Si hay pocos datos ( tabla de dos columnas ), se representan las variables en los ejes x e y .
Si hay muchos datos pero muy agrupados ( tabla de tres columnas y tablas de doble entrada ), se hace igual
pero con los puntos más gordos según la fi ,o se pintan muchos puntos juntos , o se pinta en tres dimensiones
x , y , fi , con lo que obtendríamos un diagrama de barras en tres dimensiones .
Si hay muchos datos y muchos valores posibles , se pueden agrupar en clases , y se utilizan los
estereogramas ( 3 dimensiones ) en los que el volumen de cada prisma es proporcional a la frecuencia .
También se puede tomar la marca de clase de los intervalos y tratar la variable continua como si fuese discreta
.
Cálculo de parámetros :
• Cuando hay pocos datos o están muy agrupados ( tablas de 2 o 3 columnas )
Aparece un parámetro nuevo que es la covarianza que es la media aritmética de las desviaciones de cada una
de las variables respecto a sus medias respectivas .
11
=
• Cuando hay muchos datos ( tablas de doble entrada )
=
Correlación o dependencia : es la teoría que trata de estudiar la relación o dependencia entre las dos
variables que intervienen en una distribución bidimensional , según sean los diagramas de dispersión podemos
establecer los siguientes casos :
• Independencia funcional o correlación nula : cuando no existe ninguna relación entre las variables
.( r = 0 )
• Dependencia funcional o correlación funcional : cuando existe una función tal que todos los valores
de la variable la satisfacen ( a cada valor de x le corresponde uno solo de y o a la inversa ) (r =
1)
• Dependencia aleatoria o correlación curvilinea (ó lineal ): cuando los puntos del diagrama se
ajustan a una linea recta o a una curva , puede ser positiva o directa , o negativa o inversa ( −1<r<0 ó
0<r<1)
Ejemplo : a 12 alumnos de COU se les toma las notas de los últimos exámenes de Matemáticas , Física y
Filosofía :
Matemáticas
2
3
4
4
5
6
6
Física
1
3
2
4
4
4
6
Filosofía
2
5
7
8
5
3
4
12
7
7
8
10
10
4
6
7
9
10
6
7
5
5
9
Si representamos las variables matemáticas− física en un diagrama y matemáticas−filosofía en otro vemos que
la correlación es mucho más fuerte en el primero que en el segundo ya que los valores están más alineados .
Coeficiente de correlación lineal : es una forma de cuantificar de forma más precisa el ttipo de correlación
que hay entre las dos variables .
r=
Regresión : consiste en ajustar lo más posible la nube de puntos de un diagrama de dispersión a una curva .
Cuando esta es una recta obtenemos la recta de regresión lineal , cuando es una parábola , regresión parabólica
, cuando es una exponencial , regresión exponencial , etc . ( logicamente r debe ser distinto de 0 en todos los
casos ) .
La recta de regresión de y sobre x es :
en la cual se hace mínima la distancia entre los valores yj obtenidos experimentalmente y los valores teóricos
de y.
A valor
se le llama coeficiente de regresión de y sobre x ( nos da la pendiente de la recta de regresión ).
La recta de regresión de x sobre y es :
en la cual se hace mínima la distancia entre los valores xi obtenidos experimentalmente y los valores teoricos
de x.
A valor
se le llama coeficiente de regresión de x sobre y ( su inversa nos da la otra pendiente ) .
ÍNDICE
• Métodos de muestreo
• Distribución del muestreo
• Intervalos de confianza
• Contraste de hipótesis
Métodos de muestreo : para no tener que trabajar con toda la población se utiliza el muestreo . Puede ser :
13
• Muestreo no probabilístico : no se usa el azar , sino el criterio del investigador , suele presentar
grandes sesgos y es poco fiable .
• Muestreo probabilístico : se utilizan las leyes del azar . Puede ser :
• Muestreo aleatorio simple (es el más importante ) : cada elemento de la población tiene la misma
probabilidad de ser elegido , las observaciones se realizan con reemplazamiento , de manera que la
población es identica en todas las extracciones , o sea , que la selección de un individuo no debe afectar a la
probabilidad de que sea seleccionado otro cualquiera aunque ello comporte que algún individuoo pueda ser
elegido más de una vez . ( "se hacen tantas papeletas numeradas como indivuos hay , se coge una y se
devuelve , se vuelve a coger otra y se devuelve , etc" )
• Muestreo sistemático : es cuando los elementos de la población están ordenados por listas . Se elige un
individuo al azar y a continuación a intervalos constantes se eligen todos los demás hasta completar la
muestra . Si el oreden de los elementos es tal que los individuos próximos tienden a ser más semejantes que
los alejados , el muestreo sistemático tiende a ser más preciso que el aleatorio simple , al cubrir más
homogeneamente toda la población .
• Muestreo estratificado : es cuando nos interesa que la muestra tenga la misma composición a la de la
población la cual se divide en clases o estratos . Si por ejemplo en la población el 20% son mujeres y el
80% hombres , se mantendrá la misma proporción en la muestra .
Distribuciones de muestreo : al obtener conclusiones de la muestra y las comparamos con las de la
población puede que se aproximen o no . No obstante , las medias muestrales se comportan estadísticamente
bien y siguen leyes perfectamente previsibles , esto nos permitirá hacer inferencias precisas a partir de ellas ,
incluso determinar el riesgo que asumimos al hacerlas .
Si una población está formada por N elementos , el nº de muestras diferentes de tamaño n que se pueden
obtener , si se pueden repetir los elementos ( m.a.s.) sería :
VRN,n=Nn
Distribución de medias muestrales : aunque al tomar una muestra no podemos estar seguros de que los
parámetros obtenidos sean buenos estimadores de los parámetros poblacionales si se puede afirmar que :
• La media de las medias muestrales es igual a la media real de la población es decir :
• La desviación típica de las medias muestrales vale :
Esto significa que la distribución de medias muestrales de tamaño n extraidas de una población ( normal o no
normal ) se distribuye según una N(
)
Ejemplo : Supongamos que tenemos los elementos 2,4,6,8 .
14
En esta población vamos a tomar todas las muestras posibles de tamaño 2 :
Elementos
e1 e2
22
24
26
28
42
44
46
48
62
64
66
68
82
84
86
88
Media de la
muestra
2
3
4
5
3
4
5
6
4
5
6
7
5
6
7
8
La media de las medias muestrales será :
La varianza de las medias muestrales será :
Por lo tanto
y
Ejemplo : el peso de los recién nacidos en una maternidad se ha distribuido según una ley normal de media
=3100gr y de desviación típica
=150gr ¿ Cuál será la probabilidad de que la media de una muestra de 100 recién nacidos se superior a 3130gr
?
La distribución muestral sigue una N(3100,15) por lo que p
p
= 1 − 0'9772 = 0'0228
15
por lo tanto solo un 2'28% de las muestras tendrá una media por encima de los 3130gr
Intervalos de probabilidad : inferencia estadística ;Como la distribución de medias muestrales es
se tendrá por ejemplo que :
Esto significa que por ejemplo el 68'26% de las muestras de tamaño n extraidas de una población de media
tendrán una media perteneciente al intervalo
En general el 100·(1−
)% de las muestras de tamaño n tendrán una media comprendida entre :
siendo
el valor de la probabilidad que queda a cada lado del intervalo . O lo que es lo mismo :
(nivel de confianza)
Así por ejemplo si
=0'05 entonces el 95% de las muestras tendrán una media comprendida entre
=
16
Sin embargo lo normal será que se desconozca la media y la desviación típica de la población y que mediante
técnicas de muestreo se busque estimarlas con la fiabilidad necesaria .
Por lo tanto si nos hacen la pregunta de otra forma ( ¿ cuál es la probabilidad de que la media
poblacional se encuentre entre ...? ) podremos transformar la desigualdad obteniendo :
(nivel de confianza)
A este intervalo se le llama intervalo de confianza para la media poblacional . A lo que está fuera del
intervalo se le llama regíon crítica .
Al valor
se le llama nivel de confianza .
Al valor
se le llama nivel de significación .
Por lo tanto el nuevo dibujo sería :
Por lo tanto podemos afirmar que en ese intervalo tenemos una probabilidad del 95
% de que está la media poblacional .
Como ya hemos dicho lo normal será que se desconozca la desviación , por lo que debemos sustituir
por sn−1=
donde sn−12 es la cuasivarianza muestral .
La relación entre la varianza muestral y la cuasivarianza muestral es :
17
Aunque para valores grandes de n ( mayores de 30 ) coinciden aproximadamente la cuasivarianza y la
varianza por lo que se puede sustituir
por s .
Por lo tanto :
Para n grandes :
Distribución para proporciones : cuando se trata de determinar la proporción de una población que posee un
cierto atributo ( hombre/mujer , video/no video , éxito/fracaso , etc ) su estudio es equiparable al de una
distribución binomial . Así pues si tomamos muestras aleatorias de tamaño n , la media y la desviación típica
de las medias muestrales será :
Esta distribución es aproximadamente normal para valores grandes de n ( mayor de 30 ) en consecuencia
puede estudiarse como una N
Si hablamos de intervalos de probabilidad entonces :
(nivel de confianza)
Como lo que no se suele saber es la media y la varianza podemos hacer :
Error admitido y tamaño de la muestra :
cuando decimos que
estamos admitiendo un error máximo de
esto es : la diferncia máxima entre la media poblacional y la media muestral debe ser menor que este valor .
Como se puede observar de este valor se puede controlar dos parámetros , n y z .
El tamaño mínimo de una encuesta depende de la confianza que se desee para los resultados y del error
máximo que se esté dispuesto a asumir :
18
E=
despejando
Analogamente se puede hacer para la distribución de proporciones .
Ejemplo : se desea realizar una investigación para estimar el peso medio de los hijos de madres fumadoras .
Se admite un error máximo de 50 gr , con una confianza del 95% . Si por estudios se sabe que la desviación
típica es de 400 gr ¿ Qué tamaño mínimo de muestra se necesita en la investigación ?
El tamaño mínimo de la muestra debe ser n =
= 246
Contraste de hipótesis sobre la media poblacional : La media muestral ppuede ser diferente de la media
poblacional . Lo normal es que estas diferencias sean pequeñas y estén justificadas por el azar , pero podría
suceder que no fuesen debidas al azar sino a que los parámetros poblacionales sean otros , que por los motivos
que sea , han cambiado .
El contraste de hipótesis es el instrumento que permite decidir si esas diferencias pueden interpretarse como
fluctuaciones del azar ( hipótesis nula )o bien , son de tal importancia que requieren una explicación distinta (
hipótesis alternativa ). Como en los intervalos de confianza las conclusiones se formularán en términos de
probabilidad .
Comparando la media poblacional y la media muestral ¿ Podemos asegurar que esa muestra procede de una
población de media
0 ? La respuesta será no cuando
0 no pertenezca al intervalo de confianza de
, para el nivel de significación prefijado , por el contrario la respuesta será sí cuando sí pertenezca a tal
intervalo .
Sí pertenece a la población.................
se acepta la hipótesis nula . Otra forma de verlo es que :
No pertenece a la población .............
se rechaza la hipótesis nula . Otra forma de verlo es que :
Error de tipo I : es el que cometemos cuando rechazamos la hipótesis nula siendo verdadera .
Error de tipo II : es el que cometemos cuando aceptamos la hipótesis nula siendo falsa .
Podemos hacer todavía dos preguntas :
19
¿ La muestra procede de una población con media mayor que la supuesta ?
Se acepta que la media poblacional es mayor que la supuesta
cuando :
desarrollando la igualdad obtenemos que :
La media poblacional debe de estar por encima de
y por lo tanto por encima de
La rechazamos en caso contrario .
¿ La muestra procede de una población con media menor que la supuesta ?
Se acepta que la media es menor que la supuesta cuando :
desarrollando la igualdad obtenemos que :
La media poblacional debe de estar por debajo de
y por lo tanto por debajo de
La rechazamos en caso contrario .
Nota : No olvidemos que en todas las ecuaciones anteriores si se desconoce la deviación típica de la
población debemos sustituirla por la cuasivarianza de la muestra.
Contraste de hipótesis sobre la proporción p : por analogía con el apartado anterior par responder a la
pregunta : ¿ Puede asegurarse que esa muestra de proporción
procede de una población con proporción p0 ?
20
La respuesta será sí cuando :
con una probabilidad de 1 −
Se admite que la media poblacional es mayor que un valor p0 si :
Se admite que la media poblacional es menor que un valor p0 si :
ÍNDICE
• Sucesos aleatorios
• Definición de probabilidad
• Probabilidad condicionada
• Teorema de la Bayes
• Variable aleatoria
• Función de probabilidad
• Función de distribución
• Media y varianza
• Distribución binomial
• Distribución normal
SUCESOS ALEATORIOS
Experimento aleatorio : es aquel que se caracteriza porque al repetirlo bajo análogas condiciones jamás se
puede predecir el resultado que se va a obtener . En caso contrario se llama experimento determinista .
Espacio muestral E : ( de un experimento aleatorio ) es el conjunto de todos los resultados posibles del
experimento .
Suceso de un experimento aleatorio : es un subconjunto del espacio muestral . Puede haber los siguientes
tipos :
• suceso elemental
• suceso compuesto ( de varios sucesos elementales )
• suceso seguro
• suceso imposible
• suceso contrario
Operaciones con sucesos :
• Unión de sucesos : la unión de dos sucesos A y B es el suceso que se realiza cuando se realiza A ó B
• Intersección de sucesos : la intersección de A y B es el suceso que se realiza cuando se realizan
simultaneamente los sucesos A y B . Cuando es imposible que los sucesos se realicen
21
simultaneamente se dice que son incompatibles . Si
. En caso contrario se dice que son compatibles .
Propiedades :
Asociativa
Conmutativa
Idempotente
Unión
(A
B)
C=A
(B
C)
A
B=B
A
A
A=A
A
(B
A)=A
Intersección
(A
B)
C=A
(B
C)
A
B=B
A
A
A=A
Simplificativa
Distributiva
A
(B
A)=A
A
(B
C)=(A
B)
(A
C)
A(B
C)=(A
B)
(A
C)
A
Suceso contrario
A
=E
Sistema completo de sucesos : Se dice que un conjunto de suceesos A1 , A2 .......constituyen un sistema
completo cuando se verifica :
• A1
A2
........=E
• A1 , A2 , ......son incompatibles 2 a 2 .
A1 A2 ............. An
PROBABILIDAD
22
Ley de los grandes números : La frecuencia relativa de un suceso tiende a estabilizarse en torno a un número
, a medida que el número de pruebas del experimento crece indefinidamente . Este número lo llamaremos
probabilidad de un suceso .
Definición clásica de probabilidad : (regla de Laplace)
( para aplicar esta definición se supone que los sucesos elementales son equiprobables )
Definición axiomática de probabilidad : ( Kolmogorov ) Se llama probabilidad a una ley que asocia a cada
suceso A un número real que cumple los siguientes axiomas :
• La probabilidad de un suceso cualquiera del espacio de sucesos siempre es positiva , es decir p(A)
0
• La probabilidad del suceso seguro es 1 , es decir , p(E) = 1
• La probabilidad de la unión de sucesos incompatibles es igual a la suma de probabilidades de cada uno de
ellos , o sea , p(A
B) = p(A) + p(B)
Consecuencias de los axiomas :
• p(
) = 1 − P(A)
• p(
)=0
•
• Si A
• Si los suceso son compatibles : p(A
B) = p(A) + p(B) − p(A
B)
Para el caso de tres sucesos compatibles sería :
p(A
B
C) = p(A) + p(B) + p(C) − p(A
B) − p(A
C) − p(B
C) + p(A
B
C)
Probabilidad condicionada p(A/B) : Se llama probabilidad del suceso A condicioniado por B a la
probabilidad de que se cumpla A una vez que se ha verificado el B .
p(A/B) =
AB
23
abc
p(A
B) =
p(B) =
p(A/B) =
Otra forma de ver la fórmula es :
p(A
B) = p(B) · p(A/B) = p(A) · p(B/A) = p(B
A)
Generalizando : p(A
B
C) = p(A) · p(B/A) · p(C/A
B)
Ejemplo :
Fuman
No Fuman
Hombres
70
20
90
Mujeres
40
30
70
110
50
160
p(H) = 90/160 p(M) = 70/160 p(F) = 110/160 p(NF) = 50/160
p(H/NF) = 20/50 p(H/F) = 70/110 p(M/NF) = 30/50 p(M/F) = 40/110
p(H
F) = 70/160 = p(F) · p(H/F) = (110/160) · (70/110)
Lo mismo se podría hacer con color de ojos ( marrones y azules ) y color de pelo ( rubio y castaño ) .
Sucesos independientes : dos sucesos A y B se dice que son independientes si
p(A) = p(A/B) . En caso contrario , p(A)
p(A/B) , se dice que son dependientes .
Probabilidad de la intersección o probabilidad compuesta :
• Si los sucesos son dependientes p(A
B) = p(A) · p(B/A) = p(B) · p(A/B)
• Si los sucesos son independientes p(A
B) = p(A) · p(B)
Ejemplo : si al extraer dos cartas de una baraja lo hacemos con devolución tendremos dos sucesos
independientes , p(A
24
B) = p(A) · p(B) pero si lo hacemos sin devolución ahora si son dependientes p(A
B) = p(A) · p(B/A) .
Teorema de la probabilidad total : sea un sistema completo de sucesos y sea un suceso B tal que p(B/Ai)
son conocidas , entonces :
p(B) = p(B
A1) + p(B
A2) + .........=
A1 A2 A3 A4
B
B
Teorema de Bayes : sea un sistema completo de sucesos y sea un suceso B tal que p(B/Ai) son conocidas ,
entonces :
Ejemplo importante : Se va ha realizar el siguiente experimento , se tira una moneda , si sale cara se saca una
bola de una urna en la que hay 4 bolas negras , 3 turquesa y 3 amarillas , si sale cruz se saca una bola de otra
urna en la que hay 5 bolas negras , 2 turquesa y 3 amarillas .
NNNN
TTT
AAA
Cara −−−−−−−−−−−−−−−−−−−−−−
NNNNN
TT
AAA
Cruz −−−−−−−−−−−−−−−−−−−−−−
N 4/10 p(Cara
N) = 1/2 · 4/10 = 4/20
Cara 1/2 T 3/10 p(Cara
T) = 1/2 · 3/10 = 3/20
A 3/10 p(Cara
A) = 1/2 · 3/10 = 3/20
25
N 5/10 p(Cruz
N) = 1/2 · 5/10 = 5/20
Cruz 1/2 T 2/10 p(Cruz
T) = 1/2 · 2/10 = 2/20
A 3/10 p(Cruz
A) = 1/2 · 3/10 = 3/20
Tª de la probabilidad total : p(N) = p(Cara
N) + p(Cruz
N) = 4/20 + 5/20 = 9/20
Tª de Bayes : p(Cara/N) =
que no es ni más ni menos que casos favorables entre casos posibles .
DISTRIBUCIONES DISCRETAS : DISTRIBUCIÓN BINOMIAL
Variable aleatoria X : es toda ley que asocia a cada elemento del espacio muestral un número real . Esto
permite sustituir los resultados de una prueba o experimento por números y los sucesos por partes del
conjunto de los números reales .
Las variables aleatorias pueden ser discretas o continuas .
Por ejemplo en el experimento aleatorio de lanzar tres monedas el espacio muestral es E = [ CCC , CCX ,
CXC , XCC , CXX , XCX , XXC , CCC ] . Supongamos que a cada suceso le asignamos un número real igual
al número de caras obtenidas . Esta ley o función que acabamos de construir la llamamos variable aleatoria (
discreta ) que representa el nº de caras obtenidas en el lanzamiento de tres monedas .
Consideremos el experimento que consiste en elgir al azar 100 judías de una plantación y medimos su
longitud . La ley que asocia a cada judía su longitud es una variable aleatoria ( continua ).
Por ejemplo al lanzar un dado podemos tener la varible aleatoria xi que asocia a cada suceso el nº que tiene en
la parte de arriba .
Por ejemplo al lanzar dos dados podemos tener la variable aleatoria xi que asocia a cada suceso el producto de
los dos números que tiene en la parte de arriba .
Función de probabilidad : ( de una variable aleatoria ) es la ley que asocia a cada valor de la variable
aleatoria xi su probabilidad pi = p( X = xi ) .
Función de distribución F(x) : ( de una variable aleatoria ) es la ley que asocia a cada valor de la variable
aleatoria , la probabilidad acumulada de este valor .
F(x) = p ( X
x)
Media de una variable aleatoria discreta :
Varianza de una variable aleatoria discreta :
26
=
Ejemplo : en una bolsa hay bolas numeradas : 9 bolas con un 1 , 5 con un 2 y 6 con un 3 . Sacamos una bola y
vemos que número tienen .
La función de probabilidad es :
xi
pi
1
9/20
2
5/20
3
6/20
La función de distribución es :
xi
pi
1
9/20
2
14/20
3
20/20
La media es 1·(9/20)+2·(5/20)+3·(6/20) = 1'85
La varianza es (1−1'85)2 · 9/20 + (2−1'85)2 · 5/20 + (3−1'85)2 · 6/20 = 0'72
Distribución binomial : Una variable aleatoria es binomial si cumple las siguientes características :
• Los elementos de la población se clasifican en dos categorias , éxito o fracaso .
• El resultado obtenido en cada prueba es independiente de los resultados anteriores
• La probabilidad de éxito y fracaso es siempre constante
Ejemplos : fumadores de una población , nº de aprobados de la clase , días de lluvia a lo largo de un año , nº
de caras al tirar una moneda , etc .
• Función de probabilidad p(X = r) =
pr qn−r donde p es la probabilidad de éxito , q la probabilidad de fracaso , n el numero total de
pruebas y r el número de éxitos .
• Función de distribución p(X
x) =
pr qn−r
• Media
• Varianza
=n·p·q
Ejemplo : Se lanza una moneda 11 veces :
¿ Cuál es la probabilidad de obtener 5 caras ?
¿ Cuál es la probabilidad de obtener 5 o menos caras ?
27
¿ Cuántas caras se obtienen por término medio ?
¿ Cuál es la desviación típica ?
DISTRIBUCIONES CONTINUAS : DISTRIBUCIÓN NORMAL
Función de densidad f(x) : cuando en un histograma de frecuencias relativas de una variable continua
aumentamos el nº de clases y por lo tanto su amplitud es más pequeña vemos que el polígono de frecuencias
relativas se acerca a una función f(x) que llamaremos función de densidad que cumple las siguientes
propiedades :
• f(x)
•
•
el área encerrada bajo la curva de la función es igual a la unidad .
área bajo la curva correspondiente a ese intervalo .
Función de distribución F(x) = p(X
x) : cuando en un histograma de frecuencias relativas acumuladas de una variable continua aumentamos el nº
de clases y por lo tanto su amplitud es más pequeña vemos que el polígono de frecuencias relativas
acumuladas se acerca a una función F(x) que llamaremos función de distribución que cumple las siguientes
propiedades :
• F(a) =
= p(
X
a) por lo tanto :
p(
X
b) =
= F(b) − F(a)
• F(x) es nula para todo valor de x anterior al menor valor de la variable aleatoria y es igual a la unidad
para todo valor posterior al mayor valor de la variable aleatoria . Si es continua se dice que F(−
)=0 y F(+
)=1
• Por ser una probabilidad
.
• Es una función creciente .
Media de una variable aleatoria continua :
28
Varianza de una variable aleatoria continua :
=
Distribución normal : una variable aleatoria es normal si se rige según las leyes del azar . La mayoría de las
distribuciones más importantes son normales . Por ejemplo la distribución de los pesos de los individuos de
cualquier especie , la estatura de una pobablación , Tª del mes de agosto a lo largo de 100 años , la longitud de
los tornillos que salen de una fábrica , etc .
No todas las distribuciones son normales por ejemplo si clasificamos según el nivel de renta a los ciudadanos
españoles son muy pocos los que poseen niveles de rentas altas y en cambio son muchos los que poseen
niveles de rentas bajas , por tanto la distribución no sería simétrica y en consecuencia no se adapta al modelo
normal .
Función de densidad : una variable continua X sigue una distribución normal de media
y desviación típica
, y se designa por N(
,
) , si cumple que
f(x) =
Podríamos comprobar que :
=
=
2
Para calcular los máximos y mínimos deberíamos hacer :
f(x) =
f '(x) = −
f(x) , puesto que f(x) nunca puede valer 0 entonces , si x =
f ' (x) = 0
por lo que será un posible máximo o mínimo .
29
f ''(x) =
luego f ''(
) <0 por lo que es hay un máximo en el punto (
)
Conviene observar que cuando la desviación típica es elevada aumenta la dispersión y se hace menos
puntiaguda la función ya que disminuye la altura del máximo . Por el contrario para valores pequeños de
obtenemos una gráfica menos abierta y más alta .
Cuando
=0y
=1 , N(0,1) se dice que tenemos una distribución normal reducida , estandar o simplificada .
Función de distribución : F(x) =
= p(X
x)
Distribución Normal Estándar N(0,1) : La distribución N(0,1) se encuentra tabulada , lo cual permite un
cálculo rápido de las probabilidades asociadas a esta distribución . Pero en general la media no suele ser 0 , ni
la varianza 1 , por lo que se hace una transformación que se llama tipificación de la variable , que consiste en
hacer el siguiente cambio de variable :
Z=
a partir del cual obtenemos una variable Z que si es N(0,1) y que por lo tanto podemos calcular sus
probabilidades .
F(x) =
Ejemplo : si tenemos N(2,4) y queremos calcular p(x<7) entonces :
p(x<7) =
= p( z < −5/4 ) = 0'1056
Manejo de tablas : pueden presentarse los siguientes casos :
p(z<1'45) = 0'9265
p(z<−1'45) = 0'0735
p(1'25<z<2'57) = 0'1005
30
p(−2'57<z<−1'25) = 0'1005
p(−0'53<z<2'46) = 0'695
Utilización conjunta de
:
En
está el 68'26% de los datos ya que :
p(
−
<X<
+
)=p
= p(−1< Z < 1) = 0.6826
Análogamente se puede comprobar que en
está el 95'4% de los datos y en
está el 99'7% .
Ejemplo : El C.I. de los 5600 alumnos de una provincia se distribuyen N(112,6) . Calcular aproximadamente
cuántos de ellos tienen :
• más de 112 .................2800 alumnos.................la mitad de los alumnos
• entre 106 y 118 ..........3823 alumnos .................este es el caso :
• entre 106 y 112 ...........1911 alumnos
• menos de 100 ..............128 alumnos
• más de 130 ..................7 alumnos
• entre 118 y 124 ............761 alumnos
( ojo hay que multiplicar % obtenido en la tabla por 5600/100 , que sale de una regla de tres )
Aproximación normal para la binomial :
Cuando los valores a calcular para la binomial superan a los de las tablas para obtener un resultado
aproximado se utiliza la distribución normal , es decir , la variable
obedece a una distribución N(0,1)
El resultado es tanto más fiable cuanto mayor es el tamaño de la muestra n y cuanto más cerca está p de 0'5 .
Ejemplo : Se ha comprobado que la probabilidad de tener un individuo los ojo marrones es 0'6 . Sea X la
variable aleatoria que representa el nº de individuos que tienen los ojos marrones de un grupo de 1100 .
Calcular p(X>680) y p(X=680)
p(X>680) = 1 − p(X<680) = 1 − p(Y<
) = 1 − p(Y<1'23) = 0'1093
31
p(X = 680) = p(679'5<X<680'5) se debe hacer así puesto que en una variable continua no tiene sentido
calcular probabilidades de valores puntuales .
COMBINATORIA
32
ESTADISTICA
La Estadística es una ciencia que estudia las características de un conjunto de casos para hallar en ellos
regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar predicciones.
La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto
de objetos, personas, procesos, etc. A través de la cuantificación y el ordenamiento de los datos intenta
explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones.
Población o Universo: es el total del conjunto de elementos u objetos de los cuales se quiere obtener
información. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede
referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.
La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia
de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por
lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede
perfectamente delimitado. Si, por ejemplo, estamos analizando las escuelas primarias, debemos especificar
cuáles y cuándo: escuelas primarias de la Capital Federal, año 1992.
El tamaño de una población viene dado por la cantidad de elementos que la componen.
Unidad de análisis: es el objeto del cual se desea obtener información. Muchas veces nos referimos a las
unidades de análisis con el nombre de elementos. En estadística, un elemento o unidad de análisis puede ser
algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura o un
intervalo de tiempo. Dada esta definición, puede redefinirse población como el conjunto de unidades de
análisis.
Muestra: es un subconjunto de unidades de análisis de una población dada, destinado a suministrar
información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística,
deben reunirse ciertos requisitos en la selección de los elementos.
Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga
tamaño infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el
costo de la observación exhaustiva puede ser muy elevado, el tiempo de recolección de la información muy
extenso, o más aún, la observación de los elementos puede ser destructiva. Por ejemplo, si quisiéramos hacer
un estudio de la calidad de una partida de fósforos, no podríamos probarlos a todos pues los destruiríamos.
Variable: es la cualidad o cantidad medible que se estudia de las unidades de análisis y que varían de una
unidad a otra. Por ejemplo: edad, ingreso de un individuo, sexo, cantidad de lluvia caída, etc.
Nivel de medición: las variables pueden ser medidas con mayor o menor grado de precisión según la escala
de medida utilizada para su observación. Podemos distinguir los siguientes niveles de medición de una
variable:
• Nominal: sólo permite clasificar a las unidades de análisis en categorías. Por ejemplo: sexo −varón y
mujer −.
• Ordinal: además de clasificar a los elementos en distintas categorías, permite establecer una relación
de orden de las mismas. Por ejemplo: clase social −baja, media y alta−.
1
• Intervalar: permite clasificar, ordenar y medir la distancia entre las diferentes categorías. Por ejemplo:
edad.
Las variables se clasifican en dos grupos de acuerdo al nivel de medición utilizado para su observación:
• Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la característica
que miden de la unidad de análisis es una cualidad.
• Variables cuantitativas: son las variables medidas en escala intervalar, puesto que lo que miden es una
cantidad.
Encuesta
Es un método de recolección mediante el cual la información se obtiene relevando sólo un subconjunto o
muestra de elementos del universo en estudio, que permite obtener información sobre el mismo.
Para que la información obtenida con la encuesta sea generalizable a la población, la muestra utilizada debe
ser representativa de la población de la que proviene. Para lograrlo, se utilizan métodos de selección de
unidades especialmente diseñados con este fin.
Su uso ha ido en rápido aumento, en la medida en que las instituciones productoras de información disponen
de personal capacitado para efectuar su organización, diseño y análisis, debido a su menor costo y a que en
determinadas circunstancias la información resulta más exacta debido a que los errores ajenos al muestreo
(errores en la recolección y en el procesamiento) pueden ser reducidos a través de una mejor capacitación de
los empadronadores y la utilización de métodos de captación de información más objetivos.
Agrupamiento de datos
Existen métodos para resumir los datos medidos u observados.
Cuando se trata de variables cualitativas donde las categorías están determinadas, lo único que hay que hacer
es contabilizar el número de casos pertenecientes a cada categoría y normalizar en relación al número total de
casos, calculando una proporción, un porcentaje o una razón.
En cambio, cuando se trata de variables cuantitativas, el resumen de los datos consiste en organizar tablas que
sintetizan los datos originales y se denominan distribuciones de frecuencia.
Frecuencia: es el número de veces que se presenta cada valor de la variable.
Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una variable
y sus correspondientes frecuencias.
Por ejemplo: consideremos la variable número de aulas por escuela, medida en las escuelas de una
localidad.
Número de
aulas por
escuela
Frecuencia
(2)
(1)
8
9
7
7
2
10
11
12
13
14
12
11
15
10
5
67
Representación gráfica: en general la representación gráfica de una tabla de frecuencias permite
percibir con mayor claridad algunas características de la masa de datos que se investiga. Por ello, a
través de gráficos, resulta bastante más fácil transmitir conclusiones a personas no habituadas a la
interpretación de tablas de frecuencias.
Para representar gráficamente una distribución de frecuencias se utiliza un par de ejes de coordenadas. En el
eje de las abscisas se representará la variable estudiada y en el eje de las ordenadas, las correspondientes
frecuencias.
El siguiente es un gráfico de frecuencias confeccionado con los datos del ejemplo anterior.
Parámetros estadísticos
Al obtener de una población la distribución de frecuencias de una variable lo que se persigue es reducir o
condensar en pocas cifras el conjunto de observaciones relativas a dicha variable.
Este proceso de reducción puede continuarse hasta su grado máximo, es decir, hasta sustituir todos los valores
observados por uno solo, que se llama promedio.
Existen numerosas formas de calcular promedios. La más conocida es la media aritmética, pero además
existen otras como la mediana y la moda o el modo.
Media aritmética: es el número que se obtiene al dividir la suma de todas las observaciones por la cantidad
de observaciones sumadas.
A la media aritmética la simbolizamos con X.
Por ejemplo, si tomamos las edades de un grupo de 9 personas:
16 − 17 − 19 − 20 − 22 − 22 − 23 − 28 − 29
X = (16+17+19+20+22+22+23+28+29)/9 = 21,8 años.
Mediana: si todos los valores observados de la variable se ordenan en sentido creciente (o decreciente), la
mediana es el valor de la variable que ocupa el lugar central, es decir, el que deja a un lado y a otro el mismo
número de observaciones.
La mediana se representa con el símbolo Mna.
En el ejemplo anterior, las edades ya están ordenadas de menor a mayor. La mediana será:
16 − 17 − 19 − 20 − 22 − 22 − 23 − 28 − 29
Mna= 22 años
3
Moda o modo: es el valor de la variable que más veces se repite, o sea, el valor que presenta mayor
frecuencia.
Es útil como medida de tendencia central, sólo en aquellos casos en que un valor de la variable es mucho más
frecuente que el resto. Se basa en la idea de lo que es moda o en el comportamiento de la mayoría para tomar
a cierto valor como representativo del comportamiento de los datos.
Población, elementos y caracteres.
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este
conjunto de personas o cosas es lo que denominaremos población.
Las personas o cosas que forman parte de la población se denominan elementos. En sentido estadístico un
elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la
temperatura, un voto, o un intervalo de tiempo.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio
estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los
siguientes caracteres:
Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo,Etc.
Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o
caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos
de un centro de enseñanza, o grupo clase.
Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.
Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos de la
población sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra,
cuando se toman un determinado número de elementos de la población, sin que en principio tengan nada en
común; o una subpoblación, que es el subconjunto de la población formado por los elementos de la población
que comparten una determinada característica, por ejemplo de los alumnos del centro la subpoblación formada
por los alumnos de 3º ESO, o la subpoblación de los varones.
Variables y atributos.
Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos
clasificar en: dos grandes clases:
Variables Cuantitativas.
Variables Cualitativas o Atributos.
Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el peso, Altura,
Edad, Número de Suspensos
4
A su vez este tipo de variables se puede dividir en dos subclases:
• Cuantitativas discretas. Aquellas a las que se les puede asociar un número entero, es decir, aquellas
que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos,
páginas de un libro, etc.
• Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero, es decir,
aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar
cualquier valor intermedio, por ejemplo peso, tiempo. etc.
No obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos como si
fuesen continuas y viceversa.
Los atributos son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos
asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.
A su vez las podemos clasificar en:
• Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel de
estudios, etc.
• No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden
por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.
La estadística es una Ciencia que tiene como finalidad facilitar la solución de problemas en los cuales
necesitamos conocer algunas características sobre el comportamiento de algún suceso o evento.
Características que nos permiten conocer o mejorar el conocimiento de ese suceso. Además nos permiten
inferir el comportamiento de sucesos iguales o similares sin que estos ocurran.
Inferencia Estadística: Técnica mediante la cual se sacan conclusiones o generalizaciones acerca de
parámetros de una población basándose en el estadígrafo o estadígrafos de una muestra de población.
OBJETIVO DE LA ESTADÍSTICA: Es la obtención de conclusiones basadas en los datos experimentales.
OBJETIVO DE LA ESTADÍSTICA DESCRIPTIVA: Describir las características principales de los datos
reunidos.
OBJETIVO DE LA INFERENCIA ESTADÍSTICA: Extraer las conclusiones útiles sobre la totalidad de
todas las observaciones posibles basándose en la información recolectada.
POBLACIÓN: Es el conjunto de todos los posibles elementos que intervienen en un experimento o en un
estudio.
CENSO: Al estudio completo de la población.
5
TIPOS DE POBLACIÓN:
POBLACIÓN FINITA: Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
Es aquella que posee o incluye un número limitado de medidas y observaciones.
POBLACIÓN INFINITA: Es infinita si se incluye un gran conjunto de medidas y observaciones que no
pueden alcanzarse en el conteo.
Son poblaciones infinitas porque hipotéticamente no existe límite en cuanto al número de observaciones que
cada uno de ellos puede generar.
MUESTRA: Un conjunto de medidas u observaciones tomadas a partir de una población dada. Es un
subconjunto de la población.
MUESTRA REPRESENTATIVA: Un subconjunto representativo seleccionado de una población de la cual
se obtuvo.
MUESTREO: Al estudio de la muestra representativa.
PARÁMETRO: Son las características medibles en una población completa. Se le asigna un símbolo
representado por una letra griega.
ESTADÍSTICO O ESTADÍGRAFO: Es la medida de una característica relativa a una muestra. La mayoría
de los estadísticos muestrales se encuentran por medio de una fórmula y suelen asignárseles nombres
simbólicos que son letras latinas. DATOS ESTADÍSTICOS (VARIABLES): Los datos son agrupaciones de
cualquier número de observaciones relacionadas.
Para que se considere un dato estadístico debe tener 2 características:
6
a) Que sean comparables entre sí.
b) Que tengan alguna relación.
VARIABLE: Una característica que asume valores.
CLASES DE DATOS:
VARIABLE CUANTITATIVA O ESCALAR: Será una variable cuando pueda asumir sus resultados en
medidas numéricas.
VARIABLE CUANTITATIVA DISCRETA: Es aquella que puede asumir sólo ciertos valores, números
enteros.
VARIABLE CUANTITATIVA CONTINUA: Es aquella que teóricamente puede tomar cualquier valor en
una escala de medidas, ya sea entero o fraccionario.
VARIABLES CUALITATIVAS O NOMINALES: Cuando no es posible hacer medidas numéricas, son
susceptibles de clasificación.
Ejemplo: Color de autos: rojo, verde, azul.
Estadística. El arte y ciencia de reunir, analizar presentar e interpretar datos.
Datos. Los hechos y números que se reúnen, analizan e interpretan.
Conjunto de datos. Todos los datos reunidos en un determinado estudio.
Elementos. Las entidades acerca de las que se reúnen datos.
Variable. Una característica de interés de los elementos.
Observación. Conjunto de mediciones obtenidas de un solo elemento.
Escala nominal. Una escala de medición para una variable que utiliza una etiqueta o nombre para identificar
un atributo de un elemento. Los datos nominales podrían ser no numéricos o numéricos.
Escala ordinal. Una escala de medición para una variable que tiene las propiedades de los datos nominales y
se puede emplear para clasificar u ordenar los datos. Los datos ordinales podrían ser no numéricos o
numéricos.
Escala de intervalo. Una escala de medición para una variable que tienen las propiedades de los datos
7
ordinales y el intervalo entre observaciones se expresa en términos de una unidad fija de medida. Los datos de
intervalo siempre son numéricos.
Escala de razón. Una escala de medición para una variable que tiene las propiedades de los datos de intervalo
y el cociente de los valores es significativa. Los datos de razón siempre son numéricos.
Datos cualitativos. Datos que son etiquetas o nombres utilizados para identificar un atributo de cada elemento.
Los datos cualitativos utilizan la escala de medición ordinal o nominal y podrían ser no numéricos o
numéricos.
Datos cuantitativos. Datos que indican cuanto o cuantos de algo. Los datos cuantitativos utilizan la escala de
razón o de intervalo y siempre son numéricos.
Variable cualitativa. Una variable con valores cualitativos.
Variable cuantitativa. Variable con valores cuantitativos.
Datos transversales. Datos reunidos en el mismo, o aproximadamente el mismo, punto en el tiempo.
Datos de una serie de tipo. Datos reunidos en diversos periodos sucesivos.
Estadística descriptiva. Métodos tabulares, gráficos y numéricos para resumir datos.
Población. El conjunto de todos los elementos de interés en determinado estudio.
Muestra. Un subconjunto de la población.
Inferencia estadística. Proceso de reunir datos obtenidos de una muestra para hacer estimaciones o probar
hipótesis acerca de las características de una población.
Distribución de frecuencias. Resumen tabular que muestra el número (frecuencia) de artículos en cada una de
varias clases que no se traslapan
Distribución de frecuencias relativas. Resumen tabular de datos que muestran la fracción o proporción
(frecuencia relativa), de elementos en cada una de varias clases que no se traslapan.
Distribución de frecuencias porcentuales. Resumen tabular de un conjunto de datos donde se muestra el
porcentaje de elementos en cada una de varias clases que no se traslapan.
Grafica de barras. Dispositivo grafico para representar los datos que han sido resumidos en una distribución
de frecuencia, distribución de frecuencias relativas o de frecuencias porcentuales.
Gráfica de pastel. Forma gráfica de presentar resúmenes de datos cualitativos, basado en la subdivisión de un
circulo en sectores que corresponden a la frecuencia relativa de cada clase.
Punto medio de clase. Punto en cada clase que esta a la mitad entre los límites inferior y superior de la clase.
Histograma. Presentación gráfica de una distribución de frecuencias, de frecuencias relativas o de frecuencias
porcentuales de datos cuantitativos; se traza colocando los intervalos de clase sobre el eje horizontal y las
frecuencias sobre el eje vertical.
Distribución acumulada de frecuencias. Resumen tabular de un conjunto de datos cuantitativos donde se
8
muestra el número de elementos que tienen valores menores que, o iguales al límite superior de la clase.
Distribución acumulada de frecuencias relativas. Resumen tabular de datos cuantitativos donde se muestra la
fracción o proporción de los elementos cuyos valores son menores que, o iguales al límite superior de la clase.
Distribución acumulada de frecuencias porcentuales. Resumen tabular de datos cuantitativos donde se muestra
el porcentaje de los articulas que tienen valores menores que, o iguales al límite superior de la clase.
Ojiva. Gráfica de una distribución acumulada.
Análisis exploratorio de datos. Métodos que emplean operaciones aritméticas simples y gráficas fáciles de
dibujar para resumir datos de manera rápida.
Diagrama de tallo y hojas. Técnica de análisis exploratorio de datos que clasifica y ordena simultáneamente
los datos cuantitativos y proporciona una perspectiva de la forma de la distribución.
Fabulación cruzada. Resumen tabular de datos para dos variables. Las clases de una variable se representan en
los renglones; las clases de la otra variable, en las columnas.
Diagrama de dispersión. Método gráfico para mostrar la relación entre dos variables cuantitativas. Una
variable se representa sobre el eje horizontal y la otra sobre el eje vertical.
PROBABILIDAD Y ESTADISTICA.
TEMA: CONCEPTOS DE ESTADISTICA, EJERCICIOS.
Este trabajo consta de los principales conceptos de estadística y algunos problemas resueltos.
BIBLIOGRAFIA
ESTADISTICA PARA ADMINISTRACION Y ECONOMIA , ANDERSON
EJERCICIO 2
La tabla 1.6 muestra la paga del director ejecutivo, ramo industrial, ventas anuales, sueldo y calificación del
rendimiento por parte de los accionistas para 10 empresas (Bussines Week, 21de abril de 1997). La paga del
director ejecutivo con calificación de 1 indica que la empresa pertenece al grupo con la mejor relación de
sueldo a rendimiento de las acciones. Una calificación de 2 indica que la empresa es semejante a otras que
tienen una relación muy buena, aunque no la mejor. Las empresas con la peor relación de sueldo del director
ejecutivo a rendimiento de acciones tienen calificación de 5.
• ¿Cuántos elementos hay en este conjunto de datos?
• ¿Cuantas variables hay en este conjunto de datos?
• ¿Cuáles variables son cualitativas y cuales son cuantitativas?
Sueldo del director
Compañía
Ventas
Ramo
ejecutivo($miles)
Bankers Trust
8925
($millones)
Banca
9565
Clasificación
sueldo del
directores
comparación con
los dividendos a
los accionistas
3
9
Coca Cola
General Mills
LSI Logic
Motorota
Reader digest
Sears
2437
1410
696
1847
1490
3414
Bebidas
18546
5
Alimenticia
5567
1
Electrónica
1239
2
Electrónica
27973
4
Editorial
2968
3
Detallista
38236
4
Telecomuni−
Sprint
3344
14045
4
caciones
Walgreen
1490
Detallista
12140
2
Wells fargo
2861
Banca
8723
3
Tabla 1.6 1 Sueldo del director ejecutivo de una muestra de 10 compañías.
Respuestas:
• 10
•
EJERCICIO 4
La revista Fortune publica datos sobre la clasificación de las 500 corporaciones industriales estadounidenses
más grandes, en términos de ventas y utilidades. En la tabla 1.7 vemos datos acerca de una muestra de las 500
compañías (Fortune, 28 de abril de 1997).
• ¿Cuántos elementos hay en este conjunto de datos?
• ¿Cuál es la población?
• Calcule las ventas anuales de la muestra.
• Con el resultado del inciso c, ¿Cuál es la estimación de las ventas promedio para la población?
TABLA 1.7 MUESTRA DE 10 EMPRESAS FORTUNE 500
Compañía
Ventas($millones)
Utilidades($millones)
Bank One
CPC Int
Tyson Foods
Heelett−Packard
Intel
Northurp
Seagate Teach
Unisys
Westvaco
Woolwort
10272
9844
6454
38420
20847
8071
8588
6371
3075
8093
1427.0
580.0
87.0
2586.0
5157.0
234.0
213.3
49.7
212.2
168.7
Código del ramo
industrial
8
19
19
12
15
2
11
10
22
48
Respuestas:
• 10
• Las 500 corporaciones estadounidenses más grandes.
• $14227.59millones
• 14227.59millones
10
EJERCICIO 6
En Columbia House se distribuyen discos compactos, casetes y discos por correo a los miembros de su club.
La empresa realizo una encuesta musical pidiendo a los nuevos miembros llenaran una nueva forma con 11
preguntas. Algunas de ellas fueron:
• ¿Cuántos álbumes (discos compactos, cintas o discos) compro usted en los últimos 12 meses?
• ¿Es actualmente miembro de un club nacional de pedidos por correo? (Sí o No).
• ¿Qué edad tiene usted?
• Incluyéndose usted ¿Cuántas personas (adultos y niños) viven en su casa?
• ¿Qué tipo de música le interesa comprar? (Se presenta una lista de 15 categorías, incluyendo rock pesado,
rock suave, contemporánea, heavy metal, rap y country).
Diga si en cada pregunta se piden datos cualitativos o cuantitativos.
Respuestas:
Las preguntas a, c y d son cuantitativas.
Las preguntas b y e son cualitativas.
EJERCICIO 8
En una encuesta de Wall Street Journal/NBC news se pregunto a 2013 adultos: ¿Qué tan satisfecho esta usted
con la economía estadounidense en la actualidad? (The Wall Street Journal, 12 de diciembre de 1997). Las
categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.
• ¿Cuál fue el tamaño de muestra para esta encuesta?
• Los datos ¿son cualitativos o cuantitativos?
• ¿Qué tendría mas sentido emplear, promedios o porcentajes como resumen de los datos para esta pregunta?
• De quienes respondieron, el 28% dijo no estar satisfecho con el estado de la economía de Estados Unidos.
¿Cuántas personas dieron esa respuesta?
Respuestas:
• 2013
• Cualitativo
• Porcentajes
• 563 o 564
EJRCICIO 10
Diga si cada una de las variables que siguen es cualitativa o cuantitativa.
• Edad.
• Sexo.
• Lugar en la clase.
• Marca de automóvil.
• Cantidad de personas que están a favor de la pena de muerte.
Respuestas:
11
• Cuantitativa; relación
• Cualitativa; nominal
• Cualitativa; ordinal
• Cualitativa; nominal
• Cuantitativa; relación
EJERCICIO 16
El área de mercadotecnia de su empresa ha propuesto una nueva bebida dietética que, dicen, captura una gran
parte del mercado de adultos jóvenes.
• ¿Qué datos quiere analizar antes de decidirse a invertir cantidades importantes para introducir el nuevo
producto en el mercado?
• ¿Cómo espera obtener los datos mencionados en el inciso b?
Respuestas:
• Pruebas del sabor del producto y comercialización de la prueba.
• Estudios estadísticos diseñados especialmente.
EJERCICIO 18
En un estudio reciente acerca de las causad de muerte en hombres de 60 y mas años de edad, una muestra de
120 personas indico que 48 murieron debido a enfermedades del corazón.
• Desarrolle una medida estadística descriptiva que se pueda emplear como estimado del porcentaje de
hombres de 60 años o mas, que mueren de alguna enfermedad cardiaca.
• ¿Son cualitativos o cuantitativos los datos sobre las causa de muerte?
• Explique el papel de la inferencia estadística en este tipo de investigación médica.
Respuestas:
• 40%
• Cualitativos.
EJERCICIO 20
La encuesta de usuarios de datos de escáner de 1996, entre 50 empresas, arrojo los siguientes resultados
(Mercer Management Consulting, Inc., 24 de abril de 1997):
• . A.C Nielsen acaparo el 56% del valor del mercado en dólares.
• La cantidad promedio invertida en datos de escaners, por categoría de bienes al consumidor
• En una escala de 1 (muy descontento) a 5 (muy satisfecho), el nivel promedio de satisfacción general,
con los datos de escaners, fue 3.73.
• Cite dos medias estadísticas descriptivas.
• Haga una inferencia de satisfacción general en la población de todos los usuarios de datos de lectores
ópticos.
• Haga una inferencia acerca de la cantidad promedio invertida por categoría para datos de escaners acerca de
bienes al consumidor.
Respuestas:
12
• 56% y 387,325 dólares
• 3.73
• 387,325 dólares
EJERCICIO 22
Una empresa desea probar la eficacia de un nuevo comercial de TV. Como parte de la prueba, el comercial se
pasa a las 6:30PM en un programa de noticias locales en Denver, Colorado. Dos días después, una empresa de
investigación de mercado lleva a cabo una encuesta telefónica para recabar información sobre la frecuencia de
recuerdos (porcentaje de los telespectadores que recuerdan haber visto el comercial) y las impresiones del
comercial.
• ¿Cuál es la población para este estudio?
• ¿Cuál es la muestra para este estudio?
• ¿Por qué necesita usarse una muestra en este caso? Explique su respuesta:
Respuestas:
• Todos los espectadores adultos que vieron la estación de TV.
• Espectadores contactados en la encuesta telefónica.
• Muestra.
EJERCICIO 24
Una muestra de calificaciones intermedias de cinco alumnos arrojo los siguientes resultados: 72, 65, 82, 90,
76. ¿Cuáles de las siguientes afirmaciones son correctas y cuales se debe considerar que son demasiado
generalizadas?
• La calificación intermedia promedio de la muestra de cinco alumnos es 77.
• La calificación intermedia promedio de todos los alumnos que hicieron el examen es 77.
• Un estimado de la calificación intermedia promedio, para todos los alumnos que hicieron el examen es 77.
• Más de la mitad de los alumnos que hicieron el examen tienen calificaciones entre 70 y 85.
• Si se hubieran incluido otros cinco alumnos en la muestra, sus calificaciones estarían entre 665 y 90.
Respuestas:
• Correcto
• Incorrecto
• Correcto
• Incorrecto
• Incorrecto.
CAPITULO 1
EJERCICIO 2
La tabla 1.6 muestra la paga del director ejecutivo, ramo industrial, ventas anuales, sueldo y calificación del
rendimiento por parte de los accionistas para 10 empresas (Bussines Week, 21de abril de 1997). La paga del
director ejecutivo con calificación de 1 indica que la empresa pertenece al grupo con la mejor relación de
sueldo a rendimiento de las acciones. Una calificación de 2 indica que la empresa es semejante a otras que
tienen una relación muy buena, aunque no la mejor. Las empresas con la peor relación de sueldo del director
ejecutivo a rendimiento de acciones tienen calificación de 5.
13
• ¿Cuántos elementos hay en este conjunto de datos?
• ¿Cuantas variables hay en este conjunto de datos?
• ¿Cuáles variables son cualitativas y cuales son cuantitativas?
Compañía
Bankers Trust
Coca Cola
General Mills
LSI Logic
Motorota
Reader digest
Sears
Sueldo del
director
Ventas
Ramo
ejecutivo($miles)
8925
2437
1410
696
1847
1490
3414
($millones)
Clasificación sueldo del
directores comparación con los
dividendos a los accionistas
Banca
9565
3
Bebidas
18546
5
Alimenticia
5567
1
Electrónica
1239
2
Electrónica
27973
4
Editorial
2968
3
Detallista
38236
4
Telecomuni−
14045
4
Sprint
3344
caciones
Walgreen
1490
Detallista
12140
2
Wells fargo
2861
Banca
8723
3
Tabla 1.6 2 Sueldo del director ejecutivo de una muestra de 10 compañías.
Respuestas:
• 10
•4
• Cualitativa: el sueldo y el ramo; cuantitativa las ventas y puntuación global.
EJERCICIO 4
La revista Fortune publica datos sobre la clasificación de las 500 corporaciones industriales estadounidenses
más grandes, en términos de ventas y utilidades. En la tabla 1.7 vemos datos acerca de una muestra de las 500
compañías (Fortune, 28 de abril de 1997).
• ¿Cuántos elementos hay en este conjunto de datos?
• ¿Cuál es la población?
• Calcule las ventas anuales de la muestra.
• Con el resultado del inciso c, ¿Cuál es la estimación de las ventas promedio para la población?
TABLA 1.7 MUESTRA DE 10 EMPRESAS FORTUNE 500
Compañía
Ventas($millones)
Utilidades($millones)
Bank One
CPC Int
Tyson Foods
Heelett−Packard
Intel
Northurp
10272
9844
6454
38420
20847
8071
1427.0
580.0
87.0
2586.0
5157.0
234.0
Código del ramo
industrial
8
19
19
12
15
2
14
Seagate Teach
Unisys
Westvaco
Woolwort
8588
6371
3075
8093
213.3
49.7
212.2
168.7
11
10
22
48
Respuestas:
10
• Las 500 corporaciones estadounidenses más grandes.
• $14227.59millones
• 14227.59millones
EJERCICIO 6
En Columbia House se distribuyen discos compactos, casetes y discos por correo a los miembros de su club.
La empresa realizo una encuesta musical pidiendo a los nuevos miembros llenaran una nueva forma con 11
preguntas. Algunas de ellas fueron:
• ¿Cuántos álbumes (discos compactos, cintas o discos) compro usted en los últimos 12 meses?
• ¿Es actualmente miembro de un club nacional de pedidos por correo? (Sí o No).
• ¿Qué edad tiene usted?
• Incluyéndose usted ¿Cuántas personas (adultos y niños) viven en su casa?
• ¿Qué tipo de música le interesa comprar? (Se presenta una lista de 15 categorías, incluyendo rock pesado,
rock suave, contemporánea, heavy metal, rap y country).
Diga si en cada pregunta se piden datos cualitativos o cuantitativos.
Respuestas:
Las preguntas a, c y d son cuantitativas.
Las preguntas b y e son cualitativas.
EJERCICIO 8
En una encuesta de Wall Street Journal/NBC news se pregunto a 2013 adultos: ¿Qué tan satisfecho esta usted
con la economía estadounidense en la actualidad? (The Wall Street Journal, 12 de diciembre de 1997). Las
categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.
• ¿Cuál fue el tamaño de muestra para esta encuesta?
• Los datos ¿son cualitativos o cuantitativos?
• ¿Qué tendría mas sentido emplear, promedios o porcentajes como resumen de los datos para esta pregunta?
• De quienes respondieron, el 28% dijo no estar satisfecho con el estado de la economía de Estados Unidos.
¿Cuántas personas dieron esa respuesta?
Respuestas:
2013
• Cualitativo
• Porcentajes
15
• 563 o 564
EJRCICIO 10
Diga si cada una de las variables que siguen es cualitativa o cuantitativa.
• Edad.
• Sexo.
• Lugar en la clase.
• Marca de automóvil.
• Cantidad de personas que están a favor de la pena de muerte.
Respuestas:
• Cuantitativa; relación
• Cualitativa; nominal
• Cualitativa; ordinal
• Cualitativa; nominal
• Cuantitativa; relación
EJERCICIO 16
El área de mercadotecnia de su empresa ha propuesto una nueva bebida dietética que, dicen, captura una gran
parte del mercado de adultos jóvenes.
• ¿Qué datos quiere analizar antes de decidirse a invertir cantidades importantes para introducir el nuevo
producto en el mercado?
• ¿Cómo espera obtener los datos mencionados en el inciso b?
Respuestas:
• Pruebas del sabor del producto y comercialización de la prueba.
• Estudios estadísticos diseñados especialmente.
EJERCICIO 18
En un estudio reciente acerca de las causad de muerte en hombres de 60 y mas años de edad, una muestra de
120 personas indico que 48 murieron debido a enfermedades del corazón.
• Desarrolle una medida estadística descriptiva que se pueda emplear como estimado del porcentaje de
hombres de 60 años o mas, que mueren de alguna enfermedad cardiaca.
• ¿Son cualitativos o cuantitativos los datos sobre las causa de muerte?
• Explique el papel de la inferencia estadística en este tipo de investigación médica.
Respuestas:
• 40%
• Cualitativos.
EJERCICIO 20
La encuesta de usuarios de datos de escáner de 1996, entre 50 empresas, arrojo los siguientes resultados
16
(Mercer Management Consulting, Inc., 24 de abril de 1997):
• . A.C Nielsen acaparo el 56% del valor del mercado en dólares.
• La cantidad promedio invertida en datos de escaners, por categoría de bienes al consumidor
• En una escala de 1 (muy descontento) a 5 (muy satisfecho), el nivel promedio de satisfacción general,
con los datos de escaners, fue 3.73.
• Cite dos medias estadísticas descriptivas.
• Haga una inferencia de satisfacción general en la población de todos los usuarios de datos de lectores
ópticos.
• Haga una inferencia acerca de la cantidad promedio invertida por categoría para datos de escaners acerca de
bienes al consumidor.
Respuestas:
• 56% y 387,325 dólares
• 3.73
• 387,325 dólares
EJERCICIO 22
Una empresa desea probar la eficacia de un nuevo comercial de TV. Como parte de la prueba, el comercial se
pasa a las 6:30PM en un programa de noticias locales en Denver, Colorado. Dos días después, una empresa de
investigación de mercado lleva a cabo una encuesta telefónica para recabar información sobre la frecuencia de
recuerdos (porcentaje de los telespectadores que recuerdan haber visto el comercial) y las impresiones del
comercial.
• ¿Cuál es la población para este estudio?
• ¿Cuál es la muestra para este estudio?
• ¿Por qué necesita usarse una muestra en este caso? Explique su respuesta:
Respuestas:
• Todos los espectadores adultos que vieron la estación de TV.
• Espectadores contactados en la encuesta telefónica.
• Muestra.
EJERCICIO 24
Una muestra de calificaciones intermedias de cinco alumnos arrojo los siguientes resultados: 72, 65, 82, 90,
76. ¿Cuáles de las siguientes afirmaciones son correctas y cuales se debe considerar que son demasiado
generalizadas?
• La calificación intermedia promedio de la muestra de cinco alumnos es 77.
• La calificación intermedia promedio de todos los alumnos que hicieron el examen es 77.
• Un estimado de la calificación intermedia promedio, para todos los alumnos que hicieron el examen es 77.
• Más de la mitad de los alumnos que hicieron el examen tienen calificaciones entre 70 y 85.
• Si se hubieran incluido otros cinco alumnos en la muestra, sus calificaciones estarían entre 665 y 90.
Respuestas:
• Correcto
17
• Incorrecto
• Correcto
• Incorrecto
• Incorrecto.
CAPITULO 2
EJERCICIO 6
En la tabla 2.4 se enumeran los ocho libros de mayor venta en Estados Unidos en febrero de 2000, elaborados
en rústica y relacionados con temas de negocio (Bussiness Week, 3 de abril del 2000). Suponga que se llevo
acabo un muestreo de compra de libros en Denver, Colorado, y que se obtuvieron los siguientes datos:
TABLA 2.4
LOS 8 LOBROS SOBRE ADMINISTRACION MAS VENDIDOS:
• The 7 Habits of Highly Effective People.
• Investing for Dummies
• The Ernst & Young Tax Guide 2000.
• The Millionaire Next Door.
• The Motley Fool Investment Guide.
• Rich Dad. Poor Dad.
• The Wall Street Journal Guide to Understanding Money and Investing.
• What Color is Your Parachute? 2000.
(Estos son los datos)
7 Habits
Motley
Millionaire
Dad
Motley
Millionaire
Motley
7 Habits
Motley
Millionaire
Dad
Millionaire
Motley
7 Habits
WSJ Guide
7 Habits
7 Habits
WSJ Guide
Motley
Millionaire
7 Habits
Tax Guide
Dad
WSJ Guide
Millionaire
Millionaire
Dad
Tax Guide
Millionaire
Millionaire
Millionaire
7 Habits
Dad
WSJ Guide
7 Habits
7 Habits
Dad
Millionaire
Millionaire
Dad
Millionaire
Dad
Parachute
WSJ Guide
Millionaire
Motley
Dad
Motley
Dad
Millionaire
WSJ Guide
Dummies
Dad
7 Habits
Millionaire
Motley
Dad
Tax Guide
Dummies
Dad
• forme las distribuciones de frecuencias y de frecuencias porcentuales para los datos. Agrupe los libros que
tengan una frecuencia de 5% o menor en la categoría de otros.
• Clasifique los libros de mayor venta.
• ¿Qué porcentajes de las ventas corresponden a The Millionaire Next Door y Rich Dad, Poor Dad?
Libro
7 Habits
Millionaire
Motley
Dad
Frecuencia
10
16
9
13
Frecuencia %
16,66
26,67
15
21,67
18
WSJ Guide
Otro
Totales
Respuestas:
6
6
60
10
10
100
a.
b. Primeros cinco: Millionaire, Dad,motley,7 Habits,WSJ Guide.
• 43.33%
EJERCICIO 8
En la pagina siguiente se observan datos de una muestra de 25 miembros del salon de la fama de beisbol, en
Cooperstown, Nueva York, para cada posición del campo. Cada observación indica la posición principal del
jugador: lanzador (P), receptor (H), primera base (1), segunda base (2), tercera base (3), parador en corto (S),
jardinero izquierdo (l), jardinero central ©, jardinero derecho ®.
LPCH2PR1SS1LPR
PPPRCSLRPCCPPR
23PHLP1CPPPS1L
R12HS3H2LP
• resuma los datos elaborando una distribución de frecuencias y una distribución de frecuencias relativas.
• ¿Qué posición tiene mas miembros en el salon de la fama?
• ¿Qué posición tiene menos miembros?
• ¿Qué posición de jardin (L, C o R) tiene mas miembros?
• Compare los jugadores de cuadro (1,2,3 y S) con los jardineros (L, C y R).
Respuestas:
a)
POSICION FRECUENCIA FRECUENCIA REL.
P 17 0.309
H 4 0.073
1 5 0.091
2 4 0.073
3 2 0.036
S 5 0.091
L 6 0.109
19
C 5 0.091
R 7 0.127
___ _____
TOTALES 55 1.000
b)
LANZADOR
c)
TERCERA BASE
d)
JARDINERO DERECHO
e)
16 JUGADORES DE CUADRO CONTRA 18 JARDINEROS
EJERCICIO 16
En la tabla 2.9 se presenta una muestra de 25 empresas fabricantes de componentes de computo, tomada de la
base de datos de Stock Invester Pro.
• Elabore resumenes tabulares y un histograma para los precios de las acciones. Haga comentarios acerca de
los precios característicos y de la distribución de los precios.
• Elabore resúmenes tabulares y un histograma de los datos del rendimiento por accion. Haga comentarios de
sus resultados.
Tabla 2.9
EMPRESA
Amdahl
Auspex systems
Compaq computer
Dat general
Digi internacional
Digital equipment
corp.
En pointe
Technologies
Equitrac
Franklin electronic
45.4
66.1
83.0
91.5
33.4
RELACION
PRECIO/VALOREN
LIBROS
2.49
2.22
6.84
4.25
2.04
43.00
58.8
1.92
−2.93
14.25
11.8
3.47
0.80
16.25
12.88
20.9
30.8
2.38
1.41
0.76
0.82
PRECIO
POR
ACCION
12.31
11.00
65.50
35.94
15.00
PROPIEDAD
(%)
RENDIMIENTO POR
ACCION($ANUALES)
−2.49
0.85
2.01
1.15
−0.89
20
Pals
Gateway 2000
Hewlett−packard
Ingrammicro
Maxwell
Technologies
Micro age
Micro electronics
Networ
computingdevices
Pomeroy computer
resourse
Sequent computer
systems
Silicon ggraphics
Southrn electronics
Stratus computer
Sun microsistems
Taqnden computers
Tech data
Uniys
39.13
61.50
28.75
36.0
50.2
14.4
6.45
4.35
4.53
1.74
2.64
1.01
30.50
26.5
8.07
0.46
27.19
16.31
76.6
18.8
2.16
4.48
1.25
1.06
11.88
39.8
3.34
0.15
33.00
56.9
3.29
1.81
28.19
57.0
2.65
0.36
27.44
15.13
55.50
48.00
34.25
38.94
11.31
63.0
41.9
77.2
59.3
61.3
82.3
34.8
3.01
2.46
2.48
7.50
3.61
3.80
16.64
0.44
0.99
2.52
1.67
1.02
1.50
0.08
Respuestas:
a)
Precio de frecuencia Frecuencia Frecuencia
Las acciones Relativa Porcentual
(dolares)
10.00 − 19.99 10 0.40 40
20.00 − 29.99 4 0.16 16
30.00 − 39.99 6 0.24 24
40.00 − 49.99 2 0.08 8
50.00 − 59.99 1 0.04 4
60.00 − 69.99 2 0.08 8
____ ____ ___
Totales 25 1.00 100
21
b)
Ganancias por Frecuencia Frecuencia Frecuencia
Acción Relativa Porcentual
(dólares)
• 3.00 a −2.01 2 0.08 8
• 2.00 a −1.01 0 0.00 0
• 1.00 a −0.01 2 0.08 8
0.00 a 0..99 9 0.36 36
1.00 a 1.99 9 0.36 36
2.00 a 2.99 3 0.12 12
___ ____ ___
Totales 25 1.00 100
EJERCICIO 18
Wageweb lleva a cabo encuestas de datos de salarios y presenta los resúmenes en su sitio de la red. Usando
datos de salarios a partir del primero de enero de 2000, Wageweb informo que los salarios de los
vicepresidentes de marketing variaban de 85090 a 190054 dólares (Wageweb.com, 12 de abril de 2000).
Suponga que los siguintes datos son una muestra de los salarios anuales para 50 vicepresidentes de marketing.
Los daros estan dados en miles de dolares.
145
140
145
173
116
127
155
134
138
114
95
162
127
113
178
143
93
165
160
135
148
118
148
104
123
134
102
123
157
151
112
170
165
141
141
136
154
124
138
138
132
144
138
142
138
137
142
124
131
157
• ¿Cuáles son los salarios minimo y maximo
• Use un ancho de clase de 150,00 dolares y prepare resumes tabulares de los datos de salario anual?
• ¿Qué proporcion hay de salarios anuales de 135,000 dolares o menos?
• ¿Qué porcentaje hey de salarios anuales mayores de 150,000 dolares?
• Trace un histograma de los datos.
Respuestas:
• Salario mínimo: 93,000 dólares
22
Salario máximo: 178,000 dólares.
b.
Sueldo miles de dolares
90−105
106−120
121−135
136−150
151−165
166−180
totales
frecuencia
4
5
11
18
9
3
50
Frecuencia relativa
0,08
0,1
0,22
0,36
0,18
0,06
1
Frrecuencia %
8
10
22
36
18
6
100
c. 20/50
d. 24%
e.
EJERCICIO 20
La oficina de censos de Estados Unidos publica información diversa acreca de la población de ese pais. La
siguiente información es la distribución de frecuencias porcentules de la población de Estados Unidos por
edad desde el primero de julio de 2000 (The World Almanac and Book of Facts 2000).
Edad
0−13
14−17
18−24
25−34
35−44
45−54
55−64
65 o más
Frecuencia Porcentual
20.0
5.7
9.6
13.6
16.3
13.5
8.7
12.6
100.0
• ¿Qué porcentaje de la población tiene 34 años o menos?
• ¿Qué porcentaje de la población tiene entre 25 y 54 años inclusive?
• ¿Qué porcentaje de la población es mayor de 34 años?
• La población total es 275 millones. ¿Cuántas personas son menores de 25 años?
• Suponga que usted cree que la mitad de las personas en la clase 55−64 están retiradas y que
aproximadamente todas las personas de 65 años o mas están retiradas. Estime el numero de personas
retiradas de la población.
Respuestas:
• 48.9$
• 43.4%
23
• 51.1%
• 97.075 millones
• 46.6125 millones
EJERCICIO 26
Los datos de rendimiento por acción para una muestra de 20 empresas de la tabla de empresas de bussuness
week, 17 de noviembre de 1997 son los siguientes.
Empresa Rendimiento por acción
En dólares
Barnes & Noble 0.78
Citicorp 7.10
Compaq Computer 2.16
Dana 3.42
Dell Computer 2.03
Digital Equipmet 1.28
General Dynamics 4.82
Goodyear 0.94
Harley Davidson 1.11
Heinz 0.98
Hersey Foods 1.97
Hewlett − Packard 2.82
Humana 0.89
Microsoft 2.66
Procter & Gamble 2.53
Quaker Satate 0.41
Sara Lee 2.08
Snap − On Tools 2.38
Sunstrad 2.53
Xerox 3.95
24
Trazar un diagrama de tallo y hoja para esto datos. Utilice 01 como unidad de la hoja. Comente lo que
aprendió acerca de los rendimientos por acción para estas empresas.
047899
1129
200135568
349
48
5
6
71
EJERCICIO 32
Los elementos de la tabla 2.15 son los datos financiero para una muestra de 36 compañías cuyas acciones se
comercializan en la bolsa de valores de New York . Los datos sobre ventas, márgenes , ROE, es una
evaluación compuesta basada en la tasa de crecimiento de ventas de la compañía, sus márgenes de ganancia y
su rendimiento de la equidad (ROE). La evaluación EPS es una medida del crecimiento del rendimiento por
acción para la compañía.
• Prepare una tabulacion cruzada de los datos sobre ventas , márgenes, ROE (renglones) y evaluación EPS
(columnas) . Use clases de 0−19, 20−39, 40−59, 60−79, y 80−99. para la evolución EPS .
• Calcule los porcentajes por renglón y comente cualquier relación que haya entre las variables.
Clasificación Consistencia Consistencia ventas
Compañia EPS Relativa relativa de Márgenes
De precios grupos ind. ROE
Advo 81 74 B A
Alaska AirGP 58 17 C B
Alliant Tech 84 22 B B
Atmos Engy 21 9 C E
Bsnk of Am. 87 38 C A
Bowater PLC 14 46 C D
Callaway Golf 46 62 B E
Central Parking 76 18 B C
Dean Foods 84 7 B C
Dole Food 70 54 E C
Elec. Data Sys. 72 69 A B
Fed. Dep. Stor. 79 21 D B
Gateway 82 68 A A
Goodyear 21 9 E D
25
Hanson PLC 57 32 B B
ICN Pharm 76 56 A D
Jeferson Plt. 80 38 D C
Kroger 84 24 D A
Mattel 18 20 E D
Mc Dermott 6 6 A C
Monaco 97 21 D A
Murphy Oil 80 62 B B
Nordstrom 58 57 B C
NYMAGIC 17 45 D D
Oficce Depot 58 40 B B
Payless Shoes 76 59 B B
Praxair 62 32 C B
Reebok 31 72 C E
Safeway 91 61 D A
Teco Energy 49 48 D B
Texaco 80 31 D C
US West 60 65 B A
United Rental 98 12 C A
Wachovia 69 36 E B
Winnebago 83 49 D A
York Intl 28 14 D B
Respuestas:
a)
Ventas/
Margenes/
ROE
A
B
C
D
E
Totales
0−
19
1
3
Evaluacion
20−
39
EPS
40−
59
1
4
1
4
1
2
4
1
6
0−
19
Evaluacion
20−
39
EPS
40−
59
8.33
33.33
60−
79
1
5
2
1
80−
100
8
2
3
9
13
Total
9
12
7
5
3
36
60−
79
11.11
41.67
80−
100
88.89
16.67
Total
100
100
b)
Ventas/
Margenes/
ROE
A
B
26
C
D
E
14.29
60.00
14.29
20.00
66.67
33.33
28.57
20.00
42.86
100
100
100
Al parecer, las evaluaciones EPS mayores están asociadas con evaluaciones mayores en ventas/ márgenes /
ROE.
En la columna (1) se observan los valores que toma la variable número de aulas por escuela, que varían de 8
a 14.
En la columna (2) se ha colocado la cantidad de escuelas correspondiente a cada valor de la variable. Si
sumamos esta columna obtenemos la cantidad total de escuelas bajo estudio.
Número de aulas
1 2 3 4 5 6 7 8 9 10 11 12 13 14
15
10
5
Frecuencia
27
Índice general
1. COMBINATORIA
1.1. Conceptos fundamentales . . . . . . . . . . . .
1.2. Muestras ordenadas . . . . . . . . . . . . . . .
1.2.1. Muestras ordenadas sin repetición . . .
1.2.2. Permutaciones . . . . . . . . . . . . . .
1.2.3. Permutaciones con elementos repetidos .
1.2.4. Muestras ordenadas con repetición . . .
1.3. Muestras no ordenadas . . . . . . . . . . . . . .
1.3.1. Muestras no ordenadas y sin repetición
1.4. EJERCICIOS . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
7
7
7
8
8
9
9
12
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
total.
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
15
18
21
25
26
27
30
31
33
3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. La distribución binomial o de Bernoulli . . . . . . . . . . . . . . .
3.2.1. El uso de las tablas de la distribución binomial . . . . . . .
3.2.2. Probabilidades acumuladas . . . . . . . . . . . . . . . . . .
3.2.3. Media y desviación tı́pica en una distribución binomial . . .
3.3. La distribución Normal . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1. Uso de las tablas de la distribución normal N(0;1) . . . . .
3.3.2. Cálculo de otras probabilidades . . . . . . . . . . . . . . . .
3.3.3. Cálculo de probabilidades en normales N (x; σ) . . . . . . .
3.3.4. Otro uso de las tablas . . . . . . . . . . . . . . . . . . . . .
3.4. Relación entre la distribución binomial y la distribución normal . .
3.5. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
38
38
40
40
41
42
44
44
46
47
49
51
4. INFERENCIA ESTADÍSTICA
4.1. Introducción . . . . . . . . . . . .
4.2. Muestreos . . . . . . . . . . . . .
4.3. Estimación por puntos . . . . . .
4.4. Distribución muestral de medias
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
56
56
56
58
59
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2. PROBABILIDAD
2.1. Experimentos aleatorios . . . . . . . . . . . . . . . . .
2.2. Definiciones básicas . . . . . . . . . . . . . . . . . . . .
2.3. Operaciones con sucesos . . . . . . . . . . . . . . . . .
2.4. Asignación de probabilidades. Regla de Laplace . . . .
2.5. Probabilidad condicionada . . . . . . . . . . . . . . . .
2.6. Sucesos independientes . . . . . . . . . . . . . . . . . .
2.7. Experimentos compuestos. Teorema de la probabilidad
2.8. Tablas de contingencia . . . . . . . . . . . . . . . . . .
2.9. El teorema de Bayes. . . . . . . . . . . . . . . . . . . .
2.10. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
2
4.5. Distribución muestral de proporciones . . . . . . . . . . . . . .
4.6. Intervalos de probabilidad . . . . . . . . . . . . . . . . . . . . .
4.6.1. Intervalo de probabilidad para la media muestral x . . .
4.6.2. Intervalo de probabilidad para la proporción muestral p̂
4.7. Estimación por intervalos . . . . . . . . . . . . . . . . . . . . .
4.7.1. Estimación de la media de una población µ . . . . . . .
4.7.2. Estimación de una proporción . . . . . . . . . . . . . . .
4.8. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5. TEST DE HIPÓTESIS
5.1. Introducción . . . . . . . . . . . . . .
5.2. Hipótesis estadı́sticas . . . . . . . . .
5.3. Errores . . . . . . . . . . . . . . . . .
5.4. Región crı́tica y región de aceptación
5.5. Etapas de la prueba de hipótesis . .
5.6. EJERCICIOS . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
60
62
63
65
65
65
67
69
72
72
72
73
74
76
80
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. MATRICES Y DETERMINANTES
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . .
6.2. Matrices. Definición y primeros ejemplos . . . . . . .
6.3. Tipos de matrices . . . . . . . . . . . . . . . . . . . .
6.4. Aplicaciones de las matrices . . . . . . . . . . . . . .
6.5. Operaciones con matrices . . . . . . . . . . . . . . .
6.5.1. Suma y diferencia . . . . . . . . . . . . . . .
6.5.2. Producto por un número real . . . . . . . . .
6.5.3. Trasposición de matrices . . . . . . . . . . . .
6.5.4. Producto de matrices . . . . . . . . . . . . .
6.6. La matriz inversa . . . . . . . . . . . . . . . . . . . .
6.6.1. Método directo: . . . . . . . . . . . . . . . . .
6.6.2. Método de Gauss-Jordan: . . . . . . . . . . .
6.7. Rango de una matriz . . . . . . . . . . . . . . . . . .
6.8. Determinantes . . . . . . . . . . . . . . . . . . . . .
6.9. La regla de Sarrus . . . . . . . . . . . . . . . . . . .
6.10. Propiedades de los determinantes . . . . . . . . . . .
6.11. Relación entre la inversa y los determinantes . . . .
6.12. Aplicación de los determinantes al cálculo del rango
6.13. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
82
. 82
. 82
. 83
. 84
. 86
. 86
. 87
. 87
. 88
. 90
. 91
. 92
. 94
. 95
. 97
. 98
. 100
. 101
. 103
7. SISTEMAS DE ECUACIONES LINEALES
109
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.2. Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.3. Expresión matricial de un sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.4. Tipos de sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.5. Sistemas con dos incógnitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.5.1. Discución de sistemas de 2 ecuaciones con 2 incógnitas . . . . . . . . . . . . . . 113
7.6. Sistemas de 2 incógnitas y 3 ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.7. Sistemas de 3 ecuaciones y 3 incógnitas . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.7.1. Interpretación geométrica de los sistemas con 3 ecuaciones y 3 incógnitas . . . 117
7.7.2. Discusión de sistemas de 3 ecuaciones y 3 incógnitas . . . . . . . . . . . . . . . 120
7.8. Aplicación de las matrices y determinantes a la resolución de sistemas. Regla de Cramer 121
7.8.1. Aplicación de las matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.8.2. Regla de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
ÍNDICE GENERAL
7.9. Estudio de sistemas cualesquiera
Frobenius . . . . . . . . . . . . .
7.10. Sistemas homogéneos . . . . . . .
7.11. EJERCICIOS . . . . . . . . . . .
3
mediante el
. . . . . . .
. . . . . . .
. . . . . . .
cálculo del rango. Teorema
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
de Rouché. . . . . . . 123
. . . . . . . 124
. . . . . . . 125
8. PROGRAMACIÓN LINEAL
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2. Inecuaciones lineales con 2 variables . . . . . . . . . . . . . . . .
8.3. Sistemas de inecuaciones lineales con dos variables . . . . . . . .
8.4. Problemas de optimización de una función sujeta a restricciones .
8.4.1. Forma geométrica . . . . . . . . . . . . . . . . . . . . . .
8.4.2. Forma algebraica . . . . . . . . . . . . . . . . . . . . . . .
8.5. Algunos ejemplos de casos extremos . . . . . . . . . . . . . . . .
8.6. Aplicación a problemas concretos . . . . . . . . . . . . . . . . . .
8.7. El problema del transporte . . . . . . . . . . . . . . . . . . . . .
8.8. EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
127
127
128
131
131
133
134
136
139
141
9. LÍMITES Y CONTINUIDAD DE FUNCIONES
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . .
9.2. Tipos de lı́mites . . . . . . . . . . . . . . . . . . . .
9.3. Cálculo de lı́mites . . . . . . . . . . . . . . . . . . .
9.3.1. Lı́mites en el infinito . . . . . . . . . . . . .
9.3.2. Lı́mites en puntos finitos . . . . . . . . . . .
9.3.3. Lı́mites potenciales. Indeterminación 1∞ . .
9.4. Ası́ntotas . . . . . . . . . . . . . . . . . . . . . . .
9.4.1. Ası́ntotas verticales . . . . . . . . . . . . . .
9.4.2. Ası́ntotas horizontales . . . . . . . . . . . .
9.4.3. Ası́ntotas Oblicuas . . . . . . . . . . . . . .
9.5. Continuidad . . . . . . . . . . . . . . . . . . . . . .
9.6. Tipos de discontinuidad . . . . . . . . . . . . . . .
9.7. EJERCICIOS . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
145
145
147
149
149
151
152
153
153
155
156
157
158
161
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10.DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2. Introducción al concepto de derivada. Tasas de variación media e instantánea. . . . . .
10.3. Definición de derivada. Reglas de derivación. Interpretación geométrica . . . . . . . . .
10.3.1. Propiedades de las derivadas. Reglas de derivación . . . . . . . . . . . . . . . .
10.3.2. Derivadas elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.3. Interpretación geométrica de la derivada . . . . . . . . . . . . . . . . . . . . . .
10.4. Aplicaciones de las derivadas a la Fı́sica y la Economı́a . . . . . . . . . . . . . . . . . .
10.4.1. Aplicación a la Fı́sica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.2. Aplicación a la Economı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.5. Derivabilidad y continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.6. Aplicaciones de las derivadas al cálculo del crecimiento y decrecimiento de una función.
Cálculo de extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.7. Aplicaciones de las derivadas al cálculo de la concavidad y la convexidad, puntos de
inflexión. Criterio para determinar máximos y mı́nimos. . . . . . . . . . . . . . . . . .
10.8. Representación gráfica de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.9. Optimización de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.10.EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
168
168
168
170
171
172
173
175
175
176
177
179
183
185
187
189
ÍNDICE GENERAL
11.INTEGRACIÓN. CÁLCULO DE ÁREAS
11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2. Primitivas. Integral indefinida . . . . . . . . . . . . . . . . . . . .
11.3. Primitivas inmediatas . . . . . . . . . . . . . . . . . . . . . . . .
11.4. Integración por cambio de variable . . . . . . . . . . . . . . . . .
11.5. Determinación de una primitiva particular de una función . . . .
11.6. El problema del cálculo del área . . . . . . . . . . . . . . . . . . .
11.7. La integral definida. La regla de Barrow . . . . . . . . . . . . . .
11.8. Aplicaciones de la integral definida al cálculo de áreas de recintos
11.8.1. Áreas limitadas por una función y el eje x . . . . . . . . .
11.8.2. Áreas limitadas por dos funciones . . . . . . . . . . . . .
11.9. Otras aplicaciones de las integrales . . . . . . . . . . . . . . . . .
11.10.EJERCICIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
planos
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
193
193
193
195
196
198
199
201
203
203
206
207
210
Capı́tulo 1
COMBINATORIA
Previamente al estudio de la probabilidad en sı́, conviene dedicar algún tiempo al repaso de las
técnicas combinatorias.
Recordemos que la Combinatoria es la parte de las Matemáticas que se ocupa de la resolución de
problemas de elección y disposición de los elementos de cierto conjunto, de acuerdo con ciertas reglas.
Es decir, dentro de la Combinatoria es dónde tienen sentido preguntas del tipo:
1. ¿Cuántas quinielas distintas pueden hacerse?.
2. ¿Cuántas posibles combinaciones pueden darse en la loterı́a primitiva?.
3. ¿Qué posibilidades hay de que me toquen los cuatro ases en una mano de tute?.
4. ¿De cuántas formas se pueden sentar 5 personas en 5 asientos de un cine?.
Trataremos de dar respuesta a estas cuestiones y algunas más.
1.1.
Conceptos fundamentales
En todo problema combinatorio hay varios conceptos claves que debemos distinguir:
1. Población: Es el conjunto de elementos que estamos estudiando. Llamaremos tamaño de la
población al número de elementos de este conjunto.
2. Muestra: Es un subconjunto de la población. Llamaremos tamaño de la muestra al número de
elementos que la componen.
Los diferentes tipos de muestra vienen determinados por dos aspectos:
a) El orden, es decir, si es importante que los elementos de la muestra aparezcan ordenados o no.
b) La posibilidad de repetición o no de los elementos.
Ejemplo: Veamos con qué tipo de poblaciones y muestras trabajamos en los ejemplos anteriores:
1. La población en este caso es {1,X,2}, que tiene tamaño 3 (no hay otras posibilidades en una
quiniela).
Una quiniela (teniendo en cuenta el ”pleno al 15”) es una muestra de tamaño 15 de la población
anterior (por ejemplo : 1XX121XXX212111).
Es evidente que el orden en esta muestra es importante (no es lo mismo una X en la segunda
casilla que en la quinta) y que se permiten elementos repetidos ( los unos , equis o doses se
pueden repetir).
Es por tanto una muestra ordenada y con repetición.
5
CAPÍTULO 1. COMBINATORIA
6
2. En este caso la población es mayor, pués son todos los números desde el 1 al 49, es decir
{1,2,3. . . .,49}.
Por tanto, y si nos olvidamos del complementario, una apuesta de loterı́a primitiva es una muestra
de tamaño 6 de dicha población (por ejemplo 3, 18, 40, 41, 43, 45 ).
Aquı́ el orden no influye y los elementos no se pueden repetir (no puede salir un número más de
una vez). Son muestras no ordenadas y sin repetición.
3. La población ahora está formada por las 40 cartas que componen una baraja española, es decir
{1 oros, 2 oros,. . . .,Rey bastos} , y para el caso de 4 jugadores, tenemos una muestra de 10
cartas, que evidentemente no se pueden repetir y además el orden no importa.
Muestras no ordenadas y sin repetición.
4. La población son las 5 personas a elegir, y la muestra tiene el mismo tamaño, 5, pues elegimos a
las 5 personas. Eso sı́, ahora el orden sı́ que es importante y además las personas no se pueden
repetir.
Son muestras ordenadas y sin repetición.
5. Un ejemplo de muestra no ordenada y con repetición podrı́a ser una mano de cartas pero teniendo
en cuenta que jugamos con 2 barajas idénticas mezcladas (80 cartas).
Si se reparten 10 a cada uno de 4 jugadores, tenemos una muestra de tamaño 10 en la que
es evidente que el orden no importa y que podemos tener cartas repetidas (por ejemplo, dos
caballos de oros).
El objetivo de la Combinatoria es calcular cuántos tipos de muestras de un determinado tamaño
se pueden extraer de cierta población. El resultado en el que nos basaremos a la hora de calcular el
número de muestras es el siguiente:
Principio de multiplicación:
Si un procedimiento se puede separar en r etapas, de modo que el resultado de una de ellas no influye
en el resultado de las otras, y en cada una de estas etapas se obtienen respectivamente n1 , n2 , n3 , . . ., nr
resultados, entonces el procedimiento global conduce a n1 · n2 · n3 · . . . · nr resultados.
Ejemplo: ¿Cuántos resultados podemos obtener al lanzar una moneda tres veces?.
Aplicando el principio anterior, en el primer lanzamiento obtenemos 2 resultados (Cara o cruz), en el
segundo lanzamiento, otros 2 y en el tercero también 2.
Por tanto, en total hay 2 · 2 · 2 = 8 posibles resultados. Si lo disponemos en forma de diagrama de
árbol, obtenemos los 8 resultados:
Figura 1.1: Diagrama de árbol
CAPÍTULO 1. COMBINATORIA
1.2.
7
Muestras ordenadas
1.2.1.
Muestras ordenadas sin repetición
Si tenemos una población de tamaño n y queremos extraer una muestra ordenada y sin repetición
de tamaño k (k < n), razonemos de este modo:
El primer elemento lo podemos elegir entre n elementos.
El segundo, al no poder repetir, podemos elegirlo entre n − 1 elementos.
..
.
El elemento k, lo podremos elegir entre n − k + 1 elementos.
Por tanto, y aplicando el principio de multiplicación en total hay :
n · (n − 1) · . . . · (n − k + 1)
muestras de tamaño k ordenadas y sin repetición.
Ejemplos:
1. ¿De cuántas formas se pueden elegir 2 cartas, extraı́das sucesivamente y sin repetir, de una
baraja española?
La primera se puede elegir de 40 formas.
La segunda, al no poder repetir, sólo se puede elegir de 39 maneras.
Por tanto, en total hay 40·39 = 1560 posibilidades.
2. Seis ciclistas llegan al sprint en una prueba de la Olimpiadas, ¿De cuántas maneras se pueden
colocar los tres primeros puestos?.
Para el primer puesto hay 6 posibilidades.
Para el segundo, sólo 5 posibilidades.
Para el tercero, quedan 4 opciones.
Por tanto hay en total 6·5·4 = 120 maneras.
Las muestras ordenadas y sin repetición se denominan Variaciones sin repetición. Por tanto,
si el tamaño de la población es n y el de la muestra k, el número de variaciones sin repetición lo
expresaremos por:
Vnk = n · (n − 1) · . . . · (n − k + 1)
(notemos que k, tamaño de la muestra indica el número de factores que hay que multiplicar, por
ejemplo, en los ejemplos anteriores, en el primero las muestra eran de tamaño 2 y multiplicábamos 2
factores, y en el segundo eran muestras de tamaño tres y multiplicábamos tres factores).
Ejercicio: ¿Cuántos números de cuatro cifras no repetidas se pueden formar con las cifras del 1 al 9
(ambas inclusive)?
1.2.2.
Permutaciones
En el caso particular de que se tome una muestra de tamaño igual al tamaño de la población, es
decir, k = n, las variaciones se denominan permutaciones y se obtendrı́a:
Vnn = n · (n − 1) · . . . · (n − n + 1) = n · (n − 1) · . . . · 1
CAPÍTULO 1. COMBINATORIA
8
El producto de todos los números enteros desde el 1 hasta el n se denomina factorial de n y se
representa por n!. Por definición, 0!=1 y 1!=1. Evidentemente no existen los factoriales de los números
negativos (Si intentásemos calcular, por ejemplo (-4)!, por definición deberı́amos escribir:
(−4) · (−3) · (−2) · (−1) · 0 · 1 = 0
, es decir, el 0 siempre aparecerı́a en un factorial de un entero negativo, y dicho factorial serı́a siempre
0. No tiene sentido, por tanto, calcular el factorial en este caso).
Por tanto este caso particular de variaciones sin repetición se denomina permutaciones sin repetición de n elementos y se expresa:
Pn = n!
Ejemplo: ¿De cuántas maneras se pueden sentar 5 personas en 5 asientos en un cine?.
La primera persona se puede sentar en 5 sitios.
La segunda sólo en 4, la tercera en 3, la cuarta en 2 y la quinta en 1.
De modo que hay 5·4·3·2·1 = 120 posibilidades, es decir, P5 = 5! = 120.
Ejercicio: ¿Cuántas palabras de 8 letras (con o sin sentido) se pueden formar con las letras A B C
D E F G H?.
1.2.3.
Permutaciones con elementos repetidos
Si queremos calcular el número de permutaciones de n elementos de los cuáles hay n1 de una
clase,n2 de otra, etc. . . de modo que n1 + n2 + . . . + nr = n , entonces hablamos de permutaciones de
n elementos, algunos de los cuales están repetidos, lo que se expresa como:
Pnn1 ,n2 ,...,nr =
n!
n1 ! · n2 ! · . . . · nr !
Ejemplo: Con las letras A A A B B ,¿cuántas palabras, con o sin sentido, pueden formarse?
La A se repite 3 veces y la letra B se repite 2 veces, y en total hay 5 letras. Ası́ el número total de
palabras son:
5·4·3·2·1
5·4
5!
=
=
= 10
P53,2 =
3! · 2!
3·2·1·2·1
2
Dichas palabras serı́an: AAABB, AABAB, AABBA, ABAAB, ABABA, ABBAA
Escribe los 4 restantes.
Ejercicio: Con 5 signos + y 3 signos - ¿Cuántas cadenas de sı́mbolos se pueden formar?
1.2.4.
Muestras ordenadas con repetición
Si la población es de tamaño n y la muestra de tamaño k, pero ahora permitimos repeticiones
,procedemos ası́:
El primer elemento se puede elegir de n maneras.
Como podemos repetir, el segundo también se puede elegir de n maneras.
..
.
El elemento número k se puede elegir de n maneras.
En total tendremos n·n·. . . ·n (k veces ) = nk muestras de este tipo.
Ejemplos:
1. ¿De cuántas maneras se pueden elegir 2 cartas (no necesariamente distintas de una baraja de 40
cartas?.
La primera se puede elegir de 40 maneras.
La segunda, al poder repetir, también se puede elegir de 40 maneras.
En total hay 40·40 = 1600 formas.
CAPÍTULO 1. COMBINATORIA
9
2. ¿De cuántas formas se puede entregar el Premios al primer clasificado, al segundo, al tercero, y
al cuarto entre 5 pelı́culas diferentes en un festival de cine?
El primer Premio se puede dar de 5 maneras, el segundo también, el tercero también y el cuarto
también.
Por tanto hay 54 = 625 posibilidades.
Las muestras ordenadas y con repetición se denominan Variaciones con repetición y lo expresaremos:
V Rkn = nk
Ejercicio: ¿Cuántos números de tres cifras (no necesariamente distintas) pueden formarse con los
dı́gitos 1,6,7,8,9?.
1.3.
Muestras no ordenadas
1.3.1.
Muestras no ordenadas y sin repetición
Para estudiar este caso, es conveniente fijarse en un ejemplo.
Supongamos que tenemos una bolsa con 5 bolas numeradas del 1 al 5. Sacamos dos bolas, sin
importarnos el orden y sin repetir, ¿cuántos posibles resultados hay?.
Examinemos las posibilidades. Si el orden fuese importante ya sabemos que tendrı́amos 5·4 = 20
posibilidades (V52 = 5 · 4) que serı́an:
1, 2
2, 1
3, 1
4, 1
5, 1
1, 3
2, 3
3, 2
4, 2
5, 2
1, 4
2, 4
3, 4
4, 3
5, 3
1, 5
2, 5
3, 5
4, 5
5, 4
Ahora bien, como no nos importa el orden, para nosotros las parejas 2,1 y 1,2 que son 2, en realidad
sólo deberı́an contar como una, y lo mismo ocurre con el resto de parejas.
Estamos contando cada pareja 2 veces. Por tanto, para obtener el número de parejas que buscamos
tenemos que dividir entre 2. Ası́ resulta que el número de muestras no ordenadas y sin repetición que
20
= 10 , sólo 10 posibilidades que son:
tenemos es de:
2
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}
donde las llaves indican que el orden no importa.
Si sacásemos 3 bolas en lugar de 2, tendrı́amos los trı́os: 1,2,3 1,2,4 1,2,5 etc. . . en total 5·4·3 =
60 posibilidades (V53 = 5 · 4 · 3).
Razonando de igual manera al caso anterior, todos aquellos trı́os en los que estuviesen por ejemplo,
el 1, el 2 y el 3 estarı́an repetidos. Ahora bien, ¿cuántas veces se repite cada trı́o?. Veamos, tomando
como ejemplo los trı́os con 1,2 y 3 obtenemos: 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 6 posibilidades
(P3 = 3!) que en realidad representan lo mismo pues no nos importa el orden. Lo mismo ocurre con
cada trı́o, de modo que cada uno de ellos se repite 6 veces, ası́ pués si no tenemos en cuenta el orden,
60
= 10 maneras (no ordenadas y sin repetición).
el número de muestras no son 60 sino:
6
Ejercicio: Escribir los 10 trı́os del ejemplo anterior.
Formalizando lo anterior, si la población es de tamaño n y se extraen muestras de tamaño k, si
fuesen ordenadas serı́an
Vnk = n · (n − 1) · . . . · (n − k + 1)
pero como son no ordenadas tenemos que dividir por el número de maneras de ordenar esas muestras
de tamaño k, es decir hay que dividir por
Pk = k!
CAPÍTULO 1. COMBINATORIA
10
Resumiendo, el número de muestras no ordenadas y sin repetición de tamaño k que se extraen de
una población de tamaño n es:
Vnk
Pk
Las muestras no ordenadas y sin repetición se denominan Combinaciones sin repetición y las
expresaremos:
Vk
Cnk = n
Pk
El número de combinaciones sin repetición Cnk se recuerda de manera más sencilla mediante otra
fórmula:
n
Cnk =
k
n
La expresión
se denomina número combinatorio y se lee ”n sobre k”.
k
Una regla sencilla que permite calcular este número combinatorio es:
n
n!
=
k! · (n − k)!
k
Ejemplos:
1. ¿De cuántas maneras se pueden sacar 3 bolas numeradas en cualquier orden, de una bolsa que
contiene 5 bolas?.
Serı́an combinaciones de 5 elementos de los que sacamos 3, es decir, tenemos que calcular:
5
5!
= 10
=
C53 =
3! · 2!
3
son las maneras que habı́amos calculado en el ejemplo de la introducción.
2. ¿De cuántas formas se puede formar un grupo de trabajo de 6 alumnos de entre una clase de
27?.
En este caso son combinaciones (no importa el orden ) de 27 elementos de los que se escogen 6
, es decir:
27!
27
27!
6
=
= 296010
=
C27 =
6! · (27 − 6)!
6! · 21!
6
(¡Compruébalo!).
Ejercicio: ¿De cuántas maneras se pueden extraer 6 bolas de un bombo que contiene 49 bolas?
(Loterı́a Primitiva)
Hay algunos tipos más de muestras, en concreto las muestras no ordenadas con repetición, pero
no se estudiarán en este momento.
Números combinatorios y factoriales en la calculadora
Las calculadoras cientı́ficas poseen algunas teclas útiles para el cálculo de factoriales y números combinatorios.
Para el factorial, se utiliza la tecla !, que suele encontrarse sobre alguna otra tecla, por lo que al
utilizarla habrá que presionar antes la tecla SHIFT (o INV).
Dado que los factoriales crecen a una velocidad enorme, un calculadora normal sólo puede calcular
hasta el factorial de 69, y ya si pretendemos calcular 70!, se produce un mensaje de error.
Observemos que un número tan inofensivo como 13! ya tiene un valor de 6.227.020.800
CAPÍTULO 1. COMBINATORIA
11
Para el caso de los números combinatorios, algunas calculadoras poseen una función para calcularlos. Suele estar situada sobre la tecla de la división (depende mucho del modelo de calculadora).
Dicha función es
nCr
n
5
y calcula el número combinatorio
, de modo que si queremos calcular
, basta con introducir
r
3
el 5, luego SHIFT (o INV) , posteriormente el 3 y luego presionar la tecla de = para obtener 10. (Ya
lo habı́amos calculado antes).
Evidentemente si alguna de estas funciones tiene una tecla propia en la calculadora, es decir, no
está encima de otra, no es necesario presionar la tecla SHIFT (o INV) para operar con ella.
Capı́tulo 2
PROBABILIDAD
La probabilidad y la estadı́stica son, sin duda, las ramas de las Matemáticas que están en mayor
auge en este siglo, y tienen una tremenda aplicabilidad en todos los aspectos y ciencias, especialmente
en las Ciencias Sociales, puesto que aquellas variables que influyen en dichas ciencias, económicas,
demográficas, suelen tener carácter aleatorio,es decir, no son deterministas, y se fundamentan en
predicciones a partir de datos conocidos. Todo aquello que implique predicción nos lleva al terreno de
la probabilidad.
2.1.
Experimentos aleatorios
En todos los aspectos de la vida a veces nos encontramos con acontecimientos predeterminados, es
decir, tales que podemos decir el resultado de dichos acontecimientos antes de que finalice o incluso
de que comience. Tal es el caso de:
1. Tirar una piedra desde un edificio ( sabemos que se caerá).
2. Calentar un cazo de agua ( sabemos que la temperatura sube).
3. Golpear una pelota ( sabemos que se va a mover, e incluso conociendo fuerzas que actúan etc,
podemos conocer precisamente dónde caerá ).
Tales acontecimientos o experimentos de los que podemos predecir el resultado antes de que se
realicen se denominan experimentos deterministas.
Sin embargo, analicemos otro tipo de experimentos, mucho más interesantes desde el punto de
vista matemático:
Imaginemos que lanzamos un dado al aire (normal, de 6 caras y no trucado). ¿Podemos predecir
el resultado que vamos a obtener?. Evidentemente no. Este es un experimento que no es determinista.
A este tipo de experimentos, en los cuales no se puede predecir el resultado antes de realizar el
experimento se les denomina experimentos aleatorios.
Otros ejemplos de experimentos aleatorios pueden ser:
Tirar una moneda al aire y observar qué lado cae hacia arriba, rellenar una quiniela de fútbol,
jugar una partida de póker y, en general, cualquier juego en el que intervenga el azar.
2.2.
Definiciones básicas
La teorı́a de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda
ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es
más probable que otro o relaciones parecidas. Con este fin, introduciremos algunas definiciones.
Si realizamos un experimento aleatorio, llamaremos espacio muestral del experimento al conjunto
de todos los posibles resultados de dicho experimento.
Al espacio muestral lo representaremos por E (o bien por la letra griega omega Ω ).
A cada elemento que forma parte del espacio muestral se le denomina suceso elemental.
15
CAPÍTULO 2. PROBABILIDAD
16
Ejemplo:
1. ¿Cuál es el espacio muestral asociado al experimento de lanzar un dado normal al aire y observar
la cara que queda hacia arriba?.
Evidentemente, en este caso hay 6 posibles resultados (6 sucesos elementales) y el espacio muestral estará formado por: E={1,2,3,4,5,6}.
2. ¿Y en el caso del lanzamiento de una moneda?
Entonces E={C,X}
Ejercicios:
1. Escribir el espacio muestral asociado al experimento de sacar una carta de entre las diez del palo
de copas de una baraja española.
2. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
observar la pareja de números que se obtiene.
3. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
sumar los números que se obtienen.
Llamaremos suceso aleatorio a cualquier subconjunto del espacio muestral. El concepto de suceso
es fundamental en probabilidad. Dicho de forma simple, un suceso de un experimento aleatorio es
cualquier cosa que se nos ocurra afirmar sobre dicho experimento.
Ası́, si tiramos una moneda dos veces, serı́an sucesos todos los siguientes:
1. Sale al menos una cara.
2. Salen más caras que cruces.
3. La moneda cae de canto.
4. No sale ninguna cruz.
Llamaremos suceso imposible al que no tiene ningún elemento y lo representaremos por ∅ .
Llamaremos suceso seguro al formado por todos los posibles resultados (es decir, al espacio muestral) .
Llamaremos espacio de sucesos y lo representaremos por S, al conjunto de todos los sucesos aleatorios.
Ejemplo:
1. En el caso del lanzamiento de la moneda en el que el espacio muestral era E={C,X} , analicemos
quién es el espacio de sucesos:
- Sucesos con 0 elementos: ∅
- Sucesos con 1 elemento: {C},{X}
- Sucesos con 2 elementos:{C,X}
De modo que el espacio de sucesos es: S={∅,{C},{X},{C,X}}.
2. En el caso del lanzamiento de dos monedas, si haces el diagrama de árbol obtienes el siguiente
espacio muestral:
E = {(C, C), (C, X), (X, C), (X, X)}
El espacio de sucesos tiene ahora 16 elementos, que puedes intentar escribir, siguiendo el esquema
anterior, desde los sucesos con 0 elementos hasta aquellos que tienen 4 elementos. Si describimos
los sucesos que ponı́amos antes como ejemplos, obtenemos:
CAPÍTULO 2. PROBABILIDAD
a)
17
Sale al menos una cara={(C,C),(C,X),(X,C)}
b) Salen más caras que cruces={(C,C)}
c) La moneda cae de canto=∅
d ) No sale ninguna cruz={(C,C)}
3. En el caso del lanzamiento del dado el espacio de sucesos es mucho más amplio (64 elementos.
Serı́a interesante que intentases escribirlos todos o al menos te dieses cuenta de cómo son ,
aunque no los escribas todos)
En este mismo ejemplo, se puede considerar el suceso A= ”sacar un número par”. ¿De qué sucesos
elementales consta el suceso A?. Evidentemente, A={{2},{4},{6}}.
Otros sucesos pueden ser: B = ”Sacar un número mayor que 5-{{6}}.
C = ”Sacar un número par y menor que 5-{{2},{4}}.
Ejercicio: Una urna contiene dentro 4 bolas de las cuales 2 son blancas, 1 roja y otra azul. Se saca
una bola de la urna.
a) Escribir el espacio muestral.
b) Escribir los sucesos “no sacar bola azul” y “sacar bola roja o blanca”.
c) Escribir el espacio de sucesos.
Los sucesos admiten una representación gráfica que facilita su interpretación; del modo:
Figura 2.1: Representación en diagrama de Venn del suceso A
Por ejemplo, en el caso del dado:
Figura 2.2: Representación en diagrama de Venn para un dado
A = ”salir par y menor que 5”. Estos diagramas se denominan diagramas de Venn.
Propiedad:
Si el espacio muestral tiene n elementos, el espacio de sucesos tiene 2n elementos.
Ejemplo:
En el caso del dado, el espacio muestral tenı́a 6 elementos y el espacio de sucesos tiene 26 = 64
elementos.
En el caso de la moneda, el espacio muestral tenı́a dos elementos y el espacio de sucesos tiene
22 = 4 elementos.
CAPÍTULO 2. PROBABILIDAD
2.3.
18
Operaciones con sucesos
Si realizamos un experimento aleatorio y consideramos varios sucesos A, B, C, etc, asociados a
dicho experimento, podemos realizar varias operaciones entre ellos. Los más importantes son:
1. Igualdad de sucesos: Dos sucesos A y B son iguales si están compuestos por los mismos elementos.
Lo expresaremos por A = B.
2. Intersección de sucesos: Llamaremos suceso intersección de los sucesos A y B, y lo representaremos por A ∩ B, al suceso “ocurren A y B a la vez”.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Sean los sucesos A=“sacar un nº par”={2,4,6}, y B=“sacar un número entre 2 y 4 (inclusive)”={2,3,4}.
El suceso A ∩ B es tal que ocurren A y B a la vez, es decir:
A ∩ B=“sacar un nº par y que esté entre 2 y 4 (inclusive)”={2,4}.
El suceso A ∩ B son los elementos comunes a los conjuntos A y B (elementos que están en los
dos conjuntos).
Representado en diagramas de Venn:
Figura 2.3: Intersección de sucesos: A ∩ B
En ocasiones podremos encontrarnos con sucesos que NO tengan elementos en común. En estos
casos se dice que los sucesos A y B son incompatibles, y su intersección se representa con el
conjunto vacı́o:
A∩B =∅
Evidentemente, si los sucesos sı́ tienen intersección, diremos que son compatibles.
3. Unión de sucesos: Llamaremos suceso unión de los sucesos A y B y se representa por A ∪ B al
suceso “ocurre A o bien ocurre B o bien ocurren ambos a la vez”(también podemos decir que
“ocurre alguno”).
Es decir A ∪ B son los elementos que están en ambos conjuntos (aunque no necesariamente en
los dos a la vez). Representado en diagrama de Venn:
Figura 2.4: Unión de sucesos: A ∪ B
CAPÍTULO 2. PROBABILIDAD
19
Ejemplo: En el caso anterior:
A ∪ B=”sacar un nº par o un nº que esté entre 2 y 4 (inclusive)”={2,3,4,6}.
NOTA:
Observemos que la intersección de dos conjuntos siempre es ”menor”que la unión, de hecho es
“menor” que el propio conjunto.
Escrito matemáticamente:
A∩B ⊂ A∪B A∩B ⊂ A A∩B ⊂ B A ⊂ A∪B B ⊂ A∪B
(El sı́mbolo ⊂ significa “contenido”, o que el primer conjunto es un subconjunto del segundo)
4. Suceso contrario de otro: Dado un suceso A, denominaremos suceso contrario de A y se repre
sentará por Ā (o bien A o bien Ac ) al suceso que tiene por elementos a todos aquellos que no
pertenecen a A.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Como antes, los sucesos A=“sacar un nº par”={2,4,6}, por tanto Ā={1,3,5} y B= “sacar un
número entre 2 y 4 (inclusive)”={2,3,4}, de modo que B̄={1,5,6}.
En un diagrama de Venn:
Figura 2.5: La parte punteada es Ā.(Todo lo que no está incluido en A)
5. Diferencia de sucesos: Si A y B son dos sucesos, llamaremos diferencia entre A y B al suceso
B −A, que consta de los elementos que están en B pero no están en A.Por ejemplo, si A={2,4,6},
B={2,3,4}, tenemos que B − A={3}. Se cumple que B − A = B − A ∩ B, y también que
B − A = Ā ∩ B. Representado en un diagrama de Venn:
Figura 2.6: La parte rayada es B − A, todos los elementos de B que no estén en A
De todas formas, hemos de ser cuidadosos con esta operación: No se debe confundir con una
simple resta como operación numérica, sino que es una diferencia conjuntista, quitar los elementos
comunes a dos conjuntos.
Ejercicio: En una urna tenemos 9 bolas numeradas del 1 al 9. Sacamos una y anotamos su número.
Sean los sucesos: A=”sacar un nº primo”B=“sacar un nº cuadrado” (por ejemplo 4 es un número
cuadrado, porque 4=22 ). Se pide:
a) Describir el espacio muestral.
b) ¿Cuántos elementos tiene el espacio de sucesos?.
CAPÍTULO 2. PROBABILIDAD
20
c) Calcula A ∩ B y A ∪ B.
d) ¿Son A y B compatibles o incompatibles?.
e) Calcula Ā y B̄.
f) Si C=“sale un número impar”, calcula A ∩ C, B ∩ C,C̄ , A ∪ C,Ā ∩ C̄.
Propiedades de las operaciones con sucesos:
Las operaciones con sucesos tienen las siguientes propiedades, la mayorı́a de ellas bien conocidas:
Conmutativa
Asociativa
Idempotente
Simplificación
Distributiva
Elemento neutro
Absorción
Intersección
A∩B = B∩A
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A∩A=A
A ∩ (A ∪ B) = A
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A∩E =A
A∪∅ = A
Unión
A∪B = B∪A
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A∪A = A
A ∪ (A ∩ B) = A
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A∪∅ = A
A∪E = A
Además de estas sencillas propiedades (que se demuestran fácilmente mediante un diagrama de
Venn), las operaciones con sucesos tienen otras dos propiedades muy importantes:
Leyes de De Morgan: Si A y B son dos sucesos, se verifican:
(A ∪ B) = Ā ∩ B̄
(A ∩ B) = Ā ∪ B̄
Demostración: Demostraremos la primera de las igualdades.
En primer lugar, representemos en un diagrama de Venn (A ∪ B). Para ello, primero representamos
A ∪ B, y luego su contrario (A ∪ B):
Figura 2.7: Imagen 1 corresponde a A ∪ B.
Imagen 2 corresponde a A ∪ B
Ahora, representaremos en otro diagrama el otro miembro, es decir Ā ∩ B̄. En primer lugar,
representaremos Ā, luego B̄ y luego su intersección:
Figura 2.8: Imagen 1 corresponde a Ā.
Imagen 2 corresponde a B̄.
Imagen 3 corresponde a Ā ∩ B̄.
Observando los dos resultados, vemos que las partes rayadas son iguales, por lo que la igualdad es
cierta.
CAPÍTULO 2. PROBABILIDAD
21
Ejercicio:
1. Mediante un procedimiento similar, demostrar la segunda ley de De Morgan.
2. Luisa y Marı́a interviene en un torneo de ajedrez. La primera que gane dos partidas seguidas o
tres alternas gana el torneo. Encuentra el espacio muestral con todos los resultados posibles (
suponemos que nunca hacen tablas).
(Indicación: Utiliza un diagrama de árbol).
3. Consideramos el fenómeno aleatorio extraer una carta de una baraja de 40 y anotarla . Sean los
sucesos A= “sacar oro”, B= “sacar rey”, C= “sacar el rey de bastos”.
Determina los sucesos:
A ∩ C̄, A ∩ B ∩ C, Ā ∪ B̄ ∪ C̄, Ā ∪ B̄
2.4.
Asignación de probabilidades. Regla de Laplace
Hasta el momento hemos descrito lo que es un experimento aleatorio y hemos definido los conceptos básicos asociados a este experimento. Nos falta responder a esta pregunta: ¿Cómo asignar
probabilidades a cada uno de los sucesos de un experimento aleatorio?.
Hay muchas maneras de asignar probabilidades. La más sencilla e intuitiva la dio el matemático
francés Pierre Simon Laplace (1749-1827), quién enunció la regla que lleva su nombre:
Regla de Laplace:
Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente
probables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
p(A) =
número de casos favorables al suceso A
número de casos posibles
Ejemplo: Lanzamos un dado normal al aire. Consideramos el suceso A= “sale par”. Calcular p(A).
Casos posibles hay 6, pues E={1,2,3,4,5,6}.
Casos favorables al suceso A={2,4,6}.
1
3
Por tanto p(A) = = = 0 5.
6
2
(Notemos que la probabilidad siempre es un número positivo y menor, o a lo sumo igual a 1).
El inconveniente que plantea la definición de Laplace es que necesariamente los sucesos elementales
tienen que tener la misma probabilidad de ocurrir.
Observemos un caso tan sencillo como el siguiente:
De una urna que contiene 8 bolas rojas, 5 amarillas y 7 verdes se extrae una bola al azar. Calcula
la probabilidad de que la bola extraı́da sea :
a) roja
b) verde
c) amarilla
El espacio muestral en este caso serı́a: E={R,V,A}, que consta sólo de tres elementos, pero serı́a un
poco ingenuo asignar las probabilidades mediante la regla de Laplace,
p(R) =
1
3
p(V ) =
1
3
p(A) =
1
3
porque ya intuitivamente se ve que hay más posibilidades, por ejemplo, de que salga una bola roja
que de que salga una bola amarilla, de modo que ¿cómo asignar probabilidades?.
CAPÍTULO 2. PROBABILIDAD
22
Fue el matemático ruso Kolmogorov quién precisó este término:
Definición axiomática de probabilidad:
Una probabilidad p es una función que asocia a cada suceso A del espacio de sucesos S , un número
real p(A), es decir: p : S −→ R , y que cumple las propiedades:
1. 0 ≤ p(A) ≤ 1, (es decir, cualquier suceso tiene probabilidad positiva y menor o igual que 1).
2. p(E) = 1 (la probabilidad del suceso seguro es 1).
3. Si A y B son incompatibles, es decir A ∩ B = ∅, entonces p(A ∪ B) = p(A) + p(B). (es decir
la probabilidad de la unión es la suma de las probabilidades si los sucesos tienen intersección
vacı́a).
Ejemplo:
Sea un experimento aleatorio cualquiera y definamos en S (espacio de sucesos) la siguiente probabilidad:
número de elementos del conjunto A
p(A) =
número total de elementos
Comprobemos que p es una probabilidad.
Para ello, comprobemos las tres propiedades:
a) Se ve que la probabilidad de cualquier suceso está entre cero y uno, puesto que cualquier conjunto
que tenga elementos ya tendrá probabilidad positiva, y el número de elementos de cualquier conjunto
no puede ser mayor que el número total de elementos existentes.
b) p(E) = 1, es evidente.
c) Tomemos dos sucesos A y B que no tengan elementos en común. Entonces:
p(A ∪ B) =
elementos que forman parte de A o de B
=
número total de elementos
número de elementos de A + número de elementos de B
= p(A) + p(B)
=
número total de elementos
puesto que si A y B no tienen elementos comunes, el número de elementos de la unión es la suma de
los elementos de cada conjunto por separado.
Por tanto se cumplen las 3 propiedades y p ası́ definida es una probabilidad. Esta será la definición
de probabilidad que utilicemos a partir de ahora.
Ejemplo:
En el ejemplo de las urnas anterior, lo lógico es definir la probabilidad ası́: Como en total hay 20
7
5
8
p(V ) =
p(A) = .
bolas y 8 son rojas, 7 verdes y 5 amarillas, p(R) =
20
20
20
Se puede comprobar que ası́ definida p es una probabilidad.
Sin embargo, comprobar las propiedades de la definición de Kolmogorov es una labor larga y engorrosa,
puesto que hay que verificar que se cumple para todos aquellos sucesos del espacio de sucesos S, que es
ciertamente amplio en muchas ocasiones. El siguiente resultado simplifica la tarea de decidir cuándo
una función p sobre el espacio de sucesos es una probabilidad, basándose sólo en los sucesos elementales,
es decir, aquellos que forman parte del espacio muestral. Lo enunciaremos sin demostración:
CAPÍTULO 2. PROBABILIDAD
23
Propiedad
Si w1 , w2 , . . ., wn son los n sucesos elementales de un suceso aleatorio cualquiera,p una función
p : S −→ R de modo que cumple las propiedades:
1. 0 ≤ p(wi) ≤ 1 ∀ i ∈ {1, 2, . . . , n}
2. p(w1) + p(w2) + . . . + p(wn ) = 1
Entonces p es una probabilidad.
Ejemplo: Comprobar si las siguientes funciones definidas para los sucesos elementales son probabilidad,
siendo E={a,b,c,d} el espacio muestral del experimento aleatorio:
1
1
1
1
a) p(a) = , p(b) = , p(c) = , p(d) =
2
3
4
5
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
30 + 20 + 15 + 12
77
1 1 1 1
+ + + =
=
2 3 4 5
60
60
que evidentemente NO es 1, luego p NO es probabilidad.
1
1
1
b) p(a) = , p(b) = , p(c) = 0, p(d) =
4
2
2
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
o cero menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1+2+1
1 1 1
+ + =
=1
4 2 4
4
luego p SÍ es probabilidad.
Consecuencias de la definición de probabilidad:
1. p(Ā) = 1 − p(A)
En efecto, puesto que E = A ∪ Ā y además A y Ā son incompatibles, resulta por la propiedad
3) de la definición que
p(E) = p(A ∪ Ā) = p(A) + p(Ā)
Y por la propiedad 2), p(E)=1, luego 1 = p(A) + p(Ā) y por tanto p(Ā) = 1 − p(A).
2. p(∅) = 0
Como Ē = ∅, resulta que:
p(Ē) = p(∅) = 1 − p(E) = 1 − 1 = 0
3. Si A y B son dos sucesos cualesquiera,
p(A ∪ B) = p(A) + p(B) − p(A ∩ B)
4. Si A, B y C son tres sucesos cualesquiera,
p(A ∪ B ∪ C) = p(A) + p(B) + p(C) − p(A ∩ B) − p(A ∩ C) − p(B ∩ C) + p(A ∩ B ∩ C)
CAPÍTULO 2. PROBABILIDAD
24
Ejemplo:
Se tira una moneda 3 veces. Calcular la probabilidad de obtener alguna cara.
Los problemas de este tipo, en los que se pide la probabilidad de obtener “alguna” cosa, se suelen
resolver muy bien por paso al complementario. En este caso concreto, A = “obtener alguna cara”.
Ā= “no obtener ninguna cara”= “obtener 3 cruces”.
1
, pues hay 8 casos posibles (2·2·2, ¡haz el diagrama de árbol!) y sólo uno
Entonces, p(A) =
8
favorable (XXX, 3 cruces), por tanto:
p(A) = 1 − p(Ā) = 1 −
1
7
=
8
8
Ejercicio:
Calcular la probabilidad de obtener al menos 1 seis si se lanza 4 veces un dado.
Ejemplo:
Se lanza un dado dos veces y se suman las dos caras. Sea A el suceso A= “la suma de resultados
es mayor o igual que 10” y B= “la suma de los resultados es múltiplo de 6”. Calcular p(A), p(B) y
p(A ∩ B).
Hay 36 posibles resultados al lanzar dos veces un dado. ¿Cuántos de ellos suman 10 o más?
Que sumen 10: (4,6), (5,5), (6,4)
Que sumen 11: (5,6), (6,5)
Que sumen 12: (6,6)
1
6
= .
Por tanto, p(A) =
36
6
¿Cuántos hay que sumen múltiplo de 6?
Que sumen 6: (1,5), (2,4),(3,3), (4,2), (5,1)
Que sumen 12: (6,6)
1
6
= .
Por tanto, p(B) =
36
6
1
En cuanto a A ∩ B = (6, 6), luego p(A ∩ B) = .
36
Ejercicios:
1. Se ha encargado la impresión de una encuesta a una imprenta, que imprime 12 folios defectuosos
de cada 1000. Hallar la probabilidad de que elegido un folio de la encuesta al azar:
a) Esté mal impreso.
b) Esté correctamente impreso.
2. Una bolsa contiene 8 bolas numeradas. Se extrae una bola y anota su número. Sean los sucesos
A= “salir par”, B= “salir impar”, C= “salir múltiplo de 4”.
Calcular las probabilidades de A ∪ B, A ∪ C, B ∪ C, A ∪ B ∪ C.
3. Extraemos una carta de una baraja española. Calcula:
a) La probabilidad de que sea un rey o un as.
b) La probabilidad de que sea un rey o una copa.
c) La probabilidad de que sea un rey y una copa.
4. En el banquete posterior a una boda se sientan en la presidencia 10 personas, entre los cuales se
encuentran los novios. Calcular la probabilidad de que los novios estén juntos en el centro de la
mesa.
CAPÍTULO 2. PROBABILIDAD
2.5.
25
Probabilidad condicionada
Hasta ahora nos hemos limitado a calcular probabilidades únicamente partiendo de un experimento
aleatorio, sin tener más información. Pero, ¿qué ocurre si conocemos alguna información adicional?.
Supongamos que estamos realizando el experimento aleatorio de lanzar un dado y obtener el
1
número que sale. Consideremos el suceso A= “sale un 4”. Evidentemente, p(A) = .
6
Ahora bien, ¿variarı́a esta probabilidad si al lanzar el dado alguien pasa por allı́ y nos dice que ha
salido un número par?.
Disponemos entonces de una información adicional, B={2,4,6}.
Hemos reducido nuestro espacio muestral, que ahora sólo consta de 3 elementos y tenemos que
cambiar las probabilidades asignadas.
1
Ahora el suceso A no tiene una posibilidad entre 6 de ocurrir, sino una entre tres, es decir, p(A) = .
3
Esta es la idea de la probabilidad condicionada: La información obtenida B, modifica la proba1
y se lee “probabilidad de A condicionada a B” o
bilidad de A. Lo expresaremos ası́: p(A/B) =
3
“probabilidad de A conociendo B”.
El caso anterior es muy sencillo, pues directamente podemos calcular p(A/B), pero si el espacio
muestral se amplı́a, el problema es más complicado. La fórmula siguiente simplifica el problema.
Definición:
Sea A un suceso aleatorio asociado a un experimento aleatorio, y sea B otro suceso que sabemos
que se ha realizado.
Llamaremos probabilidad de A condicionada a B y lo expresaremos por p(A/B) a la expresión:
p(A/B) =
p(A ∩ B)
p(B)
(de idéntico modo se define p(B/A), escribe la fórmula).
Ejemplo: Para el caso anterior,
1
3
A={4},B={2,4,6} −→ p(B) = = .
6
2
1
A ∩ B = {4} −→ p(A ∩ B) = .
6
Luego:
1
2
1
p(A ∩ B)
= 6 = =
p(A/B) =
1
p(B)
6
3
2
es lo mismo que obtenı́amos antes directamente.
Ejercicios:
1. Calcula la probabilidad de que la suma de las caras de dos dados sea mayor a igual que 10
sabiendo que en el primer dado ha salido un seis.
2. Se lanzan dos dados:¿cuál es la probabilidad de obtener una suma de puntos igual a siete?.
Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya
salido un 3?
CAPÍTULO 2. PROBABILIDAD
2.6.
26
Sucesos independientes
Si bien el conocer cierta información adicional modifica la probabilidad de algunos sucesos, puede
ocurrir que otros mantengan su probabilidad, pese a conocer dicha información.
Por ejemplo, en el lanzamiento de un dado, consideremos los sucesos: A= “sacar un número par”
y B= “sacar un número menor o igual que 2” Es claro que A= {2,4,6} y B= {1,2}.
Calculemos la probabilidad de A conociendo que se ha realizado el suceso B, es decir, p(A/B).
Utilizando la fórmula:
1
3
1
p(A ∩ B)
= 6 = = = 0 5
p(A/B) =
1
p(B)
6
2
3
1
1
puesto que p(A ∩ B)=p(sacar par y menor o igual que 2)= y p(B)= .
6
3
Pero si no conociésemos la información B, ¿cuál serı́a la probabilidad de A?.
3
p(A)=p(sacar par)= = 0 5, es decir que p(A/B)=p(A), y por tanto el conocer la información B
6
no modifica la probabilidad de A.
Cuando esto ocurre es decir, cuando p(A/B) = p(A), diremos que los sucesos A y B son independientes (el hecho de que ocurra B no modifica la probabilidad de A).
Propiedad:
A y B son sucesos independientes ⇐⇒ p(A ∩ B) = p(A) · (B).
Demostración: =⇒) Si A y B son independientes, p(A/B) = p(A), y por la fórmula de la probabilidad
p(A ∩ B)
p(A ∩ B)
, luego
= p(A), y por tanto p(A ∩ B) = p(A) · p(B).
condicionada,p(A/B) =
p(B)
p(B)
⇐=) Partiendo de p(A ∩ B) = p(A) · p(B), entonces
p(A/B) =
p(A) · p(B)
p(A ∩ B)
=
= p(A)
p(B)
p(B)
luego p(A/B) = p(A) y por tanto A y B son independientes.
Ejemplo:
En el caso anterior, p(A ∩ B) =
1
1
1
, y por otra parte p(A) = y p(B) = ,luego se cumple que
6
2
3
p(A ∩ B) =
1 1
1
= · = p(A) · p(B)
6
2 3
luego A y B son independientes.
Ejercicio:
1
2
De dos sucesos conocemos que p(A ∪ B) = y p(A) = , calcula p(A ∩ B) y p(B) para que A y
3
5
B sean independientes.
(Indicación: Utilizar la fórmula de la unión de dos sucesos y la de la independencia de sucesos).
7
7
, p(A ∩ B) = 60
).
(Solución: p(B) = 12
CAPÍTULO 2. PROBABILIDAD
27
NOTA IMPORTANTE:
No se deben confundir los conceptos de sucesos incompatibles y sucesos independientes. Dos sucesos
son incompatibles cuando no tienen elementos en común, es decir, A ∩ B = ∅, o con diagramas de
Venn:
Figura 2.9: A y B incompatibles, sin elementos en común.
Dos sucesos son independientes si p(A ∩ B) = p(A) · p(B). Son conceptos totalmente distintos. Uno
se refiere a CONJUNTOS y otro se refiere a PROBABILIDADES.
2.7.
Experimentos compuestos. Teorema de la probabilidad total.
Un experimento compuesto es aquel que consta de dos o más experimentos aleatorios simples.
Es decir, si tiramos un dado, o una moneda, son experimentos aleatorios simples, pero si realizamos
el experimento de tirar un dado y posteriormente una moneda, estamos realizando un experimento
compuesto.
Propiedad:
De la fórmula para calcular la probabilidad condicionada se deduce inmediatamente que:
p(A ∩ B) = p(B) · p(A/B)
y
p(A ∩ B) = p(A) · p(B/A)
Ejemplo: Se extraen 2 cartas, sucesivamente, de una baraja de 40. Calcular la probabilidad de extraer
2 sotas.
Sea A = “sacar sota en la 1ª” y B = “sacar sota en la 2ª”.
Nos piden p(A ∩ B).
Según la fórmula anterior, p(A ∩ B) = p(A) · p(B/A).
1
3
1
1 1
1
4
=
y p(B/A) =
=
, por lo que p(A) =
·
=
.
Ahora bien , p(A) =
40
10
39
13
10 13
130
La forma más sencilla de calcular probabilidades en experimentos compuestos es un digrama de
árbol, donde en cada rama situamos la probabilidad que le corresponde al suceso del final de dicha
rama. Estas probabilidades que se van poniendo en el árbol son probabilidades condicionadas, porque
dependen de los resultados anteriores.
En el caso del ejercicio anterior, el diagrama serı́a:
Figura 2.10: Diagrama de árbol para la extracción de sota(S) u otra carta (S̄)
CAPÍTULO 2. PROBABILIDAD
28
Nota:
Este mismo resultado se podrı́a haber obtenido
sin usar la probabilidad condicionada, del modo:
40
Formas de elegir 2 cartas de entre 40=
.
2
4
Formas de elegir 2 sotas entre 4=
.
2
4
6
1
casos favorables
2
= =
=
.
Por la regla de Laplace, p(obtener 2 sotas)=
40
casos posibles
780
130
2
Ejercicios:
1. Una urna contiene 9 bolas rojas y 5 negras. Se extraen sucesivamente 2 bolas. Calcula la probabilidad de que:
a) la primera bola sea roja y la segunda negra.
b) una sea roja y la otra negra.
2. En una bolsa hay 4 canicas rojas, 4 azules y 2 verdes. Se extraen 3 canicas que resultan ser 2
rojas y una azul. Sin devolverlas a la bolsa se saca otra canica, ¿de qué color es más probable
que salga?.
Ejemplo:
Tenemos dos urnas, una con 7 bolas rojas y 2 azules, y otra con 3 bolas rojas y 8 azules. Tiramos
un dado. Si nos sale un 3 o un 5, sacamos una bola de la primera urna y en caso contrario, sacamos
una bola de la segunda urna. ¿Cuál es la probabilidad de que la bola extraı́da sea azul?.
Evidentemente estamos realizando un experimento compuesto. En primer lugar, se trata de elegir una
urna, para lo cuál lanzamos un dado. Si U1 = “elegir la urna 1” y U2 = “elegir la urna 2”, es claro que
1
2
2
4
p(U1 )= = y p(U2 )= = .
6
3
6
3
Por otra parte, luego realizamos otro experimento consistente en sacar una bola de la urna elegida.
Si A= “sacar una bola azul”, las probabilidades que conocemos son:
2
p(A/U1 ) =
9
y
8
p(A/U2 ) =
11
Lo que nos piden es p(A). Para calcular dicha probabilidad, si representamos el diagrama de árbol:
Figura 2.11: Diagrama de árbol para la extracción de bolas
Como la probabilidad de A depende de la urna en la que estemos, basta multiplicar las probabilidades de cada rama que llegue a la bola azul y luego sumar los 2 resultados, es decir:
4
32
166
2 2 4 8
=
+
=
= 0 559
p(A) = · + ·
6 9 6 11
54 66
297
CAPÍTULO 2. PROBABILIDAD
29
La justificación teórica para proceder ası́ la da el teorema de la probabilidad total.
Teorema de la probabilidad total: Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión
es el espacio muestral (A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
Nota: El conjunto A1 , A2 , . . . , An que verifica la incompatibilidad 2 a 2 y que la unión de todos ellos es
el espacio muestral se denomina sistema completo de sucesos y este sistema “divide el espacio muestral
en partes que no se solapan”. Mediante representación gráfica:
Figura 2.12: Sistema completo de sucesos: A1 , A2 , . . . , An
Ejemplo: Para el caso anterior, A1 = “sacar la bola de la urna 1”.
A2 = “sacar la bola de la urna 2”.
B= “sacar bola azul”.
Y aplicando el teorema:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) =
4
32
166
2 2 4 8
· + ·
=
+
=
= 0 559
6 9 6 11
54 66
297
Ejemplo: En un colegio se imparten sólo los idiomas inglés y francés. El 80 % de los alumnos
estudian inglés y el resto francés. El 30 % de los alumnos de inglés son socios del club musical del
colegio y de los que estudian francés son socios de dicho club el 40 %. Se elige un alumno al azar.
Calcular la probabilidad de que pertenezca al club musical.
En estos problemas es importante elegir el sistema completo de sucesos. En este caso: A1 = “estudiar
inglés”
A2 = “estudiar francés”
B= “ser del club musical”
Nos piden p(B). Por el teorema anterior:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) =
20 40
8
80 30
·
+
·
=
= 0 32
100 100 100 100
25
Mediante el diagrama de árbol:
Figura 2.13: Diagrama de árbol para el problema de idiomas y club musical
Se obtiene el mismo resultado.
CAPÍTULO 2. PROBABILIDAD
30
Ejercicio:
Se tienen dos urnas, la primera de las cuales tiene 6 bolas blancas, 4 negras y 2 rojas y la urna 2
tiene 3 bolas blancas y 7 negras.
Se lanza un dado al aire, y si sale múltiplo de 3 se saca de la primera urna y en otro caso se saca
una bola de la segunda urna.
Calcular la probabilidad de que sea:
a) bola blanca
b) bola negra c) bola roja.
26 1
,
,
Solución: 11
30 45 18 .
2.8.
Tablas de contingencia
Las tablas de contingencia están referidas a 2 caracterı́sticas que presentan cada una dos o más
sucesos.
Ejemplo: En un taller se sabe que acuden, por la mañana 3 automóviles con problemas de eléctricos,
8 con problemas mecánicos y 3 con problemas de chapa. Por la tarde hay 2 con problemas eléctricos,
3 con problemas mecánicos y 1 con problemas de chapa.
a) Calcular el porcentaje de los que acuden por la tarde.
b) Calcular el porcentaje de los que acuden con problemas mecánicos
c) Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana.
Resumiendo los datos en una tabla de contingencia:
Mañana
Tarde
Total
Pr. eléctricos
3
2
5
Pr. Mecánicos
8
3
11
Pr. de chapa
3
1
4
Total
14
6
20
a) En total acuden 20 y por la tarde acuden 6, luego:
6
p(acudir por la tarde)= = 0 3, es decir, el 30 %.
20
b) En total acuden 20 y con problemas mecánicos hay 11, luego:
11
p(problemas mecánicos)= = 0 55, es decir, el 55 %.
20
c) Aquı́ tenemos una información adicional (es un coche que tiene problemas eléctricos), luego se
trata de una probabilidad condicionada.Con problemas eléctricos hay 5 y de ellos 3 por la mañana,
luego:
3
p(acudir por la mañana/problemas eléctricos)= = 0 6, es decir, el 60 %.
5
En una tabla de contingencia puede que nos falten datos, pero se pueden hallar fácilmente con los
datos que son conocidos.
Ejemplo Para tratar de curar una enfermedad se aplica un tratamiento nuevo a 81 pacientes de un
hospital, mientras que en el mismo hospital hay otros 79 pacientes que siguen un tratamiento antiguo
contra la misma enfermedad. En total, con ambos tratamientos los curados son 103, de los cuales 60
lo son gracias al tratamiento nuevo. Si tratamos de construir la tabla, con los datos del problema se
obtiene:
Curarse
No curarse
Total
Tratamiento antiguo
Tratamiento nuevo
60
79
81
Total
103
CAPÍTULO 2. PROBABILIDAD
31
Completa la tabla y responde a las cuestiones:
Si se elige un individuo al azar, calcula la probabilidad de que:
1. Se haya curado.
2. No se haya curado.
3. Se haya curado con el nuevo tratamiento.
4. No se haya curado con el nuevo tratamiento.
5. Se haya curado con el tratamiento antiguo.
6. No se haya curado con el tratamiento antiguo
2.9.
El teorema de Bayes.
Como consecuencia del teorema de la probabilidad total y de las propiedades de la probabilidad
condicionada, resulta este importante teorema que permite calcular probabilidades condicionadas.
Teorema de Bayes:
Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión es el espacio muestral
(A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:
p(Ai /B) =
p(Ai ) · p(B/Ai )
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
Demostración:
Por definición,p(Ai /B) =
p(Ai ∩ B)
.
p(B)
Ahora bien, recordando que p(Ai ∩ B) = p(Ai ) · p(B/Ai ), debido a que p(B/Ai ) =
Ai ∩ B
.
p(Ai )
Por tanto, combinando los dos hechos:
p(Ai /B) =
p(Ai ) · p(B/Ai )
p(Ai ∩ B)
=
p(B)
p(B)
Como por el teorema de la probabilidad total es:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
resulta que sustituyendo:
p(Ai/B) =
p(Ai ) · p(B/Ai )
p(Ai ) · p(B/Ai )
=
p(B)
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
y el teorema queda demostrado.
Nota:
Las probabilidades p(Ai ) se denominan probabilidades a priori.
Las probabilidades p(Ai /B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai ) se denominan verosimilitudes.
CAPÍTULO 2. PROBABILIDAD
32
Ejemplo:
Dos clases de 2º de Bachillerato, una de 28 alumnos y otra de 35 alumnos hacen conjuntamente
un examen de Matemáticas. La probabilidad de aprobar de los alumnos de la primera clase es de 0’68
y los de la segunda del 0’73. Se toma un examen al azar y resulta que está aprobado. ¿Cuál es la
probabilidad de que sea de un alumno de la 1ª clase?.
Sea A1 = “el examen es de un alumno de la primera clase”
A2 = “el examen es de un alumno de la segunda clase”
B= “el examen está aprobado”
Nos piden p(A1 /B).
Hagamos antes que nada un diagrama de árbol:
Figura 2.14: Diagrama de árbol para el problema del examen
Por el teorema de Bayes:
p(A1 /B) =
p(A1 ) · p(B/A1 )
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 )
Sustituyendo:
28 · 0 68
0 302
63
= = 0 427
p(A1 /B) =
35 28 0 708
· 0 68 +
· 0 73
63
63
p(A1 ) es la probabilidad “a priori”, es decir , antes de realizar el experimento y careciendo de
información.
28
= 0 444.
En este caso p(A1 ) =
63
p(A1 /B) es la probabilidad “a posteriori”, después de realizarlo y conocer más información. En
este caso p(A1 /B) = 0 427 (es algo menor).
Ejercicio:
Se tienen dos urnas. En la primera hay 10 bolas blancas, 7 negras y 5 rojas. En la segunda 24
blancas, 4 negras y 9 rojas. Se elige una urna al azar y se saca una bola. Calcular:
a) Probabilidad de sacar bola blanca.
b) Sabiendo que la bola extraı́da es blanca, probabilidad de que provenga de la segunda urna.
264
Solución: 449
814 , 449 .
Capı́tulo 3
DISTRIBUCIÓN BINOMIAL Y
DISTRIBUCIÓN NORMAL
3.1.
Introducción
Estudiaremos en este tema dos de las distribuciones de probabilidad más importantes y que son
imprescindibles a la hora de adentrarnos en el estudio de la inferencia estadı́stica. La distribución
binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que sólo pueden
tomar un número finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza,
1654-1705), quién escribió el primer tratado importante sobre probabilidad, “Ars conjectandi” (El
arte de pronosticar). Los Bernoulli formaron una de las sagas de matemáticos más importantes de la
historia. La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud
de fenómenos sociales. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los
más famosos matemáticos de la historia. La gráfica de la distribución normal en forma de campana se
denomina Campana de Gauss.
3.2.
La distribución binomial o de Bernoulli
La distribución binomial está asociada a experimentos del siguiente tipo:
- Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o
fracaso.
- La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o
fracaso en las demás ocasiones.
- La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.
Veámoslo con un ejemplo
Tiramos un dado 7 veces y contamos el número de cincos que obtenemos. ¿Cuál es la probabilidad
de obtener tres cincos?.
Este es un tı́pico ejemplo de distribución binomial, pues estamos repitiendo 7 veces el experimento
de lanzar un dado. ¿Cuál es nuestro éxito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, será no sacar 5, sino sacar cualquier otro número.
1
Por tanto, Éxito = E = “sacar un 5” =⇒ p(E) =
6
5
Fracaso = F = “no sacar un 5” =⇒ p(F ) =
6
Para calcular la probabilidad que nos piden, fijémonos en que nos dicen que sacamos 3 cincos y
por lo tanto tenemos 3 éxitos y 4 fracasos, ¿de cuántas maneras pueden darse estas posibilidades?.
Podrı́amos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF
Pero también podrı́amos sacar EFEFFFE, es decir que en realidad estamos calculando de cuántas
38
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
39
maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas combinatorias, este problema
se reduce a calcular las permutaciones con elementos repetidos:
7·6·5
7!
=
= 35formas
3! · 4!
3·2·1
5
1
Y por tanto, como p(E) = y tengo 3 éxitos y p(F ) = y tengo 4 fracasos:
6
6
1 1 1 5 5 5 5
p(tener 3 éxitos y 4 fracasos) = 35 · · · · · · · = 0 0781
6 6 6 6 6 6 6
P73,4 =
1
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de éxito ,
6
la probabilidad de obtener 3 éxitos es 0’0781, y lo expresarı́amos:
1
, entonces p(X = 3) = 0 0781
Bin 7;
6
Como repetir este proceso serı́a bastante penoso en la mayorı́a de los casos, lo mejor es recurrir a la
siguiente fórmula que expresa la probabilidad de obtener cierto número de éxitos en una distribución
binomial:
Definición de distribución binomial:
Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y
fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribución binomial de
parámetros n y p, y lo representaremos por Bin(n;p). En este caso la probabilidad de obtener k éxitos
viene dada por:
n
p(X = k) =
· pk · q (n−k)
k
Nota:
Observar que las probabilidades de éxito y fracaso son complementarias, es decir, q = 1-p y p =
1-q, por lo que basta saber una de ellas para calcular la otra.
Ejemplo:
1
, y querı́amos calcular p(X=3) (obtener 3 éxitos). Aplicando la fórmula:
Antes tenı́amos Bin 7;
6
3 4
5
7
1
·
= 0 0781
p(X = 3) =
·
6
6
3
Ejemplo:
Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la
probabilidad de que una familia con 6 descendientes tenga 2 hijos.
En este caso Éxito = E = “tener hijo” y p(E) = 0’5.
Fracaso = F = “tener hija” y p(F) = 0’5.
Estamos por tanto ante una binomial Bin(6;0’5) y nos piden p(X=2).
Si aplicamos la fórmula es:
6
p(X = 2) =
· (0 5)2 · (0 5)4 = 0 2344
2
Nota:
La elección de éxito o fracaso es subjetiva y queda a elección de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo
anterior, si:
Éxito = “tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos,
si el éxito es tener hija hemos de plantearnos cuál es la probabilidad de tener 4 éxitos (4 hijas), es
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
decir:
40
6
p(X = 4) =
· (0 5)4 · (0 5)2 = 0 2344
4
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el éxito y el fracaso y
la pregunta que nos hagan.
3.2.1.
El uso de las tablas de la distribución binomial
La distribución binomial se encuentra tabulada por lo que es fácil calcular probabilidades sin
necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribución binomial es necesario
conocer:
- El número de veces que se realiza el experimento (n).
- La probabilidad de éxito (p).
- El número de éxitos (k).
La probabilidad p se busca en la primera fila (valores desde 0’01 hasta 0’5).
El número de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y
el número de éxitos a su lado.
Por ejemplo en el caso anterior, Bin (6;0’5) , p(X=2), la columna p=0’5 es la última, y cuando
n=6 y k=2 encontramos 0’2344, el valor que habı́amos calculado.
Nota importante: El caso en que p > 0 5, no se encuentra tabulado.
La razón es bien sencilla. Si p > 0 5, entonces q < 0 5 y basta intercambiar los papeles de éxito y
fracaso para que podamos utilizar la tabla.
Ejemplo:
La probabilidad de que un alumno de 2º de Bachillerato apruebe las Matemáticas es de 0’7. Si
consideramos un grupo de 8 alumnos, ¿cuál es la probabilidad de que cinco de ellos aprueben las
Matemáticas?.
Si éxito = “aprobar” y fracaso = “suspender”, entonces p = 0’7 y q = 0’3.
Tenemos, por tanto, una Bin(8;0’7).
Nos piden calcular p(X=5), que no se puede calcular mediante las tablas porque p = 0’7 y sólo
tenemos hasta p = 0’5. Por tanto si intercambiamos éxito = “suspender” y fracaso =“aprobar” entonces
p = 0’3, q = 0’7, es decir la nueva binomial es Bin(8;0’3) y nos piden que aprueben 5 de 8, es decir
que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 éxitos, p(X=3), y buscando en la tabla es
p(X=3) = 0’2541.
También, desde luego podrı́amos haber utilizado la fórmula desde el principio, utilizar la Bin(8;0’7)
y olvidarnos de tablas para hacer:
8
p(X = 5) =
· (0 7)5 · (0 3)3 = 0 254
5
3.2.2.
Probabilidades acumuladas
Es posible que nos pidan no sólo la probabilidad de que ocurran un cierto número de éxitos en
concreto, sino que ocurran como mucho “k” éxitos o preguntas similares. En el ejemplo anterior, por
ejemplo, podrı́an pedirnos:
a) ¿Cuál es la probabilidad de que aprueben como mucho 2 alumnos?.
Si éxito = aprobar y fracaso = suspender, p= 0’7 y q = 0’3, entonces nos piden p(X ≤ 2). En
este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o
ninguno, es decir:
p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0 0001 + 0 0012 + 0 01 = 0 1013
(haz las cuentas)
b) ¿Cuál es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
41
Del mismo modo:
p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) =
= 0 0467 + 0 1361 + 0 2541 + 0 2965 = 0 7334
Hemos de tener en cuenta que para la distribución binomial, en las tablas sólo se admiten valores
hasta n=10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de
utilizar la fórmula.
Ejemplo:
Los alumnos de cierta clase se encuentran en una proporción del 67 % que estudian inglés y el resto
francés.
Tomamos una muestra de 15 alumnos de la clase, calcular:
a) Probabilidad de que al menos encontremos tres alumnos de inglés.
b) Probabilidad de que los 15 alumnos estudien inglés.
c) Probabilidad de que estudien inglés entre 7 y 10 alumnos.
Si éxito = estudiar inglés, p = 0’67 y fracaso = estudiar francés, q = 1-0’67 = 0’33. Manejamos
por tanto una Bin(15;0’67)
a) p(X ≥ 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + . . . + p(X = 15).
Una opción es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la fórmula para
calcular cada una, la tarea se puede hacer bastante larga. Otra opción, más sencilla, es pasar al
complementario. El complementario de encontrar al menos 3 alumnos de inglés es encontrar como
mucho 2 alumnos de inglés, p(X ≤ 2).
Es decir,
p(X ≥ 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2))
y sólo tenemos que calcular 3 probabilidades: p(X = 0) ≈ 0 , p(X=1) = 0’000001, p(X=2) = 0’000026
(¡compruébalo!).
Por lo cual,
p(X ≥ 3) = 1 − (0 + 0 000001 + 0 000026) = 1 − 0 000027 = 0 999973
b) p(X=15) = 0’0025 (aplica la fórmula).
c)
p(7 ≤ X ≤ 10) = p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =
= 0 0549 + 0 1114 + 0 1759 + 0 2142 = 0 5564.
3.2.3.
Media y desviación tı́pica en una distribución binomial
Aunque no se demostará, en una distribución binomial Bin(n;p), el número esperado de éxitos o
media, viene dado por x̄ = n · p. (Recordemos que la media es una medidad de centralización).
La desviación tı́pica, σ , que es una medida de dispersión y mide lo alejados que están los datos
√
de la media, viene dada por σ = n · p · q.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
3.3.
42
La distribución Normal
Al estudiar aspectos tan cotidianos como:
- Caracteres morfológicos de individuos ( personas, animales, plantas) de una misma raza. como
tallas, pesos, envergaduras, etc.
- Caracteres fisiológicos, como el efecto de una misma dosis de un fármaco, o de una misma cantidad
de abono.
- Caracteres sociológicos, como el consumo de ciertos productos por individuos de un mismo grupo
humano.
- Caracteres psicológicos, como el cociente intelectual, grado de adaptación a un medio.
- Caracteres fı́sicos, como la resistencia a la rotura de ciertas piezas. . .
todos ellos tienen en común que se distribuyen “normalmente”. ¿Qué quiere decir esta expresión?.
Pués, por ejemplo, si hacemos una estadı́stica para conocer la altura de 1400 mujeres y representamos
los resultados en un diagrama de barras, obtenemos:
Figura 3.1: Distribución de estaturas de 1400 mujeres
Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento
paulatino hasta llegar a la parte central del recorrido, donde está la mayorı́a de ellos.
Definición: Diremos que una distribución de probabilidad sigue una distribución normal de media x
y desviación tı́pica σ, y lo representaremos por N (x; σ) cuando la representación gráfica de su función
de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y
que tiene 2 puntos de inflexión , situados a ambos lados de la media (x − σ y x + σ respectivamente)
y a distancia de σ ella, es decir de la forma:
1
)
2·π·σ2
Figura 3.2: Distribución normal N (x; σ). El máximo está en (x, √
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
43
Dependiendo de los valores que tomen x y σ, la gráfica de esta función puede ser más o menos
alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetrı́a,
continuidad, etc reseñadas anteriormente.
El concepto de función de densidad introducido anteriormente no se estudiará con profundidad.
Baste decir que la función de densidad determina la forma de cada distribución de probabilidad. En
el caso de la distribución normal de parámetros x y σ, dicha función viene dada por:
f (x) = √
1
2 · π · σ2
· e−
(x−x)2
2·σ 2
Propiedad:
El área encerrada bajo la curva normal N (x; σ) siempre es 1.
La demostración de este resultado no es nada sencilla e implica el uso de resultados matemáticos que
exceden el nivel de este curso.
De entre todas las curvas normales N (x; σ), la más sencilla, usada y conocida es aquella que tiene
por media 0 y por desviación tı́pica 1, N(0, 1).
Esta normal estándar se suele representar por Z.
La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura:
1
Figura 3.3: Distribución normal N (0; 1). El máximo está en (0, √2·π
)
Su función de densidad será:
x2
1
· e− 2
2·π
Puesto que el área bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente
manera:
f (x) = √
Para un valor cualquiera k, definimos la probabilidad de que la distribución Z, N(0;1) , sea menor o
igual que k como:
p(Z ≤ k)= “Área encerrada bajo la curva normal N(0,1) desde −∞ hasta k”
(es decir la parte rayada de la figura siguiente).
Figura 3.4: Área encerrada por la curva normal desde −∞ hasta k
Ahora bien, ¿cómo calcular dicha área?. Fácil: Dichas áreas o probabilidades se encuentran tabuladas.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
3.3.1.
44
Uso de las tablas de la distribución normal N(0;1)
La normal N(0;1) se encuentra tabulada, para valores a partir de 0 y hasta 3’99. Si por ejemplo
queremos calcular p(Z ≤ 2 78), hemos de realizar los pasos:
1. Buscar la parte entera y las décimas en la primera columna (en este caso 2’7).
2. Buscar las centésimas en la primera fila (en este caso 8).
3. En el punto común a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada,
en este caso 0’9973.
Por tanto p(Z ≤ 2 78) = 0 9973.
Si queremos calcular una probabilidad de un valor mayor que 3’99, basta fijarse en que las probabilidades correpondientes a valores tales como 3’62 y mayores ya valen 0’9999 (prácticamente 1). Por
eso, para estos valores mayores que 3’99, diremos que la probabilidad es aproximadamente 1. Ası́:
p(Z ≤ 5 62) ≈ 1
aunque no aparezca en la tabla.
Por otra parte, fijémonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del tipo p(Z=k), ya que siempre valen 0, al no encerrar ningún área. Por tanto, si nos pidiesen
p(Z=3’2), basta decir que p(Z=3’2)=0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por
ejemplo la binomial, que es una distribución discreta.
Ası́, al pasar al complementario, si tenemos Z ≥ k, su complementario será Z < k, pero como incluir
k no influye en la probabilidad,al calcular probabilidades podemos escribir:
p(Z ≥ k) = 1 − p(Z < k) = 1 − p(Z ≤ k)
Sólo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer
y hay que ser cuidadosos con el paso al complementario.
Ejercicio: Buscar en la tabla de la normal estándar N(0;1) las probabilidades:
b) p(Z ≤ 0 5)
c) p(Z ≤ 0 82)
d) p(Z ≤ 1 05)
a) p(Z ≤ 1 15)
f) p(Z ≤ 18 09)
3.3.2.
e) p(Z ≤ 4 27)
Cálculo de otras probabilidades
1. Si k es positivo y queremos calcular p(Z ≥ k), es decir el área rayada:
Figura 3.5: p(Z ≥ k). Basta pasar al complementario
basta pasar al complementario, es decir: p(Z ≥ k) = 1 − p(Z ≤ k) y esta última probabilidad ya
se encuentra tabulada.
Ejercicio: Calcular p(Z ≥ 0 3) y p(Z ≥ 2 07).
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
45
2. Si k es positivo y queremos calcular p(Z ≤ −k), es decir el área: por simetrı́a, p(Z ≤ −k) =
Figura 3.6: p(Z ≤ −k).Las probabilidades de valores negativos no están tabuladas
p(Z ≥ k) y ésta se calcula como en el caso anterior. Se puede observar la igualdad de áreas en
la figura:
Figura 3.7: p(Z ≤ −k) = p(Z ≥ k). La simetrı́a permite reducir este caso al anterior
Ejercicio: Calcular p(Z ≤ −0 78) y p(Z ≤ −3 2).
3. Si k es positivo y queremos calcular p(Z ≥ −k), es decir el área rayada:
Figura 3.8: p(Z ≥ −k)
entonces, por simetrı́a p(Z ≥ −k) = p(Z ≤ k):
Figura 3.9: p(Z ≥ −k) = p(Z ≤ k).La simetrı́a permite reducir este caso al que ya está tabulado
Ejercicio: Calcular p(Z ≥ −0 96) y p(Z ≥ −1 01).
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
46
4. Probabilidades comprendidas entre dos valores,p(k1 ≤ Z ≤ k2 ) ,es decir el área rayada:
Figura 3.10: p(k1 ≤ Z ≤ k2 ). Probabilidad comprendida entre dos valores
se calcula restando las áreas:
Figura 3.11: p(Z ≤ k2 ) en la primera imagen.p(Z ≤ k1 ) en la segunda. Al restar obtenemos el área
pedida.
Se quita la parte correspondiente a Z ≤ k1 ,p(Z ≤ k2 ) − p(Z ≤ k1 ).
Ejercicio: Calcular p(−0 96 ≤ Z ≤ 1 49) y p(−1 32 ≤ Z ≤ −0 57).
Ejercicio: Calcular p(Z=2), p(Z ≤ 2), p(Z ≥ 2), p(Z ≤ −2), p(Z ≥ −2), p(−2 ≤ Z ≤ 2),
p(0 81 ≤ Z ≤ 1 33).
3.3.3.
Cálculo de probabilidades en normales N(x; σ)
Si no tenemos una distribución N(0;1), sino una N (x; σ) cualquiera, ¿cómo calcular probabilidades,
si no tenemos tabla salvo para N(0;1)?. El siguiente resultado nos da la respuesta.
Propiedad:
X−x
sigue una distribución N(0,1).
σ
(El paso de la variable X −→ N (x; σ) a la Z −→ N(0;1) se denomina tipificación de la variable X).
Si X sigue una distribución N (x; σ) , entonces la variable Z =
Ejemplo:
Las estaturas de 600 soldados se distribuyen de acuerdo a una distribución normal de media 168
y desviación tı́pica 8 cm. ¿Cuántos soldados miden entre 166 y 170 cm?.
Sea X la distribución de los soldados , X es una N(168,8). Nos piden p(166 ≤ X ≤ 170).
Utilizando el resultado anterior, primero restamos x=168 en la desigualdad:
p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2)
Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar:
X − 168
2
−2
≤
≤
p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = p
8
8
8
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
Llamando a
47
X − 168
= Z, ésta ya es normal N(0,1) y se encuentra en las tablas:
8
p(166 ≤ X ≤ 170) = p(−0 25 ≤ Z ≤ 0 25) = p(Z ≤ 0 25) − p(Z ≤ −0 25) =
= (tablas) = 0 5987 − 0 4013 = 0 1974.
(pues p(Z ≤ −0 25) = p(Z ≥ 0 25) = 1 − p(Z ≤ 0 25) = 1 − 0 5987 = 0 4013).
Ejercicios: 1) En una distribución N(22,5), calcula: p(X ≤ 27),p(X ≥ 27),p(X ≥ 125), p(15 ≤
X ≤ 20), p(17 ≤ X ≤ 30).
2) Los pesos de 60 soldados siguen una distribución N(67,5). Calcula la probabilidad de que el
peso sea:
a) mayor de 80 kg.
b) 50 kg. o menos
c) menos de 60 kg.
d) 70 kg.
e) Entre 60 y 70 kg inclusive.
3.3.4.
Otro uso de las tablas
Hasta ahora nos han dado la distribución normal N(0;1) y nos pedı́an p(Z ≤ k) siendo k un cierto
número, y nos pedı́an calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N(0;1) sabemos que p(Z ≤ k) =
0 9573, ¿quién es k?.
La resolución es bien sencilla. Basta buscar 0’9573 dentro de la tabla de la distribución normal, y
lo encontramos en el cruce de la fila 1’7 con la columna 2, y por lo tanto k debe ser 1’72.
Ejercicio: Calcular k si:
a) p(Z ≤ k) = 0 8078.
b) p(Z ≥ k) = 0 0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribución normal,
pueden ocurrir dos posibilidades:
a) Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente)
de cada uno de ellos, por ejemplo: p(Z ≤ k) = 0 7982. En este caso el valor buscado será la media
entre los valores extremos.
Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores
0’7967 (que corresponde a 0’83) y 0’7996 (que corresponde a 0’84). Por tanto el valor de k será:
k=
0 83 + 0 84
= 0 835
2
b) Si el valor está entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor,
por ejemplo: p(Z ≤ k) = 0 7970. El valor más cercano es 0’9767 (que corresponde a 0’83) y como el
valor buscado está muy cerca de él, entonces directamente k=0’83.
Si la distribución no es normal N(0;1), sino N (x; σ), tendremos que tipificar previamente.
Por ejemplo, si X sigue una normal N(6;3) y p(X ≤ k) = 0 9082, calcula k.
Tipificando:
k−6
k−6
X −6
≤
= 0 9082 −→ p Z ≤
= 0 9082
p
3
3
3
Y buscando en la tabla,
k−6
= 1 33 ⇒ k − 6 = 3 99 ⇒ k = 9 99
3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
48
Ejercicios:
1. Calcular k si p(X ≤ k) = 0 6141 y X sigue una N(15,4).
2. De una variable normal N (x; σ) se sabe que p(X ≤ 7) = 0 9772 y p(X ≤ 6 5) = 0 8413. Calcular:
a)
x y σ.
b) p(5 65 ≤ X ≤ 6 25)
c) El número k tal que p(X > k) = 0 3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
3.4.
49
Relación entre la distribución binomial y la distribución normal
Es un hecho comprobado que cuando tenemos una distribución Bin(n;p), a medida que n crece, es
difı́cil hacer uso de las fórmulas y/o tablas.
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos(inclusive).
5
1
Si éxito = obtener cinco entonces p = y fracaso = no obtener cinco y q = .
6
6
1
, y nos piden p(20 ≤ X ≤ 33).
Tenemos una Bin 100;
6
Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la fórmula pues
es inviable calcular, por ejemplo,
32 68
5
100
1
·
p(X = 32) =
·
6
6
32
¿Cómo resolver el problema?. Del siguiente modo:
Teorema Central del Lı́mite:
La distribución binomial Bin(n;p) se aproxima a una curva normal de media x = n · p y desviación
√
tı́pica σ = n · p · q, cuando n tiende a ∞, es decir, cuando n se hace muy grande.
La aproximación se puede aplicar (es una buena aproximación) sólo si n es grande, en concreto n ≥ 30
y además n · p ≥ 5 y n · q ≥ 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial
que tengamos por una distribución normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable
discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El “precio” que
hay que pagar por pasar de una a otra se denomina “corrección por continuidad” y consiste en hacer
determinados ajustes para que la aproximación realizada sea lo más precisa posible.
Ası́, si nos piden p(X=k) en una distribución binomial X, y aproximamos X por una distribución normal
Y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en
una distribución continua todas estas probabilidades valen 0. La corrección por continuidad consiste
en tomar un pequeño intervalo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X=k) con X binomial, con la aproximación normal Y deberemos
calcular p(k − 0 5 ≤ Y ≤ k + 0 5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos
ejemplos:
Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y ≤ k −0 5). La
explicación de que haya que restar 0’5 y no sumarlo es que queremos que X sea menor estrictamente
que k, con lo cuál, si sumase 0’5 , el propio k aparecerı́a en la probabilidad a calcular y NO debe
aparecer.
Por contra, si debiésemos calcular p(X ≤ k), con X binomial, fijémonos que ahora k SÍ está incluido
en la probabilidad y por tanto al aproximar por la normal Y deberı́amos calcular p(Y ≤ k + 0 5).
Comprender estos dos hechos es fundamental para realizar bien la correción por continuidad al
aproximar una distribución binomial por una normal.
100
500
√
= 16 67 y σ = n · p · q =
= 3 73. De modo que, como
En el caso anterior,x = n · p =
6
36
n ≥ 30, n · p = 16 67 ≥ 5 y nq̇ = 83 33 ≥ 5, se pude aproximar la binomial por la normal, es decir:
1
≈ Y −→ N (16 67; 373)
X −→ Bin 100;
6
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL
50
Entonces:
p(20 ≤ X ≤ 33) ≈ p(20 − 0 5 ≤ Y ≤ 33 + 0 5) = p
(∗)
Y − 16 67
33 5 − 16 67
19 5 − 16 67
≤
≤
3 73
3 73
3 73
=
= p(0 89 ≤ Z ≤ 4 51) = p(Z ≤ 4 51) − p(Z ≤ 0 89) ≈ 1 − 0 8133 = 0 1867
Notemos que en el paso señalado por (*) hemos cambiado X(binomial) por Y(normal) y se ha realizado
la corrección por continuidad.
Capı́tulo 4
INFERENCIA ESTADÍSTICA
4.1.
Introducción
Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra.
La estadı́stica, ciencia o rama de las Matemáticas que se ocupa de recoger datos, analizarlos y
organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes
básicas:
a) Estadı́stica descriptiva: Básicamente se ocupa de la 1ª parte, es decir, a partir de ciertos datos,
analizarlos y organizarlos. Es aquı́ donde tiene sentido calcular la media, mediana, moda, desviación
media, desviación tı́pica, etc.
b) Estadı́stica inferencial: Se ocupa de predecir, sacar conclusiones, para una población tomando
como base una muestra (es decir , una parte) de dicha población. Como todas las predicciones, siempre
han de hacerse bajo un cierto grado de fiabilidad o confianza.
Será esta última vertiente de la estadı́stica la que estudiemos en este tema.
4.2.
Muestreos
Ya sabemos que una población es el conjunto de individuos sobre los que hacemos cierto estudio, y
que una muestra es un subconjunto de la población. Es evidente que los resultados de una determinada
encuesta tendrán un mayor grado de fiabilidad si dicha encuesta se realiza sobre la población completa.
Sin embargo, en la mayorı́a de las ocasiones esto no es posible, debido a múltiples razones:
* Imposibilidad material (Hacer una encuesta a los casi 41 millones de españoles es imposible,hacer
un estudio sobre la fecha de caducidad de un producto. Si lo hacemos con todos los productos ¿qué vendemos luego?)
* Imposibilidad temporal (Hacer un estudio sobre la duración de una bombilla. ¿Cuánto debemos
esperar para saberlo?).
Por tanto, es habitual que tengamos que manejarnos con muestras, de modo que es importante
saber elegir bien una muestra de la población, una muestra que represente bien a dicha pbolación.
Hay muchas maneras de elegir una muestra de una población.
Antes de pasar a analizar dichas formas de extracción de muestras, lo que si hemos de dejar claro
es que todas las muestras han de cumplir varias condiciones indispensables.
Es evidente que para que el estudio a realizar sea fiable, hay que cuidar mucho la elección de
la muestra, para que represente en la medida de lo posible a la población de la que se extrae. Si la
muestra está mal elegida, diremos que no es representativa.
En este caso, se pueden producir errores imprevistos e incontrolados. Dichos errores se denominan
sesgos y diremos que la muestra está sesgada.
Una de las condiciones para que una muestra sea representativa es que el muestreo (o sistema
para elegir una muestra de una población) que se haga sea aleatorio, es decir, todas las personas de
56
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
57
la población tengan las mismas posibilidades de ser elegidas, mientras que si la elección de la muestra
es subjetiva, es probable que resulte sesgada.
Las distintas maneras de elegir una muestra de una población se denominan muestreos. Básicamente
hay dos tipos de muestreos:
1. Muestreo no probabilı́stico: El investigador no elige la muestra al azar, sino mediante determinados criterios subjetivos.
2. Muestreo probabilı́stico: Cuando la muestra se elige al azar. En este caso podemos distinguir
varios tipos:
a)
Muestreo aleatorio simple: Aquel en el que cada individuo de la población tiene las mismas
posibilidades de salir en la muestra.
b) Muestreo sistemático: En el que se elige un individuo al azar y a partir de él, a intervalos
constantes, se eligen los demás hasta completar la muestra.
c) Muestreo estratificado: En este muestreo se divide la población en clases o estratos y se
escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número
de componentes de cada estrato.
d ) Muestreo por conglomerados:Si no disponemos de la relación de los elementos de la población, o de los posibles estratos, no podemos aplicar los muestreos anteriores.
Aquı́ entra el llamado muestreo por conglomerados, donde en lugar de elegir individuos
directamente, se eligen unidades más amplias donde se clasifican los elementos de la población, llamados conglomerados. En cada etapa del muestreo en lugar de seleccionar elementos
al azar seleccionamos conglomerados.
Los conglomerados deben ser tan heterogéneos como la población a estudiar, para que la
represente bien. Luego se elegirı́an algunos de los conglomerados al azar, y dentro de éstos,
analizar todos sus elementos o tomar una muestra aleatoria simple.
No debemos confundir estrato y conglomerado. Un estrato es homogéneo (sus elementos
tienen las mismas caracterı́sticas), mientras que un conglomeardo es heterogéneo (debe
representar bien a la población).
Veamos la diferencia de estos muestreos mediante un ejemplo:
Imaginemos que hemos de recoger una muestra de 20 alumnos de entre los de un instituto de 600.
1
. Lo de-Muestreo aleatorio simple: Elegirı́amos un alumno al azar (probabilidad de elegirlo 600
1
volvemos a la población y se elige otro (probabilidad de elegirlo 600 ), y ası́ hasta 20. Notemos que
1
, y ya no
si no devolviésemos al alumno, entonces, la probabilidad de escoger al 2º alumno serı́a 599
todos tendrı́an la misma probabilidad de ser elegidos. El problema es que entonces permitimos que se
puedan repetir individuos.
-Muestreo sistemático: Como hemos de elegir 20 alumnos de 600, es decir, 1 de cada 30, se procede
ası́: Se ordenan los alumnos y se numeran, se elige uno al azar, por ejemplo el alumno 27, y luego los
demás se eligen a partir de este a intervalos de 30 alumnos. Escogerı́amos por tanto a los alumnos:
27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597
y el alumno 627 ya es otra vez el 27.
-Muestreo estratificado: Si queremos que la muestra sea representativa, lo mejor será conocer
cuántos alumnos de cada curso hay, es decir, si hay 200 alumnos de 3º ESO, 150 de 4º ESO, 150 de
1º Bachillerato y 100 de 2º Bachillerato, procederı́amos:
Como de 600 en total hemos de elegir a 20, de 200 de 3º de ESO hemos de elegir x:
x
4000
20
=
−→ x =
= 6 6 ≈ 7 alumnos de 3º
600
200
600
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
58
(Utilizando la regla de tres)
De igual manera podemos calcular los alumnos correspondientes a los demás cursos:
y
3000
20
=
−→ y =
= 5 alumnos de 4º
600
150
600
z
3000
20
=
−→ z =
= 5 alumnos de 1º
600
150
600
t
2000
20
=
−→ t =
= 3 3 alumnos de 2º
600
100
600
De modo que en nuestra muestra de 20, 7 alumnos son de 3º, 5 de 4º, 5 de 1º y 3 de 2º. Para la
elección de cada alumno dentro de cada curso, utilizamos el muestreo aleatorio simple.
-Muestreo por conglomerados: Para ver este muestreo, hemos de cambiar el ejemplo.
Supongamos que queremos extraer una muestra aleatoria de los estudiantes universitarios del paı́s.
Necesitariamos una lista con todos ellos para poder realizar algún muestreo del tipo de los 3 anteriores,
lo cuál es muy difı́cil de conseguir. Sin embargo, los estudiantes estan clasificados por Universidades,
Facultades y Clases.
Podemos seleccionar en una primera etapa algunas Universidades, después algunas facultades al
azar, dentro de las facultades algunas clases y dentro de las clases, algunos estudiantes por muestreo
aleatorio simple. Los conglomerados en cada etapa serı́an las diferentes Universidades, las diferentes
facultades y los diferentes clases.
Como vemos los conglomerados son unidades amplias y heterogéneas.
Ejercicio:
En una población de 1500 jóvenes,7500 adultos y 1000 ancianos, se hace una encuesta a 200 personas
para conocer sus actividades de ocio preferidas. Si se utiliza un muestreo estratificado, ¿qué tamaño
muestral corresponde a cada estrato?.
4.3.
Estimación por puntos
Como el objetivo principal de la estadı́stica inferencial es el estudio de la población y realizar
predicciones a cerca de ella pero a partir de una muestra de ella , no de la población entera, en
principio, tendremos que estimar los ı́ndices de la población a partir de los ı́ndices correspondientes
para la muestra.
En una primera aproximación, parece lógico pensar que si queremos determinar la media de una
cierta población, si hemos cogido una muestra representativa de dicha población, la media de la muestra
(que es fácilmente calculable porque tenemos los datos) será muy parecida a la de la población y por
tanto sirva para estimarla.
Distinguiremos, por tanto, entre:
1. Parámetros poblacionales: Que son los ı́ndices centrales y de dispersión que definen a una población.
Representaremos la media poblacional µ y la desviación tı́pica poblacional σ.
En el caso de proporciones, la proporción de población que tiene una determinada caracterı́stica
la denotaremos por p y la proporción que no la cumple por q = 1 − p. (Como en la Distribución
binomial)
2. Estadı́sticos poblacionales: Son los ı́ndices centrales y de dis persión que definen a una muestra.
Representaremos la media muestral por x y la desviación tı́pica muestral por s.
En el caso de proporciones, la proporción de muestra que tiene una determinada caracterı́stica
la denotaremos por p̂ y la proporción que no la cumple por q̂ = 1 − p̂.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
59
¿Cuál es el problema de la estimación entonces?. Como vamos a disponer de una muestra, lo que
podemos calcular es x y s (o bien p̂ y q̂), y a partir de estos intentar estimar quienes tienen que ser µ
y σ (o bien p y q), los reales para la población.
En la estimación por puntos, el conocimiento de un estadı́stico muestral nos permitirá decidir cuál
es el correspondiente parámetro de la pobla ción. Para ello hemos de conocer cuál es la relación entre
un estadı́stico y el corresp ondiente parámetro.
4.4.
Distribución muestral de medias
Si tenemos una población de parámetros desconocidos µ y σ, y tomamos una muestra, podemos
calcular la media muestral,x1, que tendrá cierta relación con µ.
Podrı́amos tomar otra muestra, de igual tamaño, y calcular de nuevo su media muestral x2 , que
también estará relacionada con µ.
Ası́ sucesivamente, considerando varias muestras y haciendo las medias muestrales respectivas,
tenemos una serie de medias, relacionadas de alguna manera con µ ¿cómo?. De la siguiente forma:
Propiedad: Si la población sigue una distribución normal N (µ, σ), donde µ y σ son desconocidos, si
elegimos todas las muestras de cierto tamaño (n) , de forma que sean representativas, entonces:
a) La media de las medias muestrales de todas las muestras posibles, es igual a la media poblacional,
es decir:
x1 + x2 + . . . + xk
=µ
x=
k
b) La desviación tı́pica de las medias muestrales posibles es:
σ
sx = √
n
donde σ es la desviación tı́pica poblacional y n es el tamaño de las muestras.
Conclusión: Las medias de las muestras de tamaño n extraı́das de una población de parámetros µ y
σ , siguen una distribución:
σ
X −→ N µ, √
n
siempre que dichas muestras tengan un tamaño n ≥ 30.
Notas importantes:
a) Este resultado es consecuencia del Teorema Central del lı́mite.
b) Si la población es normal, el resultado se cumple para muestras de CUALQUIER tamaño
(incluso menor que 30).
c) Si σ es desconocida, el mismo resultado sigue siendo cierto sustituyendo en la fórmula σ por s.
Ejemplo: La altura de los estudiantes de una población se distribuye según una normal de media 167
y desviación tı́pica 3’2.
a) Calcula la probabilidad de que un estudiante mida menos de 165 cm.
b) Se toma una muestra de 10 estudiantes. Calcula la probabilidad de que la media muestral sea
menor que 165 cm.
En el apartado a) , manejamos la variable
X −→ N (165; 32)
siendo X= “altura de un estudiante”.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
60
La probabilidad pedida será:
165 − 167
X − 167
<
p(X < 165) = p
32
3 2
= p(Z < −0 63) = 0 2676
En el apartado b), la variable que manejamos ya no es X, sino que tenemos una muestra de 10
estudiantes. Como la población inicial es normal, podemos aplicar el resultado anterior aunque la
muestra sea de tamaño menor que 30. Ası́, la variable a estudiar es
X=”media de las alturas de 10 estudiantes”, que según lo dicho, sigue una distribución
3 2
X −→ N 165; √
= N (165; 1012)
10
Nos piden:
165 − 167
X − 167
p(X < 165) = p
<
1 012
1 012
= p(Z < −1 97) = 0 0244
Ejemplo: Los pesos de los tornillos que fabrica cierta máquina se distribuyen según una N (14232; 85)
(medidas en gr.). Se toman muestras de 25 tornillos. Calcular:
a) Distribución que siguen las medias de esas muestras.
b) Probabilidad de que una muestra elegida al azar de 25 tornillos tenga un peso medio superior
a 144’6 gr.
c) La misma pregunta si la muestra es de 100 tornillos.
a) Como las muestras son de tamaño n=25 y la población es normal N (14232; 85), las medias muestrales siguen una distribución:
8 5
= N (14232; 17)
X −→ N 142 32; √
25
b) Nos piden:
144 6 − 144 32
= p(Z ≥ 1 34) = 1 − p(Z ≤ 1 34) = 0 0901
p(X ≥ 144 6) = p Z ≥
1 7
c) Si las muestras son de tamaño n=100, las medias muestrales siguen una distribución:
8 5
= N (14232; 085)
X −→ N 142 32; √
100
y por tanto:
144 6 − 144 32
= p(Z ≥ 2 68) = 1 − p(Z ≤ 2 68) = 0 0037
p(X ≥ 144 6) = p Z ≥
0 85
Ejercicio: Una máquina ha fabricado piezas de precisión con un peso medio de 150 gr. y una desviación
tı́pica de 20 gr. Calcular la probabilidad de que una muestra de 80 piezas tenga un peso medio de más
de 155 gr. (Solución: 0’0129)
4.5.
Distribución muestral de proporciones
Nos planteamos ahora determinar qué proporción de una población posee un cierto atributo, por
ejemplo si es fumador o no fumador, si tiene ordenador o no, si tiene alergia o no,etc... El estudio de este
tipo de proporciones es equiparable al de una distribución binomial (donde sólo hay dos posibilidades).
Si la proporción éxito es p y la de fracaso q, y se toma una muestra de la población de tamaño n, al
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
61
igual que en el caso anterior, para cada muestra tendremos una proporción muestral que denotaremos
por p̂ y una desviación tı́pica muestral que denotaremos por sp̂ .
Entonces,utilizando
razonamientos similares a los del apartado anterior, se verifica que p̂ = p, y
p·q
por tanto:
sp̂ =
n
Conclusión: Las proporciones muestrales de tamaño n ≥ 30, extraı́das de una población en la que la
probabilidad de éxito es p, se ajustan a una normal
p·q
N p;
n
Ejemplo: Una fábrica de pasteles fabrica, en su producción habitual, un 3 % de pasteles defectuosos.
Un cliente recibe un pedido de 500 pasteles de la fábrica.
a) Probabilidad de que encuentre más del 4 % de pasteles defectuosos.
b) Probabilidad de que encuentre menos de un 1 % de pasteles defectuosos.
3
tanto,
a) En este caso éxito= “pastel defectuoso”, y la proporción poblacional de éxito es de p =
100
97
. La muestra que recibe el cliente es de tamaño n=500.
q=
100
Por tanto, las proporciones muestrales siguen una distribución:


3
97
·
3
; 100 100  = N (003; 0076)
p̂ −→ N 
100
500
puesto que las muestras tienen tamaño mayor que 30.
La probabilidad pedida es que la proporción de pasteles defectuosos en la muestra sea mayor del
4 %, es decir:
0 04 − 0 03
= p(Z ≥ 1 32) = 0 0934
p(p̂ ≥ 0 04) = p Z ≥
0 0076
b) En este caso es
0 01 − 0 03
= p(Z ≤ −2 63) = 0 0043
p(p̂ ≤ 0 01) = p Z ≤
0 0076
Ejercicios:
1. De una población de 120 alumnos , hay 48 que tienen 2 o más hermanos. Si de dicha población
se toman muestras de tamaño 40.
a) ¿Qué distribución siguen las proporciones muestrales?.
b) ¿Cuál es la probabilidad de que se encuentre en dicha muestra una proporción de más del
55 % de alumnos con 2 o más hermanos?.
2. Las notas de cierto examen se distribuyen según una normal de media µ=5’3 y desviación tı́pica
σ=2’4. Hallar la probabilidad de que un estudiante tomado al azar tenga una nota:
a) Superior a 6’5
b) Inferior a 5’2
c) Comprendida entre 5 y 6’5
Halla las mismas probabilidades para de la media de las notas de 16 estudiantes elegidos al azar.
3. En un saco mezclamos judı́as blancas y pintas en la relación de 14 blancas por cada pinta.
Extraemos un puñado de 100 judı́as. Calcula la probabilidad de que la proporción de judı́as
pintas esté comprendida entre 0’05 y 0’1.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
62
4. El cociente intelectual, CI, de unos universitarios se distribuye normalmente con media 100 y
desviación tı́pica 11.
a) Se elige al azar una persona. Hallar la probabilidad de que su CI esté entre 100 y 103.
b) Se elige al azar una muestra de 25 personas. Encontrar la probabilidad de que la media de
sus cocientes intelectuales esté entre 100 y 103.
4.6.
Intervalos de probabilidad
En una variable normal cualquiera N (µ, σ), se verifica que:
1. En el intervalo (µ − σ, µ + σ) está el 68’26 % de la población.
2. En el intervalo (µ − 2 · σ, µ + 2 · σ) está el 95’44 % de la población.
3. En el intervalo (µ − 3 · σ, µ + 3 · σ) está el 99’74 % de la población.
Figura 4.1: Porcentajes de población en los diferentes intervalos simétricos de una normal N (µ, σ).
Es evidente que a medida que el intervalo se amplı́a, hay mayor porcentaje de la población en él.
En general, dado un porcentaje del N %, siempre es posible encontrar un intervalo simétrico respecto de la media de forma que dicho intervalo contenga a dicho porcentaje de población.
Más explicitamente, se denomina intervalo de probabilidad a aquel intervalo para el cuál se sabe que
hay una seguridad del N % de que los parámetros muestrales (x o p̂) se encuentren en dicho intervalo.
La seguridad N viene fijada previamente.
Si queremos que el N % de la población esté en el intervalo, denominaremos nivel de confianza al
número:
N
1−α =
100
y unido a este, se encuentra el llamado nivel de significación, que viene dado por α. Este nivel en
general vendrá explicitado en las condiciones del problema, si bien los valores más comunes suelen ser
del 90 %,95 % y 99 %.
Ejemplo: Si queremos que el 88 % de la población esté en el intervalo, el nivel de confianza será 1−α =
88
= 0 88, mientras que el nivel de significación será α = 1 − 0 88 = 0 12.
100
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
4.6.1.
63
Intervalo de probabilidad para la media muestral x
Si la población sigue una distribución de parámetros µ y σ, y las muestras son de tamaño n ≥ 30
(o bien la población ya es normal y las muestras son de cualquier tamaño), sabemos que la media
muestral x sigue una distribución:
σ
X −→ N µ; √
n
Se trata de encontrar el valor de k como en la figura:
Figura 4.2: Buscamos el valor de k que deje en el intervalo (µ − k, µ + k) al (1 − α) · 100 % de la
población.
Razonemos ahora sobre la normal Z −→ N(0;1) que es la que se encuentra tabulada Si queremos
que el intervalo buscado contenga a la media muestral con una confianza de 1 − α, entonces fuera del
intervalo el área tiene que ser de α, y como la curva es simétrica, en cada una de las ramas fuera de
α
la región rayada, tenemos un área de . Llamaremos z α2 al punto situado en el eje x que separa la
2
región rayada de la otra.
Figura 4.3: Buscamos el valor de z α2 que deje en el intervalo (−z α2 , z α2 ) al (1 − α) de la población en
la N(0;1)
Es evidente que se cumple:
α
p Z ≥ z α2 =
2
o dicho de otro modo:
α
p Z ≤ z α2 = 1 −
2
probabilidad que se busca dentro de la tabla como hemos visto anteriormente en el tema de la normal.
Ahora
este valor sólo sirve para la normal estándar N(0;1). Nosotros manejamos la normal
bien,
σ
y para pasar a la normal estándar deberemos tipificar:
N µ; √
n
k−µ
√σ
n
= z α2
de donde despejando, encontramos k, el valor buscado:
σ
k = µ + √ · z α2
n
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
64
Ası́, dado el nivel de significación α o el de confianza 1 − α, podemos determinar el intervalo de
probabilidad para la media muestral, que será:
σ
σ
µ − z α2 · √ , µ + z α2 · √
n
n
Ejemplo Determinar, en la distribución N(0;1), el valor que concentra el 75 % de la población en un
intervalo simétrico respecto a la media
α
Ahora 1 − α = 0 75, es decir α = 0 25 y por tanto = 0 125, es decir, buscamos el valor z0 125 , de
2
modo que, como en la figura, dejemos el 75 % de la población en el centro.
Figura 4.4: Buscamos el valor de z0 125 que deje en el intervalo (−z0 125 , z0 125 ) al 0’75 de la población
en la N(0;1)
Se cumple que p(Z ≥ z0 125 ) = 0 125, es decir p(Z ≤ z0 125 ) = 0 875,y si buscamos en la tabla,
resulta que el valor es:
z0 125 = 1 15
Ejercicio: Encuentra el valor correspondiente que concentre el 88 % de la población.
Ejemplo:Calcular el intervalo de probabilidad con un nivel de confianza del 95 % para la media de
una muestra de 100 recién nacidos, sabiendo que la población de recién nacidos sigue una normal de
media µ=3100 gr. y desviación tipica σ=150 gr.
Como el nivel de confianza es 0’95, entonces 1 − α = 0 95 y por tanto α = 0 05 y en cada rama
α
fuera de la región queda = 0 025.
2
Buscamos entonces z0 025 , que es el valor que deja a su derecha un área de 0’025, es decir:
p(Z ≥ z0 025 ) = 0 025 =⇒ p(Z ≤ z0 025 ) = 0 975
Buscando este valor dentro de la tabla se obtiene que el valor de z0 025 = 1 96, y por tanto el intervalo
para la media muestral es:
150
150
, 3100 + 1 96 · √
= (3100 − 1 96 · 15, 3100 + 1 96 · 15) = (3070 6, 31294)
3100 − 1 96 · √
100
100
Esto significa que el 95 % de las muestras de tamaño 100 tendrá su media comprendida entre estos 2
valores: (3070’6,3129’4)
Ejercicio: Calcular el mismo intervalo con una confianza del 99 %.
Ejercicio: Las notas de una población de 150 alumnos siguen una distribución de media 5’5 y
varianza 4’1616. Extaremos muestras de tamaño 36. Calcula el intervalo de probabilidad para un nivel
de confianza del: a)75 % b) 86’64 %, e interpreta los resultados.
(NOTA: Recordemos que la varianza y la desviación tı́pica de una distribución están relacionadas
porque la varianza es el cuadrado de la desviación tı́pica y se representa por σ 2 ).
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
4.6.2.
65
Intervalo de probabilidad para la proporción muestral p̂
Razonando de igual manera se puede llegar a que para el nivel de significación α el intervalo para
la proporción muestral p̂ es
p·q
p·q
, p + z α2 ·
p − z α2 ·
n
n
donde p y q son las proporciones poblacionales y n ≥ 30.
Ejercicio: Sabiendo que la proporción de alumnos con vı́deo de una población de 120 alumnos es de
p=0’7, halla el intervalo de probabilidad para la proporción de:
a) las muestras de tamaño 30 con una confianza del 75 %.
b) las muestras de tamaño 49 con una confianza del 90 %.
c) las muestras de tamaño 49 con una confianza del 99 %.
4.7.
Estimación por intervalos
La estimación anterior, la puntual, se utiliza poco, pues no tenemos datos suficientes que nos
indiquen el grado de fiabilidad del dato muestral que hemos tomado. Lo que tiene más sentido plantearse es cuál es la probabilidad de que la media o proporción poblacional pertenezcan a un intervalo
determinado.
4.7.1.
Estimación de la media de una población µ
La media µ de una población es desconocida y deseamos conocerla. Para ello, basándonos en los
intervalos de probabilidad, sabemos que si la población tiene parámetros µ y σ, la media muestral x
sigue una distribución:
σ
X −→ N µ; √
n
, siendo n el tamaño de la muestra, y sabemos que el intervalo de probabilidad a nivel de confianza
1 − α para x es:
σ
σ
µ − z α2 · √ , µ + z α2 · √
n
n
es decir, que:
σ
σ
µ − z α2 · √ ≤ x ≤ µ + z α2 · √
n
n
De la primera desigualdad se sigue que:
σ
σ
µ − z α2 · √ ≤ x =⇒ µ ≤ x + z α2 · √
n
n
Y de la segunda:
Luego se deduce que:
σ
σ
x ≤ µ + z α2 · √ =⇒ µ ≥ x − z α2 · √
n
n
σ
σ
x − z α2 · √ ≤ µ ≤ x + z α2 · √
n
n
Es decir, que el intervalo de confianza con nivel de confianza 1 − α para la media poblacional µ
desconocida es:
σ
σ
α
α
x − z2 · √ ,x + z2 · √
n
n
NOTA:
a) Hay que añadir que para aplicar este resultado, o bien las muestras tienen tamaño n ≥ 30, o
bien la población sigue una distribución normal.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
66
b) Si la desviación tı́pica de la población σ, es desconocida, se utilizará, la desviación tı́pica muestral
s en su lugar,y el intervalo serı́a:
s
s
x − z α2 · √ , x + z α2 · √
n
n
σ
Al valor √ se le denomina error tı́pico o estándar.
n
Ejemplo: Para estimar la media de los resultados que obtendrı́an al resolver un cierto test los alumnos
de 4º de E.S.O. de la Comunidad de Castilla-León, se les pasa el test a 400 alumnos escogidos al azar,
con los resultados de la tabla:
Puntuación
1
2
3
4
5
Número de alumnos
24
80
132
101
63
A partir de ellos, estima con un nivel de confianza del 95 % el valor de la media poblacional.
Aprovechando repasaremos el cálculo de algunos parámetros estadı́sticos.
Como sólo disponemos de la muestra, no conocemos la media ni la desviación tı́pica poblacional,
hemos de calcular la media y la desviación tı́pica muestral.
Para ello, calculamos la tabla siguiente:
X
1
2
3
4
5
Total
Frec.absoluta fi
24
80
132
101
63
400
Resulta:
x=
Varianza=s2 =
X · fi
24
160
396
404
315
1299
X2
1
4
9
16
25
X 2 · fi
24
320
1188
1616
1575
4723
1299
= 3 25
400
4723
− (3 25)2 = 11 81 − 10 56 = 1 25
400
√
√
s = s2 = 1 25 = 1 12
Ya tenemos los parámetros muestrales. Hemos de determinar el intervalo de confianza para µ. Como
α
1 − α= 0’95, resulta que α = 0 05 y queda = 0 025.
2
Se obtiene que el valor es z0 025 = 1 96, por tanto el intervalo de confianza para µ, al 95 % es:
1 12 1 12
, 3 25 + 1 96 · √
= (3 25 − 0 11, 325 + 0 11) = (3 14, 336)
3 25 − 1 96 · √
400
400
Por tanto tenemos una confianza del 95 % de que la nota media de la población esté comprendida
entre 3’14 y 3’36.
Ejercicio: De una variable estadı́stica conocemos la desviación tı́pica, 8, pero desconocemos la media.
Para estimarla, extraemos una muestra de tamaño 60 cuya media es 37. Estimar la media poblacional
con una confianza del 99 %.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
67
Error máximo admisible:
Hemos visto que el intervalo de confianza para la media poblacional µ es:
σ
σ
x − z α2 · √ , x + z α2 · √
n
n
Se cumple entonces que la diferencia, en valor absoluto, entre las medias poblacional y muestral es:
σ
|µ − x| < z α2 · √
n
Al valor
σ
E = z α2 · √
n
se le llama error máximo admisible. Dicho error tiene las siguientes propiedades:
a) El error es manor cuanto mayor sea el tamaño de la muestra (n), porque dividimos por un
número cada vez mayor.
b) El error es mayor al aumentar el nivel de confianza, puesto que el valor z α2 aumenta, como se
observa en la tabla:
Confianza=1 − α
0’9
0’95
0’99
z α2
1’645
1’96
2’575
Para reducir el error, por tanto, no hay que aumentarla confianza, sino el tamaño de la muestra elegida.
Si conocemos el error y el nivel de confianza, podemos calcular el tamaño de la muestra , usando
la fórmula del error.
Ejercicio: Al medir un tiempo de reacción, un psicólogo sabe que la desviación tı́pica del mismo es
0’5 segundos. ¿Cuál es el número de medidas que deberá realizar para que con una confianza del 99 %,
el error de estimación no exceda de 0’1 segundos?.
4.7.2.
Estimación de una proporción
Si para cierta población se desconoce la proporción p de individuos que poseen cierta caracterı́stica,
y deseamos dar un intervalo de confianza para el valor de p, como el intervalo de probabilidad para la
proporción muestral,p̂ ,para el nivel de confianza 1 − α en una muestra de tamaño n es:
p·q
p·q
α
α
,p+z2 ·
p − z2 ·
n
n
Razonando igual que en el caso anterior, concluimos que:
El intervalo de confianza para p a un nivel de confianza de 1 − α es:
p·q
p·q
, p̂ + z α2 ·
p̂ − z α2 ·
n
n
Aunque como habitualmente no se conoce p en realidad se usa:
p̂ · q̂
p̂ · q̂
, p̂ + z α2 ·
p̂ − z α2 ·
n
n
NOTA: a) Es necesario que n ≥ 30 para poder aplicar esta fórmula.
b) Habitualmente en las encuestas, se suele utilizar, en lugar de la última fórmula, el valor de
p=q=0’5, que es la situación más desfavorable.
CAPÍTULO 4. INFERENCIA ESTADÍSTICA
68
Ejercicio: Determina el intervalo de confianza, con una significación del 0’05 para la proporción
poblacional de fumadores entre los jóvenes menores de 21 años, a partir de una muestra de tamaño
900, cuando no se conocen valores de p anteriores. Considera los dos casos anteriores (usando p̂ y
p=q=0’5). La proporción de fumadores en la encuesta ha sido de p̂ = 0 3.
El error máximo admisible en este caso es:
E=z ·
α
2
o en caso de no conocer p:
p·q
n
p̂ · q̂
n
Ejercicio: Para 96 familias españolas elegidas al azar se ha determinado que la TV permanece encendida en la casa una media de 217 minutos diarios, la desviación tı́pica de la muestra fue de 40
minutos.
a) Para una fiabilidad del 95 % ¿qué error se asume cuando se da por bueno ese dato para el total
de las familias españolas?.
b) ¿Qué tamaño muestral serı́a necesario para reducir ese error a la mitad?.
E = z α2 ·
NOTA: Diferencia entre intervalos de probabilidad y de confianza
En un intervalo de probabilidad lo que conocemos es la media y desviación tı́pica poblacionales,
y damos el intervalo donde se encontrará (para un cierto nivel de confianza) la media muestral o la
proporción muestral.
Sin embargo, en un intervalo de confianza entramos ya en el terreno de la estimación, es decir
NO conocemos la media poblacional (y en ocasiones tampoco la desviación tı́pica poblacional) ni la
proporción poblacional , sino que sólo conocemos, o podemos calcular, la media muestral o la proporción
muestral, y de lo que se trata es de dar un intervalo en el que se encuentre la media poblacional (o la
proporción poblacional).
Capı́tulo 5
TEST DE HIPÓTESIS
5.1.
Introducción
En este tema trataremos el importante aspecto de la toma de decisiones, referida a decidir si un
valor obtenido a partir de la muestra es probable que pertenezca a la población.
En general, la media (o proporción) en una muestra suele ser distinta a la media de la población,
de la cuál se extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral y
poblacional sea pequeña y debida al azar, pero podrı́a suceder que dicha diferencia no esté justificada
por el azar y se deba a un cambio en la población, y debamos modificar los datos que conocemos
previamente.
Ejemplos:
a) Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su
desviación tı́pica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172
cm. ¿Puede afirmarse que esa diferencia de 2 cm es debida al azar o realmente la estatura media ha
aumentado?.
b) Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra.
Pasado el tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han
descendido hasta el 49 %.¿Ha cambiado realmente la opinión pública o tal resultado es debido al
azar?.
c) El porcentaje de aprobados en las PAU en un determinado distritouniversitario ha sido del 82 %.
En una ciudad de ese distrito, el porcentaje de aprobados fue del 86 %. ¿Puede afirmarse con un nivel
de confianza del 90 % que los resultados en esa ciudad son superiores a la media?.
Los métodos de decisión estadı́stica están ligados a los de estimación de parámetros mediante los
intervalos de confianza, aunque también aparecerán otros nuevos conceptos.
5.2.
Hipótesis estadı́sticas
Trataremos de utilizar los datos obtenidos en una muestra para tomar decisiones sobre la población.
Para ello, debemos realizar ciertos supuestos o conjeturas sobre las poblaciones. Estos supuestos, que
pueden ser o no ciertos,se llaman hipótesis estadı́sticas.
Podemos, entonces, definir el test de hipótesis o contraste de hipótesis como el procedimiento
estadı́stico mediante el cuál se investiga la verdad o falsedad de una hipótesis acerca de una población
o poblaciones.
Dichas hipótesis se formularán sobre la media poblacional µ o la proporción poblacional p.
Llamaremos hipótesis nula, y se representa por H0 , a la hipótesis que se formula y por tanto se quiere
contrastar o rechazar, e hipótesis alternativa, y se representa por H1 , a cualquier otra hipótesis que
sea diferente de la formulada, y que sea contraria a H0 , de forma que la aceptación de la hipótesis nula
H0 implica el rechazo de la alternativa H1 y viceversa, el rechazo de H0 implica la aceptación de H1 .
72
CAPÍTULO 5. TEST DE HIPÓTESIS
73
En un problema de contraste de hipótesis, pues, siempre tiene que formularse una hipótesis nula H0 ,
y ha de ir acompañada de una alternativa, H0 que es la que aspira a desplazar a la nula.
Ejemplo: Un investigador afirma que la temperatura del cuerpo humano en un adulto sano se distribuye según una normal de media µ = 37º C y desviación tı́pica σ = 0 9º C. Formular la hipótesis
nula y la hipótesis alternativa
A la vista de los datos, el investigador afirma que la temperatura media del cuerpo humano es 37º,
es decir la hipótesis o conjetura que formula es:
H0 = 37
(hipótesis nula)
Como hipótesis alternativa, hemos de tomar aquella contraria a esta, que la media sea distinta de 37º
C, es decir:
H1 = 37 (hipótesis alternativa)
Si la hipótesis nula fuese del tipo µ ≥ k la hipótesis alternativas serı́a:µ < k.
5.3.
Errores
Hay ocasiones en que la hipótesis nula, H0 , es cierta, pero a la vista de la muestra tengamos que
rechazarla. En tal caso, estamos cometiendo un error.
El error que consiste en rechazar la hipótesis nula cuando ésta es verdadera, se denomina error de
tipo I.
Otro tipo de error puede ocurrir cuando, siendo H0 falsa, las evidencias de la muestra, sin embargo,
nos lleven a aceptarla.
Este error, cometido al aceptar cuando ésta es falsa, se denomina error de tipo II. Resumiendo:
Situación
Mantener H0
H0 verdadera
Decisión correcta
Probabilidad=1 − α
H1 verdadera (H0 falsa)
Decisión incorrecta:
ERROR DE TIPO II
Probabilidad=β
Decisión incorrecta:
ERROR DE TIPO I
Probabilidad=α
Decisión correcta
Probabilidad=1 − β
Decisión
Rechazar H0
donde α es el nivel de significación y 1 − α es el nivel de confianza.
Con esta notación y utilizando probabilidades condicionadas:
α = p (Rechazar H0 /H0 es cierta) = p(Error de tipo I)
y
α = p (Aceptar H0 /H0 es cierta)
Por otra parte:
β = p (Aceptar H0 /H0 es falsa) = p(Error de tipo II)
y
1 − β = p (Rechazar H0 /H0 es falsa)
A la probabilidad 1 − β se le denomina potencia del contraste.
CAPÍTULO 5. TEST DE HIPÓTESIS
5.4.
74
Región crı́tica y región de aceptación
Sabemos ya formular la hipótesis nula y la hipótesis alternativa. Lo que necesitamos ahora es
un criterio para saber si debemos aceptar una u otra, es decir, ¿con cuál de las dos hipótesis nos
quedamos?.
Al tener ya formulada la hipótesis nula, es necesario que las evidencias sean muy fuertes para
rechazarla; es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es significativo,
y no cambiamos , pero puede que los cambios sean debidos a otras causas. En este último caso es cuando
el cambio es significativo y rechazaremos.
Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo dentro del cuál es normal
que haya cambios, es decir, una región tal que si el parámetro se mantiene en dicho intervalo, nos
seguimos quedando con H0 , pues esas pequeñas variaciones son debidas al azar. Ese intervalo o región
se denomina región de aceptación, y será mayor o menor dependiendo del nivel de confianza que
precisemos, 1 − α.
La región que quede fuera de la región de aceptación indica que en este caso los cambios no se
pueden atribuir al azar, y por tanto hemos de rechazar H0 y aceptar H1 . Tal región se llama región
crı́tica o de rechazo.
Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la
región de aceptación y la región de rechazo.
1. Contraste bilateral (o de dos colas): En este caso la región de rechazo o región crı́tica
está formada por dos conjuntos de puntos disjuntos. Dicho caso se presenta cuando la hipótesis
nula es del tipo H0 : µ = k (o bien H0 : p = k) y la hipótesis alternativa, por tanto, es del tipo
H1 : µ = k (o bien H1 : p = k).
La región crı́tica para un cierto nivel α serı́a, en la N(0;1):
Figura 5.1: El intervalo (−z α2 , z α2 ) es la Región de Aceptación. La región no sombreada es la Región
crı́tica, formada por dos partes o colas.
Fijémonos en que el nivel de significación α se concentra en dos partes (o colas) simétricas
respecto de la media.
La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad
para x o p̂, es decir:
σ
σ
µ − z α2 · √ , µ + z α2 · √
n
n
o bien:
p·q
p·q
, p + z α2 ·
p − z α2 ·
n
n
Las correspondientes regiones crı́ticas serán:
σ
σ
∪ µ + z α2 · √ , ∞
−∞, µ − z α2 · √
n
n
o bien
p·q
p·q
∪ p + z α2 ·
,∞
−∞, p − z α2 ·
n
n
CAPÍTULO 5. TEST DE HIPÓTESIS
75
2. Contraste unilateral (o de una cola): En este caso la región crı́tica está formada por un
sólo conjunto de puntos.
Como se observa en las figuras, el nivel de significación α se concentra sólo en una parte o cola.
Este caso se presenta cuando la hipótesis nula es del tipo H0 : µ ≥ k (o bien H0 : p ≥ k) y la
hipótesis alternativa, por tanto, es del tipo H1 : µ < k (o bien H1 : p < k).(También si aparece
≤)
A nivel de confianza 1 − α, las regiones serı́an, en la N(0;1):
a)
Unilateral por la derecha:
Figura 5.2: El intervalo (−∞, zα ) es la Región de Aceptación. La región no sombreada es la Región
crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.
La región de aceptación en este caso será:
σ
√
−∞, µ + zα ·
n
o bien:
p·q
−∞, p + zα ·
n
Las correspondientes regiones crı́ticas serán:
σ
µ + zα · √ , ∞
n
o bien
p + zα ·
p·q
,∞
n
b) Unilateral por la izquierda:
Figura 5.3: El intervalo (zα , ∞) es la Región de Aceptación. La región no sombreada es la Región
crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.
La región de aceptación en este caso será:
σ
µ − zα · √ , ∞
n
CAPÍTULO 5. TEST DE HIPÓTESIS
o bien
76
p − zα ·
p·q
,∞
n
Las correspondientes regiones crı́ticas serán:
σ
−∞, µ − zα · √
n
o bien:
p·q
−∞, p − zα ·
n
En todos los casos, conociendo el nivel de confianza 1 − α, tendremos que determinar el valor z α2
(para contrastes bilaterales) o bien zα (para contrastes unilaterales), que separa las regiones de rechazo
y aceptación.
Algunos de estos valores más comunes se dan en la tabla adjunta, que en los bilaterales son los
mismos que para intervalos de confianza o probabilidad, ya vistos con anterioridad:
Figura 5.4: Valores más comunes para contrastes bilaterales y unilaterales derechos. Los correspondientes para los unilaterales izquierdos son negativos.
5.5.
Etapas de la prueba de hipótesis
Los procedimientos seguidos en las pruebas de hipótesis correspondientes a las situaciones de
decisión estadı́stica se encuentran totalmente prefijados y se llevan a cabo en una serie de etapas que
facilitan su comprensión, y que son:
1. Enunciar la hipótesis nula H0 y la alternativa H1 .
Deben ser excluyentes entre sı́. Analizar, una vez enunciadas, si el contraste es bilateral o unilateral (Es bilateral si la hipótesis alternativa es del tipo = y unilateral si es del tipo > o <).
2. Determinar el valor z α2 (para contrastes bilaterales) o bien zα (para contrastes unilaterales),
que separa las regiones de rechazo y aceptación, a partir del nivel de confianza 1 − α o el de
significación α.
CAPÍTULO 5. TEST DE HIPÓTESIS
77
3. Determinar la distribución que sigue el parámetro muestral (x o p̂) y en base a ella y al valor
obtenido en la etapa anterior, escribir las correspondientes regiones de aceptación y rechazo.
4. Calcular el estadı́stico usado en la prueba (en nuestro caso, calcular media muestral x o proporción muestral p̂, a partir de la muestra).
5. Aplicar el test,es decir, dependiendo de si el estadı́stico cae en la región de aceptación o de
rechazo, tomar la decisión de aceptar una de las dos hipótesis.
A continuación se ofrecen algunos ejemplos de problemas de test de hipótesis:
1. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de
1570 horas, una desviación tı́pica de 120 horas. Si es la vida media media de los tubos de dicha
empresa, ¿se puede afirmar a nivel de significación 0’05 que la duración media de los tubos es
de 1600 horas?.
Determinar los errores de tipo I y II
Etapa 1: Queremos saber si la duración media de los tubos es de 1600 horas, es decir, que nuestra
hipótesis nula es H0 : µ = 1600.
Por lo tanto, la hipótesis alternativa será que la duración no sea de 1600 horas, es decir, la
hipótesis alternativa es H1 : µ = 1600.
Por tanto estamos ante un contraste bilateral.
Etapa 2: A nivel de significación α = 0 05 =⇒ 1 − α = 0 95, y realizando el dibujo habitual
(hacer como ejercicio), obtenemos que z α2 = z0 025 = 1 96.
Etapa 3: Determinemos la distribución de la media muestral, x, teniendo en cuente que como la
desviación tı́pica de la población no la conocemos, tomamos la muestral, que es s = 120, y por
tanto sabemos que la media muestral sigue una normal:
120
= N (1600; 12)
N 1600; √
100
Por tanto la región de aceptación será el intervalo de probabilidad:
120
120
, 1600 + √
= (1600 − 1 96 · 12, 1600 + 1 96 · 12) = (157648, 162352)
1600 − √
100
100
De modo que, Región de Aceptación:(1576’48,1623’52)
Región de Rechazo: (−∞, 157648) ∪ (162352, ∞)
Etapa 4: En la muestra se ha obtenido que x = 1570.
Etapa 5: Para aplicar el test, simplemente hemos de comprobar si el valor de está dentro de la
región de aceptación o de la de rehazo.
Como en este caso se observa que
1570 ∈
/ (157648, 162352)
es decir, 1570 no está en la región de aceptación, sino en la de rechazo.
Por tanto, hemos de rechazar que la media es 1600 (hipótesis nula) y aceptar la alternativa.
A este nivel de confianza no se puede afirmar que la duración media de los tubos sea de 1600
horas.
En cuanto a los errores:
Error de tipo I es afirmar que la duración media no es de 1600 horas cuando en realidad sı́ lo es.
Error de tipo II es afirmar que la duración media es de 1600 horas cuando en realidad no lo es.
CAPÍTULO 5. TEST DE HIPÓTESIS
78
2. Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración
de un empleo en la misma era de 6’5 años con una desviación tı́pica de 4. ¿Sirve esta afirmación
para aceptar, con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica
es menor o igual que 6? Justificar adecuadamente la respuesta.
El enunciado no puede ser más claro a la hora de determinar las hipótesis nula y alternativa.
Queremos comprobar si el tiempo medio de empleo en esa fábrica es menor o igual que 6, luego
la hipótesis alternativa será que dicho tiempo medio de empleo sea MAYOR que 6, es decir:
H0 : µ ≤ 6
o simplemente H0 : µ = 6 (lo que queremos comprobar) frente a:
H1 : µ > 6
Es claramente un contraste unilateral. La región de aceptación será
s
−∞, µ + zα √
n
puesto que aceptamos todos los valores menores que un cierto tope. Notemos que concemos el
valor de s (en la muestra) y no el de σ, pero eso no inluye en la fórmula. La región de rechazo,
por tanto, es:
s
µ + zα √ , ∞
n
Para calcular el nivel zα = z0 05 , y por tanto z0 05 = 1 645. Ası́ pues, la región de aceptación es,
puesto que µ = 6 , s = 4 y n = 64, resulta ser, aproximadamente:
(−∞, 6 8225)
Y la región crı́tica:
(6 8225, ∞)
Como en la muestra resulta que x = 6 5, que pertenece a la región de aceptación, es decir,
aceptamos la hipótesis nula, la media es de 6 años, al 95 % de confianza.
3. Un investigador, utilizando información de anteriores comicios, sostiene que, en una determinada
zona, el nivel de abstención en las próximas elecciones es del 40 % como mı́nimo. Se elige una
muestra aleatoria de 200 individuos para los que se concluye que 75 estarı́an dispuestos a votar.
Determinar, con un nivel de significación del 1 %, si se puede admitir como cierta la afirmación
del investigador.
Se trata ahora de un contraste de proporciones. La hipótesis a contrastar está muy clara: El
investigador dice que el nivel de abstención es de un 40 % por lo menos, es decir, sólo rechazaremos
su hipótesis cuando la proporción sea menor que este valor, es decir:
H0 : p ≥ 0 4
o simplemente H0 : p = 0 4 (lo que dice el investigador) frente a:
H1 : p < 0 4
(la proporción de abstención es menor)
Ası́ pues la región de aceptación es:
p − zα
pq
,∞
n
CAPÍTULO 5. TEST DE HIPÓTESIS
Y la de rechazo:
79
−∞, p − zα
pq
n
Para calcular el nivel zα = z0 01 , y por tanto z0 01 = 2 33. Ası́ pues, la región de aceptación es,
puesto que p = 0 4 , q = 0 6 y n = 200, resulta ser, aproximadamente:
(0 3192, ∞)
Y la región crı́tica:
(−∞, 0 3192)
Como en la muestra resulta que
125
= 0 625
200
, los 125 que no votan de los 200 a los que se pregunta. Al 99 % de confianza entonces, resulta
que dicho valor en la muestra pertenece a la región de aceptación, es decir,aceptamos la hipótesis
nula y el investigador tiene razón, la abstención será, al menos del 40 %.
p̂ =
Capı́tulo 6
MATRICES Y DETERMINANTES
6.1.
Introducción
Las matrices y los determinantes son herramientas del álgebra que facilitan el ordenamiento de
datos, ası́ como su manejo.
Los conceptos de matriz y todos los relacionados fueron desarrollados básicamente en el siglo XIX
por matemáticos como los ingleses J.J. Sylvester y Arthur Cayley y el irlandés William Hamilton.
Las matrices se encuentran en aquellos ámbitos en los que se trabaja con datos regularmente
ordenados y aparecen en situaciones propias de las Ciencias Sociales , Económicas y Biológicas.
6.2.
Matrices. Definición y primeros ejemplos
Una matriz es una tabla rectangular de

a11 a12 a13
 a21 a22 a23

A= .
..
..
 ..
.
.
am1 am2 am3
números reales dispuestos en filas y columnas del modo:
 
. . . a1n ←


. . . a2n 
←
..  ← Filas de la matriz A
..
.
.  


. . . amn ←
Columnas de la matriz A
Abreviadamente se puede expresar A = (aij ). Cada elemento de la matriz lleva dos subı́ndices. El
primero de ellos “i”, indica la fila en la que se encuentra el elemento, y el segundo, “j”, la columna.
Ası́ el elemento a23 está en la fila 2 y columna 3. Las matrices siempre se representarán con letras
mayúsculas.
Ejemplos: Son ejemplos de matrices los siguientes:


3
1
0
√
 2 −4 0 
2 1
6 −4 0
√ 
C =
A=
B=
−1 1
2
1
2 1
3 4
5
1
0
0
A tiene 2 filas y 2 columnas, diremos que su tamaño es 2 x 2.¿Qué elemento es a21 ?.
B tiene 2 filas y 3 columnas, diremos que su tamaño es 2 x 3.¿Qué elemento es b23?.
C tiene 4 filas y 3 columnas, diremos que su tamaño es 4 x 3.¿Qué elemento es c42 ?.
En general, si una matriz A tiene m filas y n columnas, diremos que su tamaño o dimensión es m
x n (se lee “m por n”), siempre en primer lugar el nº de filas y en segundo lugar el de columnas.
82
CAPÍTULO 6. MATRICES Y DETERMINANTES
6.3.
83
Tipos de matrices
1. Se llama matriz nula a la que tiene todos los elementos cero.
Por ejemplo,
0 0 0 0 0
A=
0 0 0 0 0
es una matriz nula de tamaño 2x5.
2. Se llama matriz fila a la que sólo tiene una fila, es decir su dimensión es 1x n.
Por ejemplo,
1 0 −4 9
es una matriz fila de tamaño 1 x 4.
3. Se llama matriz columna a la que sólo consta de una columna, es decir su dimensión será m x
1, como por ejemplo:


1
0 
C= √
− 8
es una matriz columna de tamaño 3 x 1.
4. Una matriz es cuadrada cuando tiene el mismo número de filas que de columnas, es decir su
dimensión es n x n. La matriz ( 23 14 ) del primer ejemplo anterior es cuadrada de tamaño 2 x 2 o
simplemente de orden 2.
Otro ejemplo de matriz cuadrada es:


1
2 3
D= 6
5 4
−3 −4 0
de orden 3.
Dentro de las matrices cuadradas llamaremos diagonal principal a la formada por los elementos
a11 , a22 , a33, . . . , ann , siendo la matriz:


a11 a12 a13 . . . a1n
a21 a22 a23 . . . a2n 


A= .
..
..
.. 
..
 ..
.
.
.
. 
an1 an2 an3 . . .
ann
En la matriz D del ejemplo anterior, su diagonal principal estarı́a formada por 1, 5, 0.
Se llama traza de la matriz a la suma de los elementos de la diagonal. Es decir, Traza (A)=a11 +
a22 + a33 + . . . + ann , y en el caso de D, Traza (D)= 1+5+0 = 6.
La diagonal secundaria es la formada por los elementos a1n , a2,n−1, a3,n−2, . . . , an1 .
En la matriz D estarı́a formada por 3, 5, -3.
Una clase especial de matrices cuadradas son las matrices triangulares.
Una matriz es triangular superior si todos los elementos por debajo de la diagonal principal son
nulos y triangular inferior si son nulos todos los elementos situados por encima de dicha diagonal.
Son ejemplos de estas matrices:




1 0
0
0
1 4 13
0 −4 0

0 
F = 0 9 −5
E=
3 4
5
0 
0 0 π
1 3 16 −78
Triangular superior
Triangular inferior
CAPÍTULO 6. MATRICES Y DETERMINANTES
84
Si una matriz es a la vez triangular superior e inferior, sólo tiene elementos en la diagonal principal.
Una matriz de este tipo se denomina matriz diagonal.
Un ejemplo de matriz diagonal serı́a:


1
0
0 0
0 −45 0 0

G=
0
0
3 0
0
0
0 0
Por último, si una matriz diagonal tiene en su diagonal principal sólo unos, se denomina matriz unidad
o identidad. Se suelen representar por In , donde n es el orden o tamaño de la matriz. Algunas matrices
identidad son:




1
0
0
0
1 0 0
0 1 0 0
1 0


I3 = 0 1 0 I4 = 
I2 =
0 0 1 0
0 1
0 0 1
0 0 0 1
6.4.
Aplicaciones de las matrices
Las matrices se utilizan en el contexto de las ciencias como elementos que sirven para clasificar
valores numéricos atendiendo a dos criterios o variables.
Ejemplo: Un importador de globos los importa de dos colores, naranja (N) y fresa (F). Todos
ellos se envasan en paquetes de 2, 5 y 10 unidades, que se venden al precio (en euros) indicado por la
tabla siguiente:
Color N
Color F
2 unid.
0’04
0’03
5 unid.
0’08
0’05
10 unid.
0’12
0’08
Sabiendo que en un año se venden el siguiente número de paquetes:
2 unid.
5 unid.
10 unid.
Color N
700000
600000
500000
Color F
50000
40000
500000
Resumir la información anterior en 2 matrices A y B, de tamaño respectivo 2x3 y 3x2 que recojan las
ventas en un año (A) y los precios (B).
Nos piden que organicemos la información anterior en dos matrices de tamaño concreto. Si nos fijamos
en las tablas, es sencillo obtener las matrices:
N
 2 ud 5 ud 10 ud
0 04
700000 600000 500000 N

A=
B = 0 08
50000 40000 500000 F
0 12
F

0 03 2 ud
0 05 5 ud
0 08 10 ud
Estas matrices se denominan matrices de información, y simplemente recogen los datos numéricos del
problema en cuestión.
Otras matrices son las llamadas matrices de relación, que indican si ciertos elementos están o no
relacionados entre sı́. En general, la existencia de relación se expresa con un 1 en la matriz y la ausencia
de dicha relación de expresa con un 0.
Estas matrices se utilizan cuando queremos trasladar la información dada por un grafo y expresarla
numéricamente.
CAPÍTULO 6. MATRICES Y DETERMINANTES
85
En Matemáticas, un grafo es una colección cualquiera de puntos conectados por lineas.
Existen muchos tipos de grafos. Entre ellos, podemos destacar:
* Grafo simple: Es el grafo que no contiene ciclos, es decir, lineas que unan un punto consigo
mismo, ni lineas paralelas, es decir, lineas que conectan el mismo par de puntos.
* Grafo dirigido: Es el grafo que indica un sentido de recorrido de cada linea, mediante una flecha.
Estos tipos de grafo pueden verse en la figura:
Figura 6.1: Grafo, Grafo simple y Grafo dirigido.
Relacionadas con los grafos se pueden definir algunas matrices. Entre todas ellas, nosotros nos
fijaremos en la llamada matriz de adyacencia, que es aquella formada por ceros y unos exclusivamente,
de tal forma que:
* un 1 en el lugar (i,j) expresa la posibilidad de ir desde el punto de la fila i hasta el punto de la
columna j mediante una linea que los una directamente.
* un 0 en el lugar (i,j) expresa la imposibilidad de ir del primer punto al segundo mediante una
linea que los una directamente.
La matriz de adyacencia del grafo dirigido de la figura anterior será:
A

A 0
B
0
C 1
D 0
B
1
0
0
0
C
0
1
0
0
D

1
0

0
0
Ejercicio
1) Escribe las correspondientes matrices de adyacencia de los grafos:
2) Dibuja los grafos dirigidos que correspondan a las matrices de adyacencia:
A

A 0
B 1
C 0
B
1
0
0
C

0
1
0
A

A 0
B
0
C 1
D 0
B
1
0
0
1
C
1
0
0
1
D

1
1

0
0
CAPÍTULO 6. MATRICES Y DETERMINANTES
6.5.
86
Operaciones con matrices
6.5.1.
Suma y diferencia
Dadas dos matrices A y B podemos realizar su suma o diferencia de acuerdo a la siguiente regla.
Para sumar o restar dos matrices del mismo tamaño, se suman o restan los elementos que se encuentren
en la misma posición, resultando otra matriz de igual tamaño.
Por ejemplo:
2 0 4
0 1 −1
2 1 3
−
=
3 2 5
−7 0 −4
−4 2 1
2x3
2x3
2x3
Si las matrices tienen diferente tamaño, no se pueden sumar o restar entre sı́.
Propiedades de la suma (y diferencia) de matrices:
a) Conmutativa: A + B = B + A
b) Asociativa: A + (B + C) = (A + B) + C
c) Elemento neutro: La matriz nula del tamaño correspondiente.
d) Elemento opuesto de A: La matriz -A, que resulta de cambiar de signo a los elementos de A.
Ejemplo:
Si




0 1
0 −1
A = −4 −2 =⇒ −A =  4 2
−3 9
3 −9
3x2
porque:
3x2
 

 
0 1
0 0
0 −1
−4 −2 +  4 2 = 0 0
−3 9
0 0
3 −9

3x2
3x2
3x2
Ejercicios:
1. Las exportaciones, en millones de euros, de 3 paı́ses A, B, C a otros tres X, Y, Z, en los años
2000 y 2001 vienen dadas por las matrices:
X Y Z

A 11 6 7 0 5
A2000 = B 14 5 10 1 2
C 20 9 3 2 2 3

X Y Z

A 13 3
7
1
= B 15 7 11 1 3 2
C 21
0 2 4 3

A2001
Calcula y expresa en forma de matriz el total de exportaciones para el conjunto de los dos años.
¿Cuántos millones ha exportado el paı́s B al Z en total?
Calcula el incremento de las exportaciones del año 2000 al 2001 con los datos del ejemplo anterior.
2. Calcula x, y, z en la suma:

 
 

x − y −1 2
y 0 z
−1 −1 3
 1
y −x + −z 2 3 =  0
4 4
0
z
2
−2 3 x
−2 4 1
3. Calcula a, b, c para que se cumpla la igualdad:
3−a
b
−2
2
a+b 4
−1 a 2
+
=
4
−c + 1 6
1−c
2
0
2 0 6
CAPÍTULO 6. MATRICES Y DETERMINANTES
6.5.2.
87
Producto por un número real
Dada una matriz cualquiera A y un número real k, el producto k·A se realiza multiplicando todos
los elementos de A por k, resultando otra matriz de igual tamaño. (Evidentemente la misma regla
sirve para dividir una matriz por un número real).
Por ejemplo:
−10 −5 −15
2 1 3
=
−5 ·
20 −10 −5
−4 2 1
2x3
2x3
Propiedades:
a) Distributiva respecto de la suma de matrices: k·(A + B) = k·A + k·B
b) Distributiva respecto de la suma de números: (k + d)·A= k·A + d·A
c) Asociativa: k·(d·A)=(k·d)·A
d) Elemento neutro, el número 1: 1·A=A
Ejercicios:
1. Si A =
1 1
0 1
−1 0
yB=
, halla una matriz X que verifique la ecuación:
0 2
2·X −4·A = B
2. Determina las matrices X y Y sabiendo que:

1


3X − 5Y =
8
2


 −X + 3Y =
3
6.5.3.
−2
1
4
0
Trasposición de matrices
Dada una matriz cualquiera A, se llama matriz traspuesta de A, y se representa por At a la matriz
que resulta de intercambiar
las columnas de A.
las filas y 2 1 0 7
Por ejemplo, si A =
, entonces la matriz traspuesta de A es:
−3 4 2 1


2 −3
1 4 

At = 
0 2 
7 1
Evidentemente, si A es una matriz de tamaño m x n, su traspuesta At tendrá tamaño n x m, pues el
número de columnas pasa a ser el de filas y viceversa.
Si la matriz A es cuadrada, su traspuesta tendrá el mismo tamaño.
Propiedades:
a) (At )t = A, es decir, la traspuesta de la traspuesta es la matriz inicial.
b) (A + B)t = At + B t
c) (k · A)t = k · At
En base a esta nueva operación, podemos definir otras dos clases de matrices, que son:
Matriz simétrica, que es aquella para la que se cumple

2 1

A= 1 0
3 −2
que At = A, por ejemplo la matriz:

3
−2
√
7
CAPÍTULO 6. MATRICES Y DETERMINANTES
88
es simétrica (compruébalo).
En una matriz simétrica, los elementos son simétricos respecto a la diagonal principal.
Ejercicio: ¿Puede ser simétrica una matriz que no sea cuadrada?¿Por qué?.
Matriz antisimétrica, es aquella para la que se cumple que At = −A.
Por ejemplo:


0 1 3
B = −1 0 −2
−3 2 0
es antisimétrica (comprueba).
En una matriz antisimétrica, los elementos de la diagonal principal son siempre nulos (¿por qué?),
y los restantes son opuestos respecto a dicha diagonal.
Ejercicios:




1 3 3
1
1
2
1. Dadas las matrices A = 1 4 3 y B =  2
0 −1 calcula 3At − B t .
1 3 4
−6 −1 0
2. Obtener las matrices X e Y

1


2X − 3Y =
4
a)
−1


X − Y =
3
6.5.4.
que verifiquen los sistemas:

5
2 1


X + Y =
2
3 0
b)
0
6 2


X − Y =
6
0 1

3 1


2X + Y =
0 −2
c)
1 0


X + 2Y =
−2 4
Producto de matrices
Hay que dejar claro ya desde el principio que no todas las matrices pueden multiplicarse. Dos
matrices se pueden multiplicar cuando se cumple la siguiente condición:
“Para multiplicar dos matrices A y B, en este orden, A·B , es condición indispensable que el número
de columnas de A sea igual al número de filas de B”
Si no se cumple esta condición, el producto A·B no puede realizarse, de modo que esta es una
condición que debemos comprobar previamente a la propia multiplicación.
Una vez comprobado que el producto A·B se puede realizar, si A es una matriz m x n y B es una
matriz n x p (observemos que el nº de columnas de A = n = nº de filas de B), entonces el producto
A·B da como resultado una matriz C de tamaño n x p del siguiente modo:
“El elemento que se encuentra en la fila i y la columna j de la matriz C=A·B, se obtiene multiplicando
los elementos de la fila i de A por la columna j de B y sumando los resultados”
Veámoslo mediante un ejemplo:
Para multiplicar las matrices:
A=
−3 2 1 4
2 5 3 −2
2x4

y

0 −4 1
1 −2 1

B=
2 0 2
3 2 1
4x3
primero comprobamos que se puede realizar el producto A·B, pues el nº de columnas de A es 4 y el
nº de filas de B también es 4, y el resultado, según lo dicho será una matriz de tamaño 2 x 3, tiene 2
CAPÍTULO 6. MATRICES Y DETERMINANTES
filas y 3 columnas:
89


0 −4 1
1 −2 1
−3 2 1 4


·
=
2 5 3 −2 2 0 2
2x4
2x3
3 2 1
4x3
Sólo nos falta completar los elementos de la matriz producto. Para ello, seguimos la regla anterior:
El elemento de la fila 1 y columna 1 de A·B proviene de multiplicar elemento a elemento la fila 1
de A por la columna 1 de B y sumar, es decir:
(−3) · 0 + 2 · 1 + 1 · 2 + 4 · 3 = 0 + 2 + 2 + 12 = 16
El elemento de la fila 1 y columna 2 de A·B proviene de multiplicar elemento a elemento la fila 1 de
A y la columna 2 de B y sumar:
(−3) · (−4) + 2 · (−2) + 1 · 0 + 4 · 2 = 12 − 4 + 0 + 8 = 16
El elemento de la fila 1 y columna 3 de A·B proviene de multiplicar elemento a elemento la fila 1 de
A y la columna 3 de B y sumar:
(−3) · 1 + 2 · 1 + 1 · 2 + 4 · 1 = −3 + 2 + 2 + 4 = 5
Ası́ sucesivamente se obtienen (comprueba):
16 16
5
5 −22 11
2x3
Ejercicios:
1. Para las matrices A y B anteriores, calcula B·A
1 −3
3 −5
2. Si A =
,B=
, calcula si es posible A·B y B·A. ¿Coinciden?.
−2 6
2 1


1 −1
3 0 2


3. Lo mismo si A = 0 −2 , B =
.
1 −1 5
4 1
4. Calcula todos los productos posibles entre las matrices:


 
1 2 3
1
A = 1 1 1 
B = 2
0 2 −1
1
C=
2 1 0
3 4 5
Además, calcula A2 y A3 .
5. Para las matrices
1 −1 2
A=
4 0 −3
B=
0
3 4
−1 −2 3


2 3 0 1
C = −5 1 4 −2
1 0 0 −3
 
2
D = 1
3
calcula:
A + B, 3A − 4B, A · B, A · D, B · C, C · D, At · C, Dt · At , B t · A, Dt · D, D · Dt
CAPÍTULO 6. MATRICES Y DETERMINANTES
90
Propiedades del producto de matrices
a) Asociativa: A·(B·C) = (A·B)·C
b) Distributiva respecto de la suma:
A · (B + C) = A · B + A · C
(B + C) · A = B · A + C · A
c) Elemento neutro, la matriz identidad correpondiente, si A es m x n:
A · In = A
Im · A = A
d) En general el producto de matrices no es conmutativo
A · B = B · A
Pueden verse ejemplos en los ejercicios anteriores. Esta es una propiedad muy importante.
e) El producto de dos matrices no nulas A y B puede dar lugar a una matriz nula:
 
5
0
2 1 3  
· 2
=
0
0 2 1
−4
2x3
2x1
3x1
Se dice que el conjunto de las matrices con la operación producto tiene divisores de cero, es decir, hay
matrices no nulas cuyo producto es nulo.
Ejercicios:
1. Si A y B son dos matrices cuadradas del mismo orden, ¿son ciertas las propiedades siguientes,
que son ciertas para las operaciones con números reales?:
a) (A + B)2 = A2 + B 2 + 2 · A · B
b) (A − B)2 = A2 + B 2 − 2 · A · B
c) (A + B) · (A − B) = A2 − B 2
2. Determina los valores de a y b de la matriz A =
3. ¿Qué matrices conmutan con la matriz
6.6.
2 −1
a b
para que A2 = A.
1 2
?.
0 1
La matriz inversa
Sabemos ya multiplicar matrices y hemos visto algunas de las propiedades de esta operación.
Recordemos, en primer lugar, que no siempre es posible efectúar la multiplicación de dos matrices,
y en segundo lugar, que aunque sea posible hacer esta multiplicación, en general no es conmutativo,
es decir A·B es distinto de B·A.
En el caso particular de que tratemos con matrices cuadradas del mismo orden A y B, es claro que
podemos efectuar los productos A·B y B·A, que darán como resultado otra matriz del mismo orden,
aunque, como ya se ha dicho, las matrices resultantes serán, en general, distintas.
Sabemos también que el elemento neutro del producto de matrices es la matriz identidad In .
Por analogı́a con el caso de los números reales, podemos plantearnos la siguiente cuestión:
CAPÍTULO 6. MATRICES Y DETERMINANTES
91
Si tenemos un número real, por ejemplo el 2, podemos interesarnos en buscar el inverso del 2 para
el producto, es decir un número real x tal que 2·x = 1, el producto de 2 por x sea igual al elemento
neutro, el 1.
Evidentemente, en el caso de los números reales es bien fácil despejar x para obtener, en nuestro
1
caso, que x = , es decir, el inverso de un número real es otro número que multiplicado por él da el
2
elemento neutro, el 1.
Todo número real, salvo el 0, tiene inverso.
Trasladando esto a las matrices, nos podemos plantear si dada una matriz cuadrada A de orden n,
cualquiera, existe su inversa X para el producto de matrices,tal que
A · X = In
es decir, el producto de A por su inversa produce el elemento neutro matricial, la matriz identidad In .
Sin embargo, hay algunas diferencias con respecto al caso de los números reales:
In
1) No podemos “despejar” la matriz X del modo X = , porque no hemos definido la división de
A
matrices.
2) No todas las matrices cuadradas no nulas tienen matriz “inversa” (sea lo que sea, por analogı́a
con los números).
Definamos, en primer lugar, el término de matriz inversa:
Dada una matriz cuadrada de orden n , A, se dice que A es invertible (o que posee inversa o que es
no singular o que es regular ), si existe otra matriz del mismo orden, denominada matriz inversa de A
y representada por A−1 y tal que:
A · A−1 = In
y
A−1 · A = In
Si A no tiene inversa, se dice que es singular o no invertible.
Si una matriz tiene inversa, dicha matriz inversa es única (sólo hay una). Para calcular dicha matriz
inversa, podemos utilizar dos vı́as:
6.6.1.
Método directo:
Consiste en determinar A−1 planteando
sistema de ecuaciones, es decir, si por ejemplo queremos
un 1 2
determinar la inversa de la matriz A =
, lo que estoy buscando es otra matriz de igual tamaño
−1 1
x y
−1
−1
−1
, se tiene que cumplir que :
(orden 2) tal que A · A = I2 y A · A = I2 , es decir, si A =
z t
1 2
x y
1 0
x + 2z y + 2t
1 0
−1
·
=
=⇒
=
A · A = I2 =⇒
−1 1
z t
0 1
−x + z −y + t
0 1

x + 2z = 1



y + 2t = 0
−x
+z =0



−y + t = 1
Es decir, hemos de resolver un sistema de 4 ecuaciones con 4 incógnitas, aunque en realidad son 2
sistemas de dos ingónitas cada uno (uno con x y z y otro con y y t).
Resolviendo el sistema se obtiene que
x=
−2
1
1
1
,y =
,z = ,t =
3
3
3
3
CAPÍTULO 6. MATRICES Y DETERMINANTES
92
por lo que la matriz inversa es:
−1
A
1
=
3
1
3
−2
3
1
3
1
1 −2
= ·
1 1
3
Se puede comprobar que también se cumple que A−1 · A = I2 , luego A es invertible, tiene inversa. Si
el sistema no tiene solución, la matriz no
tiene inversa.
1 1
Por ejemplo, en el caso en que A =
, del mismo modo :
2 2
−1
A·A
= I2 =⇒
1 1
x y
1 0
x+z
y+t
1 0
·
=
=⇒
=
2 2
z t
0 1
2x + 2z 2y + 2t
0 1

x+z = 1



y+t = 0
2x + 2z = 0



2y + 2t = 1
Y por ejemplo de 2x+2z=0 se obtiene x = -z, si se sustituye en la primera ecuación es -z+z=1, es
decir 0 = 1 (imposible). El sistema no tiene solución.
Por tanto A no es invertible, es singular.
Este método directo sólo se suele utilizar para matrices cuadradas de tamaño 2, puesto que para
las de tamaño 3 obtenemos un sistemas de ¡9 ecuaciones con 9 incógnitas! que realmente es difı́cil de
resolver.
6.6.2.
Método de Gauss-Jordan:
Consiste en hacer transformaciones elementales en las filas de la matriz para llegar a obtener la
matriz identidad. Realizando estas mismas transformaciones con la matriz identidad llegamos a la
matriz A−1 .
Se llama transformación elemental en una matriz a:
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
1 2
Veamos como se realiza el método de Gauss-Jordan, realizándolo a la vez con la matriz
.
−1 1
i) Consideramos la matriz formada por A y la matriz identidad correspondiente . En nuestro caso:
1 2 1 0
(A|I2 ) =
−1 1 0 1
ii) Se hace la matriz triangular superior (es decir, hacemos ceros por debajo de la diagonal principal)
usando transformaciones elementales en filas.
La mejor forma de realizar esto es hacer cero los elementos por debajo de la diagonal en la primera
columna usando la fila 1. Luego, hacer cero los elementos por debajo de la diagonal en la segunda
columna usando la fila 2, y ası́ sucesivamente.
En nuestro caso, basta sumar la fila 2 con la fila 1, y se obtiene:
1 2 1 0 F2 +F1 1 2 1 0
−−−−→
(A|I2 ) =
−1 1 0 1
0 3 1 1
iii) Una vez hecha la matriz triangular superior, se hace la matriz triangular inferior, haciendo
ceros a los elementos por encima de la diagonal. El proceso es parecido al anterior:
CAPÍTULO 6. MATRICES Y DETERMINANTES
93
Hacer cero los elementos por encima de la diagonal en la última columna usando la última fila. Luego, hacer cero los elementos por encima de la diagonal en la penúltima columna usando la penúmtima
fila, y ası́ sucesivamente. En nuestro caso:
1 2 1 0 3·F1 −2·F2 3 0 1 −2
−−−−−−→
0 3 1 1
0 3 1 1
iv) Ya tenemos una matriz diagonal. Lo único que falta es dividir a cada fila entre el número
adecuado para obtener unos en la diagonal principal, es decir, para obtener la matriz identidad en la
parte izquierda:
F1 F2 , 3
1 0 13 −2
3 0 1 −2
3
3
−
−
−
−
→
0 1 31 13
0 3 1 1
v) Una vez se tiene la matriz identidad en la parte de la izquierda, la parte derecha es la matriz inversa,
es decir, llegamos a:
1 −2 1
1 −2
1 0 13 −2
−1
3
3
3
(I2 , A−1 ) =
·
=⇒ A = 1 1 =
1 1
0 1 31 13
3
3
3
matriz que habı́amos obtenido antes por el método directo.
Si al realizar el método de Gauss-Jordan en algún momento alguna fila es de ceros, la matriz no
tiene inversa.
Cuanto mayor sea el orden de la matriz, mejor es este método frente al directo.
Veamos otro ejemplo:


1 1 0
Calcular la inversa de la matriz B = −1 1 2 por el método de Gauss-Jordan.
1 0 1
Siguiendo los pasos anteriores:






1 1 0 1 0 0
1 1 0 1 0 0
1 1 0 1 0 0
F +F1
F3 −F1
0 2 2 1 1 0 −
−−−→ 0 2 2 1 1 0
(B|I3 ) = −1 1 2 0 1 0 −−2−−→
1 0 1 0 0 1
1 0 1 0 0 1
0 −1 1 −1 0 1




1 1 0 1 0 0
1 1 0 1 0 0
2·F +F2
2·F2 −F3
4·F −F2
0 2 2 1 1 0 −
−−−3−−→
−−−−→ 0 4 0 3 1 −2 −−−1−−→
0 0 4 −1 1 2
0 0 4 −1 1 2




2
4 0 0 1 −1 2
1 0 0 14 −1
F1 F2 F3
4
4
,
,
4·F −F2
4
4
1
−2 
0 4 0 3
−−−1−−→
1 −2 −−
−−
−−4→ 0 1 0 43
= (I3 |B −1 )
4
4
2
0 0 4 −1 1
2
0 0 1 −1 14
4
 1 −1 1  4
=⇒ B −1 = 
4
3
4
−1
4
4
1
4
1
4
2
−1 
2
1
2
También se puede expresar, sacando factor común:


1 −1 2
1
1 −2
B −1 = ·  3
4
−1 1
2
1 1
Si calculamos por este método la inversa de A =
resulta:
2 2
1 1 1 0 F2 −2·F1 1 1 1 0
−−−−−→
(A|I2 ) =
2 2 0 1
0 0 −2 1
es la inversa de B.
Como aparece una fila de ceros, la matriz A no tiene inversa.
Ejercicios:
CAPÍTULO 6. MATRICES Y DETERMINANTES
94
1. Calcular por el método de Gauss-Jordan la inversa de las matrices:




1 2 −3
−2 1 4
A = 3 2 −4
B= 0 1 2 
2 −1 0
1 0 −1

3 0
2. Dada la matriz diagonal D = 0 −2
0 0
rápida la inversa de una matriz diagonal
6.7.

0
0 calcula su inversa. ¿Cómo calcuları́as de forma
5
cualquiera?.
Rango de una matriz
Un concepto muy importante relacionado con las matrices es el de rango. El concepto de rango se encuentra ligado al de “independencia lineal” de filas o columnas de una matriz, pero no se
introducirá de esta manera porque se requieren conceptos que no conocemos.
Baste saber que se define el rango de una matriz como el número máximo de filas o columnas
linealmente independientes.
Sin embargo, el cálculo del rango de una matriz lo abordaremos desde otra perspectiva, utilizando
el método de Gauss.
Supongamos que tenemos una matriz cualquiera A a la que aplicamos el método de Gauss con el
fin de simplificarla lo más posible (es decir, consiguiendo que tenga el mayor número de ceros posible),
realizando operaciones elementales en filas.
Llamaremos rango de la matriz A y lo representaremos por Rg(A) al número de filas no nulas de
la matriz tras aplicarle el método de Gauss.
Ejemplo: Calcular el rango de las siguientes matrices:


1 1 0
1 1
0 3
A=
B=
C= 2 1 1 
2 2
1 1
−1 1 −2
D=
2
4
6
−1 −2 −3
1 1 F2 −2·F1 1 1
−−−−−→
, Rg(A)=1 ,sólo una fila distinta de cero.
a)
0 0
2 2
0 3 F2 F1 1 1
−−−−→
, Rg(B)=2 hay 2 filas no nulas.
b)
0 3
1 1








1
1
0
1 1
0
1 1 0
1 1 0
F2 −2·F1 
F +F1 
F +2·F2 
−−−→
0 −1 1  −−3−−→
0 −1 1  −−3−−−→
0 −1 1
c)  2 1 1  −−
−1 1 −2
0 2 −2
0 0 0
−1 1 −2
Rg(C)=2
hay 2 filas
no nulas.
2 4 6
2
4
6
2·F2 +F1
−−−−−→
, Rg(D)=1, sólo una fila no nula.
d)
0 0 0
−1 −2 −3
Los ejemplos anteriores ponen de manifiesto que el rango de cualquier matriz siempre es menor o
igual que el número de filas de la matriz.
De hecho se verifica que el rango de cualquier matriz siempre es menor o igual que su número de
filas y de columnas, pues el proceso para hacer el método de Gauss se puede hacer indistintamente
mediante operaciones elementales en filas o en columnas.
Esto permite, antes de calcular el rango de una matriz, saber entre qué valores va a estar ese rango.
Por ejemplo, en el caso c) del ejemplo, como la matriz es 3x3 , el rango sólo puede ser 0, 1, 2 ó 3,
no hay otras posibilidades.
En el caso del apartado d), como la matriz es 2 x 3, el rango sólo puede ser 0,1 ó 2. (De hecho,
podemos reducir esto algo más , pues una matriz sólo tiene rango cero si es la matriz nula).Resumiendo:
CAPÍTULO 6. MATRICES Y DETERMINANTES
95
Propiedad: Si A es una matriz de tamaño m x n no nula se cumple que:
1 ≤ Rg(A) ≤ min{m, n}
Ejemplo: Calcular en función de k el rango de la matriz:
1 1 2
A=
3 3 k
Aplicando Gauss,
A=
1 1 2
3 3 k
1 1
2
−−−−−→
0 0 k−6
F2 −3·F1
Ahora es evidente que si k-6=0, la última fila es nula. Por tanto, si k=6, la última fila es nula y el
rango de A es 1, Rg(A)=1, mientras que si k-6 es distinto de cero, es decir si k es distinto de 6, hay 2
filas no nulas y el rango de A es 2, Rg(A)=2. Resumiendo:
Si k = 6, entonces Rg(A)=2
Si k=6, entonces Rg(A)=1
La siguiente propiedad permite relacionar el concepto de rango con el de matriz inversa visto
anteriormente:
Propiedad:
Una matriz cuadrada A tiene inversa ⇐⇒ Rg(A) es máximo.
Ejercicios:


1 −2 1
1. Calcula el rango de A según los valores de k: A = 1 1 3.¿Para qué valores de k tiene A
5 −1 k
inversa?.
2. Calcula el rango de las matrices:

0
1 0 1
A=
B = 1
2 1 0
0



2 −1 1 1
2
0 0 1 0

−1
D
=
C =
2 1 1 1
1
0 0 0 1
6.8.

2 1
0 −1
4 2

1 5 −1 8
2 3
4
5
3 10 11 13
Determinantes
Introduciremos a continuación el concepto de determinante asociado a una matriz cuadrada. Este
concepto permite simplificar operaciones matriciales tales como el cálculo del rango o de la matriz
inversa.
Definición:
Si es una matriz 2 x 2 se define el determinante de la matriz A, y se expresa como det(A) o bien
|A|, como el número:
a11 a12 = a11 · a22 − a12 · a21
det(A) = |A| = a21 a22 Ejemplos: El cálculo de los determinantes de orden 2 es bien sencillo, por ejemplo:
CAPÍTULO 6. MATRICES Y DETERMINANTES
96
1 3
=1·4-(-1)·3=4+3=7.
a) −1 4
−2 −3
=-10+6=-4.
b) 2
5
Para definir determinantes de matrices de orden mayor que 2 es necesario introducir previamente
algunos conceptos.
Dada una matriz cuadrada A de orden n, definimos el menor complementario de un elemento de
A,aij , como el determinante de la matriz que se obtiene al suprimir la fila i y la columna j en la que
se encuentra dicho elemento aij . Se representa por Mij .


−2 4 5
Ejemplo: En la matriz A =  6 7 −3 , los menores complementarios de cada uno de los
3 0 2
elementos de la primera fila son:
7 −3
=14-0=14.
Menor complementario de -2:M11 = 0 2 6 −3
=12+9=21.
Menor complementario de 4:M12 = 3 2
6 7
=0-21=-21.
Menor complementario de 5:M13 = 3 0
Y ası́ sucesivamente.
Ejercicio: Obtener los restantes menores complementarios de los elementos de la matriz A.
Estrechamente ligado al concepto de menor complementario se encuentra el de adjunto de una matriz.
Dada una matriz cuadrada A de orden n, definimos el adjunto de un elemento aij de A como el
número:
Aij = (−1)i+j · Mij
es decir, no es más que el menor complementario correspondiente acompañado de un signo más o
menos dependiendo de la fila y la columna en la que se encuentre el elemento en cuestión.
Por ejemplo, para la matriz anterior, los adjuntos de los elementos de la primera fila son:
Adjunto de -2:A11 = (−1)1+1 · M11 = 1 · 14 = 14 (coincide con el menor complementario)
Adjunto de 4:A12 = (−1)1+2 · M12 = (−1) · 21 = −21 (menor complementario con signo cambiado)
Adjunto de 5:A13 = (−1)1+3 · M13 = 1 · −21 = −21 (coincide con el menor complementario).
Ejercicio: Obtener los restantes adjuntos de los elementos de la matriz A.
En general puede saberse si el signo del menor complementario y del adjunto coinciden o no utilizando
una sencilla regla gráfica, por ejemplo, para matrices 3 x 3 y 4 x 4 basta fijarse en las matrices:




+ − + −
+ − +
− + − + 


− + −
+ − + − 
+ − +
− + − +
donde el + significa que el adjunto coincide con el menor complementario y el - indica que tienen signo
contrario.
Una vez vistos estos conceptos se puede definir ya:
Definición: Dada una matriz cuadrada A de tamaño n se define su determinante como la suma
CAPÍTULO 6. MATRICES Y DETERMINANTES
97
del producto de los elementos de una linea cualquiera de la matriz (fila o columna) elegida, por sus
correpondientes adjuntos.
Se puede demostrar, aunque dicha demostración excede los contenidos del curso, que el valor del
determinante no depende de la fila o columna elegida para calcularlo.


−2 4 5
Ejemplo: Para la matriz A =  6 7 −3 ,aplicando la definición, si elegimos la fila tercera queda:
3 0 2
4 5 −2 5 −2 4
=
det(A) = 3 · + 0 · −
+2·
7 −3
6 −3
6 7
= 3 · (−12 − 35) + 0 · (−(6 − 30)) + 2 · (−14 − 24) = −141 + 0 − 76 = −217
Si hubiésemos elegido otra fila o columna, por ejemplo la columna 2, quedarı́a:
6 −3
−2 5
−2 5 +7·
det(A) = 4 · − 3 2 + 0 · − 6 −3 =
3 2 = 4 · (−(12 + 9)) + 7 · (−4 − 15) + 0 · (−(6 − 30)) = −84 − 133 + 0 = −217
Ejercicio: Calcula, desarrollando por la fila que tú elijas los determinantes de las matrices:








1 8 1
3 4 −6
7 8 0
0 3 1
1 7 0 
2 −1 1 
0 −7 3
−2 0 2
1 6 −1
5 3 −5
1 0 1
3 4 0

1
1

1
0
6.9.
1
1
0
1
1
0
1
1

0
1

1
1

1
2

3
3
2
1
1
4
3
3
4
1

4
1

3
2

1
2

2
3

0 −1 2
3 2 −2

4 2
1
1 5 −3
La regla de Sarrus
La definición de determinante es bastante engorrosa y se hace mucho más pesada a medida que
aumenta el orden de la matriz A.
En el caso de las matrices cuadradas de orden 3, esta regla facilita el cálculo de dichos determinantes.


a11 a12 a13
Si la matriz es A = a21 a22 a23 , entonces el determinante de A se calcula mediante la resta
a31 a32 a33
de dos expresiones obtenidas del siguiente modo:
Llamaremos sumandos positivos a los obtenidos al multiplicar:
- Los elementos de la diagonal principal,a11 · a22 · a33 .
- Los elementos de la linea paralela superior a la diagonal principal por el elemento aislado de la
esquina inferior izquierda:a12 · a23 · a31 .
- Los elementos de la linea paralela inferior a la diagonal principal por el elemento aislado de la
esquina superior derecha:a21 · a32 · a13 .
CAPÍTULO 6. MATRICES Y DETERMINANTES
98
Gráficamente:
Figura 6.2: Sumandos positivos
Llamaremos sumandos negativos a los obtenidos al multiplicar:
- Los elementos de la diagonal secundaria,a13 · a22 · a31 .
- Los elementos de la linea paralela superior a la diagonal secundaria por el elemento aislado de la
esquina inferior derecha: a12 · a21 · a33 .
- Los elementos de la linea paralela inferior a la diagonal secundaria por el elemento aislado de la
esquina superior izquierda: a32 · a23 · a11 .
Gráficamente:
Figura 6.3: Sumandos negativos
Y entonces det (A)= Sumandos positivos - Sumandos negativos.
Por ejemplo, en el caso de la matriz anterior:


−2 4 5
A =  6 7 −3
3 0 2
, se tiene que aplicando la regla de Sarrus:
det(A)=(-2)·7·2+4·3·(-3)+6·5·0-(3·7·5+0·(-2)·(-3)+6·4·2)=-28-36-105-48=-217.
Ejercicio: Comprobar, mediante la regla de Sarrus, los determinantes de orden 3 obtenidos en el
ejercicio anterior.
6.10.
Propiedades de los determinantes
Algunas propiedades importantes que tienen los determinantes, y que se enuncian sin demostración,
son:
1. Si una matriz tiene una linea (fila o columna) de ceros, el determinante vale cero.
Esta propiedad es evidente, puesto que por definición de determinante, basta elegir dicha linea
para desarrollar y el determinante será 0.
CAPÍTULO 6. MATRICES Y DETERMINANTES
99
2. Si una matriz tiene dos filas iguales o proporcionales, su determinante es nulo.
3. Si permutamos dos lineas paralelas de una matriz cuadrada, su determinante cambia de signo,
por ejemplo:
0 1
0 1
2
−3
2
−3
1 3
1 3
2 −5
2 −5
= 91 =⇒ = −91
2 4
3
1 3 −2 −8 1 2 4
3 −2 −8 1 3
1
4. Si multiplicamos todos los elementos de una linea de un determinante por un número, el determinante queda multiplicado por ese número. Por ejemplo:
0 1
0 1
2 −3
2
−3 1 3
2 6
2 −5
4 −10
= 91 =⇒ = 182
2 4
3
1 3
1 2 4
3 −2 −8 1 3 −2 −8
1 0 2
4
−6 2 6
4
−10
pero = 16 · 91 = 1456
6
2 4 8
6 −4 −16
2 5. Si a una linea de una matriz se le suma otra linea multiplicada por un número, el determinante
no cambia.
Esta propiedad permite utilizar un método más sencillo para calcular determinantes de orden
mayor que 3.
6. El determinante de una matriz es igual al de su traspuesta,
|A| = |At|
7. Si A tiene matriz inversa, A−1 , se verifica que:
det(A−1 ) =
1
det(A)
Una estrategia a tener en cuenta en este caso de determinantes de orden 4 o superior, o incluso de
orden 3 si la matriz es compleja, es el método de “hacer ceros”, puesto que el valor del determinante
no varı́a al realizar a la matriz ciertas transformaciones elementales en filas,como indica la propiedad
5 anterior, si bien hemos de ser cuidadosos al aplicar dicha propiedad.
Ası́ pues la mejor forma de calcular un determinante es hacer ceros en una fila o columna y
desarrollar por dicha fila o columna, porque entonces sólo tendremos que calcular un adjunto. Por
ejemplo, si calculamos:
0 1
0
0 1
2 −3
1
2
−3
2 −3
1 3
2 −5 F4 −3·F2 1
3
2
−5
2 −5 F3 −2·F2 1 3
= = =
2 4
3
1 0 −2 −1 11 0 −2 −1 11 3 −2 −8 1 0 −11 −14 16 3 −2 −8 1 Desarrollando por la columna 1

 1
2
−3
= 1 · − −2 −1 11  =
−11 −14 16 = −(−16 − 242 − 84 − (−33 − 154 − 64)) = 91
CAPÍTULO 6. MATRICES Y DETERMINANTES
100
Como hemos dicho, hemos de tener especial cuidado al aplicar esta regla con determinantes, puesto
que no podemos hacer las mismas operaciones que con las matrices, lo que puede confundir.
Por ejemplo, si queremos calcular el determinante:
1 2 3
C = 0 1 2
4 1 5
mediante la regla de Sarrus es:
det(C)=5+16+0-(12+2+0)=21-14=7.
Si hiciésemos ceros en la primera columna, y desarrollásemos nos deberı́a dar lo mismo. Ahora
bien,podemos hacer cero el 4 de la primera columna mediante:
1 2
1 2 3
3
1
2 1 0 1 2 F3 −4·F
2 =
= −7 + 14 = 7.
= 0 1
−7 −7
0 −7 −7
4 1 5
lo que es correcto. Sin embargo, si queremos hacer cero el 1 de la primera columna serı́a un error
hacer:
1 2 3
4·F1 −F3 0 7 7
0 1 2 −→ 0 1 2 = 4 · 7 7 = 4 · (14 − 7) = 28.
1 2
4 1 5
4 1 5
no obtenemos lo mismo, porque hemos multiplicado la fila sustituida por un número y eso altera el
valor del determinante. Luego la fila a sustituir conviene no multiplicarla, como en el primer ejemplo,
puesto que si no nos damos cuenta, podemos variar el valor del determinante.
6.11.
Relación entre la inversa y los determinantes
Hay una estrecha relación entre la inversa de una matriz cuadrada y su determinante. De hecho se
verifica que:
Propiedad: Una matriz cuadrada A tiene inversa ⇐⇒ |A| =
0.
−1
Además, en este caso, la matriz inversa de A, A se calcula de la manera:
A−1 =
(Adj(A)t
|A|
donde Adj(A) denota la matriz adjunta de A, es decir, aquella que se obtiene de sustituir cada elemento
de A por su adjunto.


1 0 −1
Ejemplo: Calcular, si es posible, la inversa de la matriz A =  0 1 −3.
−1 1 0
1 0 −1
En primer lugar,|A| = 0 1 −3 = 0 + 0 + 0 − (1 − 3 + 0) = 2 y por tanto A tiene inversa.
−1 1 0 Calculando Adj(A), se obtiene:

 1 −3 − 0 −3 0 1
−1 0 −1 1  
 1 0 
 
3
3
1
 0 −1 1 −1
1 0
 

Adj(A) = 
− 1 0 −1 0 − −1 1 = −1 −1 −1
 
1
3
1
 0 −1
1 −1
1 0 
−
1 −3
0 −3
0 1
CAPÍTULO 6. MATRICES Y DETERMINANTES
Por tanto,
101


3 −1 1
(Adj(A)t) = 3 −1 3
1 −1 1
Y entonces, se obtiene:
3
A−1 =
2
3
2
1
2
−1
2
−1
2
−1
2

1
2
3
2
1
2
Ejercicio: Calcular la inversa anterior por el método de Gauss.
6.12.
Aplicación de los determinantes al cálculo del rango
Los determinantes también proporcionan una forma sencilla de calcular el rango de una matriz
cualquiera.
Un definición alternativa de rango de una matriz es:
El Rango de una matriz A es el tamaño del mayor menor complementario no nulo que esté incluido
dentro de la matriz.
Aplicando este criterio, calculemos el rango de las matrices siguientes:


1 1 0
1 1
0 3
2
4
6


A=
B=
C=
2 1 1
D=
2 2
1 1
−1 −2 −3
−1 1 −2
a) Sólo hay un menor de orden 2, que es:
1 1
2 2 = 0
Como es nulo, el rango de la matriz NO es 2. Menores de orden 1 hay 4, por ejemplo |1| = 1, que es
no nulo,luego el rango de la matriz es Rg(A)=1 (el tamaño de dicho menor complementario).
b) Sólo hay un menor de orden 2, que es:
0 3
1 1 = 0 − 3 = −3
Como no es nulo, el rango de la matriz es Rg(B)=2 (el tamaño de dicho menor complementario).
c) Sólo hay un menor de orden 3, que es:
1 1 0
2 1 1 = −2 − 1 + 0 − (0 + 1 − 4) = −3 + 3 = 0
−1 1 −2
Como es nulo, podemos asegurar que el rango NO es 3.
Menores de orden 2 hay 9. Calculando alguno:
1 0
1 1 = 1
resulta que es no nulo, luego el rango es Rg(C)=2 (el tamaño de dicho menor complementario).
d) El menor más grande que podemos formar es de orden 2. Hay 3 de ellos:
2
2
4
4 6 6 −1 −2 = −4 + 4 = 0
−1 −3 = −6 + 6 = 0
−2 −3 = −12 + 12 = 0
CAPÍTULO 6. MATRICES Y DETERMINANTES
102
Son todos nulos, luego el rango NO es 2. Menores de orden 1 hay 6, y por ejemplo |6| = 6 = 0, es no
nulo, luego el rango es Rg(D)=1.
Ejercicio Calcula,utilizando los determinantes, el rango de

0
1 0 1
A=
B = 1
2 1 0
0



2 −1 1 1
2
0 0 1 0



C =
D = −1
2 1 1 1
1
0 0 0 1
las matrices:

2 1
0 −1
4 2

1 5 −1 8
2 3
4
5
3 10 11 13
Capı́tulo 7
SISTEMAS DE ECUACIONES
LINEALES
7.1.
Introducción
Se denomina ecuación lineal a aquella que tiene la forma de un polinomio de primer grado, es decir,
las incógnitas no están elevadas a potencias, ni multiplicadas entre sı́, ni en el denominador.
Por ejemplo, 3x + 2y + 6z = 6 es una ecuación lineal con tres incógnitas.
Como es bien sabido, las ecuaciones lineales con 2 incógnitas representan una recta en el plano.
Si la ecuación lineal tiene 3 incógnitas, su representación gráfica es un plano en el espacio.
Un ejemplo de ambas representaciones puede observarse en la figura:
Figura 7.1: Representación gráfica de la recta −x + 2y = 3 en el plano y del del plano x + y + z = 1
en el espacio
El objetivo del tema es el estudio de los sistemas de ecuaciones lineales, es decir, un conjunto de
varias ecuaciones lineales. Diremos que dos ecuaciones son equivalentes si tienen las mismas soluciones,
o geométricamente representan la misma recta o plano.
109
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
7.2.
110
Sistemas de ecuaciones lineales
Un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales de la forma:

a11 · x1 + a12 · x2 + a13 · x3 + · · · + a1n · xn = b1 


a21 · x1 + a22 · x2 + a23 · x3 + · · · + a2n · xn = b2 
..

.



am1 · x1 + am2 · x2 + am3 · x3 + · · · + amn · xn = bm
En este caso tenemos m ecuaciones y n incógnitas.
Los números reales aij se denominan coeficientes y los xi se denominan incógnitas (o números a
determinar) y bj se denominan términos independientes.
En el caso de que las incógnitas sean 2 se suelen designar simplemente por x e y en vez de x1 y x2
, y en el caso de tres, x, y, z en lugar de x1 , x2 y x3 pero esto es indiferente a la hora de resolver el
sistema.
Resolver el sistema consiste en calcular las incógnitas para que se cumplan TODAS las ecuaciones
del sistema simultáneamente.
Diremos que dos sistemas son equivalentes cuando tienen las mismas soluciones.
7.3.
Expresión matricial de un sistema
Cualquier sistema de ecuaciones lineales se puede expresar en forma matricial del modo:
    

x1
b1
a11 a12 a13 . . . a1n
 a21 a22 a23 . . . a2n   x2   b2 
    

 ..
..
..
..  ·  ..  =  .. 
.
.
 .
.
.
.
.   .   . 
am1 am2 am3 . . . amn
xn
bm
mxn

nx1
mx1

 
a1n
x1
x2 
a2n 

 
..  se llama matriz de coeficientes, la matriz X =  .. 

 . 
.
am1 am2 am3 . . . amn
xn
 
b1
 b2 
 
se llama matriz de incógnitas, y la matriz B =  .  se llama matriz de términos independientes.
 .. 
bm
La matriz formada por A y B conjuntamente, es decir:


a11 a12 a13 . . . a1n b1
 a21 a22 a23 . . . a2n b2 


(A|B) =  .
..
..
.. .. 
..
 ..
.
.
.
. . 
am1 am2 am3 . . . amn bm
a11
 a21

La matriz A =  .
 ..
a12
a22
..
.
a13
a23
..
.
...
...
..
.
se llama matriz ampliada del sistema y se representará por (A|B) o bien por A∗ .

x+y−z = 5 
Ejemplo: El sistema:
x+y =7
escrito matricialmente es:

2x + 2y − z = 12

    
1 1 −1
x
5
1 1 0  ·  y  =  7 
2 2 −1
z
12
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
111
y la matriz ampliada es:

1 1 −1 5
(A|B) = 1 1 0 7 
2 2 −1 12

7.4.
Tipos de sistemas
En general,buscaremos las soluciones de los sistemas en los números reales R. Dependiendo del
posible número de tales soluciones reales que tenga un sistema, éstos de pueden clasificar en:

→ S.I.
 * INCOMPATIBLES (No tienen solución)
* DETERMINADOS (Solución única)→ S.C.D.
 * COMPATIBLES (Tienen solución)
* INDETERMINADOS (Infinitas soluciones)→ S.C.I.
7.5.
Sistemas con dos incógnitas
Los sistemas más sencillos son aquellos en los que sólo hay dos incógnitas y 2 ecuaciones, y que ya
son conocidos de cursos pasados.
Hay varios sistemas para resolverlos, los más habituales:
* Reducción
* Igualación
* Sustitución
en los que ya no nos entretendremos.
Como cada ecuación lineal con 2 incógnitas se interpreta geométricamente como una recta, el estudio
de la solución del sistema se limita a estudiar la posición de 2 rectas en el plano.
Veamos algunos ejemplos con los tres casos que se pueden presentar. Resolver e interpretar el
x + 2y = −3
sistema:
.
−2x + y = 1
Por reducción:
2x+4y=-6
-2x+ y=1
5y=-5
de donde y = -1 y sustituyendo x + 2·(-1) = -3, x = -1.
Es decir, la solución del sistema es única, x = -1, y = -1 lo que significa que el sistema es compatible
y determinado, y que las rectas se cortan en un punto, precisamente el (-1,-1):
Figura 7.2: Solución del sistema, punto (-1,-1)
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
112
x + 2y = −3
Resolver e interpretar el sistema:
.
−2x − 4y = 5

x = −3 − 2y
5 + 4y
de donde:
Por igualación:

x=
−2
−3 − 2y =
5 + 4y
=⇒ 4y + 6 = 5 + 4y =⇒ 0y = −1 =⇒ 0 = −1
−2
lo cuál es imposible y por tanto el sistema no tiene solución, es un sistema incompatible y por
tanto las rectas son paralelas. Geométricamente:
Figura 7.3: Sistema sin solución. Rectas paralelas
x + 2y = −3
Resolver e interpretar el sistema:
.
3x + 6y = −9
Por sustitución, como x = −2y − 3 resulta 3(−2y − 3) + 6y = −9, es decir −6y − 9 + 6y = −9, por
tanto 0y = 0, 0 = 0.
Como 0 = 0 es una igualdad siempre cierta, quiere decir que el sistema tiene infinitas soluciones,
es compatible indeterminado, o que las rectas son la misma.
Figura 7.4: Infinitas soluciones. Las rectas coinciden
Lo expresaremos ası́. Como x = −2y − 3, dando valores a y se obtiene x.
Ası́ si le damos a y el valor arbitrario de λ (lambda), entonces expresaremos la solución como:
x = −2λ − 3
siendo λ ∈ R
y=λ
y como λ puede ser cualquier número real, hay infinitas soluciones.
Estos son los únicos casos que pueden darse con dos ecuaciones y dos incógnitas, y su interpretación
geométrica.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
113
Ejercicio: Estudiar la solución de los siguientes sistemas e interpretarla geométricamente:
x+y = 5
2x + y = 1
x + 2y = 3
b)
c)
a)
2x − y = 7
3x + 2y = 4
x−y = 4
7.5.1.
Discución de sistemas de 2 ecuaciones con 2 incógnitas
ax + 3y = 5
Si alguno de los coeficientes del sistema es desconocido, por ejemplo,
, no estamos
2x − y = 6
ante un sólo sistema, sino ante infinitos, uno para cada valor de a, y cada sistema será distinto en
función del valor que tome dicha letra (llamada parámetro).
Para estudiarlo, se resuelve el sistema como habitualmente y se estudian los distintos casos que se
pueden dar. Por ejemplo , por reducción:
ax+3y=5
6x-3y=18
ax+6x =23
por tanto, x(6 + a) = 23. Entonces, si 6 + a = 0 no podremos despejar x, es decir si a = −6, obtenemos
una ecuación del tipo 0 = 23, es decir, imposible.
Por tanto, si a = −6 el sistema es incompatible.
23
, y se puede sacar y sustituyendo, por tanto,
En cualquier otro caso, podemos despejar x,x =
6+a
si a = −6, el sistema es compatible determinado.
Ejercicio: Discutir los sistemas en función del parámetro desconocido:
1
x+y =5
ky + x =
a)
b)
2
ax + 2y = 10
y − 3x = 5
7.6.
Sistemas de 2 incógnitas y 3 ecuaciones
Podemos añadir a los clásicos sistemas de 2 ecuaciones y 2 incógnitas cuantas ecuaciones queramos
para obtener diferentes tipos de sistemas con 3, 4, 5 o más ecuaciones.
En cualquier caso, los tipos de sistemas a los que dan lugar son los mismos reseñados anteriormente.
Al aumentar el número de ecuaciones, la resolución del sistema por alguno de los tres métodos
clásicos se vuelve más farragoso, por lo que conviene aplicar ya el conocido método de Gauss para
determinar el tipo de sistema.
Para ello expresaremos el sistema en la forma matricial, analizando la matriz ampliada asociada,
que tendrá 2 columnas y tantas filas como ecuaciones tengamos.
Analizaremos tan sólo aquellos sistemas con 3 ecuaciones y 2 incógnitas.
La matriz ampliada genérica es:


a11 a12 b1
(A|B) = a21 a22 b2 
a31 a32 b3
Aplicar el método de Gauss consiste en realizar transformaciones elementales mediante las filas de la
matriz para obtener la matriz escalonada siguiente:


a11 a12 b1
(A|B) =  0 a∗22 b∗2 
0
0 b∗3
Recordemos que las operaciones elementales permitidas en las filas de la matriz (ecuaciones del sistema)
eran:
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
114
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
Utilizando estas transformaciones, los sucesivos sistemas que se obtienen son equivalentes al primero, es decir, tienen las mismas soluciones.
Debemos eliminar, en este orden, el elemento a21 utilizando la fila 1, el elemento a31 , utilizando
también la fila 1, y por último el elemento a32 utilizando la fila 2, de modo análogo al método de
Gauss-Jordan para la inversa.
Además, es conveniente en cada paso indicar la operación realizada con las filas, poniendo en
primer lugar aquella que se va a sustituir por otra.
Llegados a la matriz ampliada escalonada al final del proceso, pueden darse los casos siguientes:
1. a∗22 = 0. Entonces hay dos posibilidades:
a)
b∗3 = 0. Sistema incompatible (hay una ecuación del tipo 0=k), sin solución.
Geométricamente, puede ocurrir que:
a) Dos rectas sean paralelas y la otra las corte.
b) Las rectas se corten dos a dos (formen un triángulo).
b) b∗3 = 0. Aparece una ecuación 0=0 que no influye en la resolución del sistema, que reducido a las dos ecuaciones iniciales tiene solución única, es decir, el Sistema es Compatible
Determinado.
Geométricamente:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
2. a∗22 = 0. Entonces hay tres posibilidades:
a)
Si b∗2 = b∗3 = 0, aparecen dos ecuaciones 0=0, que no influyen en la resolución del sistema, que ahora tiene infinitas soluciones (1 ecuación y dos incógnitas). Sistema compatible
indeterminado.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
115
Geométricamente, las tres rectas coinciden (son la misma):
b) Si b∗2 = 0, b∗3 = 0 o bien b∗2 = 0, b∗3 = 0, aparece una ecuación 0=0 (que no influye) y otra
0=k (que es imposible). El sistema es incompatible.
Geométricamente:
a) Dos rectas son paralelas y la otra las corta.
b) Dos rectas coinciden y la otra es paralela.
c) Si b∗2 = 0, b∗3 = 0, hay dos ecuaciones 0=k que son imposibles, el sistema es incompatible.
Geométricamente, las tres rectas son paralelas o dos son coincidentes y una paralela.
En cada uno de los casos, para determinar la posición concreta de las rectas, basta representarlas.
Ejemplo Estudiar el sistema siguiente, dando la interpretación geométrica:

−x + 2y = 5 
3x + y = 7

2x + 3y = 12
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
A partir de la matriz ampliada

−1
(A|B) =  3
2
y aplicando el método


−1
2 5
F +3F1 
0
1 7  −−2−−−→
F3 +2F1
0
3 12
116
de Gauss, obtenemos:



−1 2 5
2 5
F −F2 
0 7 22
7 22 −−3−−→
0 00
7 22
En este caso aparece una ecuación 0=0 que no influye y el elemento a∗22 es no nulo. El sistema es
compatible determinado, tiene solución única.
Geométricamente, puede ocurrir que:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
Resolviendo y dibujando, obtenemos:
−x + 2y = 5
7y = 22
9
22
y sustituyendo es x = (compruébalo).
De donde y =
7
7
Dibujando las rectas:
9 22
Figura 7.5: Solución del sistema. Las tres rectas se cortan en un punto: P= ,
7 7
que las rectas se cortan en un punto, precisamente el punto solución del sistema: P =
se observa
9 22
,
.
7 7
Ejercicios
a) Resuelve e interpreta geométricamente los sistemas:


 x+y =0
 x − y = −2
a) −x + y = 2 b)
x + 2y = 1


x + 3y = −2
4x − 10y = −14

 2x + y = 2
c) −x + y = −3

y = −2x
b) Discute y resuelve en función del parámetro:


 x−y = 1
 2x + y = 3
a) x + 2y = −1 b) −x + 3y = 0


2x + my = 0
mx + 4y = 3
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
7.7.
117
Sistemas de 3 ecuaciones y 3 incógnitas
Cuando los sistemas tienen más de dos ecuaciones y tres o más incógnitas se utilizará el ya conocido
método de Gauss.
Ahora partiremos de la matriz ampliada:


a11 a12 a13 b1
(A|B) = a21 a22 a23 b2 
a31 a32 a33 b3
para dejar dicha matriz escalonada, es decir, del tipo:

a11 a12 a13
 0 a∗22 a∗23
0
0 a∗33

b1
∗
b 
2
b∗
3
utilizando las transformaciones conocidas, y de la forma indicada en ocasiones anteriores.
Los tipos de sistema que pueden obtenerse dependiendo del número de soluciones son los reseñados
en apartados anteriores.
Al aplicar el método de Gauss podemos encontrarnos con distintos casos:
* Si se obtiene un sistema escalonado con coeficientes no nulos, el sistema es compatible determinado, tiene solución única.
* Si se obtiene una o más filas en las que todos los elementos sean cero, el sistema tiene infinitas
soluciones, y hay que despejar una o varias incógnitas en función de otras, es un sistema compatible
indeterminado.
* Si se obtiene una o más filas de ceros, salvo el elemento correspondiente al término independiente,
que es distinto de cero, digamos k, entonces como la fila en cuestión corresponderı́a a una ecuación
del tipo 0 = k , lo que es imposible, el sistema no tiene solución y por tanto es incompatible.
Veamos un ejemplo:

 2x + y − z = 11
Ejemplo Resolver por el método de Gauss:
x − 3y = −20 .

4x + 2y + 5z = 8


2 1 −1 11
La matriz ampliada es (A|B) = 1 −3 0 −20. Aplicando el método de Gauss:
4 2
5 8




2 1 −1 11
2 1 −1 11
 2x + y − z = 11
2F2 −F1


1 −3 0 −20 −
−7y + z = −51
−−−−→ 0 −7 1 −51 =⇒

F3 −2F1
0 0
7 −14
7z = −14
4 2
5 8

obtenemos un sistema escalonado, que es compatible y determinado, pués podemos despejar z,
obteniendo z = −2, y luego −7y − 2 = −51, de donde −7y = −49 es decir y = 7 y sustituyendo en la
primera ecuación es 2x + 7 + 2 = 11, luego 2x = 2 , es decir x = 1.
La solución es (1, 7, −2).
Este proceso de resolución, que comienza calculando z y permite calcular las demás incógnitas
sustituyendo en las ecuaciones anteriores se denomina sustitución regresiva.
7.7.1.
Interpretación geométrica de los sistemas con 3 ecuaciones y 3 incógnitas
Como cada ecuación lineal con 3 incógnitas corresponde a un plano en el espacio, la solución del
sistema correspoderá a la posición en que dichos planos estén en el espacio.
Lo más sencillo es saber que ocurre con los planos 2 a 2, pues en el espacio dos planos sólo pueden
estar en 3 posiciones:
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
118
* Son coincidentes: Lo cuál es fácil de saber porque sus correspondientes ecuaciones tienen coeficientes de las incógnitas y los términos independientes proporcionales, es decir, si los planos son:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
B
C
D
A
= = = A
B
C
D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5, y −10x − 15y + 5z = −15 son coincidentes.
* Son paralelos: También es sencillo de saber porque los coeficientes de las incógnitas son proporcionales, pero los términos independientes NO. Es decir, en este caso:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
B
C
D
A
= = = A
B
C
D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5 y −10x − 15y + 5z = 7 son paralelos.
* Son secantes: Simplemente los coeficientes no son proporcionales, es decir:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
B
C
D
A
= = = A
B
C
D
(siempre que se puedan realizar las divisiones, y basta con que un par de ellas correspondientes a las
incógnitas sean diferentes).
Por ejemplo, los planos 7x + 3y − z = 5 y −10x − 15y + 5z = 7 son secantes.
Puesto que podemos determinar la posición de los planos 2 a 2, podemos determinar en qué posición
se encuentran los 3 a la vez, fijándonos en los casos:
1. Si el sistema es S.C.D. (Solución única), es que los tres planos se cortan en un punto, que es la
solución del sistema.
2. Si el sistema es S.C.I. (Infinitas soluciones), puede ocurrir que:
a)
Los tres planos se corten en una recta.
b) Dos planos son coincidentes y el otro los corta en una recta.
c) Los tres planos son coincidentes.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
119
Y determinaremos la opción correspondiente estudiándolos de dos en dos.
3. Si el sistema es S.I. (Sin solución), puede ocurrir que:
a)
Los planos se cortan dos a dos.
b) Dos planos son paralelos y el otro los corta.
c) Los tres planos son paralelos.
d ) Dos planos son paralelos y el otro coincidente con uno de ellos.
Y determinaremos la opción correspondiente estudiándolos de dos en dos.
Ejemplo: Estudiar el sistema e interpretarlo geométricamente:

 2x + y − z = −6
3x − y + z = −5

4x + 2y − 2z = −1


2 1 −1 −6
Aplicando Gauss a (A|B) = 3 −1 1 −5, se obtiene:
4 2 −2 −1





2 1 −1 −6
2 1 −1 −6
 2x + y − z = −6
2F2 −3F1 
8  =⇒
3 −1 1 −5 −
−
−
−
−
→
0
−5
5
−5y + 5z = 8

F3 −2F1
0 0
0 11
0 = 11
4 2 −2 −1
Lo que indica que el sistema es incompatible y por tanto no tiene solución, los planos no tienen puntos
comunes.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
120
Si estudiamos la posición de los planos 2 a 2, se obtiene que el primero y el segundo tienen
coeficientes que no son proporcionales, luego se cortan.
El primero y el tercero tienen coeficientes proporcionales pero no los términos independientes,
luego son paralelos.
Y el segundo y el tercero no tienen coeficientes proporcionales, por lo que se cortan.
Concluimos por tanto que los planos primero y tercero son paralelos y son cortados por el segundo
plano, ésta es la interpretación geométrica:
Ejercicios: Estudiar e interpretar geométricamente los sistemas:



 2x − y + 3z = −1
 x+y+z = 2
 x + y − z = −2
a) 4x − 2y + 6z = −5 b) 2x + y + 3z = 1 c) 2x − y + 3z = −5



−2x + y − 3z = −7
x + 2y + z = 4
3x + 2z = −7
7.7.2.

 x+y+z = 8
d) 7x + y + 6z = 7

x + 7y + z = 1
Discusión de sistemas de 3 ecuaciones y 3 incógnitas
Si aparece algún coeficiente desconocido,aplicaremos el método de Gauss e investigaremos según
los valores del parámetro la posibilidad de que aparezca o no una fila de ceros.

 x+y+z = m+1
Ejemplo: Discutir según los valores de m el sistema: mx + y + (m − 1)z = m

x + 7y + z = 1
Aplicando Gauss a la matriz ampliada:




1
1
1 m + 1
1 1
1 m + 1
F2 −mF1
F −F1
m 1 m − 1 m  −
−−−−→ 0 1 − m −1 −m2  −−3−−→
(m=0)
1
7
1 1
1 m
1 1




1
1
1 m + 1
1
1
1 m + 1
F −F1
F3 +F2
0 1 − m −1 −m2  −
−−3−−→
−−−→ 0 1 − m −1 −m2 
0 m − 1 0 −m
0
0
−1 −m − m2
Debemos, llegados a este punto, fijarnos en dos aspectos:
a) El desarrollo anterior sólo es posible si m = 0, luego el caso m = 0 debe estudiarse por separado.
b) En el sistema escalonado final, hay problemas cuando el valor 1 − m = 0, es decir, cuando
m = 1. En cualquier otro caso, no hay problemas.
De modo que, resumiendo, si m = 0 y m = 1, el sistema es S.C.D.
Estudiemos ahora cada caso por separado:
Si m = 0, al aplicar Gauss, queda:






1 1
1 1
1 1 1 1
1 1 1 1
F3 −F1
F +F2
0 1 −1 0
0 1 −1 0 −
−−−→ 0 1 −1 0 −−3−−→
0 −1 0 0
0 0 −1 0
1 0 1 1
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
121
que vuelve a ser S.C.D.
Si m = 1, al aplicar Gauss queda:

1 1 1 1
0 0 −1 −1
0 0 −1 −2

Se obtienen dos valores distintos de z, lo que es absurdo y el sistema en este caso no tiene solución
(S.I.)
Conclusión:
* Si m = 1 S.I.
* Si m = 1 S.C.D.
Ejercicios:
1. Discutir en función del parámetro desconocido los sistemas siguientes e interpretar geométricamente el resultado:


x + y + az = 1
 x + y − 6z = 0
a) x + ay + z = 1 b)
x − 2y + 6z = 0


ax + y + z = 1
3x + −y + mz = 0


 3x + y + 2z = 1 − a
x + y + az = a2
c) (1 + a)x + 2y + z = a d) x + ay + z = a


ax + y + z = 1
ax − y + z = 1 − a

 x + 2y − z = 8
2. Dado el sistema 2x − 3y + z = −1 , se pide:

3x − y + kz = 5
a) Hallar el valor de k que hace el sistema incompatible.
b) Hallar el valor de k que hace el sistema compatible y además z= -1.
c) Para el valor de k hallado en b), resolver el sistema.
7.8.
7.8.1.
Aplicación de las matrices y determinantes a la resolución de
sistemas. Regla de Cramer
Aplicación de las matrices
Si tenemos un sistema con el mismo número de ecuaciones que de incógnitas ( un sistema de ese
tipo de llama cuadrado), entonces la matriz A de coeficientes es cuadrada y podemos escribir el sistema
matricialmente ası́:
A·X =B
donde A,X y B son las matrices ya definidas de coeficientes, incógnitas y términos independientes
respectivamente.
Como el objetivo es calcular la matriz X de incógnitas, el problema estarı́a resuelto si conseguimos
despejar X de dicha ecuación.
Sabemos que eso se puede hacer sólo cuando la matriz A posee inversa, y en ese caso aplicarı́amos
que:
A · X = B =⇒ A−1 · A · X = A−1 · B =⇒ I · X = A−1 · B =⇒ X = A−1 · B
es decir podrı́amos calcular X, y el sistema tendrı́a solución única.
Si A no posee inversa, no podemos despejar X y el sistema no se puede resolver de esta manera.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
122
Conclusión: En un sistema cuadrado y cuya matriz de coeficientes tenga inversa, la solución del
sistema viene dada por:
X = A−1 · B

 2x + y − z = 11
Ejemplo: Resolver, aplicando la inversa, el sistema:
x − 3y = −20 .

4x + 2y + 5z = 8


2 1 −1
La matriz de coeficentes es 1 −3 0 .
4 2
5
Para poder aplicar lo anterior es necesario que A tenga inversa, lo que por ejemplo comprobamos
haciendo det (A).
Como det(A) = −49, no nulo, A tiene inversa. Por tanto y según lo dicho,X = A−1 · B , es decir:

  
−1 
11
x
2 1 −1
y  = 1 −3 0  · −20
8
z
4 2
5
Si hacemos la inversa de A (¡compruébalo!), resulta:
 15
A−1 =
y por tanto,
   15
x
49
y  =  5
49
−2
z
49
49
 5
49
−2
49
1
7
−2
7
0
1
7
−2
7
0

3
49
1 
49
1
7
 
3
49
1 
49
1
7
  
11
1
· −20 = 2
8
7
es decir x=1, y=7 , z=-2 , solución que ya habı́amos obtenido utilizando el método de Gauss.
7.8.2.
Regla de Cramer
En el caso de sistemas que cumplan las mismas condiciones que los del anterior apartado, es decir,
que sean cuadrados y tales que su matriz de coeficientes tenga inversa (los sistemas que cumplen estas
dos condiciones se llaman sistemas de Cramer ), se puede aplicar una regla muy sencilla para calular
la solución y que se basa en los determinantes, conocida como regla de Cramer.
Si det(A) es cero, evidentemente la regla no se puede aplicar.
La regla de Cramer:
Para un sistema de Cramer (cuadrado y con matriz regular) se verifica que la incónita número k
se calcula dividiendo entre el determinante de A el determinante que resulta de sustituir la columna
k (correspodiente al lugar que ocupe la incógnita que se está calculando) por la columna de términos
independientes.

 2x + y − z = 11
x − 3y = −20 .
Ejemplo: Resolver el sistema

4x + 2y + 5z = 8
Como el sistema es de Cramer puesto que det(A) = −49, aplicamos la regla de Cramer:
Para x sustituimos la primera columna por la de términos independientes pues x es la primera
incógnita:
11
1 −1
−20 −3 0 8
2
5 −49
=
=1
x=
−49
−49
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
123
Para y sustituimos la segunda columna por la de términos independientes pues y es la segunda incógnita.
2 11 −1
1 −20 0 4
8
5 −343
=
=7
y=
−49
−49
Para z sustituimos la tercera columna por la de términos independientes pues z es la tercera incógnita).
2 1
11 1 −3 −20
4 2
8 98
=
= −2
x=
−49
−49
Y obtenemos la solución como antes.
Recordemos que esto sólo se puede aplicar para sistemas de Cramer.
Ejercicio: Resolver, mediante estos dos métodos, los sistemas:



3x − 2y + z = −1
x+y+z = 6
 3x + y + z = 2
a)
2x + y − z = 2
b) x − y + 2z = 5 c) 2x + 2y + z = 5



x − 3y + z = 0
x+y−z = 0
x−y +z = 0
7.9.
Estudio de sistemas cualesquiera mediante el cálculo del rango.
Teorema de Rouché-Frobenius
Saber si un sistema tiene o no solución (si es compatible), y cuántas soluciones tiene (si es determinado o indeterminado), se reduce para cualquier tipo de sistemas a estudiar rangos. El resultado
fundamental es el:
Teorema de Rouché-Frobenius:
Un sistema cualquiera de matriz A y matriz ampliada (A|B) tiene solución (es compatible) si y
solamente si Rg(A) = Rg(A|B).
Por tanto si los dos rangos son distintos el sistema no tiene solución (S.I.).
Además, si dicho rango coincide con el número de incógnitas del sistema, la solución es única
(S.C.D.), y si dicho rango es menor que el número de incógnitas, hay infinitas soluciones (S.C.I.).
Es importante darse cuenta de que Rg(A) ≤ Rg(A|B), puesto que la matriz de coeficientes forma
parte de la ampliada, es decir, la matriz A no puede tener rango mayor que la ampliada.
Aún siendo importante, el único problema que plantea este teorema es que NO ofrece ningún método
para calcular la solución, sólamente dice si hay solución o no.
Ejercicio: Aplicar el teorema de Rouché para determinar el tipo de sistema que es:



x+y−z+t = 4

 2x − y = 1
 x + 3y = 3
3x + 3y − z = −1
a)
2x − y + 3z + 2t = −1
b) x + 3y = −2 c) 3x + 5y = 7 d)
x + y − 5z = 2



−4x + 5y − 11z − 4t = 11
5x − 4y = 7
2x + 4y = 5
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES
7.10.
124
Sistemas homogéneos
Un sistema homogéneo es aquél que tiene todos los términos independientes nulos.
Cualquier sistema homogeneo es evidente que es compatible, pues dando a cada incógnita el valor
0, se cumplen las ecuaciones. Esta solución (que todas las incógnitas sean nulas) se llama solución
trivial.
El problema entonces está en determinar si dichos sistemas son compatibles determinados o indeterminados.
Aplicando el teorema de Rouché sólo podemos tener dos casos:
a) Rg (A) = nº incógnitas. En este caso el sistema es compatible determinado, y por tanto tiene
solución única que es la trivial (todas las incógnitas valen cero)
b) Rg(A) < nº incógnitas. En este caso el sistema es compatible indeterminado y tiene infinitas
soluciones que se determinan de la manera conocida.
Ejercicios:
1. Estudiar la solución de los sistemas homogéneos siguientes:

x+y−z = 0
x+y = 0
x+y+z = 0
a)
b)
c) 2x − y + z = 0
x−y = 0
2x − y + z = 0

4x + y − z = 0

 6x + 18y − bz = 0
2. Discutir el sistema homogéneo: 7x − 2y − 4z = 0 .

4x + 10y − 6z = 0
Capı́tulo 8
PROGRAMACIÓN LINEAL
8.1.
Introducción
La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste
en una serie de métodos y procedimientos que permiten resolver problemas de optimización en el
ámbito, sobre todo, de las Ciencias Sociales.
Nos centraremos en este tema en aquellos problemas simples de programación lineal, los que tienen
sólamente 2 variables, problemas bidimensionales.
Para sistemas de más variables, el procedimiento no es tan sencillo y se resuelven por el llamado
método Simplex (ideado por G.B.Danzig, matemático estadounidense en 1951).
Recientemente (1984) el matemático indio establecido en Estados Unidos, Narenda Karmarkar,
ha encontrado un algoritmo, llamado algoritmo de Karmarkar, que es más rápido que el método
simplex en ciertos casos. Los problemas de este tipo, en el que intervienen gran número de variables,
se implementan en ordenadores.
8.2.
Inecuaciones lineales con 2 variables
Una inecuación lineal con 2 variables es una expresión de la forma:
ax + by ≤ c
(donde el sı́mbolo ≤ puede ser también ≥ , < o bien >), donde a, b y c son números reales y x e y las
incógnitas.
Para resolver estas inecuaciones, se recordará de otros cursos, hay que representar gráficamente en
el plano la recta dada por la correspondiente ecuación lineal y marcar una de las dos regiones en que
dicha recta divide al plano.
Ejemplo: Si queremos resolver la inecuación: 2x + 3y ≥ −3, representamos en primer lugar la recta
2x + 3y = −3:
127
CAPÍTULO 8. PROGRAMACIÓN LINEAL
128
La recta divide al plano en dos regiones, una de las cuales es la solución de la inecuación. Para
saber qué parte es, hay dos procedimientos:
1. Se despeja la y de la inecuación, poniendo cuidado en que si en una inecuación multiplicamos o
dividimos por un número negativo, la desigualdad cambia de sentido.
En este caso tendı́amos que:
y≥
−3 − 2x
3
Observando el dibujo vemos que la recta divide al eje de ordenadas (y) en dos partes.
La solución de la inecuación será aquella parte en la que la y sea mayor que la recta, es decir, la
parte superior.
Figura 8.1: Solución de la inecuación lineal
2. Se toma un punto cualquiera que no pertenezca a la recta, por ejemplo el (1,2).
Para que dicho punto sea solución, se tendrá que cumplir la desigualdad, por lo que sustituimos
en la inecuación inicial el (1,2):
2 · 1 + 3 · 2 ≥ −3, es decir, 8 ≥ −3.
Como esta última desigualdad es evidentemente cierta, concluimos que el (1,2) es solución y
por tanto el semiplano que contiene al (1,2) es la solución, es decir el semiplano superior, como
habı́amos obtenido antes.
Cualquiera de los procedimientos es válido si se realiza con corrección.
8.3.
Sistemas de inecuaciones lineales con dos variables
Un sistema de inecuaciones lineales, por tanto, es un conjunto de inecuaciones del tipo anterior, y
resolverlo consistirá en resolver gráficamente cada inecuación (como en el caso anterior), representar
la solución en un mismo gráfico y la solución total será la parte común a todas las soluciones.
CAPÍTULO 8. PROGRAMACIÓN LINEAL
129
Ejemplo: Resolver el sistema de inecuaciones siguiente:

 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Si representamos las rectas:

 2x + 3y = −3 (recta r)
2x − y − 9 = 0 (recta s)

2x − 5y − 5 = 0 (recta t)
Figura 8.2: Solución del sistema de inecuaciones lineales
El triángulo rayado es la solución del sistema.
Además, para los problemas de programación lineal es necesario el cálculo de los vértices de la
región solución. Es sencillo su cálculo, pues se reduce a resolver sistemas de ecuaciones lineales son
dos incógnitas, que provienen de igualar las ecuaciones de las rectas correspondientes.
Por ejemplo, en este caso, si queremos el punto intersección de las rectas r y t tendremos que
resolver el sistema formado por:
2x + 3y = −3
−2x − 3y = 3
=⇒
2x − y − 9 = 0
2x − y − 9 = 0
Sumando −4y = 12 =⇒ y = −3.
Y sustituyendo que da 2x + 3(−3) = −3, es decir 2x − 9 = −3, y entonces x = 3.
Luego r y t se cortan en el punto (3,-3).
Ejercicios:
1. Calcular los otros dos vértices.
2. Resolver los sistemas de inecuaciones lineales siguientes encontrando los vértices de las regiones
que sean solución:

x + 2y ≤ 12



3x + 6y ≥ 420
3x + 5y ≤ 150
2x + y ≥ 4
a)
b)
c)
4x + 2y ≥ 290
3x + 3y ≤ 120
x
− 2y ≤ 6



x−y ≥0
CAPÍTULO 8. PROGRAMACIÓN LINEAL
130
Nota: Rectas horizontales y verticales.
En ocasiones, en estos sistemas, aparecen inecuaciones del tipo x ≥ k o bien y ≥ k, donde falta
alguna de las dos incógnitas.
Estas inecuaciones en realidad corresponden a rectas horizontales y verticales, y su representación
es bien sencilla.
Por ejemplo, la inecuación x ≤ −2 no es más que el conjunto de puntos a la izquierda de la recta
vertical que pasa por el punto x = −2, gráficamente:
Lo mismo ocurre con y ≤ 1, que será en este caso la parte inferior a la recta horizontal y = 1, es
decir:
En el caso particular de que sea x ≥ 0 o y ≥ 0, las rectas coincidirán con los ejes de coordenadas.
Ejercicios: Resolver los sistemas de inecuaciones lineales siguientes, encontrando los vértices de las
regiones que sean solución:



x + 3y ≥ 50


2x + y ≤ 10
5x + 15y ≤ 150






 9x − 8y ≥ 0

x + 3y ≤ 12
6x + 8y ≤ 120
b) 3x + 4y ≥ 60 c)
a)
0≤x≤8
x
≥
0






x≥0





0≤y≤2
y≥0
y≥0
Nota: Las dobles desigualdades como 0 ≤ x ≤ 8 se pueden desdobler en otras dos, x ≥ 0 y x ≤ 8.
CAPÍTULO 8. PROGRAMACIÓN LINEAL
8.4.
131
Problemas de optimización de una función sujeta a restricciones
En un problema de programación lineal de dos variables x e y, se trata de optimizar (hacer máxima
o mı́nima, según los casos) una función (llamada función objetivo) de la forma:
F (x, y) = A · x + B · y
sujeta a una serie de restricciones dadas mediante un sistema de inecuaciones lineales del tipo:

a1 x + b1 y ≤ c1



 a2 x + b2 y ≤ c2
..

.



am x + bm y ≤ cm
Los puntos del plano que cumplen el sistema de desigualdades forman un recinto convexo acotado
(poligonal) o no acotado, llamado región factible del problema.
Todos los puntos de dicha región cumplen el sistema de desigualdades. Se trata de buscar, entre
todos esos puntos, aquel o aquellos que hagan el valor de F(x,y) máximo o mı́nimo, según sea el
problema.
Los puntos de la región factible se denominan soluciones factibles.
De todas esas soluciones factibles, aquellas que hacen óptima (máxima o mı́nima) la función objetivo se llaman soluciones óptimas.
En general,un problema de programación lineal puede tener una, infinitas o ninguna solución.
Lo que si se verifica es la siguiente propiedad:
Propiedad:
Si hay una única solución óptima, ésta se encuentra en un vértice de la región factible, y si hay
infinitas soluciones óptimas, se encontrarán en un lado de la región factible.
Es posible que no haya solución óptima, pues cuando el recinto es no acotado, la función objetivo
puede crecer o decrecer indefinidamente.
Para resolver el problema, podemos abordarlo de dos formas, pero antes a aplicar cualquiera
de ellas siempre hay que dibujar la región factible, resolviendo el sistema de inecuaciones lineales
correspondiente, como se ha visto en los epı́grafes anteriores (la región factible puede estar acotada o
no), y se calculan los vértices de dicha región.
8.4.1.
Forma geométrica
En este caso se representa el vector director de la recta que viene dada por la ecuación de la función
objetivo,F (x, y) = A · x + B · y , que hay que maximizar o minimizar.
El vector director de la recta A · x + B · y viene dado por v = (−B, A). Además, como lo único que
nos importa es la dirección del vector y no su módulo (longitud), podemos dividir a las coordenadas
del vector si los números son muy grandes, puesto que vectores con coordenadas proporcionales tienen
la misma dirección.
Posteriormente, se trazan rectas paralelas a este vector que pasen por los vértices de la región
factible (si es acotada) , o por todo el borde de la región factible (cuándo no es acotada) y se observa
en qué vértice la función F se hace máxima (o mı́nima) sin más que tener en cuenta cuál de las rectas
tiene mayor (o menor) ordenada en el origen, es decir, qué recta corta en un punto mayor o menor al
eje y.
Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:

 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
CAPÍTULO 8. PROGRAMACIÓN LINEAL
132
La región factible en este caso es:
Los vértices eran los puntos (0,-1), (5,1) y (3,-3).
Como la función es F (x, y) = 2000x + 5000y, el vector director es v = (−5000, 2000), que tiene la
misma dirección que el v = (−5, 2) y representándolo queda:
Figura 8.3: Región factible y vector de la función objetivo
CAPÍTULO 8. PROGRAMACIÓN LINEAL
133
Se trata ahora de trazar paralelas al vector que pasen por los vértices anteriores, es decir:
Figura 8.4: Solución gráfica. Paralelas al vector por los vértices.
Se observa gráficamente que de las tres paralelas trazadas, la que corta al eje y en un punto mayor
es la que pasa por el punto (5,1), que por tanto será la solución óptima al problema de máximos
planteado.
Para saber cuál es este valor ,máximo sustituimos en la función:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000
Luego la función tiene su solución óptima en (5,1) donde toma el valor 15000.
8.4.2.
Forma algebraica
Consiste, simplemente, en susituir cada uno de los vértices de la región en la función objetivo. La
solución óptima vendrá dada por aquel que tome el mayor (o menor) valor.
Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:

 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Con la misma región factible que en el caso anterior.
Los vértices eran los puntos (0,-1), (5,1) y (3,-3).
De esta forma sustituyendo:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000
F (0, −1) = 2000 · 0 + 5000 · (−1) = 0 − 5000 = −5000
F (3, −3) = 2000 · 3 + 5000 · (−3) = 6000 − 15000 = −9000
Vemos que el valor máximo se alcanza para el vértice (5,1) y que dicho valor es 15. La misma solución
que se obtenı́a antes.
Ejercicio: Resolver los problemas de programación lineal:
CAPÍTULO 8. PROGRAMACIÓN LINEAL
134

2x + y ≤ 10



x + 3y ≤ 12
Maximizar F (x, y) = 4x + 5y sujeto a:
.
0≤x≤8



0≤y≤2

3x + 2y ≥ 12



4x + 5y ≥ 29
.
Minimizar F (x, y) = 12x + 10y sujeto a:
x≥0



y≥0

4x + 2y ≤ 6



7x + 8y ≤ 28
Maximizar F (x, y) = 120x + 80y sujeto a:
.
x≥0



y≥0

4x + 5y ≥ 20
Minimizar F (x, y) = 12x + 8y sujeto a: 7x + 2y ≥ 14 .

x≤y
1.
2.
3.
4.
8.5.
Algunos ejemplos de casos extremos
Puede ocurrir que la solución óptima no sea única, e incluso que no exista, como en los ejemplos
siguientes:
Ejemplo 1:

x + y ≥ 14



2x + 3y ≥ 36
Maximizar g(x, y) = 3x + 4y sujeta a las rectricciones:
.
4x + y ≥ 16



x − 3y ≥ 0
Si representamos la región factible:
Los vértices serán:
A=
2 40
,
, B = (6, 8), C = (12, 4)
3 3
Observemos que la región factible es NO acotada superiormente.
CAPÍTULO 8. PROGRAMACIÓN LINEAL
135
Si aplicamos el método geométrico, deberı́a trazar paralelas al vector director por los vértices, pero
como la región en no acotada, dichas rectas son cada vez mayores al trazarlas sobre los puntos de la
recta t, que son soluciones factibles. Por tanto el problema no tiene solución.
Figura 8.5: Las paralelas cortan cada vez en un punto mayor.
En general, un problema de máximos no tiene solución si la región factible no está acotada superiormente, y un problema de mı́nimos no tiene solución si la región no está acotada inferiormente.
También puede tener el problema infinitas soluciones:
Ejemplo 2:

x+y ≥5




y
 ≤ x+3
Minimizar g(x, y) = 3x + 3y sujeta a las restricciones 3y − x ≥ −1 .


y + 2x ≤ 16



4y − x ≤ 22
La región es, en este caso:
CAPÍTULO 8. PROGRAMACIÓN LINEAL
136
Los vértices respectivos son: A=(1,4), B=(2,5), C=(6,4), D=(7,2) y E=(4,1).
Si utilizamos el método gráfico, obtenemos:
Es decir, como buscamos el valor mı́nimo, todos los puntos comprendidos entre A y E sirven, es
decir, hay infinitas soluciones.
Si utilizamos el método algebraico: g(x, y) = 3x + 3y, luego:
A : g(1, 4) = 3 + 12 = 15
B : g(2, 5) = 6 + 15 = 21
C : g(6, 4) = 18 + 12 = 30
D : g(7, 2) = 21 + 6 = 27
E : g(4, 1) = 12 + 3 = 15
Observamos que el valor mı́nimo se toma en A y en E, y por tanto en todos los puntos comprendidos
entre ellos, es decir, hay infinitas soluciones.
8.6.
Aplicación a problemas concretos
El verdadero valor de las técnicas de la programación lineal consiste en poder aplicarlas a problemas
reales.
Para resolver estos problemas se deben seguir los siguientes pasos, a la vez que vemos como se
aplicarı́a a un ejemplo concreto.
Ejemplo:
Una fábrica de muebles fabrica dos tipos de sillones, S1 y S2. La fábrica cuenta con dos secciones;
carpinterı́a y tapicerı́a.
Hacer un sillón de tipo S1 requiere 1 hora de carpinterı́a y 2 de tapicerı́a, mientras que uno de tipo
S2 requiere 3 horas de carpinterı́a y 1 de tapicerı́a.
El personal de tapicerı́a trabaja un total de 80 horas, y el de carpinterı́a 90.
Las ganancias por las ventas de S1 y S2 (unidad) son, respectivamente 60 y 30 euros. Calcular
cuántos sillones de cada tipo hay que hacer para maximizar las ganancias.
CAPÍTULO 8. PROGRAMACIÓN LINEAL
137
Este es un problema tı́pico en el que hay que usar las técnicas de programación lineal. Intentaremos
seguir el siguiente esquema:
1. Leer el enunciado , determinar la función objetivo y definir las variables.
En este caso, queremos hacer máximo el beneficio, es decir, queremos maximizar una función.
Como queremos determinar las cantidades de sillones S1 y S2 respectivamente, llamemos x=nº
de unidades de S1 e y=nº de unidades de S2.
La función beneficio a maximizar será: B(x, y) = 60 · x + 30 · y, que es la función objetivo.
2. Reordenar los datos del problema y escribir las inecuaciones correspondientes.
En este paso es conveniente el uso de tablas:
Tiempo(horas)
S1
S2
Disponible
Tiempo(horas)
S1
S2
Necesario
Disponible
Carpinterı́a
1
3
90
Cantidad
x
y
Tapicerı́a
2
1
80
Carpinterı́a
x
3y
x + 3y
90
Tapicerı́a
2x
y
2x + y
80
De aquı́ se deduce que:
x + 3y ≤ 90
2x + y ≤ 80
y además
x≥0
y≥0
pues el nº de unidades producidas no puede ser negativo.
Ya tenemos por tanto las restricciones.
3. Representar gráficamente la región factible, calcular sus vértices y el vector si usamos el método
geométrico.
En este caso, representando la región factible:
CAPÍTULO 8. PROGRAMACIÓN LINEAL
138
Siendo los vértices A=(0,0), B=(0,30), C=(30,20), D=(40,0).
60), equivalente a (−10,
20).
El vector será (−30,
Gráficamente se observa que la solución no es única, sino que se encuentran infinitas soluciones
en el lado correspondiente CD, sobre la recta 2x + y = 80, desde que x vale 30 hasta que vale
40, todas las soluciones son válidas.
4. Sustituir las coordenadas en la función objetivo y dar la solución correcta.
En este caso se obtiene:
B(0, 0) = 0
B(0, 30) = 900
B(30, 20) = 2400
B(40, 0) = 2400
con lo cuál hay infinitas soluciones y el beneficio que se obtiene es 2400 euros.
5. Analizar la solución obtenida en el contexto del problema: ¿tiene sentido?.
Debemos interpretar que en el contexto del problema no todas las soluciones son válidas, sino
que sólo sirven soluciones enteras, es decir, no se pueden fabricar, por ejemplo 3’8 sillones del
tipo S1. Las soluciones con sentido vendrı́an dadas por:
S1
S2
30
20
31
18
32
16
33
14
34
12
35
10
36
8
37
6
38
4
39
2
40
0
Encontramos por tanto sólo 11 soluciones que son las de la tabla
En cualquiera de estas soluciones el beneficio es de 2400 euros, que es el máximo bajo las
condiciones del problema.
CAPÍTULO 8. PROGRAMACIÓN LINEAL
8.7.
139
El problema del transporte
Es uno de los problemas que dieron lugar a la programación lineal.
Un ejemplo tı́pico serı́a el siguiente:
Ejemplo:
Una empresa tiene 2 plantas de producción (P1 y P2) de cierto artı́culo que vende en 3 ciudades
(C1,C2 y C3). En P1 produce 5000 unidades, y en P2 7000 unidades. De estas 12000 unidades las
vende ası́: 3500 es C1, 4000 en C2 y 4500 en C3. Los costes de transporte, en euros por unidad de
producto, desde las plantas de producción a las ciudades son:
Envı́os
Desde P1
Desde P2
Hasta C1
3
2’25
Hasta C2
2’5
3’75
Hasta C3
3’5
4
Determina el nº de artı́culos que debe enviar la empresa desde cada planta a cada ciudad para que los
costes de transporte sean mı́nimos.
Para problemas de este tipo necesitamos una nueva variable.
Sea x=unidades de P1 a C1, y=unidades de P1 a C2 y z=unidades de P1 a C3.
Tiene que verificarse entonces que x + y + z = 5000.
Si desde P1 a C1 se envı́an x unidades, como en C1 necesitan 3500, desde P2 se mandarán a C1
3500 − x. Razonando del mismo modo con y y z, se obtiene la tabla:
Envı́os
Desde P1
Desde P2
Hasta C1
x
3500 − x
Hasta C2
y
4000 − y
Hasta C3
z = 5000 − x − y
4500 − z = 4500 − (5000 − x − y)
Hemos sustituido z por 5000 − y − x, porque x + y + z = 5000 y ası́ transformamos las 3 incógnitas
en sólo 2.
Para obtener las restricciones imponemos que cada cantidad ha de ser mayor o igual que cero, es
decir:
x≥0
3500 − x ≥ 0
y≥0
4000 − y ≥ 0
5000 − x − y ≥ 0
−500 + x + y ≥ 0
Por tanto el sistema de inecuaciones es:

x≥0




x
≤ 3500



y≥0
y
≤ 4000




x + y ≤ 5000


x + y ≥ 500
Como se trata de minimizar costes, la función objetivo es:
C(x, y) = 3 · x + 2 5 · y + 3 5 · (5000 − x − y) + 2 25 · (3500 − x) + 3 75 · (4000 − y) + 4 · (−500 + x + y)
C(x, y) = 1 25 · x − 0 75 · y + 22625
CAPÍTULO 8. PROGRAMACIÓN LINEAL
140
Dibujando la región factible:
Resulta que A=(0,500), B=(0,4000), C=(1000,4000), D=(3500,1500), E= (3500,0) y F=(500,0).
Sustituyendo es:
C(0, 500) = 22250
C(0, 4000) = 19625
C(1000, 4000) = 20875
C(3500, 1500) = 25875
C(3500, 0) = 27000
C(500, 0) = 23250
El mı́nimo se da en B, cuando x = 0 e y = 4000.
Es decir, las unidades a distribuir son:
Envı́os
Desde P1
Desde P2
Hasta C1
0
3500
Hasta C2
4000
0
Hasta C3
1000
3500
Ejercicio:
Dos fábricas de cemento, F1 y F2, producen respectivamente 3000 y 4000 sacos de cemento al dı́a.
Hay que enviar ese cemento a tres centros de ventas C1, C2 y C3 en cantidades de 3000, 2500 y
1500 sacos respectivamente.
Los costes de transporte de cada fábrica a los puntos de venta vienen dados, en euros por cada
saco, por:
Envı́os
Desde F1
Desde F2
Hasta C1
2
1’5
Hasta C2
2’5
3
Hasta C3
2
1
Determina cómo hay que distribuir la producción para que el transporte resulte lo más económico
posible.
Capı́tulo 9
LÍMITES Y CONTINUIDAD DE
FUNCIONES
9.1.
Introducción
El concepto de lı́mite en Matemáticas tiene el sentido de “lugar” hacia el que se dirige una función
en un determinado punto o en el infinito.
Veamos un ejemplo: Consideremos la función dada por la gráfica de la figura y fijémonos en el
punto x = 2 situado en el eje de abscisas:
¿Qué ocurre cuando nos acercamos al punto 2 moviéndonos sobre el eje x? Tomemos algunos
valores como 2’1, 2’01, 2’001.
Vemos en la figura que en este caso las imágenes de dichos puntos sobre la curva, f(2’1), f(2’01),
f(2’001) se acercan a su vez a un valor situado en el eje y, el valor y = 3.
Si nos acercamos a 2 por la otra parte, es decir, con valores como 1’9, 1’99, 1’999 en este caso las
imágenes f(1’9), f(1’99), f(1’999) se acercan también al mismo valor, y = 3.
Concluimos que el lı́mite de la función f(x) cuando nos acercamos a x = 2 es 3, lo cuál expresamos
como:
lı́m f (x) = 3
x→2
Intuitivamente, por tanto, podemos decir que el lı́mite de una función en un punto es el valor en el
eje Oy al que se acerca la función, f (x), cuando la x se acerca, en el eje Ox a dicho punto.
145
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
146
Sin embargo la expresión matemática rigurosa de lı́mite es algo más compleja:
Definición: Dada una función f (x) y un punto x = a, se dice que el lı́mite de f (x) cuando x se acerca
a a es L, y se expresa como:
lı́m f (x) = L
x→a
cuando:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − L| < Lo que viene a expresar esta formulación matemática es que si x está “suficientemente cerca” de
a, entonces su imagen f(x) también está muy próxima a L.
En la práctica en muchas ocasiones es necesario calcular los llamados lı́mites laterales, que como
recordaremos se definen de la siguiente forma:
Definición:
Se define el lı́mite lateral por la derecha de a de la función f (x), y se expresa como:
lı́m f (x)
x→a+
al lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores mayores que a.
De igual modo, el lı́mite lateral por la izquierda de a de la función f (x) se expresa como:
lı́m f (x)
x→a−
y se define como el lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores menores que a.
Propiedad: Para que una función f (x) tenga lı́mite en x = a es necesario y suficiente que existan
ambos lı́mites laterales y coincidan, es decir:
lı́m f (x) = lı́m f (x) = lı́m f (x)
x→a
x→a+
x→a−
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
9.2.
147
Tipos de lı́mites
Recordaremos algunos tipos de lı́mites que son conocidos:
1. Lı́mites infinitos en un punto finito: En la situación del dibujo, se dice que el lı́mite cuando x
se acerca por la derecha de a es +∞, pués a medida que la x se acerca a a, la función se hace
cada vez mayor:
lı́m f (x) = +∞
x→a+
(de igual forma se puede definir cuando nos acercamos por la izquierda. Intenta hacer el dibujo).
De igual modo se define el lı́mite −∞ cuando nos acercamos a a (por la derecha o por la
izquierda).(Dibuja el que falta)
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
148
Puede ocurrir que uno de los lı́mites laterales sea finito y otro infinito, o cualquier combinación
entre ellos, por ejemplo:
En la figura anterior se cumple que:
lı́m f (x) = +∞
x→2+
y
lı́m f (x) = 2
x→2−
2. Lı́mites finitos en el infinito: Se dice que una función tiene lı́mite b cuando x tiende a +∞
cuando la función se acerca a b cuando la x se hace cada vez mayor, es decir:
lı́m f (x) = b
x→∞
Gráficamente:
En este caso el lı́mite es 2 cuando x tiende a +∞.
De igual modo se define el lı́mite finito cuando x tiende a −∞.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
149
3. Lı́mites infinitos en el infinito: Aparece este caso cuando si x tiende a +∞ la función se hace
cada vez mayor o menor (lo mismo si x tiende a −∞).
Un ejemplo gráfico de este tipo de lı́mites serı́a:
En este caso:
lı́m f (x) = −∞
x→∞
(Intenta dibujar otros casos diferentes).
9.3.
Cálculo de lı́mites
Recordaremos, dada su importancia, algunas de las reglas para el cálculo de lı́mites cuando se
presentan diferentes indeterminaciones:
9.3.1.
Lı́mites en el infinito
1. Lı́mites de polinomios: El lı́mite de cualquier polinomio cuando x tiende a ∞ siempre es +∞ o
−∞, dependiendo del coeficiente del término de mayor grado del polinomio:
lı́m (2x5 − 3x2 + 5) = +∞
x→∞
lı́m (−3x7 − 5x2 + 4x − 8) = −∞
x→∞
pues en el primer caso el coeficiente de x5 es positivo, y en el segundo caso el coeficiente de x7
es negativo.
∞
: Si tenemos un cociente de polinomios nos encontraremos con una indeter2. Indeterminación
∞
minación de este tipo. Para resolverla basta recordar la siguiente regla:
Si tenemos:

±∞









p(x) 
0
=
lı́m
x→∞ q(x)




a





b

Ejemplos: a)
si grado(p(x)) > grado(q(x)),
donde el signo depende de los coeficientes.
si grado(p(x)) < grado(q(x))
si grado(p(x)) = grado(q(x)), siendo a y b los
coeficientes de los términos de mayor grado de cada polinomio.
x3 − 5x2 + 6 ∞ =
= −∞
x→∞
−x2 + 4
∞
lı́m
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
150
porque el grado del numerador es mayor, pero los respectivos coeficientes de mayor grado tienen
signo diferente.
b)
∞
x2 − 5
=
=0
x→∞ x6 − x4 − 3x2 + 4
∞
porque el grado del denominador es mayor.
lı́m
c)
7
7x3 + 2x − 6 ∞ =
=−
x→∞ −3x3 + 6
∞
3
lı́m
porque los grados son iguales.
Nota: La resolución de lı́mites cuando x tiende a −∞ se reduce a estos casos, puesto que:
lı́m f (x) = lı́m f (−x)
x→−∞
x→∞
es decir:
x3 − 5x2 + 4
(−x)3 − 5(−x)2 + 4
−x3 − 5x2 + 4 ∞ =
lı́m
=
lı́m
=
=∞
x→−∞ −x2 + 5x
x→∞ −(−x)2 + 5(−x)
x→∞
−x2 − 5x
∞
lı́m
La misma regla anterior sirve en el caso de que aparezcan raı́ces, siempre que tengan sentido los
lı́mites:
d)
lı́m
3+
x→∞
√
x3 − 5x ∞ =
=0
x2 + 4
∞
3
puesto que el grado del denominador es 2 y en el numerador la mayor potencia de x es , que
2
es menor que 2.
e)
√
−x + 1 + x3
=
x→∞ 1 + x + 3x3
puesto que aunque los grados de numerador y denominador son iguales, cuando x tiende a +∞
(es positivo y muy grande) resulta que −x + 1 es negativo y como es bien conocido, la raı́z
cuadrada de un número negativo no existe en el cuerpo de los números reales, por tanto el lı́mite
anterior no tiene sentido.
lı́m
f)
√
∞ 1
−(−x) + 1 + (−x)3
−x + 1 + x3
x + 1 − x3
=
=
lı́m
=
lı́m
=
x→∞ 1 + (−x) + 3(−x)3
x→∞ 1 − x − 3x3
1 + x + 3x3
∞
3
√
lı́m
x→−∞
pues en este caso la raı́z si tiene sentido y los grados son iguales, quedando el lı́mite el cociente
de los coeficientes de los monomios de mayor grado.
3. Indeterminación ∞ − ∞: Cuando aparece esta indeterminación, si tenemos una resta de fracciones, simplemente se hace la resta para obtener un cociente de polinomios que ya sabemos
resolver:
2
x2 − x + 1 x + 3 + x2
(x − x + 1)(x − 1) (x + 3 + x2 )(x + 1)
−
= (∞ − ∞) = lı́m
−
=
lı́m
x→∞
x→∞
x+1
x−1
(x + 1)(x − 1)
(x − 1)(x + 1)
3
−4x2 − 2x − 4 ∞ x − 2x2 + 2x − 1 x3 + 2x2 + 4x + 3
−
=
lı́m
=
= −4
= lı́m
x→∞
x→∞
x2 − 1
x2 − 1
x2 − 1
∞
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
151
En caso de que aparezca una raı́z, el proceso es multiplicar y dividir por el conjugado de la
expresión radical:
√
√
√
(2x − 1) − x + 1 · (2x − 1) + x + 1
√
=
lı́m (2x − 1) − x + 1 = (∞ − ∞) = lı́m
x→∞
x→∞
(2x − 1) + x + 1
√
(2x − 1)2 − ( x + 1)2
4x2 − 4x + 1 − x − 1
√
√
= lı́m
= lı́m
=
x→∞ (2x − 1) + x + 1
x→∞ (2x − 1) + x + 1
∞
4x2 − 5x
√
=
= +∞
= lı́m
x→∞ (2x − 1) + x + 1
∞
9.3.2.
Lı́mites en puntos finitos
Si queremos calcular el lı́mite de una función f (x) cuando x se acerca a cierto valor a, simplemente
hemos de sustituir el valor de a en f (x):
2 · 9 − 3 · (−3) + 1
2x2 − 3x + 1
=
= −28
x→−3
x+2
−3 + 2
lı́m
El problema que nos podemos encontrar en este caso es que el denominador se haga 0 al sustituir x
por el valor que corresponda.
Nos podemos encontrar, por tanto, varios tipos de indeterminación.
k
1. Indeterminación , (k = 0): Se presenta cuando en el numerador aparece un número cualquiera
0
no nulo y el denominador es 0.
En este caso el lı́mite el siempre ∞, pero para determinar su signo, se calculan los lı́mites
laterales:
a)






lı́m
1 − 2 · 1 0001
−1
1 − 2x
=
= − = +∞
1 − x2
1 − (1 0001)2
0
lı́m
1 − 2 · 0 9999
−1
1 − 2x
=
= + = −∞
2
2
1−x
1 − (0 9999)
0
x→1+
−1
1−2
1 − 2x
=
=
=
x→1 1 − x2

1−1
0




lı́m
b)





−7
−7
=
=
x→0 x

0



x→1−
lı́m
−7
−7
−7
= = + = −∞
x
0 0001
0
lı́m
−7
−7
−7
=
= − = +∞
x
−0 0001
0
x→0+
lı́m
c)





−2
−2
=
=
2
x→−1 (x + 1)

0



x→0−
lı́m
−2
−2
−2
=
= + = −∞
2
2
(x + 1)
(−0 9999 + 1)
0
lı́m
−2
−2
−2
=
= + = −∞
2
2
(x + 1)
(−1 0001 + 1)
0
x→−1+
lı́m
x→−1−
0
: En este caso tanto numerador como denominador se hacen 0.
0
Si tanto en el numerador como en el denominador tenemos polinomios, la forma de resolver la
indeterminación es descomponer los polinomios en factores (mediante, por ejemplo, la regla de
Ruffini) y simplificar para posteriormente volver a sustituir.
4 − 10 + 6
0
−1
x2 − 5x + 6
(x − 2)(x − 3)
(x − 3)
=
=
= lı́m
= lı́m
=
lı́m
x→2
x→2 (x − 2)(x + 2)
x→2 (x − 2)
x2 − 4
4−4
0
4
2. Indeterminación
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
152
En caso de que también aparezcan raı́ces cuadradas, el proceso es multiplicar y dividir por la
expresión radical conjugada con el fin de simplificar y luego sustituir:
√
√
√
0
x+4−1
( x + 4 − 1) · ( x + 4 + 1)
√
=
=
= lı́m
lı́m 2
x→−3 x + 2x − 3
x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
0
√
( x + 4)2 − 12
x+3
√
√
= lı́m
= lı́m
=
x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
1
−1
(x + 3)
1
√
√
= lı́m
=
=
= lı́m
x→−3 (x + 3) · (x − 1) · ( x + 4 + 1)
x→−3 (x − 1) · ( x + 4 + 1)
(−4) · (1 + 1)
8
9.3.3.
Lı́mites potenciales. Indeterminación 1∞
Cuando aparecen exponentes, hay que recordar algunas reglas básicas.
Si tenemos
lı́m (f (x))g(x)
x→a
o bien
lı́m (f (x))g(x)
x→∞
se pueden presentar varios casos:
1. La base tiende a un número cualquiera no nulo y el exponente a otro número. En este caso el
lı́mite es el número que resulta de realizar la operación correspondiente:
lı́m (x + 1)2x−3 = 2−1 =
x→1
1
2
2. La base tiende a un número positivo mayor que 1 y el exponente a +∞. En este caso el lı́mite
es también +∞.
2x + 1 2x−3
= 2∞ = +∞
lı́m
x→∞
1+x
3. La base tiene a un número no nulo comprendido entre -1 y 1 y el exponente a +∞. En este caso
el lı́mite es 0.
∞
1
1 + x 2x−3
=
=0
lı́m
x→∞ 2x + 1
2
4. La base tiende a un número negativo menor o igual que -1 y el exponente a +∞. En este caso
el lı́mite no existe, pues los productos son alternativamente de signo contrario:
lı́m
x→∞
−3x + 1
1+x
2x−3
= (−3)∞ = 5. En el caso en que la base tiende a 1 y el exponente a +∞ tenemos una indeterminación que se
resuelve aplicando la fórmula:
lı́m (g(x) · (f (x) − 1))
lı́m (f (x))g(x) = (1∞ ) = (e)x→a
x→a
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
153
O bien realizando los pasos para resolver tales lı́mites que recordamos:
2x+3
2x+3
x
x
3
1+x
1+x
∞
0
−1
= (1) = (1 )
=
lı́m 1 +
=
lı́m
se suma y se resta 1 a la base x→0
se hace la resta
x→0 2x + 1
2x + 1
2x+3
2x+3
x
x
1 + x − 2x − 1
−x
= lı́m 1 +
= lı́m 1 +
=
se baja el numerador dividiendo al denominador
x→0
x→0
2x + 1
2x + 1
−x 2x+3

· x
2x+3
2x+1  2x+1
x
−x
1
1

= lı́m 1 +
=
lı́m  1 +
=
x→0
2x+1
−x
se pone el denominador como exponente
lı́m
=
se sustituye el corechete por
e
(e)x→0
−x
2x+1
·
2x+3
x
2x+1
−x
x→0
lı́m
= (e)x→0
−2x−3
2x+1
= e−3
Ejercicio: Resolver el lı́mite anterior utilizando la fórmula.
Nota: El caso en que el exponente tiende a −∞ se reduce a este sin más que recordar las propiedades
de las potencias:
a n b −n
=
b
a
9.4.
Ası́ntotas
Una primera aplicación del cálculo de lı́mites consiste en el cálculo de las ası́ntotas de una función.
Hay tres tipos de ası́ntotas:
Verticales, Horizontales y Oblicuas (aunque de hecho las ası́ntotas horizontales son un caso particular de éstas).
9.4.1.
Ası́ntotas verticales
Una ası́ntota vertical de una función f (x) es una recta vertical x = k tal que se cumple:
lı́m f (x) = ±∞
x→k+
o bien
lı́m f (x) = ±∞
x→k−
Las posibles ası́ntotas verticales de una función se encuentran entre los puntos que no están en el
dominio de la función, aquellos que anulan el dominador en las funciones racionales, etc...
Para determinar si un punto constituye una ası́ntota vertical de la función, se tiene que cumplir
que alguno de los lı́mites laterales de la función en el punto sea ±∞.
En tal caso, se dirá que la función posee una ası́ntota vertical en dicho punto por el lado en el cuál
dicho lı́mite sea ±∞.
Ejemplo: Estudiar las ası́ntotas verticales de las funciones:
f (x) =
2x + 3
x−1
1
g(x) = √
x
a) Para la primera función, la posible ası́ntota estará en el punto x = 1, que es el único número real
que no pertenece a su domino por anular el denominador.
Ası́ pues estudiamos el:

2 · 1 0001 + 3
5
2x + 3


lı́m
=
= + = +∞

+
1 0001 − 1
0
5  x→1 x − 1
2x + 3
= =
lı́m
x→1 x − 1
0 


 lı́m 2x + 3 = 2 · 0 9999 + 3 = 5 = −∞
0 9999 − 1
0−
x→1− x − 1
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
154
Como ambos lı́mites laterales son infinitos, existe una ası́ntota vertical de la función en x = 1, y es
más, conociendo el valor de los lı́mites podemos asegurar que en las cercanı́as de la ası́ntota la función
se comportará como en el dibujo:
√
1
b) En cuanto a esta función,g(x) = √ , notemos que el denominador se anula cuando x = 0 =⇒
x
x = 0, es decir la posible ası́ntota vertical estará en x = 0. Analizando obtenemos:

1
1
1

lı́m √ = √
= + = +∞


+
x
0
0 0001
1  x→0
1
lı́m √ = =
x→0
x
0 

1
1

 lı́m √ = √
=
−
x
x→0
−0 0001
puesto que no hay raı́ces cuadradas de números negativos.
De modo que hay una ası́ntota vertical en x = 0 pero sólo por la derecha, es decir, la gráfica será:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
9.4.2.
155
Ası́ntotas horizontales
Las ası́ntotas horizontales, si existen, indican el valor al que se acerca la función cuando la variable
independiente x se hace muy grande o muy pequeña.
Dicho en forma de lı́mites, una función tiene una ası́ntota horizontal en y = k cuando para alguno
de los dos lı́mites:
lı́m f (x) = k
x→∞
o bien
lı́m f (x) = k
x→−∞
Ejemplo: Calcular las ası́ntotas horizontales de las funciones:
f (x) =
x2 + 1
x+1
1
g(x) = √
x
a) Para f (x) calculemos los lı́mites anteriores:
x2 + 1
= +∞
x→∞ x + 1
lı́m
x2 + 1
(−x)2 + 1
x2 + 1
= lı́m
= lı́m
= −∞
x→−∞ x + 1
x→∞ (−x) + 1
x→∞ −x + 1
lı́m
de modo que la función f(x) no posee ası́ntotas horizontales.
b) En cuanto a g(x), de igual modo:
1
lı́m √ = 0
x
x→∞
1
lı́m √ = x
x→−∞
De modo que g(x) posee una ası́ntota horizontal en y = 0 cuando x tiende a ∞. De forma gráfica:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
9.4.3.
156
Ası́ntotas Oblicuas
Una recta y = m · x + n es una ası́ntota oblicua de la función f(x) cuando existen y son finitos los
lı́mites:
f (x)
m = lı́m
x→∞
x
y
n = lı́m (f (x) − m · x)
x→∞
Las ası́ntotas horizontales son un caso particular de las oblicuas para el caso en que m = 0.
Ejemplo: Estudiar las ası́ntotas oblicuas de f (x) =
Calculemos m y n:
m = lı́m
x→∞
f (x)
x
= lı́m
x→∞
x2
.
x+1
x2
x+1
x
x2
=1
x→∞ x2 + x
= lı́m
2
x2
x
− 1 · x = lı́m
−x =
n = lı́m (f (x) − m · x) = lı́m
x→∞
x→∞ x + 1
x→∞ x + 1
2
x − x2 − x
−x
= lı́m
= −1
lı́m
x→∞
x→∞ x + 1
x+1
Por tanto f (x) tiene una ası́ntota oblicua en y = x − 1 cuando x tiende a +∞.
Se puede comprobar que cuando x tiende a −∞, f (x) tiene esta misma ası́ntota. (Inténtalo).
Gráficamente se obtiene:
Figura 9.1: La ası́ntota oblicua es y = x − 1
Ejercicios:
1. Calcula las ası́ntotas de las funciones:
f (x) =
x
2
x −1
g(x) =
1
2. Estudia las ası́ntotas de la función:f (x) = e x−2 .
x2
x+2
h(x) =
x2 − 4
x2 + 4
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
157
3. Calcula los lı́mites:
x3
a) lı́m √
x→∞ x2 − 2
d) lı́m
x→1
9.5.
x2 + 4
x+4
x
x−1
x3
b) lı́m √
x→−∞ x2 − 2
c) lı́m
√
x2 + 5 − 3
e) lı́m √
x→2
x+7−3
x→∞
3x2 − 5
3x2 + x
x2 −1
2x2 − 2
x→1 x2 − 2x + 1
f ) lı́m
Continuidad
La idea intuitiva de función continua en un punto es bien sencilla.
Una función continua en un punto es aquella que no “da saltos”, aquella que se puede dibujar sin
levantar el lápiz del papel.
Matemáticamente la definición de función continua es un poco más compleja. Dice ası́:
Definición: Una función f (x) es continua en un punto x = a si:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − f (a)| < Dicho de otra forma, si nos acercamos al punto a, entonces las imágenes se acercan a la imagen de a,
f (a).
Si f (x) no es continua en x = a se dice que f (x) es discontinua en a o que tiene una discontinuidad
en x = a.
Propiedad: Para que una función sea continua en un punto a es necesario y suficiente que:
a) Exista el valor de la función en el punto, f (a).
b) Existan los lı́mites laterales,
lı́m f (x)
x→a+
y
lı́m f (x)
x→a−
, y sean finitos e iguales entre sı́ e iguales a f (a), es decir:
lı́m f (x) = lı́m f (x) = f (a)
x→a+
x→a−
Esta última propiedad proporciona una forma muy sencilla de saber si una función es continua o no
en un punto.
Ejemplo: Estudiar la continuidad de la función:
2x + 1 si x > 2
f (x) =
1
si x ≤ 2
x
En primer lugar, señalemos que la mayorı́a de las funciones que estudiamos son continuas en todos los
puntos salvo en algunos.
¿Cuáles son los posibles puntos de discontinuidad de una función?.
Aquellos en los que no está definida la función (anulan el denominador, etc...) y aquellos en los
que cambia la definición de la función.
En todos los demás puntos las funciones son siempre continuas y no hace falta analizarlos.
En nuestro caso, si nos fijamos en f (x) encontramos 2 posibles puntos de discontinuidad.
El primero es aquel en el que cambia la definición de la función, x = 2. Además, como hay un
demominador, que se anula para x = 0, y además estamos en el tramo de función para valores menores
que 2, el punto x = 0 es otro posible punto de discontinuidad.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
158
Analicemos si la función es continua o no en esos puntos.
Continuidad en x = 2:
1
f (2) =
2
pues debemos sustituir en la parte inferior de f (x), que es donde está el igual.
Lı́mites laterales:
1
1
lı́m f (x) = lı́m =
−
x→2
x
2
x→2
Por otra parte:
lı́m f (x) = lı́m 2x + 1 = 5
x→2+
x→2
Como los lı́mites laterales existen pero son diferentes, concluimos que f (x) es discontinua en x = 2.
Continuidad en x = 0:
f (0) = quedarı́a un cero en el denominador.
Con esto ya sabemos que la función no puede ser continua en x = 0. De todos modos calculamos
los lı́mites laterales.
Observemos que cuando nos acercamos a 0, da igual por la derecha que por la izquierda, estamos
siempre en la parte inferior de la función, luego:
lı́m f (x) = lı́m
1
1
= − = −∞
x
0
lı́m f (x) = lı́m
1
1
= + = +∞
x
0
x→0−
x→0−
Por otra parte:
x→0+
x→0+
Y f (x) también es discontinua en x = 0.
Por tanto f (x) es continua en todos los números reales salvo en x = 0 y x = 2.
9.6.
Tipos de discontinuidad
Analicemos los posibles casos que se pueden dar a la hora de estudiar la continuidad de una función
en un punto.
1. Existe f (a) y los lı́mites laterales, que son iguales y finitos, pero distintos del valor de f (a). Una
discontinuidad de este tipo se denomina discontinuidad evitable. Gráficamente:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
159
Observamos que los lı́mites por la derecha y por la izquierda valen 1, ambos, mientras que
f (0) = 0. Hay una discontinuidad evitable en x = 0.
2. Existe f (a) y los lı́mites laterales existen y son finitos, aunque distintos. Estamos ante una
discontinuidad de salto finito. Gráficamente:
−1
, hay una discontinuidad
En este caso el lı́mite por la derecha es 1, el izquierdo es 0 y f (0) =
2
evitable en x = 0.
3. Existe f (a) y alguno de los lı́mites laterales es infinito. En este caso hay una discontinuidad de
salto infinito. Gráficamente:
Ahora f (0) = 1, el lı́mite por la izquierda vale 1 también y el lı́mite lateral por la derecha vale
+∞. Discontinuidad de salto infinito en x = 0.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES
160
4. No existe f (a) o alguno de los lı́mites laterales. Se trata de una discontinuidad esencial. De forma
gráfica:
Los lı́mites laterales, ambos, son +∞, pero f (0) no existe. Hay una discontinuidad esencial en
x = 0.
Capı́tulo 10
DIFERENCIABILIDAD DE
FUNCIONES. OPTIMIZACIÓN
10.1.
Introducción
Sin duda uno de los pilares básicos de las matemáticas lo constituye el cálculo diferencial (o cálculo
de derivadas). Las aplicaciones de las derivadas son múltiples y se dan en muchos y muy diversos
campos.
El cálculo diferencial tuvo su gérmen en los trabajos del ilustres matemáticos como I.Newton y
G.W. Leibnitz, quienes, independientemente uno del otro, llegaron a resultados similares en el siglo
XVII.
En este tema se añalizarán algunas de las principales aplicaciones de las derivadas de funciones,
que posibilitan el cálculo de extremos relativos, concavidad y puntos de inflexión, facilitan el trazado
de curvas y sirven de herramienta para la resolución de los llamados problemas de optimización, en
los cuales se trata de encontrar la solución óptima (máxima o mı́nima) a cierto problema.
10.2.
Introducción al concepto de derivada. Tasas de variación media e instantánea.
Sabemos que las funciones son crecientes en ocasiones, decrecientes en otras, e incluso constantes
en alguna de sus partes.
Ahora bien, no todas las funciones crecientes crecen de igual modo, e incluso una misma función
creciente puede crecer de distinta forma, dependiendo de que nos encontremos en una parte u otra.
−x
:
Analicemos un ejemplo. La siguiente figura muestra la gráfica de la función f (x) =
x−2
Es evidente que la función es creciente a partir del punto de abscisa x = 2. Ahora bien, ¿siempre
crece de igual modo?.
168
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
169
Evidentemente no.
Tomemos un intervalo, por ejemplo el intervalo [3, 4].
¿Cuánto ha crecido la función en ese intervalo?. Como:
f (3) =
−3
= −3
1
f (4) =
−4
= −2
2
y
la función ha crecido en realidad:
f (4) − f (3) = 1
1 unidad.
Si nos fijamos en otro intervalo donde la función también sea creciente, el [4, 6], veamos como crece
la función.
Como f (4) = −2 y
−3
−6
=
f (6) =
4
2
el crecimiento total es de
1
−3
− (−2) =
f (6) − f (4) =
2
2
tan sólo media unidad, aunque el intervalo es dos veces mayor que el primero.
Podemos inferir entonces que la función es mucho más creciente, o que crece más rápidamente en
el intervalo [3, 4] que en el [4, 6].
La formalización de estas ideas la da la Tasa de Variación Media de una función.
Definición: Se llama Tasa de Variación Media en un intervalo [a, b] de una función f (x), y se expresa
por T V M [a, b], al cociente:
f (b) − f (a)
T V M [a, b] =
b−a
La T V M no es más que la diferencia entre los valores de la función en los extremos del intervalo
dividida entre la longitud del intervalo.
Por tanto, de esta primera definición podemos deducir algunas propiedades:
* Si la T V M en el intervalo es positiva, significa que la función crece, globalmente en el intervalo.
(Entiéndase globalmente en el sentido de que no es necesariamente creciente en todo el intervalo, pero
en definitiva hay un crecimiento de la función en dicho intervalo).
* Si la T V M en el intervalo es negativa, la función decrecerá.
* La magnitud del crecimiento o el decrecimiento dependerá de la magnitud de la T V M .
Ası́ pues la T V M nos da una idea de cómo crece o decrece la función y con qué rapidez lo hace.
Sin embargo, la T V M no resuelve todos los problemas, puesto que nos podemos plantear si la
función es creciente o no en un punto concreto, no en un intervalo.
La T V M y el concepto de lı́mite solucionan el problema:
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
170
Si queremos saber si la función tiene una tendencia creciente o decreciente en un punto a, utilizaremos el concepto de T V M como antes en un intervalo [a, a + h]:
T V M [a, a + h] =
f (a + h) − f (a)
f (a + h) − f (a)
=
a+h−a
h
A medida que nos acercamos al punto a, es decir, a medida que h se acerca a 0, la tasa de variación
media en ese intervalo se acerca al dato buscado, la tasa de variación en ese punto concreto. Más
concretamente:
Definición: Se llama Tasa de Variación Instantánea en un punto a de una función f (x) al valor,
denotado por T V I(a):
f (a + h) − f (a)
T V I(a) = lı́m
h→0
h
x
en el punto 2.
Ejemplo: Calcular la tasa de variación instantánea de la función f (x) =
x−1
Aplicando la definición:
2+h
2
− 2−1
−2
= lı́m 1+h
=
h
h→0
h
−h
−h
−1
= lı́m 1+h = lı́m
= lı́m
=1
h→0 h
h→0 h(h + 1)
h→0 h + 1
f (2 + h) − f (2)
= lı́m
h→0
h
h→0
T V I(2) = lı́m
= lı́m
h→0
2+h−2−2h
1+h
h
2+h
2+h−1
Ejercicio: Calcula la Tasa de Variación Instantánea para las siguientes funciones en los puntos indicados:
2x − 1
en x = 0 y x = −1.
a) f (x) =
x+1
b) g(x) = √
x3 − x + 3 en x = 1 y x = −2.
c) h(x) = x + 3 en x = 6 y x = −2.
10.3.
Definición de derivada. Reglas de derivación. Interpretación
geométrica
La tasa de variación instantánea en un punto es precisamente la derivada de la función en un
punto. Formalicemos:
Definición: Dada una función f (x) y un punto a, se llama derivada de la función f (x) en el punto
a, y se representa por f (a) a:
f (a + h) − f (a)
f (a) = lı́m
h→0
h
es decir la derivada en un punto es la tasa de variación instantánea en ese punto.
El problema que nos podemos encontrar es el siguiente.
Si tenemos una función, digamos f (x) = 2x2 + 1, y calculamos su derivada en un punto x = −3,
tendremos que hacer:
f (−3 + h) − f (−3)
2(−3 + h)2 + 1 − (2(−3)2 + 1)
= lı́m
=
h→0
h
h→0
h
2(9 + h2 − 6h) + 1 − 19
2h2 − 12h
h(2h − 12)
= lı́m
= lı́m
= lı́m 2h − 12 = −12
= lı́m
h→0
h→0
h→0
h→0
h
h
h
f (−3) = lı́m
Ahora bien, si queremos calcular la derivada en el punto 2 de la misma función, tenemos que volver a
calcular ese lı́mite, lo cuál es un trabajo engorroso.
Conviene, por tanto calcular la función derivada de f (x), es decir f (x).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
171
Esta función derivada permite calcular la derivada en cualquier punto sin más que sustituir en el
punto concreto. Por ello es conveniente dominar las llamadas reglas de derivación para las funciones
más habituales.
Por otra parte, es posible calcular las derivadas sucesivas de una función.
La derivada segunda será la derivada de la función derivada, y se representará por f (x), y ası́ sucesivamente las funciones derivadas tercera (f (x)), cuarta, etc.
10.3.1.
Propiedades de las derivadas. Reglas de derivación
1. La derivada de una constante es nula:
f (x) = k =⇒ f (x) = 0
donde k ∈ R.
2. Derivada de la suma (o diferencia de funciones):
(f ± g)(x) = f (x) ± g (x)
3. Derivada del producto de una función por una constante:
(k · f ) (x) = k · f (x)
donde k ∈ R.
4. Derivada del producto de funciones:
(f · g) (x) = f (x) · g(x) + f (x) · g (x)
5. Derivada del cociente de funciones:
f (x) · g(x) − f (x) · g (x)
f
(x) =
g
(g(x))2
6. Derivada de la composición de funciones (Regla de la cadena):
(f ◦ g) (x) = f (g(x)) · g (x)
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.3.2.
172
Derivadas elementales
Función elemental
Derivada
1.- f (x) = xk , k ∈ R
f (x) = k · xk−1
2.- f (x) = ex
f (x) = ex
3.- f (x) = ax , a ∈ R+
f (x) = ax · ln a
4.- f (x) = logax, a ∈ R+
f (x) =
1
1
·
x ln a
5.- f (x) = ln x
f (x) =
1
x
6.- f (x) = sen x
f (x) = cos x
7.- f (x) = cos x
f (x) = −sen x
8.- f (x) = tan x
f (x) = 1 + tan2 x = sec2 x =
9.- f (x) = csc x
f (x) = − cot x · csc x
10.- f (x) = sec x
f (x) = tan x · sec x
11.- f (x) = cot x
f (x) =
12.- f (x) = arc sen x
f (x) = √
1
1 − x2
13.- f (x) = arc cos x
f (x) = √
−1
1 − x2
14.- f (x) = arctan x
f (x) =
1
1 + x2
f (x) =
1
√
15.- f (x) =
16.- f (x) =
√
x
√
n
x
f (x) =
1
cos2 x
−1
= − csc2 x
sen 2 x
2·
x
1
√
n
n · xn−1
Con todas estas propiedades es mucho más fácil derivar, por ejemplo, para la función y el punto
anterior, calculamos la función derivada:
f (x) = 2x2 + 1 =⇒ f (x) = 4x
y ahora, conocida la función derivada podemos calcular la derivada en cualquier punto: En x = 2,
f (2) = 4 · 2 = 8
En x = −3,
f (−3) = 4 · (−3) = −12
Es mucho más cómodo y no tenemos que recurrir a la definición.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.3.3.
173
Interpretación geométrica de la derivada
La derivada tiene una interpretación geométrica muy sencilla.
Observemos la función f (x). Si calculamos las respectivas tasas de variación media en los intervalos
que se acercan al punto a, como la tasa de variación media es:
T V M [a, a + h] =
f (a + h) − f (a)
h
este cociente corresponde a la pendiente (o inclinación) de la recta que une los puntos (a, f (a)) y
(a + h, f (a + h)):
Figura 10.1: La pendiente de la recta secante es
f (a + h) − f (a)
.
h
Por tanto cuando nos acercamos al punto a, es decir, cuando calculamos el valor de la tasa de
variación instantánea o derivada en el punto a, dicho valor es precisamente la pendiente de la recta
tangente en el punto a, es decir, aquella recta que sólo corta (en las cercanı́as del punto) a la función
f (x) en el punto a.
Figura 10.2: La pendiente de la recta tangente es f (a).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
174
Recordemos que la pendiente de una recta es, en cierta forma, la inclinación de la recta.
Si α es al ángulo que forma la recta con el eje x y m es la pendiente de la recta, se cumple que:
m = tan α
Figura 10.3: La pendiente de la recta tangente es m = tan α
Ası́, si f (x) es la función y queremos calcular la tangente en el punto (a, f (a)), sabemos que la
pendiente de la recta tangente es m = f (a), y utilizando la ecuación de la recta en la forma puntopendiente, sabemos que la ecuación de dicha recta tangente es:
y − f (a) = f (a) · (x − a)
Ejemplo: Calcula la ecuación de la recta tangente a la curva f (x) = e2x+2 en el punto −1.
Como a = −1, en primer lugar calculamos:
f (−1) = e−2+2 = e0 = 1
Para calcular f (−1), derivamos:
f (x) = 2 · e2x+2
y por tanto la derivada en el punto a = −1 será:
f (−1) = 2 · e−2+2 = 2 · e0 = 2
Con estos datos, la ecuación de la recta tangente es:
y − f (−1) = f (−1) · (x − (−1)) =⇒ y − 1 = 2(x + 1) =⇒ y = 2x + 3
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
175
Graficamente la función y la recta tangente son:
Figura 10.4: Curva f (x) = e2x+2 y tangente en x = −1, y = 2x + 3.
10.4.
Aplicaciones de las derivadas a la Fı́sica y la Economı́a
10.4.1.
Aplicación a la Fı́sica
La derivada tiene una importante aplicación en el campo de la fı́sica.
Si una partı́cula lleva un movimiento cualquiera en el que el espacio recorrido viene dado por una
función e(t), es decir, el espacio dado en función del tiempo, entonces se cumple que:
a) La derivada del espacio, e (t) representa la velocidad de la partı́cula en el instante t, es decir, la
derivada del espacio es la velocidad:
v(t) = e (t)
b) Además, la derivada de la velocidad, v (t) representa la aceleración de la partı́cula en cualquier
instante t, es decir, la derivada de la velocidad (o la derivada segunda del espacio) es la aceleración:
a(t) = v (t) = e (t)
Ejemplo: El espacio recorrido por un móvil viene dado por la función e(t) = 3t2 − t + 1.
a) Calcular la tasa de variación en el intervalo [2, 6].
b) Hallar la velocidad en el instante t = 0.
c) Hallar la velocidad y aceleración en el instante t = 2.
a) Aplicando la fórmula:
e(6) = 108 − 6 + 1 = 103, e(2) = 12 − 2 + 1 = 11
luego:
T V M [2, 6] =
b) La velocidad será:
103 − 11
92
e(6) − e(2)
=
=
= 23 m/s
6−2
4
4
v(t) = e (t) = 6t − 1 =⇒ v(0) = −1 m/s
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
176
c) En el instante 2:
v(2) = 11 m/s
Y la aceleración en ese mismo instante;
a(t) = v (t) = 6
Por tanto,
a(2) = 6 m/s2
la aceleración es constante, es un movimiento uniformemente acelerado.
10.4.2.
Aplicación a la Economı́a
La aplicación a la Economı́a se refiere al concepto de marginalidad.
Ası́, el coste marginal de fabricación de un producto es el incremento de coste que se produce
cuando se aumenta la producción en una unidad más.
Del mismo modo se habları́a del incremento de los ingresos por la última unidad vendida, ingreso
marginal.
En cualquier caso, siempre que se utilice el término marginal , se trata de la derivada de la función
de que se esté tratando, respecto de la variable de producción, que se mide en unidades fabricadas.
Supongamos, por ejemplo, que la función de costes de cierto producto viene dada por la expresión
c(x) = 30 + 50x − x2 , donde c(x) se expresa en euros y x en unidades.
El coste marginal para producir la unidad x + 1 serı́a c (x) = 50 − 2x.
En realidad, la derivada no proporciona exactamente el coste marginal, sino una aproximación
que facilita el cálculo. Dicho coste marignal, rigurosamente, viene dado por c(x + 1) − c(x), pero esta
diferencia se puede aproximar bien por la derivada c (x).
Si queremos calcular el coste marginal producido al producir la 3ª unidad, fijémonos en que estarı́amos calculando el coste marginal de la unidad nº 2, c (2) = 46, es decir, 46 euros.
Si no utilizásemos la derivada, el coste marginal serı́a:
c(3) = 30 + 150 − 9 = 171, c(2) = 30 + 100 − 4 = 126 =⇒ c(3) − c(2) = 171 − 126 = 45
no es el valor que obtenı́amos con la derivada, pero es una buena aproximación.
Las funciones de la Economı́a tienen un campo de validez que, por lo general, es restringido respecto
al dominio de definición de la función.
En este caso, por ejemplo, la función es válida desde x = 0 hasta x = 25; a partir de ahı́, si observamos el coste marginal, disminuyen los costes de fabricación, lo que es absurdo si se está fabricando
más.
Notemos, además que si queremos calcular el coste marginal si se quiere producir la unidad número
n, hemos de calcular la función de coste marginal evaluada en la unidad anterior, que es la última
unidad producida, es decir, en la unidad n − 1.
Lo mismo se puede decir si la función es de ingresos o de beneficios.
Ejercicios:
1. El desplazamiento de un móvil que se mueve a lo largo de una linea recta viene dado por la
2
función e(t) = et − 1.
Halla la velocidad y la aceleración del movimiento. En el instante inicial, ¿cuáles son éstas?.
2. Las funciones de ingresos y gastos correspondientes a cierto producto de consumo son, respectivamente:
I(x) = 80x − 0 1x2 , C(x) = 500 + 20x
. Halla la función beneficio y el beneficio marginal. ¿Para qué valores de x están definidas estas
funciones?.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.5.
177
Derivabilidad y continuidad
Se estudió en el tema anterior el concepto de continuidad de una función en un punto.
Vimos, por ejemplo, que intuitivamente se puede decir que una función es continua cuando se
puede dibujar sin levantar el lápiz del papel, o de manera más formal, cuando en el punto coinciden
los lı́mites laterales con el valor de la función en el punto, esto es:
lı́m f (x) = lı́m f (x) = f (a)
x→a−
x→a+
La condición para que una función sea derivable es más fuerte, más restrictiva. Para ello es necesario
definir las derivadas laterales.
Definición: Dado un punto a y una función f (x), se define la derivada lateral por la derecha de la
función f (x) y se expresa por f+ (a), como:
f+ (a) = lı́m
h→0+
f (a + h) − f (a)
h
Dado un punto a y una función f (x), se define la derivada lateral por la izquierda de la función f (x)
y se expresa porpor f− (a), como:
f− (a) = lı́m
h→0−
f (a + h) − f (a)
h
Definición: Diremos que una función es derivable en un punto a cuando existen y son finitas las
derivadas laterales y son iguales, es decir:
f+ (a) = f− (a)
Ejemplo: Estudiar la continuidad y derivabilidad de la función:
−x si x ≤ 0
f (x) =
x si x > 0
Calculando los lı́mites laterales:
lı́m f (x) = lı́m x = 0
x→0+
x→0
lı́m f (x) = lı́m −x = 0
x→0−
x→0
Además f (0) = 0, por tanto la función es continua en el punto x = 0 que es el único punto conflictivo.
Analicemos la derivabilidad en x = 0:
f− (0) = lı́m
h→0−
f (0 + h) − f (0)
−h − 0
−h
= lı́m
= lı́m
= lı́m −1 = −1
h→0
h→0 h
h→0
h
h
f+ (0) = lı́m
h→0+
f (0 + h) − f (0)
h−0
h
= lı́m
= lı́m = lı́m 1 = 1
h→0
h→0 h
h→0
h
h
Por tanto la función no es derivable en x = 0.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
178
Viendo la gráfica de la función, se observa lo que ocurre:
La función es continua pues se puede dibujar sin levantar el lápiz del papel, pero no es derivable
en el cero porque en dicho punto hay un punto anguloso, una “esquina”. En puntos como estos, la
función no es derivable.
Por tanto, se verifica que aunque una función puede ser continua en un punto y sin embargo no
ser derivable en ese mismo punto.
Sin embargo, la posibilidad contraria no es posible. Resumiendo:
Propiedad:
Si una función es derivable en un punto, entonces es continua en dicho punto.
Sin embargo, el recı́proco no es cierto, si una función es continua en un punto, la función puede ser o
no derivable en dicho punto.
Ejercicios:
1. Estudiar la continuidad y derivabilidad de la función:

x ≤ −2
−2x − 1 si
f (x) =
x2 − 3 si −2 < x ≤ 2

2x − 3 si
x>2
2. Calcula a y b para que sea derivable la función:
ax + 3 si x ≤ 1
g(x) =
2x2 − b si x > 1
Indicación: Primero impón la condición de que sea continua
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.6.
179
Aplicaciones de las derivadas al cálculo del crecimiento y decrecimiento de una función. Cálculo de extremos
Observemos la siguiente gráfica:
Figura 10.5: La pendiente de las tangentes (la derivada) es positiva si la función crece.
Si trazamos las correspondientes tangentes en diversos puntos, todos ellos donde la función es
creciente, obsevamos como la recta tangente está cada vez menos inclinada, lo que quiere decir (ya
que la inclinación de una recta se mide a través de su pendientes y sabemos que esta coincide con la
derivada ) que la derivada es cada vez menor.
Más aún, como las rectas tangentes tienen inclinación positiva (son rectas crecientes), las pendientes
son cada vez menores y positivas, es decir, la derivada es positiva en aquellos intervalos en los que la
función es creciente.
Si seguimos trazando tangentes, llegamos al punto 3, donde la tangente es totalmente horizontal,
es decir:
Figura 10.6: La pendiente de las tangentes (la derivada) es nula si la función tiene un extremo (un
valor máximo o mı́nimo).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
180
Decı́amos que la pendiente era decreciente, hasta que llega al máximo de la función, donde se ha
alcanzado el valor extremo de la pendiente. La recta es horizontal, no está inclinada y su pendiente es
cero.
Si seguimos trazando las tangentes, vemos ahora lo siguiente:
Figura 10.7: La pendiente de las tangentes (la derivada) es negativa si la función decrece.
Y ahora observamos que la pendiente de la recta (la derivada) es negativa, y cada vez menor, por
tanto si la función de decreciente, afirmamos que la función derivada es negativa.
Todo lo observado anteriormente lo podemos resumir en la siguiente propiedad.
Propiedad: Dada una función f (x), se cumple que:
a) Si f (x) > 0 (la derivada es positiva) entonces la función f (x) es creciente.
b) Si f (x) < 0 (la derivada es negativa) entonces la función f (x) es decreciente.
c) Si f (x) = 0 entonces la función puede presentar un extremo relativo (máximo o mı́nimo) en
dicho punto.
La manera práctica de proceder, por tanto, para determinar los extremos de una función, ası́ como
aquellos intervalos en los que la función crece o decrece es la siguiente:
* Calculamos la derivada de la función, f (x), y la igualamos a cero, resolvemos la ecuación resultante, cuyas soluciones son los posibles extremos de la función.
* Realizamos una tabla en la que tenemos que poner los puntos obtenidos anteriormente y además
los puntos conflictivos de la función (aquellos donde la función no está definida, o donde no es derivable....). Todos estos puntos se denominan puntos crı́ticos.
* En dicha tabla, estudiamos el signo de la derivada primera, f (x).
Si dicha derivada es positiva, nos indicará el crecimiento de la función, y si es negativa, será un signo
de su decrecimiento. El paso de un intervalo creciente a otro decreciente o viceversa nos indicará la
existencia de un máximo o un mı́nimo relativo de la función f (x).
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función: f (x) = x3 − 3x.
Comenzamos calculando la derivada: f (x) = 3x2 − 3.
Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
181
obtenemos dos puntos crı́ticos, y no hay más pues la función es polinómica y por tanto, su dominio
son todos los números reales y no presenta problemas. Hacemos una tabla como la siguiente:
f (x)
f (x)
−∞
−1
+
1
−
+∞
+
Para obtener los signos de f (x) basta tomar, por ejemplo, un punto en cada intervalo y sustituir en
la expresión de la derivada.
Entre −∞ y −1 tomamos el −2, con lo que:
f (−2) = 12 − 3 = 9 > 0
positiva. Entre −1 y 1, tomamos el 0, quedando:
f (0) = −3 < 0
negativa. Entre 1 e ∞ se toma el 2, y se obtiene:
f (2) = 12 − 3 = 9 > 0
positivo.
Concluimos que la función es creciente en el intervalo (−∞, −1) ∪ (1, ∞).
La función es decreciente en (−1, 1).
Además, se observa que presenta un máximo en el punto x = −1, y un mı́nimo en x = 1.
¿Cómo calcular la segunda coordenada del máximo y el mı́nimo?.
Basta sustituir en la función:
El máximo está en el punto (−1, f (−1)) = (−1, 2).
El mı́nimo está en el punto (1, f (1)) = (1, −2).
Ası́, la representación aproximada de la función será:
Figura 10.8: Gráfica de f (x) = x3 − 3x. Intervalos de crecimiento y extremos.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
182
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:
f (x) =
2x2 − 3x
ex
Derivando:
f (x) =
(4x − 3)ex − ex (2x2 − 3x)
ex (−2x2 + 7x − 3)
−2x2 + 7x − 3
=
=
(ex )2
(ex )2
ex
E igualando a cero:
1
−2x2 + 7x − 3
= 0 =⇒ −2x2 + 7x − 3 = 0 =⇒ x = 3, x =
x
e
2
No hay más puntos conflictivos, pues aunque hay denominador, nunca se hace cero, pues ex , la función
exponencial es siempre positiva, de modo que Dom f (x) = R.
Ası́ pues los únicos puntos crı́ticos son x = 3, x = 12 .
Hacemos la tabla:
−∞
1
2
3
+∞
+
−
f (x)
1
1
, 3 , decreciente en −∞,
∪ (3, ∞).
Con lo que f (x) es creciente en
2
2
Por tanto f (x) presenta un máximo relativo en:
9
(3, f (3)) = 3, 3 ≈ (3, 045)
e
f (x)
y un mı́nimo relativo en
1
,f
2
−
1
1 −1
,
=
≈ (0 5, −061)
2
2 e 12
Gráficamente:
Figura 10.9: Gráfica de f (x) =
2x2 − 3x
. Intervalos de crecimiento y extremos.
ex
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
10.7.
183
Aplicaciones de las derivadas al cálculo de la concavidad y
la convexidad, puntos de inflexión. Criterio para determinar
máximos y mı́nimos.
Igual que se aplican las derivadas para el cálculo de los máximos y los mı́nimos, y el crecimiento
o decrecimiento de la función, también se pueden aplicar para calcular la concavidad y la convexidad.
Fijémonos en la función siguiente, convexa (o, para evitar ambigüedades, cóncava hacia abajo):
Figura 10.10: La pendiente de las tangentes pasa de positiva a negativa (es decir, decrece) si la función
es cóncava hacia abajo
Al trazar las tangentes, nos fijamos en que cada vez son menores.
Empiezan siendo positivas y muy grandes, van decreciendo hasta que valen cero, y luego comienzan
a ser negativas y cada vez menores. Es decir, que la función derivada es decreciente, f (x) decreciente.
Si f (x) es decreciente, es que su derivada es negativa, es decir, f (x) < 0.
Por tanto se deduce que si la derivada segunda de la función es negativa, la función es cóncava
hacia abajo.
De igual modo si nos fijamos en una función cóncava (o cóncava hacia arriba):
Figura 10.11: La pendiente de las tangentes pasa de negativa a positiva (es decir, crece) si la función
es cóncava hacia arriba
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
184
En este caso la derivada es creciente, y por tanto la derivada segunda será positiva. Es decir, si la
derivada segunda es positiva, la función es cóncava hacia arriba.
Propiedad: Dada una función f (x), se cumple que:
a) Si f (x) > 0, entonces la función f (x) es cóncava hacia arriba.
b) Si f (x) < 0, entonces la función f (x) es cóncava hacia abajo.
c) Si f (x) = 0, entonces el punto es un posible punto de inflexión (un punto donde la función
pasa de cóncava hacia arrina a cóncava hacia abajo o viceversa) de la función.
El proceso para determinar la concavidad y puntos de inflexión es, por tanto, muy similar al del
cálculo del crecimiento, únicamente hay que hacer la derivada segunda e igualarla a cero. La tabla es
similar.
Ejemplo: Calcular la concavidad y convexidad de la función:
f (x) = x3 − 3x
Calculando la derivada segunda:
f (x) = 3x2 − 3 =⇒ f (x) = 6x
Igualando a cero, 6x = 0, de donde x = 0.
Es el único punto conflictivo, pues la función es polinómica.
Haciendo la tabla:
f (x)
f (x)
−∞
0
−
∩
+∞
+
∪
Ası́ pues la función es cóncava hacia arriba en (0, ∞) y cóncava hacia abajo en (−∞, 0).
Hay un punto de inflexión es (0, f (0)) = (0, 0).
Se observa gráficamente:
Figura 10.12: Gráfica de f (x) = x3 − 3x. Intervalos de concavidad y puntos de inflexión.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
185
Ejercicios: Estudiar la concavidad y convexidad, el crecimiento y el decrecimiento, los extremos
y puntos de inflexión de las siguientes funciones:
a) f (x) = 2x3 − 9x2
2
b) g(x) =
x
c) h(x) = x4 − 12x2 + 8
d) t(x) = x · e−2x
Además la derivada segunda permite discernir si un punto crı́tico es un máximo o un mı́nimo, en base
al siguiente resultado:
Propiedad: Si a es un punto tal que f (a) = 0 (un posible extremo relativo), entonces:
* Si f (a) > 0, entonces a es un mı́nimo de la función.
* Si f (a) < 0, entonces a es un máximo de la función.
* Si f (a) = 0 no podemos asegurar nada. (Aunque en realidad si se puede saber pero excede los
contenidos del curso).
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:
f (x) = x3 − 3x
Comenzamos calculando la derivada: f (x) = 3x2 − 3.
Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
, obtenemos dos puntos crı́ticos.
Calculando la derivada segunda:
Sustituyendo,
en x = 1 hay un mı́nimo.
f (x) = 6x
f (1) = 6 > 0
f (−1) = −6 < 0
en x = −1 hay un máximo.
Como ya habı́amos obtenido anteriormente.
10.8.
Representación gráfica de funciones
Con todas estas aplicaciones es sencillo representar gráficamente cualquier función, basándose en
los siguientes puntos:
1. Dominio de definición.
2. Puntos de corte con los ejes:
Con el eje x, y = 0.
Con el eje y, x = 0.
3. Simetrı́as.
Par si f (−x) = f (x).
Impar si f (−x) = −f (x).
No tiene simetrı́a si no se da ninguna de esas condiciones.
4. Ası́ntotas: Verticales, Horizontales y Oblicuas.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
186
5. Crecimiento y decrecimiento. Extremos relativos.
6. Concavidad y convexidad. Puntos de inflexión.
Ejemplo: Representa gráficamente la función f (x) =
3x − 1
.
3x2 + 1
1. Dominio de definición
Igualando a cero el denominador:
−1
=⇒ x =
3x + 1 = 0 =⇒ x =
3
2
2
−1
=
3
de modo que Dom f (x) = R.
2. Puntos de corte con los ejes
Con el eje x, f (x) = 0:
1
3x − 1
=⇒ 3x − 1 = 0 =⇒ x =
2
3x + 1
3
1
,0 .
el punto es
3
Con el eje y, x = 0:
−1
3·0−1
=
= −1
2
3·0 +1
1
f (0) =
el punto es (0, −1).
3. Simetrı́as
f (−x) =
f no es par.
f (−x) =
−3x − 1
3x − 1
3(−x) − 1
=
= 2
= f (x)
2
2
3(−x) + 1
3x + 1
3x + 1
−3x − 1
3x − 1
3(−x) − 1
=
= − 2
= −f (x)
3(−x)2 + 1
3x2 + 1
3x + 1
f no es impar, luego f no tiene simetrı́as.
4. Ası́ntotas
Verticales: No tiene puesto que Dom f (x) = R.
Horizontales:
3x − 1
=0
3x2 + 1
3x − 1
3(−x) − 1
−3x − 1
= lı́m
= lı́m
=0
lı́m
x→−∞ 3x2 + 1
x→∞ 3(−x)2 + 1
x→∞ 3x2 + 1
lı́m
x→∞
Hay una ası́ntota horizontal en y = 0.
Oblicuas: No hay, pues hay horizontales.
5. Crecimiento
Derivando:
f (x) =
3(3x2 + 1) − 6x(3x − 1)
−9x2 + 6x + 3
=
=0
(3x2 + 1)2
(3x2 + 1)2
Igualando a cero:
−9x2 + 6x + 3 = 0 =⇒ −3x2 + 2x + 1 = 0 =⇒ x = 1 x =
−1
3
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
187
No hay más puntos crı́ticos, pues Dom f (x) = R.
Haciendo la tabla:
−∞
f (x)
f (x)
Luego f (x) es creciente en
−1
,1
3
−
−1
3
1
y decreciente en
Tiene un máximo relativo en (1, f (1)) =
−1 −3
−1 −6
,
=
,
.
3 4
3 2
1
1,
2
+∞
−
+
−1
−∞,
3
∪ (1, ∞).
y un máximo relativo en
−1 −2
, 4
3
3
=
6. Concavidad
Calculando la derivada segunda, es:
f (x) =
54x3 − 54x2 − 54x + 6
(3x2 + 1)3
e igualando a cero no se obtienen raı́ces exactas, por lo que no se puede hacer este estudio.
Con los datos que tenemos, podemos hacer un esbozo de la gráfica de la función:
Figura 10.13: Gráfica de f (x) =
10.9.
3x − 1
.
3x2 + 1
Optimización de funciones
La última aplicación de las derivada es la optimización de funciones. Consiste en calcular los
máximos y los mı́nimos de cierta función que se obtiene de un problema surgido de una situación
cotidiana.
En estos problemas siempre se tiene:
* Una función de la que hay que calcular el máximo o el mı́nimo, y que habitualmente tiene dos
variables, x e y.
* Una relación entre x e y, que permite despejar una de las dos para obtener una función con una
sola variable.
Veamos cómo se aplica:
Ejemplo: De entre todos los números cuya suma es 36, calcula aquellos cuya suma de cuadrados
es mı́nimo.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN
188
Los números buscados son x e y.
La función a minimizar es f (x, y) = x2 + y 2 .
Tenemos dos variables, luego todavı́a no podemos derivar.
La relación que tenemos es que los números suman 36, es decir, x + y = 36.
Despejando, y = 36 − x.
Y por tanto, la función a minimizar es:
f (x) = x2 + (36 − x)2
que ya tiene sólo una vatiable.
Para buscar sus mı́nimos, calculamos la derivada f (x):
f (x) = 2x + 2(36 − x)(−1) = 2x − 72 + 2x = 4x − 72
Igualando a cero,
4x − 72 = 0 =⇒ x =
Además calculando la derivada segunda:
con lo que sustituyendo:
72
= 18
4
f (x) = 4
f (18) = 4 > 0
es positivo luego el punto x = 18 es un mı́nimo.
La solución es, por tanto, un número x = 18 y el otro y = 36 − 18 = 18.
Los dos números son iguales a 18.
Ejercicios:
1. Descompón el número 48 en dos sumandos tales que el quı́ntuplo del cuadrado del primero más
el séxtuplo del cuadrado del segundo sea mı́nimo.
2. Halla un número positivo cuya suma con 4 veces su recı́proco sea mı́nima.
3. Halla las dimensiones del rectángulo de área máxima inscrito en una circunferencia de 20 cm de
radio.
4. La suma de tres números es 60. El primero más el doble del segundo más el triple del tercero
suman 120. Halla los números que verifican estas condiciones y cuyo producto es máximo.
5. Un depósito abierto de chapa y de base cuadrada debe tener capacidad para 13500 litros. ¿Cuáles
han de ser sus dimensiones para que se precise la menor cantidad de chapa?
6. Una ventana normanda consiste en un rectángulo coronado con un semicı́rculo. Encontrar las
dimensiones de la ventana de área máxima si su perı́metro es 10 metros.
7. Una hoja de papel debe contener 18 cm2 de texto impreso. Los márgenes superior e inferior
deben tener 2 cm cada uno y los laterales 1 cm. Calcular las dimensiones de la hoja para que el
gasto de papel sea mı́nimo.
Capı́tulo 11
INTEGRACIÓN. CÁLCULO DE
ÁREAS
11.1.
Introducción
Si el problema del cálculo de la recta tangente llevó a los matemáticos del siglo XVII al desarrollo de
las técnicas de la derivación, otro problema, el del cálculo del área encerrada por una curva, propició el
desrrollo de las técnicas de integración.
Se trataba, por ejemplo, de hallar el área encerrada bajo la curva f (x) entre los puntos a y b:
Se conocı́an fórmulas para recintos de forma igual a figuras geométricas(rectangulares, triangulares,
e incluso algunas de curvas especı́ficas), pero si la curva no tenı́a forma regular, no se conocı́a, en
general, su área exacta.
El cálculo integral da respuesta a esta y otras cuestiones.
11.2.
Primitivas. Integral indefinida
Dada un función f (x), sabemos calcular su derivada f (x), e incluso sus derivadas sucesivas, f (x),
f (x), etc.
Sin embargo ahora nos planteamos el problema recı́proco:
Dada una función f (x), se trata de encontrar otra, F (x), tal que al derivar esta última función,
obtengamos la función inicial, es decir:
F (x) = f (x)
Veamos un ejemplo:
Tomemos la función f (x) = 2x.
Se trata de encontrar una función F (x) tal que al derivarla nos de f (x).
193
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
194
Si pensamos un poco, llegamos a que tal función puede ser:
F (x) = x2
pues su derivada es precisamente f (x) = 2x.
Ahora bien, no es F (x) la única función que cumple eso.
Tomemos esta otra:
F (x) = x2 + 43
También su derivada es f (x) = 2x.
Esto nos hace ver que no sólo hay una función que cumple lo requerido, sino infinitas, sin más que
añadir cualquier número. Esto se expresa como:
F (x) = x2 + C
Una función F (x) como la que hemos encontrado se llama primitiva de f (x), y hemos visto que si una
función tiene una primitiva, entonces tiene infinitas.
Llamaremos integral indefinida de la función al conjunto de todas estas primitivas.
Lo representaremos, en el caso anterior, como:
2x dx = x2 + C, C ∈ R
Definición: Dada una función f (x), se llama primitiva de f (x) a otra función F (x) tal que:
F (x) = f (x)
Se denomina integral indefinida de f (x) al conjunto de todas las primitivas (hay infinitas) de f (x), y
se representa por:
f (x) dx = F (x) + C, C ∈ R
Ası́, el problema de calcular una primitiva de una función es inverso al de calcular una derivada; como
son operaciones inversas la suma y la resta, el producto y el cociente, la potenciación y la radicación.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
11.3.
195
Primitivas inmediatas
De modo análogo al caso de las derivadas, debemos recordar algunas primitivas de las funciones
más usuales:
1. − k dx = kx + C, C ∈ R, k ∈ R
2. −
3. −
xn+1
+ C, C ∈ R,
n+1
1
dx = ln x + C,
dx =
x
xn dx =
, n ∈ R,
x−1
C∈R
4. −
ax dx =
ax
+ C,
ln a
n = −1
C∈R
5. −
ex dx = ex + C,
C∈R
6. −
sen x dx = − cos x + C,
C∈R
7. −
8. −
9. −
cos x dx = sen x + C,
C∈R
1
dx = arctan x,
1 + x2
C∈R
1
√
dx = arc sen x + C,
1 − x2
C∈R
−1
dx = arc cos x + C, C ∈ R
1 − x2
Estas primitivas permiten calcular algunas integrales sencillas.
Además es conveniente la utilización de las dos propiedades siguientes:
10. −
√
1.
k · f (x) dx = k ·
k∈R
f (x) dx,
Esta propiedad indica que si hay un número multiplicando a toda la integral, entonces se puede
sacar fuera de la integral.
2.
(f (x) ± g(x)) dx =
f (x) dx ±
g(x) dx
Lo que indica esta propiedad es que si tenemos una suma (o resta) de dos funciones, entonces
podemos separar la integral en la suma (o resta) de dos integrales.
Utilizando estas propiedades de manera combinada, se calculan las primeras integrales sencillas.
Veamos algunos ejemplos:
Ejemplo: Calcular las integrales siguientes:
√
x dx b)
(15x4 + 10x3 − 12x2 − 8x + 5) dx
a)
c)
2
x
+ e − 3 cos x dx
x
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
196
Para la primera integral , expresamos la raı́z en forma de potencia y utlizamos la integral inmediata
2:
√
√
1
3
3
√
1
2 x3
2x x
x2
x 2 +1
2x 2
2
=
=
+ C, C ∈ R
= 3 =
x dx = x dx = 1
3
3
3
2 +1
2
En la segunda, separamos las sucesivas sumas y restas y sacamos los números fuera de las integrales,
aplicando las propiedades de la integral para luego aplicar la integral inmediata 2 de nuevo:
4
3
2
4
3
2
(15x + 10x − 12x − 8x + 5) dx = 15x dx + 10x dx − 12x dx − 8x dx + 5 dx =
15x5 10x4 12x3 8x2
4
3
2
+
−
−
+ 5x =
= 15 x dx + 10 x dx − 12 x dx − 8 x dx + 5 dx =
5
4
3
2
5x4
− 4x3 − 4x2 + 5x + C, C ∈ R
= 3x5 +
2
Por último, volvemos a separar las integrales y los números y aplicamos la tabla de integrales inmediatas:
2
2
x
+ e − 3 cos x dx =
dx + ex dx − 3 cos x dx =
x
x
1
dx + ex dx − 3 cos x dx = 2 ln x + ex − 3 · sen x + C, C ∈ R
=2
x
Ejercicio: Calcular las siguientes integrales:
5x3 − 4x
dx b)
sen x + 2 cos x + 3 dx c)
(18x + 1) dx
a)
x4
√
3
2
4
2
2
+ 2 + 3 dx f )
2 3 x dx
(x + 2) dx g)
d)
(2x − 1) (2x + 1) dx e)
x x
x
11.4.
Integración por cambio de variable
A veces las integrales no son tan simples como las inmediatas, sino que hay pequeños detalles que
nos impiden aplicar la tabla de primitivas.
Por ejemplo, podemos calcular sin problema la integral:
sen x dx = − cos x + C, C ∈ R
pues es inmediata.
Sin embargo otra integral tan parecida y de aspecto simple como:
sen (2x + 6) dx
ya no la sabemos calcular porque no aparece en la tabla de primitivas inmediatas.
El razonamiento a utilizar en este caso es el siguiente:
Si en vez de tener en la integral anterior 2x + 6, tuviésemos simplemente x, la integral serı́a inmediata.
Por tanto, la idea es la siguiente, vamos a cambiar la variable x por otra nueva (que usualmente
denotaremos por t) y que simplifica la tarea.
Llamaremos t a la variable que tiene la siguiente relación con x, en este caso:
t = 2x + 6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
197
Ahora bien, se nos plantea otro problema. En la integral aparece el término dx (léase diferencial de x).
Lo lógico es que si la integral tiene una nueva variable t, en vez de aparecer diferencial de x, aparezca
diferencial de t, para no mezclar las variables.
Aunque pueda parecer una forma un poco artificial, daremos aquı́ la forma para calcular dt.
Simplemente se deriva en la expresión del cambio de variable:
Derivando t = 2x + 6, se obtiene, 1 · dt = 2 · dx, es decir que:
dx =
dt
2
Una vez calculado esto, ya podemos calcular la integral:
1
1
dt
=
sen t · dt = (− cos t) =
sen t ·
sen (2x + 6) dx =
cambio
2
2
2
−1
cos (2x + 6) + C, C ∈ R
=
deshacer el cambio 2
El método del cambio de variable permite resolver de manera simple integrales que de otro modo no
se podrı́an abordar.
Ejemplo:
e2x
3 −5
x2 dx
Razonando como antes, se observa que la parte problemática de la integral está en el exponente de
dicha integral.
Hacemos entonces el cambio:
t = 2x3 − 5
y calculando el diferencial:
dt = 6x2 dx
de donde despejamos la parte que aparece en la integral:
x2 dx =
dt
6
y por tanto la integral queda reducida a:
1
1
3
dt
et dt = et
et =
e2x −5 x2 dx =
cambio
6
6
6
Ejemplo:
=
deshacer el cambio
1 2x3 −5
e
+ C, C ∈ R
6
(6x2 + 15x + 3)178 (12x + 15) dx
El cambio necesario en este caso es:
t = 6x2 + 15x + 3
con lo que queda:
dt = 12x + 15 dx
y por tanto la integral es:
t179
2
178
=
t178 dt =
(6x + 15x + 3) (12x + 15) dx = =
cambio
179
(6x2 + 15x + 3)179
+ C, C ∈ R
=
deshacer el cambio
179
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
198
Ejercicios: Calcula mediante integración por cambio de variable las siguientes integrales:
3x2 − 2x
3
2
2
dx Cambio:t = x − x + 3 b)
cos (x + 1) 2x dx c)
5sen (3x + 1) dx
a)
x3 − x2 + 3
5
1
2x + 1
(x − 4) 7 dx g)
dx e)
ex+2 dx f )
dx
d)
cos
3
1+x
1
1 + cos x
x2
dx
dx i)
xe dx j)
h)
x + sen x
(x + 2)3
11.5.
Determinación de una primitiva particular de una función
Ya hemos visto que si una función tiene una primitiva, entonces tiene infinitas, lo que representamos
añadiendo la constante C al cálculo de la integral.
Ahora bien, si queremos determinar una primitiva concreta de entre todas esas infinitas, necesitamos un dato más, como por ejemplo, un punto por el que pase dicha función.
Ejemplo: Calcular la primitiva de la función:
f (x) = x3 − 2x + 5
que pasa por el punto (1, 3).
Calculamos en primer lugar todas las primitivas de f (x), es decir la integral indefinida:
x2
x4
x4
− 2 + 5x =
− x2 + 5x + C, C ∈ R
x3 − 2x + 5 dx =
4
2
4
De todas estas primitivas, la única que cumple que pasa por el (1, 3), es aquella tal que:
14
− 12 + 5 · 1 + C = 3
4
es decir
17
−5
1
− 1 + 5 + C = 3 =⇒
+ C = 3 =⇒ C =
4
4
4
y por tanto la primitiva buscada es:
F (x) =
5
x4
− x2 + 5x −
4
4
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
11.6.
199
El problema del cálculo del área
Ya se dijo que el desarrollo del cálculo integral en buena medida se debe al problema de calcular
áreas de funciones como esta:
Una aproximación para calcular el área consiste en dividir el intervalo en otros más pequeños y
calcular el área de los rectángulos que se forman bien al tomar el valor de la función en un extremo
del intervalo, bien en otro entremo, es decir:
Figura 11.1: Aproximación del área mediante rectángulos más pequeños que la función
En este caso, hemos dividido el intervalo mayor en 4 subintevalos más pequeños y hemos tomado
como altura de los rectángulos el valor de la función en el extremo superior del intervalo.
Ası́ la suma de las áreas de los rectángulos son más pequeñas que el área buscada.
Área suma rectángulos< Área de la función
Esta suma, en la que la suma de las áreas de los rectángulos es menor que el área total se denomina
suma inferior de la función en el intervalo.
Pero podrı́amos haber tomado estos otros rectángulos:
Figura 11.2: Aproximación del área mediante rectángulos más grandes que la función
Ahora la suma del área de los rectángulos es mayor que el área total, es decir:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
200
Área de la función< Área suma rectángulos
Esta suma, en la que la suma de las áreas de los rectángulos es mayor que el área total se denomina
suma superior de la función en el intervalo.
Por tanto, el área buscada está entre la suma superior y la suma inferior de la función:
Suma inferior≤ Área≤ Suma superior
Además, obervemos lo que ocurre cuando los subintervalos que tomamos son cada vez menores:
Vemos que las sumas inferiores son cada vez mayores y cada vez más cercanas al área buscada, a
medida que los intervalos son más pequeños.
Figura 11.3: La aproximación se mejora al aumentar el número de rectángulos
Por contra, las sumas superiores son cada vez más pequeñas y también cada vez más cercanas al
área buscada, a medida que los intervalos son más pequeños.
A medida que los subintervalos son menores, las sumas superiores e inferiores se acercan al área
buscada. Para llegar a calcular dicha área, necesitamos calcular una suma infinita (la de los infinitos
rectángulos a medida que estos son más pequeños), cosa que en matemáticas se denomina sumar una
serie.
Esto excede con mucho los contenidos del curso. Lo que se necesita saber es que tanto las sumas
superiores como las sumas inferiores convergen (se acercan) al área buscada, y dicha suma se representa,
si la función es f (x) y el intervalo es [a, b], por la integral:
b
f (x) dx
a
Ahora bien, el siguiente problema es cómo se calcula esta integral, pues en las integrales indefinidas
no habı́amos incluido ningún intervalo.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
11.7.
201
La integral definida. La regla de Barrow
Se denomina integral definida de la función f (x) en el intervalo [a, b] a la expresión:
b
f (x) dx
a
La integral definida posee las mismas propiedades que la definida, es decir:
1.
b
b
k∈R
f (x) dx,
a
2.
b
k · f (x) dx = k ·
a
(f (x) ± g(x)) dx =
a
b
f (x) dx ±
a
b
g(x) dx
a
La integral definida, puesto que representa, si la función es positiva, el área que encierra la función
con el eje x, tiene algunas propiedades tales como:
1. Si c es un punto que está dentro del intervalo [a, b], entonces:
c
b
b
f (x) dx =
f (x) dx +
f (x) dx
a
a
c
En otras palabras, el área de la función desde a hasta b es la suma de las áreas de la función
desde a hasta c y desde c hasta b, si la función es positiva.
2. Si calculamos la integral de derecha a izquierda ,en vez de izquierda a derecha se cumple:
a
b
f (x) dx = −
f (x) dx
a
b
3. La integral cuando el intervalo se reduce a un punto es cero:
a
f (x) dx = 0
a
Pero sin duda la propiedad más importante, y que permite calcular integrales definidas es la llamada
Regla de Barrow.
Regla de Barrow: Si f (x) es una función que tiene primitiva F (x), y queremos calcular su integral
definida en un intervalo [a, b], se cumple que:
a
b
f (x) dx = F (x)]x=b
x=a = F (b) − F (a)
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
Ejemplo: Calcular la integral definida:
3
202
x2 dx
1
e interpretar el resultado geométricamente.
Aplicando la regla de Barrow, queda:
1
3
x3
x dx =
3
x=3
2
=
x=1
27 1
−
3
3
=
26
≈ 8 67 u2
3
donde u2 representa unidades de área.
Geométricamente es el área representada en la figura:
Ejercicio: Utilizando la regla de Barrow, calcula el valor de las siguientes integrales definidas:
4
4
1
3
3
2
2
4
2
(2x −4x +5x−2) dx b)
(3x+1) dx c)
(2x −3x −7) dx d)
(x+1)(x−2) dx
a)
1
−1
2
−2
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
11.8.
203
Aplicaciones de la integral definida al cálculo de áreas de recintos planos
La aplicación de la integral definida para el cálculo de áreas depende de cómo sea la función en el
intervalo concreto. Se pueden presentar los siguientes casos:
11.8.1.
Áreas limitadas por una función y el eje x
1. La función es siempre positiva siempre en el intevalo: En este caso el área simplemente viene
dada por:
b
f (x) dx
Área =
a
donde a y b son los puntos entre los que queremos calcular el área, y que habitualmente son los
puntos de corte de la función con el eje x.
Geométricamente:
2. La función se siempre negativa dentro del intervalo: En este caso el área viene dada por:
b
f (x) dx
Área = a
Geométricamente:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
204
3. Si la función es a veces positiva y a veces negativa en el intervalo, se calculan los puntos de corte
y se calculan las integrales sucesivas, utilizando los apartados anteriores:
En la figura, serı́a:
c
Área =
a
f (x) dx + d
c
b
f (x) dx +
f (x) dx
d
En cualquier caso, y cuando calculemos áreas, siempre es conveniente comenzar por calcular los puntos
de corte de la función con el eje x para saber si es positiva o negativa y calcular las integrales
correspondientes, o bien utilizar siempre el valor absoluto para asegurarnos de que el resultado es
positivo.
Ejemplo: Calcular el área que encierra con el eje x la gráfica de la función:
f (x) = x3 − 7x2 + 10x
No hace falta dibujar la gráfica.
Calculamos los puntos de corte con el eje x:
x − 7x + 10x = 0 =⇒ x(x − 7x + 10) = 0 =⇒
3
2
2
x=0
=⇒ x = 0, x = 2, x = 5
x2 − 7x + 10 = 0
Corta al eje x en (0, 0), (2, 0) y (5, 0).
Veamos cómo es la función entre 0 y 2. Tomamos un valor situado en ese intervalo y lo sustituimos
en la función. Se obtiene:
f (1) = 13 − 7 · 12 + 10 · 1 = 1 − 7 + 10 = 4
como 4 es positivo, significa que la función es positiva en ese intervalo, luego el área será:
x=2
x3
x2
x4
− 7 + 10
x − 7x + 10x dx =
=
Área =
4
3
2
0
x=0
4
23
22
04
03
02
56
16 2
2
− 7 + 10
−
− 7 + 10
= 4−
+ 20 =
u
=
4
3
2
4
3
2
3
3
2
3
2
En el otro intervalo, entre el 2 y el 5, tomamos otro valor para saber si la función es positiva o negativa:
f (3) = 33 − 7 · 32 + 10 · 3 = 27 − 63 + 30 = −6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
205
la función es negativa en el intervalo, luego el área será:
4
5
x=5 3
2
x
x
x
− 7 + 10
x3 − 7x2 + 10x dx = Área = =
4
3
2
2
x=2 4
4
3
2
3
2 5
−125 16 −63 63 2
5
5
2
2
2
=
=
=
= − 7 + 10
−
− 7 + 10
−
u
4
3
2
4
3
2 12
3 4 4
En total el área pedida será:
253 2
16 63
+
=
u ≈ 21 08 u2
3
4
12
Gráficamente:
Observa lo importante que es diferenciar los dos intervalos, pues si simplemente hubiésemos calculado, sin más:
5
x3 − 7x2 + 10x dx
0
sin separar, el resultado serı́a:
5
x3 − 7x2 + 10x dx = −10 42
0
(Compruébala) que no es el área buscada, sino la diferencia entre las áreas.
Desde luego, si es posible, es mejor hacer un dibujo para saber como va la gráfica y determinar el
área a calcular.
Ejercicio: Calcula las áreas encerradas por el eje x y las funciones siguientes:
a) f (x) = x − x3
b) g(x) = −x2 + 9
c) h(x) = x2 − 2x − 3 entre x=1 y x=5.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
11.8.2.
206
Áreas limitadas por dos funciones
También es posible aplicar las integrales definidas para el cálculo de áreas de recintos limitados
por dos curvas, por ejemplo el de la figura:
Si las curvas son f (x) y g(x) se cumple que el área limitada por las dos curvas en el intervalo [a, b]
es:
b
(f (x) − g(x)) dx
a
siempre que f (x) esté por encima de g(x) en el intervalo [a, b].
Si las curvas se cortan en el intervalo, se subdivide el intervalo en otros menores, en cada uno de los
cuales se aplican la integral anterior, determinando qué curva está por encima, y se suma el resultado.
En todo caso siempre es necesario hallar los puntos de corte entre las curvas, que se calculan
igualando las expresiones algebraicas de ambas funciones:
f (x) = g(x)
y resolviendo la ecuación resultante.
Ejemplo: Calcular el área limitada por las curvas f (x) = x2 − 1 y g(x) = 4x − 4.
Comenzamos calculando los puntos de corte de las funciones:
f (x) = g(x) =⇒ x2 − 1 = 4x − 4 =⇒ x2 − 4x + 3 = 0 =⇒ x = 1, x = 3
Las funciones se cortan en los puntos 1 y 3.
Veamos qué función está por encima y cuál por debajo en ese intervalo.
Dando un valor intermedio, por ejemplo el 2:
f (2) = 22 − 1 = 3
g(2) = 8 − 4 = 4
Como el valor de g(x) es mayor, significa que g(x) está por encima de f (x) en el intervalo, de modo
que el valor del área será el dado por la integral definida:
3
3
3
2
(g(x) − f (x)) dx =
(4x − 4 − (x − 1)) dx =
4x − 3 − x2 dx =
Área =
1
1
1
x=3
4 2
x3
1
2
=
u ≈ 1 33 u2
= (18 − 9 − 9) − 2 − 3 −
= 2x − 3x −
3
3
3
x=1
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
207
Si se hace un dibujo, lo cuál es sencillo porque se trata de una recta y una parábola:
Ejercicio: Calcular el área encerrada por las curvas:
a) f (x) = x2 − 2x y g(x) = 6x − x2
b) f (x) = x2 y g(x) = x + 2
c) f (x) = x3 y g(x) = 2x
11.9.
Otras aplicaciones de las integrales
Las aplicaciones de las integrales a las Ciencias Sociales se relacionan con las de las derivadas.
Sabemos, por ejemplo, que si cierta función I(x), es la función de ingresos de una determinada
empresa, la función de ingresos marginal es su derivada I (x).
Las integrales, al ser la operación recı́proca, permiten calcular la función de ingresos conocida la
de ingresos marginal, es decir:
I (x) dx = I(x) + C, C ∈ R
(Lo mismo si la función es de coste o de beneficio, etc).
Por tanto, en general, conociendo la función de cambio (o crecimiento) de cualquier proceso,
integrando se puede conocer la función que mide dicho proceso.
Ejemplo: El ritmo de crecimiento de la población de palomas en una ciudad viene dado por la función:
f (x) = 2x − 0 5x2
x en años a partir del actual y f (x) en miles de palomas.
Actualmente hay 2500 palomas.
a) ¿Cuántas habrá dentro de x años?
b) ¿En cuánto aumentará la población durante el segundo semestre a partir del momento actual?
c) ¿Hasta cuando aumenta la población de palomas?. ¿Qué número máximo alcanza?.
a) Como conocemos la función de crecimiento, la función que da el número total de palomas será una
primitiva de ésta:
1
F (x) = f (x) dx = 2x − 0 5x2 dx = x2 − x3 + C, C ∈ R
6
Para determinar C, sabemos que la población de palomas ahora mismo es de 2500, es decir:
F (0) = 2 5
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
208
luego sustituyendo:
1 3
· 0 + C = 2 5 =⇒ C = 2 5
6
La población de palomas sigue una función:
02 −
1
F (x) = x2 − x3 + 2 5
6
b) El segundo semestre, x va desde 0 5 hasta 1, y el aumento de palomas será:
F (1) − F (0 5) =
29
20 131
−
=
= 0 604
6
48
49
es decir, 604 palomas (recuerda que la función viene dada en miles de palomas).
c) Calculamos los máximos y mimimos de F (x).
Como:
F (x) = f (x)
resulta que igualamos f (x) = 0, y queda:
2x − 0 5x2 = 0 =⇒ x(2 − 0 5x) = 0 =⇒ x = 0, x = 4
Para saber si son máximos o mı́nimos, con la derivada segunda:
F (x) = 2 − x
luego:
x = 0 es un mı́nimo y:
F (0) = 2
F (4) = −2
x = 4 es un máximo, luego a lo sumo, la población de palomas se dará a los 4 años a partir de ahora,
es decir:
1
64
+ 2 5 = 7 833
F (4) = 42 − 43 + 2 5 = 16 −
6
6
aproximadamente 7833 palomas.
La gráfica de F(x) es:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS
209
Ejercicios:
√
1. Supongamos que dentro de x meses la población de tu ciudad crecerá a razón de 5+4 x personas
por mes.
Si la población actual es de 7500 personas.
a) ¿Cuál será la población dentro de un año?
b) ¿En cuántos habitantes aumentará durante el segundo año?
c) ¿Llegará a algún máximo su número de habitantes?.
2. Halla la función de beneficio de una empresa, B(x), sabiendo que los costes e ingresos marginales
, c(x) e i(x), vienen dados respectivamente por las funciones:
c(x) = 0 04x + 4
con C(0) = 80 , siendo C(x) la función de coste.
i(x) = 200 − 2x
Descargar