la aleatoriedad en los modelos matemáticos utilizados en las

Anuncio
FERNANDO HERNÁNDEZ PALACIOS
LA ALEATORIEDAD EN LOS
MODELOS MATEMÁTICOS
UTILIZADOS EN LAS CIENCIAS
SOCIALES
Hoy en día se ha generalizado el uso de modelos en las ciencias sociales.
Entendemos por modelo un conjunto de relaciones matemáticas que expresan en forma simplificada e idealizada las características básicas de un
fenómeno social particular.
El uso de los modelos en las ciencias sociales data, de hecho, de mucho
tiempo atrás, aunque el concepto mismo de modelo ha sufrido cambios
importantes.1
El origen del uso de los modelos en las ciencias sociales está en que al
necesitar abstraer la realidad para poder conocerla dado que no es posible
aprehender los fenómenos sociales en toda su complejidad, el procedimiento tiene que ser escoger los factores que parezcan ser los más importantes y las relaciones que se den entre ellos, centrando nuestra atención sólo en ellos. Esto es un modelo.
Los modelos no tienen que ser matemáticos. Sin embargo el uso de las
matemáticas en las ciencias sociales es hoy generalizado pues ha permitido una "economía" del pensamiento y ha forzado al científico social a
hacer explícitos sus supuestos en cada etapa de razonamiento.'
Así pues, un modelo de los empleados en las ciencias sociales está constituido por un conjunto de ecuaciones o funciones entre las variables más
importantes. En este caso las variables representan a los factores que consideramos centrales en el fenómeno social que queremos analizar, y las
1
Véase Dagum, Camilo y Estela M. Bee de Dagum: Introducción a la ironometría.
México. Siglo XXI Editores. 1971. Cap. 1.
2
No vamos a discutir aquí, pues no es el objeto de este trabajo, las ventajas y
desventajas de un enfoque matemático en las ciencias sociales, tema por demás
muy debatido y sobre el que existe una amplia y bien conocida bibliografía.
333
ecuaciones representan las relaciones más importantes entre esos factores
y sobre las que fijaremos nuestra atención,
Se suele clasificar las ecuaciones de un modelo en: a) de comportamiento, si explican ía manera en que actúan los sujetos sociales que se
analizan; b) institucionales o legales, si reflejan la manera en que las instituciones sociales y las leyes influyen en la realidad social; c) tecnológicas, si explican los modos de producción; d) de definición o identidades,
y e) de equilibrio, que resultan de una condición impuesta.
Á su vez, las variables se suelen clasificar en: a) endógenas, si sus valores van a ser determinados por soluciones particulares del sistema de
ecuaciones que integran el modelo; b) predeterminadas, si sus valores provienen de fuera del modelo; c) aleatorias o estocásticas, si no son observables y cumplen con la función de recoger el conjunto de causas no
especificadas explícitamente en un modelo, y d) expectativas, si no son
observables pero se refieren a valores esperados o deseados.
Dentro de este marco general, el objeto de este trabajo es discutir algunos supuestos que comúnmente se hacen en el uso de las variables aleatorias en modelos sociales,
Para ello primero presentaremos brevemente el uso de las variables
aleatorias en un modelo para precisar sus supuestos, y después de un
marco teórico pasaremos a discutir esos supuestos.
Así pues, no pretendemos hacer un análisis exhaustivo del comportamiento aleatorio de algunas de las variables que intervienen en los modelos matemáticos que representan realidades de tipo social, sino más bien
complementar y uniformar algunos de los criterios que los estudiosos del
tema han tratado.
El enfoque será fundamentalmente probabilístico aprovechando las contribuciones que a las matemáticas sociales han hecho los modernos métodos estadísticos.
I
Consideremos un modelo cualquiera formado por un conjunto de ecuaciones que dan relaciones entre variables, y que dicho modelo cumple con
los requisitos de consistencia e independencia de modo tal que admite
solución,
Consideremos, asimismo, que las ecuaciones de nuestro modelo son lineales, lo que es un supuesto simplificador pero que no resta generalidad
a nuestra discución. Dicho modelo puede representarse en forma matriciul de la siguiente manera:
334
*
(1)
Y = Xp
-G)
Este modelo tiene como componentes un vector Y = I :
I cuyos
elementos yt(i = l
n) son los valores observados de una cierta variable, los cuales dependen del comportamiento de las variables
Xj, X3,
Xk, las cuales constituyen la matriz X del modelo, y un
vector de parámetros fi que representan los valores que para cada ecuación (2) definen el modelo
(2)
Yi = fix + &X 2l +
+ y§kXu
Un modelo como éste resulta de un desarrollo teórico y del análisis de
una realidad; esto es, se espera que el comportamiento de la variable
Y esté en relación con los valores de las variables X de tal manera que
existan los parámetros que permitan identificar el modelo y lograr su
cuantificación.
Para la estimación de los parámetros /ii existen métodos econométricos como el de mínimos cuadrados en el cual los valores observados de
las variables explicativas son ajustados a un modelo del tipo (1).
La ecuación matricial (1) define un hiperplano cuyos puntos, si bien
no necesariamente coinciden con los valores que muestran el verdadero
comportamiento de las variables, hace posible que las diferencias en las
observaciones sean mínimas.
Lo anterior puede expresarse de la siguiente manera:
(3)
Y=X£+e
donde ¡3 es el vector de parámetros que muestran la realidad del comportamiento de las variables, Y y X son como antes el vector y la matriz
de los valores observados de las variables, y c es el vector donde se especifican las diferencias cuantitativas entre este modelo (3) con el modelo (1).
De lo anterior es obvio que el criterio para obtener el mejor ajuste en
el hiperplano (1) es el de minimizar las diferencias, es decir, que el hiperplano debe ser tal que
i * -* o
1=1
La existencia de esas diferencias €i nos obligan a pensar en la existencia
335
de factores externos al modelo que no sólo influyen en el comportamiento de las variables, sino que presentan un grado de complejidad tan grande
que resulta imposible intentar cuantificar su influencia, fuera considerandolos como nuevas variables explicativas o definiéndolos en nuevas ecuaciones del modelo.
De ahí que la mayoría de los autores que han tocado este tema se decidan por introducir un vector de variables aleatorias que cumplan con la
misión de recoger el conjunto de causas que no se encuentran explícitamente incorporadas al modelo, tales como omisión de variables explicativas, errores de especificación, errores de medida sobre las variables endógenas, etc. El nuevo modelo sería:
(4)
Y = X/3 + u
Siguiendo la notación tradicional llamamos u a un vector de variables
U l
\ I sobre el cual se suelen postular las siguientes caaleatorias u = /I
\ un/
racterísticas:
a) E (u) = 0 donde
0 es el vector nulo.
b) E (u'u) = o-2Ik donde crJ es la varianza de las ui, e Ik es la matriz
idéntica de dimensión k.
c) Cada variable aleatoria Ui (i = 1, 22 . . . . , n) se distribuye normalmente con media cero y varianza or .
Trataremos de aprovechar la teoría de la
probabilidad desarrollada
principalmente por Gnedcnko y Kolmogorov5 para justificar la introducción de las variables aleatorias en las ecuaciones del modelo y demostraremos que bajo ciertas condiciones impuestas a las variables X* es posible
justificar el comportamiento de las variables aleatorias ui tal como se ha
supuesto tradicionalmente.
II
Para lograr el fin de este trabajo principiemos por establecer nuestro marco teórico.
Tal como hemos dicho en páginas anteriores, éste se basa en la teoría
de la probabilidad y supone un conocimiento mínimo de estadística, probabilidad y cálculo.
Si cada ui (i = 1
n) del modelo (4) al ser adicionada a su co» Gnedcnko, B. V.: Theory of probabüily. London. Chelsea Publishing Co.
1968.
336
rrespondiente ecuación está considerando todas las posibles causas aleatorias que afectan a los valores observados de las variables de dicha ecuación, entonces a cada una de estas causas podemos asignarle una variable
aleatoria, que lógicamente tendrá una esperanza matemática y una varianza bien definidas. Esa variable aleatoria sólo podrá tomar dos valores:
0 y 1 con probabilidades respectivas q y p = 1 — q. Es decir, cada una
de las causas aleatorias que afectan a la ecuación del modelo tienen como
probabilidad de ocurrencia p y como probabilidad de no ocurrencia q.
Sea XK la variable aleatoria asociada al evento k-ésimo, que en sí es
una de las causas que afectan los valores del modelo. Denotemos por /n*
su esperanza matemática y por cr2. su varianza, de modo que:
iik = E (X k )
<rk = E (X k -
I*)1
Por fines prácticos denotaremos
N
S; = £ (Xk - Mk)2
k=l
Puede demostrarse que bajo ciertas condiciones impuestas a las variables aleatorias Xk la función de distribución de las sumas
(5)
i - £ (Xk - ;*)
k=l
convergen a una distribución normal. Con este marco estaremos en posibilidad de justificar el comportamiento de las variables u( en nuestro modelo inicial.
Para este fin utilizaremos la condición de Lindberg. Esta condición
puede expresarse de la siguiente manera:
Para toda e > 0
(I)
lim ¿ - £ / (X - i*)* dFk(X) = 0
n^„ nk=i | Xk - / i k | > « Sn
donde Fk(X) es la función de distribución de la variable Xk.
Si Ak denota al evento de que
.
|Xk-/tk| >eSn
( k = 1,2
,n)
337
estimemos la probabilidad
P -{ max | Xk — /ik | > « S„f
i»k*n
como
P-j max I X k - fik I > €S„}- = P (Ai.+ A 2 +
+ A„)
xdkñ
y
P ( 2 A k ) ^ 2P(Ak)
k=l
haciendo
P(Ak)=
k=i
/
dFkW^-^^l-
/
(X-/*k)'dFk(X)
| X — ftk | > e S n
obtenemos
P-lmax I Xk — Atk | > e S„J- < - ^ r S
iák»n
C" i " k=i
(X-/Xk)3dFk(X)
| X - flk | > € Sn
/
Lo cual por la condición de Lindberg nos lleva a afirmar que cuando
n -> oo y para cualquier É > 0.
P{ max | Xk - M" 1 5: « S„^-» 0
líkín
Es decir que los términos de la sumatoria (5) son uniformemente pequeños o sea que ——cpara k = 1,2
n tienen un valor muy
cercano a cero lo cual nos llevará adelante a demostrar que la suma (5)
converge a una distribución normal.
111
Con lo que hemos establecido hasta el momento podremos demostrar
que si las variables Xk que corresponden a las causas aleatorias que afectan los valores observados de las variables del modelo son mutuamente
338
independientes y satisfacen la condición de Lindberg entonces tienden a
una distribución normal con media cero y varianza 1.
Enunciémoslo en la forma de teorema:
Si una secuencia de variables aleatorias mutuamente independientes
X„ X2
Xn satisfacen la condición de Lindberg para cualquier e > 0,
entonces
lim P-{¿- f (X k -¿i k ) < X [ - * 4 = f I
2V
e^dZ
Antes de pasar a la demostración del teorema precisaremos algunos
conceptos que utilizaremos.
Si X es una variable aleatoria cualquiera asociada a un evento E, tendrá una función de distribución que denotaremos como F(x), y definiremos su función característica como
f(t) = / e ' " d F ( X )
Como ¡ e ' u I = 1 esta función existe para todas las funciones de distribución, por lo que para cada variable aleatoria X existe una función
característica.
Enunciaremos a continuación las principales cualidades de las funciones características.
1. Una función característica es uniformemente continua sobre todos
los números reales y satisface las propiedades:
a) f (0) = 1
b) | f ( t ) | < l
(-oo<t<co)
2. Si y = ax + b, para a y b constantes; y, x variables aleatorias,
entonces
f,(t) = fx(at)
e'"
donde f r (t), f*(t) son las funciones características de las variables
y, x respectivamente.
3. La función característica de la suma de dos variables aleatorias independientes es igual al producto de sus funciones características.
4. Si una variable aleatoria x tiene un momento de orden n entonces
para su función característica existe su n-ésima derivada y para
k<n
f (k) (0) = i" E (Xk)
339
donde f (k) (t) es la k-ésima derivada de la función en el punto t
De donde
f">(0) = iE(x) =ifi
donde ¡J, es la esperanza matemática de la variable aleatoria
5. SiF,(x),F 2 (x),
,F„(x)
son funciones de distribución y convergen a otra F(x) entonces la
secuencia de funciones características
f,(0,f 2 (t)
fn(t)
converge a f(t).
6. Si la secuencia de funciones características
f.(t)
, fn(t)
converge a la función continua f(t), entonces la secuencia de funciones de distribución
F,(x)
, F„(x)
converge a F(x).
Demostraremos ahora el teorema:4
Denotemos por xDk = —=—— F„k(x) = P •{x.u < x\
entonces
E(x„k) = E(
=-!—) = 0
5n
CTiik* — - x - j - <Tk»
y claramente
£ o-nk» - 1
k=i
La condición de Lindberg puesta en esta notación se expresa:
(I')
lina 2
J
x J dF nk (x) • 0
•-•" *•• | x | > e
* La demostración parte de una serie que se debe a I.iapounov y que puede consultarse en Onedenko: Op. cit.
340
la función característica de la suma
I n
n
—- 2 (Xk — /ik) = 2 Xnk
On
k=i
k=l
es
y.„(t) = n f»k(t)
k=i
donde fnk(t) es la función característica de x^
—1«
Demostraremos que lim <pn(t) = ¿^~
Como E(Xnk) = 0 entonces
fnk(t) - 1 = / ( e i U - 1 - itt) dFnkíX)
entonces
IMO-ll^-^/x'dF^x)
ya que
|e"-i-ia|<f
y lo cual lo obtenemos partiendo del hecho de que
o
|e.._l_ja| =
|/(
e
u_i
) d x
|<£
Sea 8 un número positivo arbitrario entonces
(II) /x»dF»k(x)=
/
x'dF„k(x) +
|x|<8
+
/
X»dF„ k (X)<8' +
/
X'dFnkíX)
|x|>S
|x|>8
a partir de la ecuación:
lim f
/
x a dF Ilk (x) = 0
n_«,k=l
|x|>C
El último término de (II) puede hacerse más pequeño que 8' para valores suficientemente grandes de n. Entonces para todos los valores suficientemente grandes de n y para t en un intervalo finito cualquiera
|t|<T
| W t ) - 1 | < 8"P
de donde por la defunción de límite de una función obtenemos
lim fIlk(t) = 1
341
uniformemente, en k (k.= 1,2
, n)
y que paran suficientemente grande, la desigualdad
(III) | M t ) - 1 | < - y
se satisface para ] 11 < T (T arbitrario)
así pues expresemos en forma logarítmica (en expansión en serie)
lOgVn(l) = 2 lOgfnk(t) = 2 l0g[l + (fnk(t) - 1 ) ]
k=i
k-i
= 2 (fnk(t) - 1) + R n
donde
R„= 2 2 L_J±.(fllk(t)_;i)s
por (III)
|R„|=S 2 2 - L | f k a ( t ) _ l | s =
-T»i"'!fV'i.*»m'>-'iZ k.^1 1 — | fnk(t) — 1 j
tart'
'
como:
¿ I Mt) ~ 11 - ¿ I / íe"* - i - to) dF^íx) | <.
obtenemos
|R.|á£
-TÍj'x,dFflk(x)
=
T
max J W O - l l
como lim fnk(t) = 1
n_t> as
R„-+0
n - * op
además
2 ( M O - U - ^ +A
donde
/>» = Y + ¿ / (e"" - 1 - itx) dFnk
Sea y y un entero arbitrario positivo
342
P* = 2
/
T|x|-7
+ 1
/
( e ' t t - 1 - itx - ^ 2 1 ) dF nk (x) +
22
( ^ + e" 1 - l - itx) d F ^ x )
y vemos que pa cumple
6
6
£
|x]>7
Por la condición (T) el último término puede ser menor que 17 > 0
haciendo n suficientemente grande y como e es arbitrario, podemos seleccionarlo lo bastante pequeño de tal manera que para cualquier T y cualquier r¡ > 0 la desigualdad
| p n | < Z Tn>min (7, TJ, T)]
se cumple para toda t tal que | 11 < T
Esta desigualdad muestra que
lim pB — 0
n _ * ce
y que la convergencia es uniforme en cualquier intervalo finito
|t|<T
Recordemos que
lOgpn(t) = Í ( f n k ( t ) - l ) + R „
k=i
n
— t2
y que 1 (fnk(t) — 1) = —=— + pa
k=i
¿
como Rn -* 0, y hemos demostrado que pB -* 0
entonces
_ t*
lim lOg/0n(t) = - y y por la propiedad 6 de las funciones características, apuntada con anterioridad
P
^ ¿ ¿ ( X k - ^ k ) < X ^ VTTTT
quedando así demostrado el teorema.
( y * *
En conclusión, hemos demostrado que si una secuencia de variables aleatorias mutuamente independientes satisfacen la condición de Lindberg para
343
cualquier e > O entonces en el límite nos aproximaremos a una normal
con media cero y varianza unitaria.
Esta propiedad es de importancia si recordamos que para poder obtener estimadores insesgados en un modelo econométrico requerimos que
las variables aleatorias se distribuyan normalmente.
344
Descargar