Desarrollo de la inferencia estadística desde sus comienzos hasta

Anuncio
ESTADISTtCA ESPAÑOLA
N ú m. 98, 1983, págs. 9 a 29
Desarrollo de la inferencia estadística desde sus
comienzos hasta principios de este siglo
por SEGUNDC^ GUTIE RREZ CABRIA.
Departamento de Estadfstica
e Investigación Operativa.
U n iversidad de V alen c ia
RESUMEN
Se estudia en este trabajo el desarrollo de la inFluencia estadística en el
períudo que va desde los trab^jos de John Arbutnot (1714) hasta los de
Lexis (1875-1879). Desde que se atisban los primeros pasos de la inferencia
se observan dos tendencias en su cor.cepción: una, basada en el método
hipotético-deductivo, tomaba como base las probabilidades d irectas; otra,
inspirada en la inducción científica, apuntaba a las probabilidades inversas
y tuvo dos fases. En la primera, obtención de probabilidades por medio de
frec uencias, fracasaron los intentus de Bernouill i y i.aplace . La segu ncia,
inferencia, en términos de probabilidad, de frecuencias mediante otras frecuencias, se desarrolla a partir de Lexis, y es el punto de par^ida de la estadística moderna.
Pulubrus clu^^^: Inducción estadística, métcxiu hiputético-deductivu, prubabilidad directa, probabilidad inversa, principiu de mínimo, frecuencia,
estabilidad de las frecuencias.
l.
LA ES"T'ADISTICA HIPOTETICU-DEDUCTIVA DE LOS SIGLC^.S XVIII Y XIX
Y LAS PROBABILIDADES DIRECTAS
1.
Se cree, no sin fundarnentu, que el primer cálculo estadístico de naturaleza infe-
rencial es el contenido en un informe presentado en la Royal Society, el año 1710 por
itl
F^;r^[^^^r^c^a F.sr'qN()l.A
Jvhn Arhutn^^t, médicu c^e ld curte, quitn ^:reycí ver un testimc^nit^ de ld Divina Providencia en la r^^,r^^luriclucl cc^ristunt^ que se ubservaba entre lu:^ nacimientos de ambos
yexc^^;. .^rbutnut asimilaba, en una serie de nacimientvs acaecidus en Lundres desde
1629 hasta 171U, la prevalencia numérica ctel sexu masculino a la aparición de cara
cuandc^ se lanza la moneda. Cumo el exceso c1e varones a lo iargo de los años era un
sucesu con escasa probabilidad, rechazaba la hipótesis de azar «Es arte y nu casualidad, escribía, !o que interviene en los nacimientos» { 1712).
Ni^olás Bernuuilli, en carta que dirige a Pierre Remond de Morimont, el 23 de enero
de 1713, le dice: «í^s envío el catálogo de niños de ambos sexos nacidos en Londres
desde 1b29 a 171U, cun mis demostraciones de lo que os he escrito con respecto al
^^rgumento pur el que ^e yuiere probar que es un milagro que los n ^ímeros de niñus de
cada sexu nacidos en Londres no se hdyan atejado unos de otros durante ochenta y dos
añus seguidu5, y yue pur ^1 u;,ur seria impusible que durante tdn largu tiempu se hubierurr c^nc•^rruc^c^ er^ tun Eastr^chc^s ltr»ites, eomo los observacios en esos cx: henta y dc^s
añu5. Pretend^ que no hay lugar a la extrañeza, y que hay una gran probabi) idad de que
el número de varones y hembras caiga entre límites más pequeños que los observados.»
Ue Moivre se hizo eco de esta controversia, y señaló yue los argumentos de N,
Bernouílli nu se adecuaban a los avdnzados por el doctor Arbutnot. De hechu, se trataba cie dos te5is contrapuestas: la que propugnabd r^nu c•ue^su st^p^ric^r y la que atribuíd
lds diserepancías al u^ur. La primera abría pasu a la Estuclístic•u Inc^uc•ti^^u; la segunda
apuntaba al problema de las prr^buhilic^ud^s c^irPCtus, consagrado luego pur la ley de los
grandes númerc^s. La cartd dntes citacia termind, efectivamente, con estas palabras:
«Recuerdu que mi tío (Jacobu} ha demostrado algo semejante en su Tr`atado "De Art^
^unj^ctuncli" , que se imprirne actualrnente en Basilea, esto es, que si se quiere descubrir por experiencias reiteradas el número de casos con yue un cierto suceso puede
ucurrir o no, se puede aumentar el número de observaciones, de tal suerte que al final
la prubabilidad de que hayamos descubierto la verdadera relación existente entre el númera de casos, sea mayor que una probdbilidad dada. Cuandu este libro aparezca, veremc^s si en esta clase de materíati he encontrado una aproximación tan justa como él.»
( Mortmont, 17 i 3 ).
2. Creo, cun toc.ic^, que no hay antecedente más clásico (y m^s cc^nc^cidu) del análisís estadísticu incluctivo yue el ilevado a cabo por Muupertir^s en 1?52. Fstud ^iando durante cuatro generaciones una genealogia f^amiliar, había encontradu en sus miembro5
más dedos cie los currientes. Mediante cálculos demostró que un conjuntu tal de anornalías en consanguíneos no pocíía ser atribuido al azar. Es éstd quirá la primera furmulación probabilística euherente del mc^tuclr^ `iiput^tie^^-c^ec^uc•tivo: formulacivn de un mc^c^c^lc^ hipc^tE^tic•^^ meciiante una inciuc•c•icin a partir de lus datos y clc^cluc•c•i^r^, a partir del
mocielo, de unas consecuencias, todo en un ambiente de incertídumbre y con valíciez
UESARftOL.LO DE LA INF-ERENCIA ES`TAUISTICA t)ESDF SI;S CUMIENl.O^i
1I
prubable. Como buen newtoniano, Maupertius había calculado una t^robabilida^d directa
y la utilizaba como probabilidad inversa.
3. Tan pronto como el cálculo de probabilidades empezó a tomdr furma definitiva,
lus matemdticos se interesaron en la aplicación de los conceptos probabilísticos al estudio de las discrepancias en las observaciones.
Nueve años después de la aparición del «Ars conjectandi», Rnger Cc^tes (1722), en
un trabajo sobre la estimación de errores en med^das trigonométricas, discutió lo que
hoy llamaríamos «un problema de estimación en el plano». Sean p, y, r, s cuatro determinaciones distintas de un punto ^^, con pesos respectivos, P, Q, R, S, inversamente
proporcionales a las distancias a c^ (pnnderu r^c•ripruc•c^ pr^^pc^rciunulru sputiis E^^^u^^utiunc^r»). Asignemos los pesus, P, a p, etc., y hallemos su centro de gravedad ^. Este centro, dice Cotes, es la posición más probable de ^. Cotes no dice el porqué de esta
afirmac ión, ni cómu llegó a esta regla.
Según Laplace, este resultado de Cotes no fue aplicado hasta que Euler (1749) lo
utilizó en un trabajo sobre irregularidades en el movimiento de Saturno y Júpiter.
4.
Otr^s intentos de resolver el mismu problema fueron hechos pur Muyer (1750) y
Bc^scu ^ ^ic•h (1755), el primero sobre libración lunar y el segundo en el cálculo de la órbita
elíptica de la Tierra. En todo este tiempo de mediados del siglo xvtit hubo gran preocupación por los errores de observación. Las ideas eran puramente intuitivas, y venían
expresada^ en términus oscuros, pero lus problemas más importantes fuerun ya planteadus. Así, Simpson (1757) aludía a una upinión corriente entonces de que una buena
observación era tan precisa como la «media» de un cunjunto de datos, y el mismo Laplace (1774), en su gran Memoria, se mostraba cauto respectu al uso de la media,
cuando afirmaba que para algunas distribuciones de errores pudía haber estimaciones
mejores que la media, como, por ejernplo, la mediana.
5.
El primero en introducir el concepto de distribución de errores y en considerar
distribuciunes continuas fue Simpsc^n (1756, 1757). Pero como todos sus contemporáneos consideraba inevitable establecer estas condiciones: las distribuciones debían ser
finitas y de rango tinito. Simpsun obtuvo una distribución triangular continua y mediante ella probó que la media aritmética es preferible a una simple ohservación, y Ilegó
a deducir la probabilidad de un error dado para la media aritmética, en el caso límite.
En una Memoria (1700-1703), Luxrunke reproduce, sin citarlos, los trabajos de Simpson,
pero las aportaciones de Lagrange son de interés más analítico que probabilístico. Sobre
el uso de la «media aritmética» se recomienda la lectura del trabajo de R. L. Plackett
.
(1919).
F:sTA[)ISTICA E.sF'.41VC)l_A
6.
En las dctas de la Academia de San Petesburgo dpareció en 1777 una Memoria
sobre «La elección más prubable entre varias observaciones discrepantes y la formación, a partir de ellas, de la inducción más verosímil», presentdda en latín por Uuni^!
Bernvui!!i, seguida de un comentario por L. Euler^^ . Una tutocopia de este documento
figura en la biblioieca de la Royal Statistical Society de Londres),
I nfluido par la idea de que una dístribución de los errores debe tener rango finito,
.
Bernouilii supone que esta distribución es semicircular y debe terminar abruptamente en
sus extremos. Con estos supuestos, su formulación de máxirna verosimiliiud es clara y
explícita, y se deduce de las que hoy llamaríamos «ecuaciones de máxima verosímilitud», deducibles por derivación de la función de vero^^imilitud de la muestra. «l.o que
sucede en el curso de una observación particuldr, escasamente lo cc.^nocemos "ex hipótesis", peru esta profunda ignorancia será el refugio en el que somos forzados a guarecernos cuando tomdmos partidos, por lo que no es verdadero sino verosímil, no cierto sino más probable (MOn ^^Prtsslmum sed ^^erosimi!limum, nvn c•^rtum s^d ^ ^r^huhilissi^nr^m}, como enseña la teuría de la probabilidad. Si esto es siempre y por todas partes
idéntico a la media aritmética, usualmente aceptada, es cosa que puede ser razonablemente puesta en duda» ( D. Bernouilli, 1777).
En el párrafa Ib de esta Memoria, Bernouitli se aproxima a1 principio de mínima
varianza.
En su comentario, Euler señala que el princípio de máxima versomi[itud es arbitrario, en el sentido de yue no hay razón lógica para creer que las observaciones provengan de un sistema generador que les otorgue máxima probabilidaci. Se extíende luego en
una serie de contraargumentos a algunos de los razonamientos expuestos por Bernouilii,
para nosotros no totalmente convincentes. Pueden verse en la Memoria citada. No hay
que olvidar que Euler tenía entonces setenta y un años y estaba ya casi ciego.
?. Nu deja ^ie ser sugestivo que el teórico de la probabilidad inversd, P. S. Lu^luc^E^, verificase, en 1789, la hipótesis que afirma que los cometas pertenecen al sistema
sular, basada en el esquema lcígico de D. Bernouilli, que contempla únicamente probabilidades directas en perfecta concurdancia cun el razunamiento hipotético-deductivo. La
teoría clásica de errores empieza cle este modo a apoyarse, con Laplace, en la ley de
los grandes números. Parece que había Ilégada el momento de la unión de la Estadística
con el cálculo de probabilidades. Pero esto no fue así, y hubo que esperar casi un siglu
hasta que este casorio definitivo se consumara. En efecto, Guuss, en su «Theoria motus
corporurn coelestium» ( 1809), razona sobre las prupiedades probabilísticas de los errores aleatorios, a los que asigna una distribución empírica, con olvido total de la 1ey de
los grandes números. La razón de este hecho hay que buscarla en el divorcio existente
entances entre el concepto de error de observación aleatorio y cantidad aleatoria. Una
definicíón de cantidad aleatoria no se diu en la teoría clásica de la probabilidad . H ubo
DESARROl.LO UE LA INhERENCIA ESTAUISTICA DESDF SI.^S COMIENl.OS
^^
que esperar a la segunda mitad del siglo x^x para que se definiesen cantidacies «dependientes de azar» y poseyendo ciertas leyes de distribución.
Los errores aleatorios fueron considerados por Gauss, en su obra «Theoria combinationis observationum erroribus minimis obnoxiae» (1826), con ciertas propiedaccies probabilísticas, pero a la distribución de esas probabilidades no le dio ninguna impartancia.
En el apéndice de su obra «Nouvelles Méthodes pour la Determination des Orbites
des Cométes» (1805), LexPndre escribe que en problemas en los que es necesario extraer conclusiones lo más exactas posibles de medidas de observación, «casi siempre»
se llega a un sistema de ecuaciones de la forma
1;
_^hjZj;
- i{;
(i = l, 2, ..., N> ql
[11
j=1
donde las Zj; son «coeficientes» conocidos, las X; son medidas, las bj . son las «incógnitas» y los 1^ son los «errores» . Gauss, en «Disquisitio Palladis» ( 1810), adoptó un modelo
análogo al anterior. EI objetivo de Legendre era «determinar» (para nosotros, estimar)
las q incógnitas ( para nosotms, parámetros), hj, de modo que cada «error» (para nosoiros,
residuo) llegue a hacerse muy pequeño y los «errores extrernos» se conserven dentro de
estrechos límites, independientemente del signo. E1 princ•ipi^^ que propuso para obtener
esta «determinación» era la minimi^ucivn, por variación en las h j, de la suma de los
cuadrados de los «errores» /;.
La primera discusión del modelo de Legendre en la que fue considerada explícitamente la distribución de probabilidad de los errores 1; apareció en la «Theoria Motus» ,
de Gauss, en donde suponía que, con una distribución uniforme «a priori» del par<ámetro
de posición, la «moda» de la distribución a posteriori de N medidas (errores) independientes era la media aritmética de aquellos errores. De acuerdo con esto, halló que la
distribución de errores, supuesta continua, era necesariamente de forma normal. EI modelo lineal [ 1] era asi el adecuado para el caso en que los 1; son muestreados independientemente de una población normal, con media cero y varianza csZ.
EI principio de «mínimo» sugerido por Legendre recibe el espaldar•azo de Gauss,
quien en su «Theoria Combinationis» escribe: «Determinar una magnitud, por med io de
observaciones, es como un juego en el que hay riesgo de perder sin esper<anza de vencer... La magnitud de la pérdida debe ser valorada mediante una función de los errores,
siempre positiva^. Entre el infinito número de funciones que satisfacen estas cond iciones
parece natural escoger la mús simple, la cual es sin contradicción Ke! cc^uulruc^c^ de!
^rr^r^^ . Había nacido la tevríu de la estimución.
^4
ES"rAUISTIC A kSl'AÑOI.A
8.
La preocupación por el análísis probabilístico de los datos empíricos había des-
bordado el ámbito físico-astronómico. Un ejemplo il^strativo lo tenemos en el intento
de creación del rnétodo numc^rico por el médico francés Lour`s (1787-1872), dentro de la
escuela anatomoclínica de Paris, empeñada en constituir la medicina como ciencia.
Louis descartá sistemáticamente toda especula+ción apriorística, procurando limitarse a
la obtención de datos a partir de las relaciones numéricas entre los fenómenos patológicos y los resultados terapéutícos en que «ya no podemos seguir diciendo: esto to he
visto a menudo; sino que debemos decir: esto lo he visio con tal frecuencia^ .
E1 programa de Louis fue concretado y desarrollado por su discípulo y colega Jules
Gu1JUrret (1809-90), quien publicó en 1840 la obra titulada «Principios generales de Estadística médica». Gavarret estableció, influido por Poisson y Laplace, que estando
toda observación médica favorecida por un cierto número de circunstancias y contrarestada por otras, debe someterse al Cálculo de Probabilidades.
Era éste un modo de razonamiento audaz, que provocará la risa presuntuosa de muchos. Per© será el movimienio biométrico, basado en principios más profundos de la
probabilidad, el que dará paso a una nueva metodologia inferencial, que crecerá sin tregua hasta nuestros días, constituyendo un cuerpo formalizado y complejo.
Desde los tiempos en que Augusto de Comte juzgaba ei análisis probabilístico de los
hechos reales como «una aberración científica» había pasado mucha agua bajo los puentes de la Ciencia. Los epistemólogos empiezan a tomar conciencia de las técnicas estadísticas, que fundadas «en conceptos en modo alguno invulnerables, desde el punto de
vista del rigor..., se han impuesto poco a poco en casi todos los ramos del saber moderno, hasta constituir hoy uno de los instrumentos más eficaces, destinado presumiblemente a sustituir aquellos otros clásicos que se movían en la rigurosísima matemática
del continuo^, según frase de Geymonat (^9bo).
9.
Estos primeros procedimientos inductivos de la Estadística, basados en el cálcu-
lo de probabilidades directas y en coherencia con el esquema hipotético-deductivo de
la tradición científica, consistían en deducir las consecuenc•ius (no necesariamente univocas) de una hípótesis y en c•onfrontc^rlas con los dutus c•oncreto^s, buscando eríterios
generales para valorar el grado de confor^nidad. La formulación de las hipótesis se
hacía naturalmente en lenguaje probabilistico, el cual se ajustaba a la metodología de
una ciencia desde entonces liberada de ios estrechos cánones determinísticos de la rea1 idad natural .
E1 método hipotético-deductivo caló muy hondo en la inferencia estadística inicial y
ha impreso en ella una huella de prudencia que ha conservado en el curso del tiempo y
que la lleva a guardar provisionalmente toda hipótesis que no se ha logrado refutar (es
el «argumentum ad ignorantiam» de la lógica clásica), Los datos que explican una hipó-
DESARROLLn DE LA INFERENCIA ESTADISTICA DESDE SUS COMIEN"I.OS
1S
tesis pueden estar de acuerdo también con otra. De suerte que a la aseveración de una
verdad conforme con una evidencia empírica, corresponde siempre una falacia lógica de
la que puede sustraerse, si la prueba de una hipótesis es también la desaprobación de
las hipótesis rivales. De muchas de estas falacias dará cuenta la historia de la ciencia.
Tal el caso de Adolfo Quetelet (1844), el cual veía en el ajuste del modelo «binomial» a las distribuciones de muchos caracteres morfológicos un indicio de cor^formidard
de las discrepancias somáticas, observadas en íos seres vivos, con el modelo gausiano
de distribución de fos errores en torno a un valor medio. Atribuía estas desviaciones al
influjo de factores ambientales, referidas a un tipo biolcígico bajo otros aspectos invariables. La ley distributiva era considerada como expresión de un sistema en equilibrio
estático en tornu a su propio centro de gravedad, «el tipo». Pero la conformidad del
modelo con los datos empíricos, en modo alguno excluía otras hipótesis, en aquellos
tiempos inadmisibles. En efecto, más tai•de, con Mendel, y sobre todo con Johannsen,
aparecerán otros paradigmas interpretativos de esas variaciones observadas.
Tal también el intento de Calton (1877) de probar la herencia de características métricas en diversas especies de seres vivos, basado en la concordancia de medidas realizadas en ascendientes y descendientes. Se trataba de una adaptación de los datos a una
regulación hipotético^ieductiva, confirmada por la ciencia posterior como correcta,
pero que pudo muy bien resultar una falacia, si se admite que las mismas observaciones
pudieran verificar ^^na premisa distinta.
2.
INFERENCIA ESTADISTICA Y LEY DE LOS GRANDES NUMEROS
l.
Nay una gran diferencia enire la proposición «Es probable que todo caso de esta
generalización es verdadero» y la proposición «Es probable que cualquier caso de esta
generalización, tomado al azar, es verdadero» . La última proposición puede perrnanecer
válida aun cuando algunos casos de la generalización sean falsos.
EI primer tipo de proposición pertenece a la inducc^ón universal; el segundo pertenece a la inducción estadística.
Lo característico de la probabilidad, cualquiera que sea su interpretación (y no sólo
la frecuencialista), es su conexión, no con un simple hecho, sino con una serie de hechos,
y esto, pensamos, es también característico de la inducción estadística. Una inducción
estadística, o bien afirma la probabilidad de un hecho, elegido al azar de una serie de
proposiciones, o bien asigna la probabilidad a la aserción, según la cua! la vendadera
frecuencia de una serie de proposiciones (esto es, la proporción de proposiciones verdaderas en la serie) está en el entorno del verdadero valor. En todo caso, se está aseve-
^b
l-:^TAUI^TIC"A ESNANE)l_A
rando und cardcterística de una serie de praposiciunes y no de una propasición pariicular. Mientras en ld inducción universal construimc^s nuestroti argumentos med ^iante el
examen de analogías pusitivas y negativas, exhibicias en una serie simpie de observaciones, la tdrea correspondiente en inducción estadística se basará en ei examen de
andlugías pvsitivas y negativas presentadas por serres de seri^s de observaciones.
E1 análisis de inducción estadística no es fundamentalmente distinto dei corresponciiente a la inducción universai, pero es mucho más intrincado, como demuestra su
evolución histórica y las interminables polémicas que dividen el actuaJ espectro de la
Estadística.
2.
Hdy dos farmas esencialmente distintas de ar,^umentar: por deducción y por
reducción.
En la d^clrcccic^n se corx:luye su premisa menor de un enunciado condicional y de
su premisa mayor: si A, entonces B; es así que A, luego B.
En ia rPClrcc•ción, por el contrario, se concluye de un enunciado condicional y de su
premisa menor, su mayor: si A, entonces B; es así que B, luego A.
La reduccicín puede ser prvkresi ^ ^u y rekr^si ^ ^u. En la reducción progresiva se comienza por la prertinisa rnayor desconocida, según su valor de verdad y se procede hacia
!a premisa menor conocida o camprobable. La reducción progresiva se llama también
verificación,
Cuando 1a premisa mayor es una ^^neruli^ucívn de ia premisa menor, ia reduceión
se tlama inclucc•ic^n.
En la actualidad no todus están de acuerdo con esta definición restrictiva de la
inducción. Así, Max Black ( 1979) define la inducción como «un argumento no demostrativo, en el que la verdad de la premisa, aunque no entraña la verdad de la conclusión, constituye una buena razón para acepiarla». Tales argumentaciones, par'a las que
la canclusión puede presuponer la existencia de individuos no presupuestados por las
premisas, son iiamadas por Peirce ( t932} «dmpliativas» . E^te ir «más aliá de las premisas», que son los hechos singulares de la experiencia (de ahí su carácter ampliativo),
posibilita la inferencia de hechos observados a hechos inobservados y, en particular, a
ia predicción del futuro.
3. Los argumentos que utiliza la inferencia estadística se c^ampendian en los ires
que exponemos a cantinuación.
u) Dada la prvbahiliduci relativa a la evidencia de cada uno de los sucesos de una
serie o cunjunto de sucesos, í,cuáles son ias probabilidades, con respecto a la misma
^7
DESARROl.LO [X-: l.A I^1F^FRENCI,A EST`ADIS^I'IC'A UE:S[)E: 5l S C'OMIENl.Oti
evidencia, de las cii ^ "c^ rsus,jrc^c^^cnc•ius observadas de los sucesos de la serie total? Dicho
de otro modo, ^con qué frecuencia pc^demos esperar la c>currencia de un suceso en una
serie de ocasiones, dada su probabilidad en cada ocdsión?
h)
Dada la Jrec•c^cnc•iu con la que ha acaecido un suceso en una serie de ocasiones,
^con qué prc^hahiliduc^ puede esperarse que oc urra en una c^casión posterior?
c)
Dada la frecuc^nciu con la que ha ocurrido un suceso en una serie de ocasiones,
^con qué frec•uenciu puede esperarse probablemente ocurra en una serie posterior de
ocasiones?
En la argumentación u) se supone conocida la premisa mayor, y se procede hacia la
menor desconocida. En realidad es un caso de í^^c^r^cción, pues, inferimos una frecuencia estadística de una probabilidad «a priori» y su fundamento teórico es el tec^remu de
Bernc^ui!!i o de las probabilidades directas, conocido también como !ey ciéhi^ cle Ivs
krunúes númcrc^s. En el tipo de argumento h) estamos empeñados en la operación inversa: calcular una probabilidad sobre la base de frecuencias observadas. En el tipo c)
intentamos pasar de una frecuencia estadística observada, no a la probabilidad de una
ocurrencia individual, sino a los valores probables de otras frecuencias estadísticas no
conocidas.
4.
La idea básica que subyace en la ley de los grandes números, esto es, el empleo
de la media aritmética de un conjunto de observaciones frente al empleo de observaciones simples, es muy antiguo. Era la práctica común en los estudios de astronomía y
geodesia, com^ hemos tenido ocasión de ver en los trabajos de Halley y Cotes.
Si hemos de creer a Ore (1963), la forma más rudimentaria de la ley de los grandes
números es debida a Curdunn, quien verificó que en largas series de observaciones el
número de ocurrencias de un suceso en n pruebas independientes es
^nde p es la probabilidad constante de la ocurrencia de este suceso en una prueba.
La impresión general es que la prehistoria de la ley de los grandes números contiene una comprensión de la naturaleza y uso de la fórmula [ 1) y de la media aritmética
de un conjunto de observaciones. Pero la compilación y posterior formalización de estas
ideas dispersas fue debida a Jacobo Bernouilli.
En la versión alemana del «Ars Conjectandi» (1713), Bernouilli probó que cuandu n
tiende a x
lím. prob.
^- p ^ F ^ l
n
^2)
IR
ESTADISTI('A ESPAIV()L^A
Con anterioridad a la muerte de J. Bernouilli, pero antes de la publicación del «Ars
Conjectandi^, en carta dirigida a Montmort (de la que nos hicimos ya eco), Nicolás
Bernouilii dedujo una estimación aproximada del promedio de una serie binominal, y
tomando datas de Arbuthnot utilizó esta estimación para el razonamiento probabilístico
acerca de las «regularidades constantes observadas en los nacimientos de ambos sexos^.
I.^a tendencia a acumuiar información durante los siglos xvtl y xvtt^, tabula^ción de
nacímientos por sexo, etc., sacaran a ia luz un nuevo hecho, ignorado anteriormente,
esto es, que cuando no hay asociación total el grado de asociación parcial muestra una
sorprendente regularidad, y que esta regularidad aparece más y más acentuada cuanto
mayor es el número de casos tomados en consideración. Así, se halló, por ejemplo, qúe
niños y niñas nacen en proporciones iguales, pero que estas proporciones ( que no son
completamente iguales entre sí) tienden, par todas partes, a aproximarse hacia ciertos
números, cuando el número de observaciones es grande.
Sussmilc•h (17I4 ^ descubrió un interés teológico por estas regularidades. Tales ideas
debieron ser suflcientemente familiares a Gibóon como para caracterizar los resultados
de una probabilidad coma «ciertos en general y falaces en particular», y Kant (como
muchos escritores posteriores} los encuniraba como una aportación al libre albedrío.
El siglo xtx fue más osado en los métodos y más informado de los hechos. Después
de probar una extensión del problema de Bernouilli, Poiss^^n (1^37) lo aplicó a conjuntos de hechos observados y dio al «principio» que subyacía en estas regularídades
el título de lPy cie I^^s Rrr^ncles númerns. En « Recherches» (1837) escribió estas palabras: «Les choses de toute nature sont soumises á une loi universelle qu'on peut
appeler la loi ^ies grands nombres... De ces exemples de toutes natures, il résulte que la
loi universelle des grands nombres est déjá pour nous un fait général et incontestable,
résultant d'experiences qui ne se démentent iamais».
Es el lenguaje de la exageración, extremadamente vago pero excitante, abierto a un
nuevo campo de la investigación científica y que tuvo gran influencia en el pensamiento
subsiguiente. Poisson parece proclamar que en el mundo dei azar existe realmente, en
medio del desorden aparente, un manifiesto «sistema». Las car^sus ,cr^nstantes actúan
siempre y se reafirman en las largas series de hechos, de suerte que los d iversos sucesos acaecen en una determinada proporción de casos observados. No está claro en qué
medida es una ley natural basada en !a Pxperlencra. F,n todo casa, pone de manifiesto
una cierta armonía entre la ley natural y el razonamiento «a priori» de probabilídades.
S.
Un pasterior desarrollo de la ley de Bernouilli condujo al teorema límite «De
Moivre-Laplace» .
UE:.^AWROI.l.O I)F: l,A INhf:ftf:N("IA f^.S`TADItiTI(',A l)ESUF,
^l'^ ('O411f-.ti/O^
19
L.us trabajus de Ahrc!lium c^^ Mc^i ^ ^rc^ están contenidos en ^u principol ohra «Uuctrine uf Chances», apdrecidas en 171K, 173K y póstumamente en 1756, y en su lihro
«Miscellanea Analitica de Seriebc^s et Quadraturis», publicad(^ en 1734.
De la «Ductrine uf Chances» son estas línea^: « Si despué^^ de real izar u n gran número de experimentos se percibiera que los éxitos y los fracasus aparecen en una cierta
proporción... deberá concluirse que las probabilidades de éxitu o de fracaso, en otro
tiempo distinto, serán muy próximas a esa proporción, y que cuanta mayor ha sido el
número de experimentus, más próxima a la verdad será Id conjetura yue se ha derivado
de elios. Peru supungamos se dijera que, nu ohstante, la r^^cionahilidad de construir
conjeturas en base a ohservaciones, considerandu el gran poder del azar, los sucesos
pueden ocurrir, en grandes sucesione^; de pruehas, en distinta propurción de dquella
predisposición, según la cual acaecer. de un modo u utru, y que suponiendo, par ejemplo, que un suceso que es igualmente propenso a ocurrir yue a no ocurrir, ha ocurrido
2.(x>D veces en 3.000 experiencias, se asignaría entonces, ante tan grandes d iferencias
observadas, una variación frente a la igualdad propugnada, razón por la cual la mente
estaría mejor dispuesta hacia las cc^nclusiones interida^ pur experimentos.»
Ue este oscuro pasaje se deduce que I^e Moivre intentó una reconc,il ^ iación de 1a.5
probabilidades «a priori» con las probabilidades estadísticas, piedra de toque de la ley
de los grandes números.
Laplace repitió las pruebas del teurema lírnite de De Moivre ^in citarle, corno era
costumhre en él. Sólo en la nota históricd de su «l^ssai philosophiq^ie...» hace referencia a sus trabajos. Pensá que el teorema de Bernc^uilli contenía una demostración de
una l^^^ ^^nc^ru! dc> !a ncttrcrulc^; u y en su segunda edieión de la obra citada, puhl icada en
1814, reemplaza la dedicatoria «A Napoléon-le-Grand», de la edición de 1H12, por una
exaltación de dich^^ teorema que termina con estas palahras: «c'est encore un résultat
du calcul des prubahilités, cunfirmé par des nombreuses et funeste^ expériences».
b.
Aclc^lfc^ Qrc^tc>lc^t (1796-1K74) fue el gran popularizador cíe las ideas de Poisson.
Incrementcí el número de comprobaciones de la ley de los grandes númerus. Sus uhservaciones provenían preferentemente del campu scxial y algunas de ellas fuerun dirigidas
a excitar la imaginación: regularidad en el número de suicidius; «I'effrayente exactitude
avec laquelle les crimes se reproduisent», etc. Quetelet escrihe cun espanto casi religioso de estas leyes misteriosas y las trata curno si fueran leyes físicas, nu necesitadas
de un posteriur análisis u explicdción.
FI progreso sobre la concepción de las leyes de los grandes n ^ merus, desde lus tiempos de Quetelet ha sido constante y desigual. Se h^in multiplicadu lus ejemplos y las
cundiciones necesarias, para la existencia de la estahilidad estadística, todo ello comu
premisa esencial para la inducción estadística. F_.n este sentido, la ley de los grandes
E•:tiI4[)ItiTi(^A Eal'ANOl..A
númer-cas, cuyu nc^mhre máti adecuadc^ deherí^i ^er el de «iey de estabilidad de la.s frecuencia^ e^+tadi^ticati», constituye la hdse e^^encial de lc^s argumentos inferenciales de lc^s
tipc^4 h) y c), de lc^s que se hahlará a continuación.
3.
EL PRC)BLEMA DE LA INDUCC[nN EST'ADISTICA Y LAS
PROBABILtDADES INVERSAS
1.
En los dos apartados anteriores se ha considerado la probabilidad de un suceso
como algo dado, y a partir de este hecho se ha intentado inferir las probabilidades de
ocurrencias del sucesca en el total de las series de frecuencias pvsibles de su realización.
En ningún caso se ha discutidv por qué prvicedimiento se ha obtenido esa probabilidad
«a priori», lo que constituye el punto de arranque en el método hipotético-deductivo y
el gozne sobre el cual gira la ley de lus grandes números. En Estadística general esta
probabilidad inicial suele basarse en distribuciones frecuenciales de sucesos análogos,
observadas con anterioridad. Pero, ^,cómo ir de las frecuencias a las probabilidades? E1
problema está inmerso en el llamado «problema general de la inducción», pues pretende
obtener juicios de probabilidad tomando como base las experiencias observadas, y sólo
pvdrá ser tratado siguiendo los métodos de la lógica inductiva general.
Históricamente ha habido dos intentas de resolver el problema mediante asignación
de probabilidades «a priori» por consideraciones puramente matemáticas. Los dos se
redujeron a mera «charlatanería», según calificacián de J. M. Keynes (1921), y redujeron la Estadística a la esterilidad durante un centenar de años, por apoyarse en bases
totalmente insostenibles. EI primero de estos métados directos para la obtención de
prohabilidades «a priori» pudiera denominarse «teorema de inversión de Bernouilli», y el
segundo, «regla de sucesión de Laplace» .
2.
La primera discusión de este problema se halla en la correspondencia mantenida
entre Leibniz y J. Bernouilli, y pensamvs que el mejor modo de entrar en ella es relatar
el modo en ^ue se expresaban, sobre el tema, estos dos ilustres filósofos.
En carta dirigida por Jacobo Bernouilli a Leibniz (1855), fechada en 1^03, le dice:
«podemas determinar, por consideraciones «a priorí», en qué cuantía es más probable
obtener la suma siete, al lanzar los dados, que la suma ocho; pero no podemos determinar, por tales prc^^edimientvs, la prvbabilidad de que un hvmbre de veinte años sobreviva a otro de cincu;;nta ^No será posible aún obtener este conocimiento «a posteriori»
de haber observado un gran número de parejas de hombres, análogas a la anterior?» .
En la réplica de Leibniz se encuentra la raíz de la difultad de la respuesta. «El
cálculo de probabilidades -escribe-- es del más alto valor, pero en investigaciones
[)f+:tiARROl_.l.O [)E^: l.A INf-'f•:REN('IA f:sT^AUISTI('A [)E^:^[)E: sl S('O^+IIf-:^1/,Oti
e^tadísticas es necesario, no tanto la sutileza matemática cuanto el enunciadc) precisu de
tucias las circunstancias. Las posibles contingencias y el cálculc^ exactc^ está, en consecuencia, fuera de la cuestión. Aunque la naturaleza tiene sus hábitos, ^iehido a la cuncurrencia de causas, no son generales, inmutables. Con todo, cálculos empíricos, aunque inexactos, pueden ser adecuados en asuntos prácticos.»
Bernouilli volvió,, en su respuesta, a insistir en la analogía con las bolas extraídas de
la urna y mantuvo que «sin estimar cada contingencia pur separado, podemos determinar, dentro de estrechos límites, la proporción que ofrece cada alternativa.» Y añadía
en su carta: «Esto es ^ ierto, se acabó la controversia; te agradará la demostración que
publicaré.» Se reféría a su libro «Ars Conjectandi», que editaría en Ginebra (]7l3).
Lo cierto es que la demostración no llegó. Después de tratar de algunas de las
objeciones, apuntadas por Leibniz, y prometer algún procedimiento para estimar probabilidades «a pusteriori» mediante una inversión de su teorema, da la demostración directa y termina sin más el «Ars Conjectandi» .
Durante el sislo xvtll no hay ningún indicio de explicitar el uso de la inversión del
teorema de Bernouilli. Las investigaciones de D'Alembert, Daniel Bernouill i y otros, se
orientan al estudio de las condiciones de aplicabilidad del teorema directo. Laplace
supone, sin prueba, una inversión del teorema.
E1 análisis bayesiano actual da la siguiente respuesta al problema de la inversión: si
la probabilidad «a priori» de un suceso es p, su aparición x veces en rr pruebas es
^
X
p x ( ] .- p )n -x
Que p, considerada como variable, adquiera un valor determinado, constituye una hipótesis cuya «verosimilitud» es
^n px(] - p)"-x
^X
Los diversos valores de p constituyen una clase completa de hipótesis. Se torna así al
clásico problema de la «Probabilidad de las causas». Considerada p corno una variable
aleatoria de, densidad f^(p), el teorema de Bayes da la probabilidad «a posteriori» de
que p esté entre dos números, p' y p", después de haber observado x veces el suceso en
n pruebas:
„
P ^ ^P ^ < p < p„ ) lx ] -
p
p'
n Px(1 - P Í"-z.f íP )^P
X
E
o
n P X(] ^ P)"-x.f ^P )^p
x
F-;s^ ^u^s r^^<^A ^-:^^qNC^^t A
Cc^mu .^`^p ) está acvia^ia. es ,j^(p )= 0, para p t^ijo. Además
i
fEp )clp = 1, pc}r ser ^< ^l ^ 1,
0
luego la convergencia de las integrales de la expresión anterior queda asegurada, lc^ cua
permite calcular la probabilidad a partir de la frecuencia. Queda, naturalmente, abierto
el problema de la determinación de.f^(p) al que intenta responder el análisis bayesiano.
A efectos de nuestra tesis, el punto esencial que hay que señalar es que las probabiiidades «a posteric^ri» presuponen el conocimiento, no sólo de las verosimil itudes, sinca
también de las probabilidades «a priori». Ambos conocimientos implican inciucciones
primarias, por lo que la inciucción obtenida, dl ser secundaria, no sirve a la solucicín del
problema de la inducción.
Fn el caso en que la distribución «a priori» sea uniforrne en (0, 1) es^f'^ )= l y la
densidad «a posteriori» de p, después de ji observaciones, tiene un máximo para x/n . Es
el caso aplicado por Laplace a la solución del problema.
3.
LuplacQ toma como ejemplo en su disertación el mismo utilizado por H ume,
expresado por la ley: «EI sol saldrá tr^das las mañanas». La argumentación empleada es
del tipo «Si B también A; si el sol ha salido todas las mañanas hasta ahora, seguirá
saliendo en lo sucesivo».
Según Laplace, se puede considerar la posesión del atributo A por un objeto que es
un B, como suceso aleatorio. Se asimila asi la ley a una serie de extracciones de bolas
de una urna cuya composición sea constante. En su «Essai philosophique sur les probabilités» (1R14), cap. 111, 7.° princípio, enuncia: «La probabilidad de un suceso futuro
es la suma de los productos de las probabilidades de cada causa extraida del suceso
observado, por la probabilidad de que, existiendo esta causa, ocurra el suceso futuro».
Pone a continuación un ejemplo que, generalizado, conduce a esta regla: Si el suc•PSC^ ftu
vcrrrridc^ siempre en n oc•usiones, Iu pr^^huhilidud de que se ^^erifique siernpr^ Yn t^nu
nc^e^^cl s^erie dc m pruebus, es
n + 1
. E1 caso m= 1, en que la probabil itlad
n+m+1
toma el valor (n + 1)/(n + 2), fue bautizada por VPnn ( Venn, J., 1t^H4) con el nombre
de regla de sucesi^n de Luplace.
^.a prueba de esta sucesión puede hacerse brevemente asi: Sea p la probabilidact «a
priori» de un suceso en condiciones dadas. La probabilidad de que el suceso ocurra m
veces en esas condiciones y falle en atras n ocasiones es pm(1 - p)" . Luego, la probabilidad «a posteriori» de m ocurrencias del suceso en m+ n pruebas, de que p esté
entre p y p + dp, es
UESAFtKOt.l.O l)E•: (.,A ItiE f-:RE:NCIA k:ST^AUIS1 l('A Uf-:^Uf: ^l ^ C^OMlf-:ti/t)S
/^ m ( 1 - r )" cl^^
^^ m (1 - P )" [ ^ 1 rrt + n + ? )
c,f^^
1 ^7 m ( 1
- r) )ncÍn
f ( Ir1 -+- 1 ) [^ ( I1 + ^ )
0
Por tantu, la probabilidad de que el suceso ocurra en la (m + n + 1)-ésima prueba,
habiendo ucurridu m veces en rrl + rr pruebas, es
i
r(rr7 + n + ?)
Pm+^(1 - P1"^P
o
f^(rn + 1)C^(n + 1)
T( t^rl + n+ 2) r( rn ) f( n)
r(rn + 1)['(n + 1)f^(trt + n)
rrz + 1
rn + n+ 2
Para n= 0, estu es, euancto E^1 s^ecc•esc^ {lu uc•rrrrrc^u !rl ^ '(lrluhlE'Ir1E^nt^, la fórmula es
(nt + 1)l(m + 2). En el ca^u en que las cundiciunes del ^'uceso ^>e han d^xío rcnu sulu
^^c^,^ ti^ éste hu c^c•tirric^c^, el resultado e^ ?/3. Si las cundiciune5 del suceso nu se hun duclc^
ttrcncu, la probabilidad del suceso es 1/?, y en el caso tn que lds condiciones ^e d ieran
r^nu sulu ^ ^c^^ y el st^c•c^sc^ nc^ c^c•tirri^ru, la probabilidad tiería 1/3 (resultacíu tutalmente
absurdu).
Aparte estas absurdidade^, la fcármula de Laplace involucra la teoría de «probabilidade^ desconocidas» intruducidas pur él cumo suplemento del principio de indiferencia,
cun toda la problerriática que ello encierra. La^ objeciunes hechas a esta fórmula son
muchas. Cun re^pecto a la demustración anterior hay una yue aparece enseguida: Si p
es la probabilidad «a priori» de haber acaecido una vez, p^ es la probabilidad de haber
acacido n veces sucesivamente. Ahora bien, del prupio teorerna ^e deduce que si c^c•r^rr^
unu ^ ^c^^,, mc^clific•u lu c^ctcrrc^nciu clE' lu ^ ^c^;, si^^rcientc^, luegu las sucesiva^ oc urrencia^ no
^on independientes. Así, si la probabilidad «a priori» es 1/2, la prubabiiidad de la segundd ocurrer^cia es 2/3, luegu la probabilidad «a priori» de ocurrencia dos veces es, no
1/2 • 1/2, ^inu 1/? • 2I3 = 1/3; y, en general, la probabilidad «a priuri» de ^u ucurrencia
n veces nea e^ (1/2)", sino 1/(n + 1).
i.as primeras críticas a esta regla provinieron del propio Venn en la obra citada, por
no estar de acuerdu, según él, cun la experiencia. PE'ursun, que la acepta, retiuelve
estas discrepancias. Ls rechazada también por Boole (1g54) yue dice se basa en hipóte^is arbitrarias, por Bertrand (1^^9), que niega su aplicabilidad al ca^u de un número
finito de alternativas, y que la califica de ridícula, etc. En cambic^ merece la aprobaciún,
entre otru^, aparte de Pearson, de Dc^ Mur^un, J^ ^ ^c^ns, Lut^c^_v y C'<.rchc^r.
Cun respecto a la materia que nos oc upa, la crítica ha de centr^^rse e n^i es o no
coherente reducir el problema de la inducción a la cr^c^stic^rl clc^ ci^tc^rmirtur t^rlu prc^hubiliduc^ clc^sc•c^nuc•ic^u, aunque cuntitante. Supuesto aceptable la introducc:ión de probabil i-
r-.s t^.gt^iti t ic a E.s ^j,qtvc^t_.:a
'4
d^i^iti s<^ a priuri» ,^e mantiene la hipcítesis de yue B da a la pose5ión de A u nci prubabil i^i^^c1 ^ieterminad^^. E^ stc^ es, el razunamientu de L^iplace tiupune que entre B y A existe
un^^ implicación probahle: Si .^ es un B, hay una prubabililidad de que x sea un A.
Ahura bien, pdra que este razunamiento lleve a dlguna cunclusión cun ciert{^ validez es
precisu yue B deterrninz A(ai menos en términos probables) y que sea B e] únicu factor
determinante de A. Esiá clara que estas suposiciones implican una inciucción previa,
cun la que se vuelve a caer en un círculo vicioso.
Nagamos una ubservacicín fwnal. Tantu en la regla de sucesión de Laplace, como en
el teurema de Bernouilli, curnu en cualquier investigación con base estadística, el uso
de muestras aleate^rias es imprescindible. Las ciiversa5 técnicas de selección de estas
muestras ponen e^pecial énfasis en eliminar todo factur de naturaJeza causal que pueda
dar lugar a algún ses^;e^. l.a c:arencia de tudu sesgo en la elección es lu que garantiza el
carácter aleatorio ^ie la muestra. Lus diversos prucedimientos para la obtención de
muestras aleaturias parten, pues, de ta hipótesis de que c^lirriinun tuclc^ ^uc•tur c•uresuntc^
cl^^l sc^s^v. i,l-íasta qué punto podemos estar ciertos de que estas hipótesis se cumplen?
Aún en el caso de que se cumplan, ^,no están presuponiendo un conocimiento previo
difícil de adyuirir por la vía de la inferencia estadística? Nuevamente nos vemos recurriendo un cambio que termina en ef punto de salida.
Cancluimos, pues, que la aplicación de los métodus matemáticos a la sulución del
problema general de la inducción estadística es inválido. 1_.os métodos que anal izamus a
continuación, ligados a los nombres de Lexis, Vc.^n Bortkiewicz y Tschuprow, nos
parecen más en consonancia cun los principios de una sana inducción.
.
4. Borikiewicz (1905) considera que fue Lexis «el primeru en establecer la cunexión integral» entre la teoría estadística y la teuría de la probabilidad. Parece, cun todu,
que se hicieron canexiones iniciales con anterioridad. Así, Davidov ( I855 b) contrastó la
significación estadística de varias discrepancias empíricas y en otro trabajo (1885 a) expusu yue «el excesivo desarrollo» de la Estadística y sus deducciones, u menrrclc^ inf^^ncludus, pueden mancillarla y que el instrumento más fiable para eliminar «deducciones inmaduras» e^; una discusión de los datus iníciales cun verificación probabitística. 'CJ"tia cte
sus instrumento^; prubabilísticus de verificación era el teuremd límite de L^ ^e Moi vreLaplace.
Cc^ttrnc^t (1 K43), cuyos trabajos sobre probabilidades han sido poco divulgados, razona sobre (a pu:^ibilidact de «contaminar» la estadística, contrasta el significadu cie
discrepancias empiricas y considera la ley de los grandes números, según la furmulación
de Bernouilli, comu base fiable para conectar estadística con probabilidad.
Todos los estudios de estadística social, desde Graunt hasta Quetelet habían prestado especial atención a ia estahilidacl c!e !us frec•uencius en series estadísticas, a la
pruporción de nacimientos de ambos sexos, al grado de constancia de las razones entre
[)E:sARR()l_l.() UE-'. l.A INf^E•:RE:N( I,A F:^IAUI^rI(^^ r)E-:51)t-. ^l ^ C()MIE•.ti/t ^ ^,
distinta^ partes de una misma serie de ohservac:iones, a^í cumu ^i tius ^^^Ic^re^ prumedius
c:un respectu a la media tutal de la serie. Cc^n tc^^ic^, (luetelet at'irmcí t^recuentemente la
existencia de estabilidad, h^isadu en insuficientc evidenci^i, y cayú en I^^ment^^hles errures pur su afán de imitar en demasía lus métud^^^ de l._aplacc.^. Huhc^ yut e^perar al
últimu cuarto de siglu xtx para yue este nuevo mudu de enfc^car la E stadística teórica
fuera cimentado y lograra la sistemática y la técnica que hasta entc^nces le hahía faltadu,
y para que, en consecuencia, prevaleciera el métudo inductivo.
EI fundador de esta escuela fue Wilh^l^n LE^xis, cuyas teurías fueron expuestas en
una serie de drtículos y monografías publicacios entre lus añus 1K7S y 1K79. Uurante
algunos años las ideas fundamentales de Lexis no atrajerun mucha atención, y hasta é)
mismo pareció olvidarse de ellas y dirigió tius estudios en otras direcciunts. Pero pasadus unus añus, se produjo una abundante literaturd en turnu ^^ lus escritus ^ie L_exis,
principalmente en Alemania, la cual clarificó tius ide^^s, peru yue apenas apc)rtó nacia
nuevo, si exceptuamos la obra de Ladislaus Burtkiewicl, yuien nu sólo interpretó magistralmente las ideas de su maestro, sinu que las inc rementó notablemente.
Lexis con^ibió la teoría c^^n una orientación clara hacia los e^tudius de la pruporción
de sexos y de la mortalidad. Este particular enfoque de tius trabajus pudo ser ld causd
del ^Ivido en yue se los tuvu durante añus.
L,a lógica y la filosutia de la probabilidad que inspira a los escritore^ de la escuela de
Lexis coincide con la de Von Kries, quizá como reacción común contra la tradición
laplaciana: el elemento aglutinante es una tendencia a encc,ntrar la hase de la prubabilidad en considerac iones frsicus más bien que Ic^gicus.
Siguiendo un análisis hecho por Bortkiewicz (1 ^396) podemus sintetizar las ideas de
Lexis de este mudo. Supungamos que se hace un conjunto de ubservac iunes s^^bre
varios grupos de sujetos a los que son aplicables distintas frecuencias con respecto al
carácter que se investiga. Si es ^ el número total de observaciones, ;,1^ de ellas pueden
pertenecer al grupo i-ésimo, según lo cual, dada la frecuencia, la probabilid^^i «a priori»
del carácter bajo observación, en un caso partic ular, sería ^^;. En este caso, dadas las
frecuencias para todos los grupos particulares, la probabilidad p, par^r el grupo total
agreg^^do, se obtendrí^ así:
,
P - ^-^I^,
-t- ,.^
p` + ..
^,,
^.,
Llamamos prc^hubiliclucl ken^rcll a p y pr^^buhilicl^tclc^s es^aE^c^iulc^s a la.s p! . Pero las
probabilidades especiales pueden, a su vez, ser generales, de mocto yue puede haher
más de un modo de resolver una probabilidad general en prc^bahilidades espe^iales.
Si p^ = p2 =... = p, se dice, en terminulogía de Bortkiewicz, que p es incli,jerente. Si p es indiferente para todas las «resuluciones>> concebibles, Bortkiewicz dice
que tiene una interpr^tucr'c^n cl^finiti^^u. AI tratar con prubabilidades «a priori» podemos
^ F1
t^ 1!^^ r) I^ 1 1( '^^^ E-1 }' ^^ !^i (} I A
re^ulver arn^r prc,h^ihili^^i^,l tut^al ha^t^i le ^ grar la^ pruhcik^iliclacie^ e^,peciale^ cit e^i^1a ca:^c^
p^irtieular; ^i h^all^rrY^c^^ yue tc^ci^iti e^tati pruh^^hili^i^^^le^ e^peciale^ ^un igu^^le^, aparece
el^ru yue I^^ pruhahili^^r^1 gener^^l tiuti^,t^aee I^^ e^^n^iieiún ^ie tener interpretación ciefinitiv^^.
Hemus trata^u hd^,ta ahuru ^ie pruhahilic^acie^ «d priuri», pero el ubjetu de) ani^li^i^ ha arrujaciu luz ^uhre el problema in ver^u. Necesit^mc^ti ciescuhrir en y ué concl iciunes puec^e cun^icier^^rse una frecuencia ut^^ervaeia cumo ^^ciecua^i^ uJ^rnxi^rruc•iúrr clE^ u^^t^
J^ruhcchilic/cJC! ^.,^^c>rrercrl clc^Jiriiti^^c^>•.
^^ i J^' t, LI valur e ^t^píricr^ ^^c: J^, cla^u pur un^ ^erie c^e ri c}bservaciune^, puc^emu^
punc;r:
^r, J^,
r^
+ ri^ f^- +
^r
.Aa^n en tl c:a^u ci^: yue c:^te n^u^1c^ purticular cie rc^^ulver lu ^;erie cie ubservaciunes 5ea
inc^iferente, la^./rc^c^rcc^^rc'iu.^^ clc^t^rcrl^rrEjr^tc- ^^h.^^c^r ^ ^u^lcrs, J^ ;, f^^, ..., puecien ser ^iistintus, yu
yue pur intlueneia ^te) az^ir pare^íen t]uctuar en turnu ^i la nurma p'. f'ero si ^t,, jl+, ...,
^^ un grancleti, pucJemu^+ ^ipliear tl teuremu cie Bernc^uilii p^ira inciag^^r tii, ^luc.i^i la nurma
J^ `, !a^ c^ivergencit^^ ^1e ella c:un r^espee:to a lo^ valureti J^, , J^,, ... , e^tán cfentru c^e lus
limite^ r-azunuble^^ ^itribuihle:^ al arar, ^ie acuercie^ cun la^ hipóte^i^ hernuuillanas. Cun
tu^iu, ^;úlu pucltmu^ ^:unstruir un argumentu currectu en t^^vur cic; una prub^chil ic^^^c.i clc^ti^riti ^ ^cr, ^^' ^,i «re^ulvernu^» el ^agregd^u cie uhservac:iune^ en ^ub^eries cie un^i gran v^rie^iaci c^e mc^ciu^, ^3pli<<cnciu caei^t vez lu^; ^álculv^ anteriure^. Aún tisi permaneec;rttn ^umhra^ eie ^fu^la, curnu ucurre en tuciu ^^rgumentu cie naturaleza incluctiva.
Burtkiewiel llama /^rc,huhrlicluclc^.S" elP^llc'/ItUlE^.s^ a lus yue tienen intc^rJlrE^tuc^iúrc c^erinitíva. Ai^ura hien, la^ pruhdbilic^a^es que ^urgen en investigaciune^ e^t<:^^íí^ticu^ nu sura
^ie este tipu y pue^ien tier c^enuminacia^ ^^r^^huhiliclc^clE-.^ J?run^E>clic^. E^tu e5, un^ serie cie
pruh^^hili^ia^ies en^pírica^ (t'recuencias) rru tie agrupa, pur lu gener^il, comu ^i e^trivaer^
^fe hechu ^ujeta a un^^ prob^ihilicí^^ci eiement^il. ^upungamus, pur ejemplu, yue yueremc^^
inferir yue la prubabili^idci cie un nacimientu ma^eulinu e^ ^ri y ycae ciispunemu^; ^ie ciutu^
etita^i^ticu^ ^uhre prupurcioneti ^e naci^íu5 pur ^exos, ^ie tuc^ati lati partts ciel mun^iu
^iur^^nte una larga ^+er^ie cie ^^ñc^^ ^. Srrpungamo^ yue calcul^imu^ la mecíia punc^er^i^a c!e la
i^recue^neia ^e naeimientu^ ma^culinu^ y hallamu^ yue e^ rrr. ^,^uc^ríarnu^ ^^rgúir, h^i^^.^^u^
en etite retirilt^^ciu yue la nlc^^ii^i t^rec.^uencial cie n^c irr^it^ntc^^ m^i^culint^^; en ^;^pañ^i ^;er^a ^j^
^1ur^inte lu^ prc^ximu^; añ^^ti`' Estu implic^^ría la hipc^te^i^, nu ju^tifitac^a, ^1e yut la pruh^hili^lacl empíric.a ^ri e^ c>lc^^rtc^^itc^! para eualyuier re^ulueión cienen^liente ciel e^p^reiu y cfel
tiempu, y que nu e^ un^i J^rc^huhiliclucl f^ru^nc^cfi^^ ec^rnpuesta ^e ur^a ^erie c^e grripu^,
refericios É^ ctistintu^ tiemp<^^; o lugares, a eac^a unu cle lus cu<iles es ^^plic^^ble un^r ciisiinta
J^r^^hcthi/iclr^cl ^sJ^c^c^icll.
Serí^c pre^upuner yue I^^ v^rri^ic; ic^nes ^ie tiernpu y^ie iugar sun
irrelevante:^ sin apelar, parti estahlecer e^ta^ supo^iciunes, al c:mpieu c^e métcxiu^ analc^gicu^, po^itivu^ y negativu^.
DESARR(.)LLO UE l_A INFERENCIA ESTADISTIC:A DE:sUE SUS COMIENIOS
Z%
Ueberemos, pues, separar el material estadísticc^ e^n grupos por fechas, lugar y toda
otra característica que la generalización buscada considere corno relevante. Ubtenernos
.
.
^
i
•
i
i.
r^
r^
asi un numero de recuencias m^, mz, m;, ..., m^.
m^,
m;,
etc., que se distribuyen
en torno al promedio frecuencial m. Por sirnplicidad, consideremos que las series de
frecuencias m;, rrt2, m;, ..., corresponden a la clasificación porfec•ha de nacimientos. Si
las divergencias observadas entre estas frecuencias y su media no son significativas,
tenemos los comienzos de un argumento inductivo en base a considerar la fecha como
i•-relevante.
Lo más característico de la aportación de Lexis es que centró su atención en la
naturaleza de la dispersión de las frecuencias m;, m^, m;, ..., en torno al valor medio
m. Estudió los varios tipos de dispersión y, entre ellos, encontró uno c{aramente distinguible de los demás, cuya peculiaridad es que los valores individuales fluctúan de modo
«puramente aleatorio» en tc^rno a un valor constante fundamental. Llamó a este tipa
dispersión típica («typische»). Quiso significar con esto que la dispersión se ajustaba
aproximadamente a la distribucicín, que vendría dada por alguna ley normal de error.
l.a siguiente etapa de la argumentación de Lexis consistió en introducir una media
de la dispersión obtenida dividiendo el error cuadrático medio de la serie empíñca p^ar
el error cuadrático medio de la serie teórica, deducida en la hipótesis de que sólo intervengan componentes accidentales. De aquí surgía el problema de valorar la desviación
respecto a la uctitud bernouillianu, esto es, de calcular la probabilidad de realizarse
entre los límites de la variabilidad accidental espontánea.
En coherencia con las medidas experimentales de Laplace y Bessel, el criterio Lexiniano presuponía desviaciones sistemáticas r<grandes» y desviaciones accidentales «pequeñas» y utilizaba la probabilidad d^recta como probabilidad inversa.
Tschuprow ( 1905) modificó el coeficiente de dispersión de Lexis. Tschuprow lo expresó como cociente de un módulo «físico» por otro «combinatorio»:^ Q= P/C, donde
_.._______
1
n
_.__^.
p ^ ._ . 2 .
_
^ ^k p)^
n
k^^
C
^
^ .
_
2P(1
P) ,
M
siendo M el número de casos en cada grupo, n el número de grupos, pk la frecuencia
para el grupo k y p la media de las n frecuencias.
Los trabajos más interesantes de Lexis sobre Estadística inductiva están recopilados
en «Abhandlugen» (1903).
Con Lexis, Bortkiewicz y Tschuprow quedaba abierta la puerta a la teoría de la
«significación».
FSTAf^ISTlCA ESf'AIYOLA
REFERENCIA BIBL..IOGRAI~ICA
BERNOU[LL1, D.: «The most probabk choice between several discrepant observations and the
formatiso there frorr^ of the most likely induction», 1977. En Studies..., por Pearson y Kendall.
BERTRAND, J.: Calcul des probabilités. Paris, 1889.
BLwCK, M.: Inducción y probabilidad.
Ed. Cátedr•a. Madrid, 1970.
BoOLE, G.: An Investigation of the Laws Tnought, London, 1854.
BORTKIEWICZ, L, votv: Kritfsch Betrachtungen zur theoretlschen Statistik.
Nationakik, vol. 11, 18%.
U.
Stat Jahrb. f.
BOSCOV^CH, R. G.: (In Maire, C., and Boscovich). De litteraria expeditionem ad dimetiendos duos
meridiani gradus. Roma, 1755.
CouRtvOT, A. A.: Ezposition de la théorie des chances et des probabilités. París, 1843.
CoTES, R.: Aestimatio errorurn in mixta mathesi, per variationes partícum triangulo plani et
spheric i^^ . Opera Miscellanea. ^Cantabrigiae, 1722.
GALTON, F.: «Regresion towards mediocrity in Hereditare Stature^ ^ . J. Antro. Inst., 15, 246, ' 877.
GAUSS, C. F.: Theoria motus carparum coelestium. Hamburgo, 1809.
--: Disquisitio Palladis. Gáttingen, 1810.
-: Theoria co^nbinationis observatíone erroribus minimi omnoxiae. Comm. Soc., vol. V, 33.
Giittingen, 1823.
KEYtvES, J. M.: A ?"reatise on Prabability. MacMillan. i,ondon, 1921.
LAGRANGE, J. L.: «Memoire sur 1'utilité de la méthode de prendre le rnilieu des resultats de
plusieurs observatíons, etc.^^ . Miscellanea Taurinensia, S, 167, 1970-1973.
Lwt^L^^ cE, S. P.: «Determiner le milieu que 1'on dait pendre entre trois observations données d'un
méme phenoméne^. Mem. Acad., 4, 634. Paris, 1774.
LEGENDRE, A. M.: Nouvelles méthodes pour la determination des orbites des cornétes. París, 1805.
--: «M^éthode des maindres carrés^. Mem. de Inst. París, 1810.
MAYER, T.: Abhandlung iiber die Umwalzung des Mondes um seine Axe Kosmo-graphische
Nachrichten un Summlung.
MOiVRE, A. de: The Dactrine af Chances, 3,a ed., Printed for A. Millar, 17S6.
MoRTMONT, P. R.: Essay d'Analyse sur les Jeux de tlazard. París, 1713.
PEIRCE, C. S.: Collected Papers, t. lI., p. 421, 1932.
PLACKETT, R.: «A historical note on the method of lsast Squares^. Biometrica, 3ó, 1936.
Po^ssoN, S. D.: Rec•herches sur !a probabilité des jugements en matiére civile, precedées des
régles generules du calcu! des probabilités. P'arís, 1837.
QUETEL,ET, A.: Lettres sur la Théorie des probabilités. Bruselas, 1844,
-: «Recherches sur le penchant au crime aux differentes áges^ . Memoire Nouveaux de la Ac. Sci.
et L. Bruselles, 1852.
SUSMILCH, J. P.: Die góttliche Ordnung in den Veranderungen dnas menschlichen Geschlechts,
aus der Geburt, dern Toce un der Fortplanzung desseben erwiesen, 1765.
1)E=.SAEZf^OI^I.U f)F: (.A INFF•:REN('IA f^:^fAt)Itifl{'^ I)f::Sl)F. 5l ^('UMIf-:ti/Oti
V F`.NN, J.: Th^ L^^k^r• uj^ Cjiunc•^. New Yo'rk: Chelsea. 1 Re^r^nt ^^f 1 KKK ed. ^ubli^hed hy MacM il1^^n.
London, 19b^.
SUMMARY
The development of Statisticdl Inférence in the pericxi cuevering t^rom
the contributions of John Arburnot (1710) till that of Lexis (1 ti75-1 K7^), is
^tudied in this paper.
conception arise.
As soon as inference begins, two tendencies in its
The first one, based on the hypothetical-deductive me-
thud, underlied on direct probabilities.
The second one, inspired in ^cienti-
fic induction, pointed towards inverse probabilitie^, ^^nci had two ph^ses.
ln the tirst phase, where frequencies were use tc^ obtain probabilitie^,
Bernouilli and Laplace failed in their trials.
The second one, in which
inference about frequencies, in terms of^ probability, is made using another
frequencies, is developped ^ince Alexis, dnd is the initial point of Modern
Statistic^.
Keti• ti1^^^rcls: Statistical Induction. Hypothetical-deductive method. Uirect
probability. lnver:^e Probability. Principle ot' Minimium. Frequency.
Stability of the frequencies.
AMS, 1970. Subject cla.tisiticatiun: 6203.
Descargar