ESTADISTICA ESPAÑOLA nú m. 101, 1983, p^gs. 77 a 102 Estimación de modelos de elección cualitativa * por GERARD LASSIBILLE* Institut de Aecherche sur I'Economie de I'Education Dijon LUCiA NAVARRO GOMEZ Facul#ad de Ciencias Económicas y Empresarial®s Málaga RESUMEN En su expresión más simple, los modelos de re4puesta cudlitativa asocian la realización de una elección binaria o cficotómica a un cierto número de caracteristicas exógenas juzgadas «a priori» pertinentes. El tratdmiento de estos modelos, que se generaliza fácilmente para tener en cuenta una realidad más compleja (elección múltiple), obstaculiza tas hipótetiis utiuales de la esiimación econométrica, debido u que la vari^ble explicadd se identitica con una probabilidad. Para paliar estus inconvenientes lo más usual es sustituir la especificación ^lineal clásica par la función de ciistribución logístic^ e:^tandarizada, que se estima por el método cie máxim^ verosimilitud o por el procedimiento cie los mínimos cuadrados gener^lizacius, según la naturalezd de loti datos tratados. EI objeto de etite artículo es mu^trar las ventajas e inconvenientes de diterente^ métodos de estimación de los modelos de etección cualitativ^, ilu^trúndolos mediante la explicación empírica cie la probabilidad de acceso * La metodoiogía utilizada en este trabajo hd sido descritd previamente en más detalle en Gerdrd La^^ tiihille, Lucía Navarro: «Tratamiento econométrico de las variables cualitativas». R^^•i.ti^tu Ci^ciclc^rnu,^^ Cic^irc•icr,^^ Er^,n^^i»rc^u.ti^ ^' ^^ti/)I•c^.^^c^riulE^.^^, K. Universidad de Málagd. Abril, 19K 1. r ti 1 A[)rti [l( A r.ti['AtiOLA ^lc^ i^r^ m^^-jere^ laliid^i^ ^^I mercr^d^^ l^ih^^ral. l_c^^ resultacíuti pre^enta^lo^ ^e ret^ieren ^^ un^^ mue^tr^^ ^ie 7yt) t^^milia^ t^rance^a^, que fueron encue^tdc)o^ pc^r I' In^titut cie Rec.herche ^ur I'Economie de I'Education en 1977. /'c^lcrhr^^.^ c^l«^•c^: Mudelo^ ^ie variuhle^ dependiente^ cualiidtiva4 binaria y rnúltiple. Estim^^c ic^n proh^ihitidad de ^cceso de mujere^ ca^adas a1 merc^tdu I^^hor^il medi^^nte mc^Jelo lineul por MGO y MCG y moc^efo logi^;ticc^ pur m^íxim^i ^^erc^^imilitud. l. MOllEl.O UE EI_ECCtON ^31NARlA ^ea el ^ure^c^: E=^ Iri m^i^ire ve ttimilit^ ejerce und dctivicldcl profesional} y de^ignemos ^^, -- 1. ^i e^te ^uce^(^ ^e realizu pur^i 1^^ ohtiervdcián i ^^, = U, en c:^is^^ c^^ntraric) Actmit^imc^^ q^re I^^ p^irticip^iciún femenind en ef inercdcio labaral está determinada por un conjuntca ^ie K v^^riahle^ excigena^, continua^ o no. En el cdso concreto que v^imos ^ ex^^min^^r, e^t^^^ v^^riahles e^t^^n de^crita^ en la tahld 1 y se retieren al nivel de e^tudios y ed^d de Id esposa, al s^lario mensual del marido, a los ingresos no salariales del matrimonio (pen^;ione^, pre^tacioneti ciiversa^, rentas de eapital), dl lugar cie re^idencia de lu t'amilid y al número de hijos dependientes por grupos de edad. Un^^ t^^rm^^ ^imple de cunsiderdr Ia intluenci^^ de e^t^^ vdriable^ consiste en repre^entur el eventuul acceso de Ia mujer ca^dda al mercado de trabajo por una especificación line^^l, Sin emhargu, !^i naturaleza cíel prohlema planteado por tal tipo cie análi^i^ tr(^pier_<< cc^n t^^ hipúte^i^ u^u^^l de line^^licia^i del mocielo y con ^u estimdciún por lo^ métudu^ cl^í^ico^ de int-erenci^^ etit^^cií^tic^. E1 an^ili^;ti Ivgí^ticu r-eme^li^i e^to^ inconveniente^, pero tiu fdcilidad de aplicación depende de I^c n^iturale<<^ de I^r intórmaciún trutuda. En efecto, si datos agrupado^; permiten el aju^te «ex pc^^t» c^e un mocíelo lineal truntitormado, una infurmaeián reeo^id^^ ^^ nivel inclividual comu I^^ que di^ponemo^ ^quí exige, por el contrario, pretiervar el c^^r^ilcter inicial cie l^i e^peciticacieín y e^tim^^r ^u^ parámetro^ por el método de máximu verotiimilitu+^. 79 FSTIMACION DE: MC)DFLC)S DE ELECCIC}N CUALITATIVA TAet.A 1 VALORES MEDtOS, DESVIACIONES STANDARD Y C^E1•~1CIENTES DE VA ^ RIACION DE LAS vARtABLES Variables Media aritmética Desviación standard Cceficiente de variación - Variable endógena: • Acti ^ ^icluc/ ^^rc^/é.^^innul Je lu ^.ti^nu.^^rc {d) . . . . . . . . . . . . . . . . 0,35b 0, 4^9 0,743 0,306 0,165 0,4b1 0,371 0,6ó4 0,444 6.K42 --- Variables exógenas: Ni ^ •r^/ ct^ e.^^ti^clic^.^ cle lu e.ti^nusu {b) • Medio ........................................... • Alto ............................................. Educl cte lu esnu.^^u ( en años) . . . . . . . . . . . . . . . . . . . . . . . . . 47,054 b.000 Sulc^ric^ mens^^ul clel muric/u {en Francos de 197K) ....... 4.470,330 2.614,22^ 1,710 /n^^ re.^^c^unuulnusuluriulJPlmutrimvnic^tenfrancosde 1978) 1.047,K76 I.1K9,41? O,^K1 Li^^^ur c/e r^.ti^iJenc•iu JY !u ,Jurnilru (c ) • Parí^ y sus alrededores . . . . . . . . . . . . . . . . . . . . . . . . . . . . • Gran ciudad . . . . . . . . .. . .. . . . . . . . . . . . . . . .. . . . . . . .. . • Ciudad media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,12H 0,2K2 0,166 0,334 0,450 0,372 0,3^3 0,627 0,446 Núrnerc^ ctP {tijc^s cte lu .J^t^ntliu (d ) • De menos de 6 años .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De 6 a 10 años . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De 1 1 a l4 años . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De 1 S a 17 años . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De más de 1 ? años . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0,227 0.7K4 I ,06? 0,51 K 0, 30S 0,514 0.904 O.K30 0,661 0,650 0,441 O.K6K 1.28b 0.7K 3 0, 469 (a) l..a variable endó^ena torna el valor ! si la mujcr trab^ja, y 0, cn c! caso contrario. (b) La variable nivel dc cstudios «mcdio» sc codifica 1 si la esposa tienc entrc 8 y I 1 años dc estudios, y 0. si no. Para cl nivcf dc cstudios «alto» , la variablc toma el valor 1 si la mujer ha efectuado al rnenos 12 años de estudios, y vale 0 en caso contrario. Uc este hecho resulta yue cada una de estas dos variables está considerada cn rclación a un nive! de estudios «b^jo», que corrcsponde a la escoiaridad orligatoria ( 7 aíios de estudios). (c1 La variabk París y sus alredcdorcs se codifica 1 si la familia habita en cstt área, y 0, en otro caso. En cuanto a«gran ciudad» se entiendc la de más de 100.000 habitantes. Si la familia reside en una ciudad de estc tipo, la variable torna su valor l, y 0. cn caso contrario. L,a variabk «ciudad media» vak 1 si Ia familia reside en una localidad que tcnQa entre 20.000 y 100.400 habitantcs, y 0. si no. Así. estas trcs variables se considieran en rclación a una familia quc rcsida en una localidad de menos dc 20.000 habitantes. (d) Todas estas familias de 1a cncuesta titnen por lo mtnos un hijo no enrancipado. . LA FUNCI(^N DE PROBAB[LIDAD LINEAL Dada el carácter dicotómico de la vdriable endógena, el modelo lineal se identific^ con una función de probabilidad que no satisface ni las hipótesis clásicas para la estimdción por et método de los mínimos cuddradas ordinarios ( MCO), ni ld naturaleza particular de la variable explicada. La dplic^ción del método de loti rnínimos cuadrados generalizaclas (MCG) puede evitar, bdjo ciertas condicioneti, el primera de estos inconvenientes, pero la única forma ndtural de poliar el segundo eti dbancionar la formuldción linedl y sustituirla por una especiticación restringida. t.tiTAU^s^r^c ^ t.sPAr^ot.^ K(M l.l.l. t:^^t^^t^rtt^i^i» ^^^1 ^ ' .^1C^O ^ti^^^n^^ ^tnn^^, que exi^te untt rel^tción line^^ I enire I^i vdriahle encicígen^ y 1^^ exógena^ ^iel m^^^lelu. F n e,te c^t,o, tenciremo^: -.t^,^;+E, p^ r^ r = i,..., ir cíonve .^, = vec:t^^r ^1e ^^rc^en ( l, ti-+ I) cie I^^^ variuhle^ exógena^ reldtiva^ al intiivicluo i. vectc^r- ^#e ur^ien (^ + 1, 1) cie Ic^^ pt^rámetrus ciesconocidos que debemos estimar. ^^ f;, - tér-min^^ cit^ pertttrh^tción ^ile^tillr^^i t^il que L(^ ^ ^.i B^tju l^: hi^úte^,i^ ^ie nuli^ia^i ^e i;t esper-^nz^ m^itemátic^ cie la perturbdcicín, el valor c^tlcui^:cic^ ^ie e^te m^^cielc^ ^íe re^re^ión lineal nu e^ má^ que Id estimación c^e I^ ^ruh^thili^itt^t cc^n^íiciun;il ^íe realil^^ción ^iel tiuce^o contiicierdcio. En efecto, puesto que ^•; e^ rtnu ti^triíihle hinc^mial, ^u e^^er^n^tt m^itemátic^i e^ igual ^ F ( ^^ , ^ -t , ^ ^ E^i-^^h ( ^^, _ O ( .r, )0 + Pruh ( ^•; = 1 ( .^^ , } 1 = Proh ( ^' ; = 1 ^ .t^ ; ) _ , E'c^r e^t^t r^rreín, ^e aco^;tumhra ^i e^crihir e1 mocielo a^i: Proh t^•, = 1 ^ .^-, } _ -t^ ^ ^3 l_^i tiihl^t 2 pre,enitf Ic^^ estimacic^reti cie lo^ pdrámetroti c1e etita e^pecit`icación cie lu ^rc^hahilicitt^ cJe ^tcce^c^ ^ie I^^ mujere^ ^^1 mercado cie trdhajca, en el ca4u de un uju:^te ^ur MC'(). Lv^ retiultuciu^ mue^tran que lu ecíad de Id espo:^a, el ingreso mensual del marido y el número ^ie hijo^ nu em^tnc:ip^rcio^ ( nc^ eomprenciicioti lo^ de 15 u l7 añoti c^e edac^ ) hacen ^ii^rninuir- lu pruhahiii^i^id cie empleu cie Id maclre ^ie familia. EI nivel de estudios de I^ mujer, ^in emh^^rgo, e^ una incitacicín t^anto mayor al trdbajo cuanto más elevado e^;. '[^umhién el lug^r cie re^iciencia cie }a tamilia, consicieracio como un indicdcior de luti ciemanciati cie empleo locule^, a^í cc^mu c^e loti co^te^ de entrudd en el mercddo ldboral, tiene un et^ecto pc^^itive^ ^ohre la prohdhilidaci que tiene la mujer de ejercer una profe^icín ( con exelu^ión cie lu^ que re^ic^en en ciucídcie^ meciids). A^í, cie ia^ 13 vari^ihleti con^ideradati en el moclelo estimado por el método de los MCt), lU ^an si^nitict^tivati a un nivel ^,uperior o igual al 5 por 104; ^aunque consicie- E:5"r1MAC'ION Uf: MC)UEL.OS DE; ELECCION ('UALITATIVA KI r^indo el ajusie en ^u c^^njuntu, étite explicd ^c^ldmente el 1K pur lUU cie Id vdridnc.i^a del ténúmeno estudiadu, por lu que ^lebemo^ tier prudentes en la interpretacicín de lu^ re^ultado^. Cun el tín de veriticar el poder predictivo del modelu, vamu^ d definir I(a^ cuatro casoti hipotéticus siguientes: A: Mujer caracterizdctd por vdlore^ meclio^ cie Ids vdridble^; explicativa^ continuas y pur v^^lore^ mocidle^ de I^^ti vdridble^ exógena^ dicutúmicds. B: Mujer yue po^ea un alto nivel de e^tudio^, juven, cuyu maricfu gane un ^alario mensual medio, que no perciba ingresos salariales, que resida en París y que tenga un hijo de menos de b años. TABLA 2 ESTIMAC1nN UE LA FUNCION DE PROBABlL1UAD LINEAi. POR EL METOI^ UE MCO Variahle^ Coeticiente Errur titandard ^ de Student Elasticic^ad Id) Ni^^c^l clc^ c^.^tt^clic^.^ clc^ lct c^.^^^u.,u • Mediu . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . .. • Altu ................................... 0.202K U,3^4K 0.03KK 0,U52S 5,2291 7,1414 0,1743 0,1737 ^'clctcl clc^ lcr c^.^^^cr.^u (en año^) . . . . . . . . . . . . . . - 0.0074 0.0033 2,2592 - U,K533 Sulctric^ ^^lc^n.^tiul clc^l r^turiclca (en francoti 197 S/ 1. 000 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - 0.04 46 U. 0069 6 . 3901 - U . S 60 I lrt,^^rc-.^^u ctnttul ^icr ^^uluriul clc^l rnutrimunic^ (en t•rancu^ 197^i/ 1.0001 . . . . . . . . . . . . . . • • • • • • • • • - 0,011 ? O,U 171 U,6S71 - 0,0300 0,1422 0.1293 U,0529 U.U521 O.U4U4 U.04bU 2.7267 3,1993 1.14K9 U,OS I 1 U.1U24 0.0247 De menuti de Ei uño^^ . . . . . . . . . . . . . . . . . . . . - U,U725 De b a lU ^tñu^ . . . . . . . . . . . . . . . . . . . . . . . . - U.OKt^9 De I 1 ^ 14 ^iñu^ . . . . . . . . . . . . . . . . . . . . . . . - U,0446 De IS ^i 17 ^ñu^ . . . . . . . . . . . . . . . . . . . . . . . -- 0.02K9 De má^ de 17 añu^ . . . . . . . . . . . . . . . . . . . . . - U,U699 0,0342 0.0214 U,022U 0.027K U.U263 2, I 164 4.14K0 ?.U2_59 I .U39t5 2,6499 - U,0462 - U.1960 - U.1334 - U,04205 - O,U599 Cc^n.^^tctr^tc^ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . O.K54K 0.1457 S.K66K - C'uc^Jic•ic^tttc^ clc^ clc^tc^r•rnirtuc•icírt . . . . . . . . . . . . . . O,1ti43 - - - -- -- - [_rr,^^ctr clr r-c-.^iclc^ ^tc^iu c/c^ lu Jurniliu • P^iríti y ^u^ ^^Irecleelure^ . . . . . . . . . . . . . . . . . • Grun ciud^tcl . . . . . . . . . . . . . . . . . . . . . . . . . . . • Ciucldd ruecliu .......................... Ntír ^tc^ru clc- l^ ijc^.^^ clc^ lu _Ictr ^iilict • • • • • Ntír ^tc^ru clc^ c,h.^^c^ ^-^•ctc•iunc^,^^ . . . . . . . . . . . . . . . .. 790 lal l.a+ elasticidade^ se han calculado en el punto medio (ct'. tabla I1. f:ti^l A[)1ST 1(`A E-.tiPANUt.A („^: li^ttl.^^r C^ll^ ^l)leir Un nl^t'^ l^e ^titUt^il)ti mel^ll)1, de e^^itf ine^li^ini^, cuyu maricio tenga ^ rn ^^^I^rriu men^ual eleva^iu, que nc^ ^erciha ingresus nu sdlaridles, yue resida en un^r grdn ci ^ td^r^ y yue ^eii rnir^lre ^fe ^l^)^ hiju^ ^1e la y 16 ^ ^ ñus ^e eei^ici. D: M ^rjer yue ^e c^rrircter-iee rur- un h^ ^jo nive^ de e^tuciius, relativ^^mente mayur, cuyu es^oso gane un salario mensuat grande, que perciha ingresos no salariales modestos, yue re^i^iÉr en un^^ ^equeñ^r luc:^rlidaci y q ^,e ^ea mtidre cie seis hijos mayc^res (ire^ ^1e miits cie 17 irñu^, ^iu^ cle ^f^ ^rñu^ y un^^ ^ie la irñ^^s). 1'irr^r c^r^l^r ^ rnu e^e e^t^^^ (;ii^^ U1, I^r t^unciún c^e ^ruhahilie^ad lineal, e^+timac^a ^ur MCO, ^1^r ^^r^ ^ig ^ tiente^ rre^ic.^ciune^ ^ie I^r ^r^^hahili^í^ ^^i cundiciun^rl ^ie em^lec^ de la^ mujere^+ en el mercir^iu lirhur^rl: 1'rc)h {_^^ ^_ 1_^ a ^=-. U, If^y^c I't'^^h i ^^ ^ = 1 .^^ R ) = I .1 a ^, 1'r^)h ( ^^ ^.. ^ i ^ .^ ^. ^ _^_ U .-^(^Oh 1'ruh (^` ^, = 1^.^^ r^ I= - t), I?^ 19 E^t^r^ ^imrle^ ^imulirciune^, mue^tr^rn e! ^rimer incc)nveniente cie I^r t'unciún lineal: no ^e a^eg ^rr^r que el ^^rlur' de ^reciicciún cie I^r ^ruh;rhili^l^:ci esté cum^ren^idu en el intervalo c^e ^iet^inic:iún ^ U.1) . E^te hechu cun^tit ^rye un h^ín^lic^ ^ ^ seriu, que se ^uede, evicientemente. ^iiltiil' ^U!+tul^^ n^ic^ un^ ^ t^uncic^n nu lineal, en lit que ^•^ esié limitaci^^ entre cioti ^^ ^íntut^i^ U y I( tigur^r 11. i'IGURA ^ REE'kESEN^TACION GRAf=1CA l^E[_ AJUSTE DE UNA t-^UNCION DE VARIABLE DEI'FNDIENTE E3INARIA t'r(^ h 1 ^^ ^= 1 ^ .ti^ ^ ) I a^ruximación ^or un^r líne^ trunc^^da retitringic^d E-^5"CIMAC'It)N DF MODELOS DE: E1.EC^CIt)N C'L!Al_(TAT(VA AI ^rohlem^, ^I^^nte^icic^ ^or I^^ line^,liei^^ci c^e I^, t-uncic^n de ^rohdhiliciaci ^^, - .r;^i + E, ^e añ^^de el de lo^ te^t^ cie ^igniticdción cie lds variable^. En et'ecto, la hip^te^iti de normdliciuci cie la^ perturbacione^, hdbitualmente acimitidd para juzgar la pertinenci^ cie I^r^+ varí^hles explicativa^, ya no ^e veritica en e^te caso, pue^to que 1a naturaleza de Id v^^ridhle enciógend obligd a la ^erturbacicín aleatoria a tomar ^uS valore^ en el intervalo I-.^^;R, 1-.r;^i[ y no en el intervalo )-^_ ,^[. EI histograrna cie loS resíduo^, pre^entado en I^ tigura 2, ate^;tigua este hecho en el catio de Id eStimación cie la probahiliddc! conciicion^^l del em^leo de Id^ mujeres, en el modelo line^l uju^t^do por MCO. Sin embdrgo, e^ta gr^tica, no puecie verd^ider^mente ciisoci^r I^i no normdliddct de lo^ errures de ^u hetero^;cectatiticiddd, hecho é^te que ciek^e tener^e en cuenta en la e^timacic^n ^i nc^ ^;e quiere introducir un Segundo tipo,cie sesgo en lo^ test^ de signiticaciún de Id^ vdridble^. F IGURA ? HISTGGRAMA DE L{JS RESIDUOS 1 1 1 '' 1 1 1 1 1 1 . . 1 1 1 1 1 1 1 1 1 1 I 1 . 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 . 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . l 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 1 i 1 . 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1] 1 1 1 1 1 1 1 1 1 i . . 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 l 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 . 1 1 1 l 1 1 1 1 1 1 1 1 . 1 1 1 1 1 l 1 1 1 1 1 1 1 . f ti T Af)(ti rr('A f^.SPAtiOl A K-^ 1.1.^. f:^rl^^JtE^('^^i^J /^^i^' 11C^(i 1.:, e^tim:ECi^ín eíe la t^unci^ín ^1e ^ruh:^hilicfa^i lineul ^ur ivtCC) ^ru^urciun:^ e^tim:^^ic^r-e^ c:un ^:,ri:,nc:i:f mínima ^ul:,mente en el ca^u en que la^ periurbaciune^ uleaturias ^un hurnu^cec^ál,tlcill e inele^en^iiente^. 1_^^ verit^c^ici^ín em^íric:^ de I^^ ^rimera ^e e^t^i^ du^ cun^iciune^ ' nece^itt, lá^ cun^trucciún c^e un te^t de heteru^ce^l^^ticidacl cie I^^ ^erturbaciune^, h:1^+áiÚu en lu e^,timacicín ^fel mcx^elu ^:^ra ^1uti ^uhcunjuntuti cie uh^ervaeiune:^ '. 1_:, t^ihl:, ^ re^ru^iuce l:, e^tim:,ciún c!e Ir, ^ruh:,hilid^^^i del em^leo cfe lu^ mujere^, ^ar:r ^íu^ ^E1^1fYllte`itl^:,^ cie i^iénticu t:Em:,hu (^yS uh^er^^:llciune^t extr:úct:,^ ^ileaturi^,mente rvie la ^uhl:,cicin cie retéren^:ia. l_u^ re^Ellt:,^i«~. ^e retieren ^, l.r t^unciún cie ^ruhahiliciaci line:^l, e^timá,^i:r ^ur el mét^^^u ^ie MC'O. F:I cuciente ^1e I:^^ ^E,má,^ cie lu^ eu:^cir^.,ciu^ c^e luti r^e^íciuc» ^ie :,mh:,^ ^E,hmue^tr:,^, in^fic:, yue nu ruciemu^ rech^,l:ir ld hi^úte^i^ de heteru^ct^1:,^tic:i^ia^i cie l:r^ ^erturhaciune^ :,I ni^^el eie ^i^nitic^,ciún c^el 1^or I(XJ, ya qE,e el valur c:,lcul:E^iu ^iel te^t e, i,^E,:,l :, E=* = 77,Uñ - = l,17! fi5 . K 3 mientr:,1 yue :,I ni>>el ^ie tii^niticaciún inc^ic:rclu y cun (^K1,3K1 t graciu^ de lihertacf, el v:,lur teút-icu ^:,r:r I:i t^ ^te E=i^her eti ^1e 1,UO. E^^ t:, cun^tat<<ciún ern^nírica, uhteni^i:, :, ^artir ^1e ^i^tu^ cuncretu^, cunfirm^i I:, demu^tr:lc i^ín tecíric:, cie Gt}Ie^her^er s. E^n etéctu, en un mu^ielo ^e v^^ri:,hle ciepenciiente ^ic:utúrnic:i, l:, nertE,rhálclun f:, nu ^ue^e tumá^r m:^^ que c^u^ v^,lure^ f ^ _-- 1 - .^-^^3 ^i ^^, = t f. , -- ^;i 1^ , = 0 - -^^ ^^3 A^mitien^lu yue E(^E ,)- ^, tenemu^ E:(^,i --= f'ruh (^, T^ --l^^^ii(--^^;^i) + t'ruh (E, = 1 - .^^^^^1( I - .^^^^^) = U ' Cun 1:^ cl^^^e ^e ciat^^^ tr:^t:^ciu^. I:, hi^úte^i^ ^ie in^le^en^enci^ ^e veritic:, ^+in ningún ^ruhlema. = Ver Theil, N. t 1^71). i Ver C^uleihti^^^^er. A. ^. 11y7?). 85 E:tiTIMACIC)N DF 1N0©ELC^S Uf: 1^.'LEC'(:'[C)N C'l'ALITATIVA TABLA 3 EST1MAClON UE LA FUNCIUN UE PRUBABIt_IUAi^ LINEAI_ P(}R MCO, PARA DOS SUBMUESTRAS ALEATC)RIAS Ni^•c^l clc^ c^.titric/ir^.^^ clc^ h^ c^.1^nO.1'tJ • Medio ................................. • AEtu ................................... O,146K U.2017 Z,ó 142 2,6557 0,2K 13 0, 5749 5.2394 7, 9K03 ^^clucl clc^ lu E^.^^^r^.^rr ( en dñoti ^ . . . . . . . . . . . . . . - U.0137 2.K3x4 O,U^47 U.1042 Suluric, ,n^n.titrul c/c•/ ^rcuriclr, (en frdneu^ 197K/ 1.000) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - U.033U 3, 39 t 7 - O,US7s s,7Q7K In^,^rc^.^^n ctrtrrul nr,^ .^^ct/uriul c%/ ,nulri,rtr,nic, (en t^ ancu^ t97ti^t ! .OOU) . . . . . . . . . . . . . . . . . . . . . . . -U.OU4t^ U,1K29 -U,O155 U,4s5K U,2112 U.123y U,007U 2,7ó1s 2,US37 0,1U2K 0,074K 0.14KK 0.0907 I,Uó24 2.74K5 1,47ss - O,OK42 - U.UK I 9 - 0,04sK -0,0227 - U,OKUS I ,6929 2.ó210 l ,a327 U,SK 14 2,4374 - O,Oó49 - U,0966 - U,0426 -- U,OS 13 - O,OS44 1,3s2s 3.2341 I , 3s33 1,26s 1 l .s437 C'r„r.,rc^,rtc- . . . . . . . . . . • . . . . . . . . . . . . . . . . . . . . . l.OK64 s.Uóol o.s4KK 2.7sU9 Cueticiente cie cieterminariún . . . . . . . . . . . . . . 0,141K -- 0,27KS - Lrr^,^u,• clc^ ,-c^.ctclc^nc•iu clc^ lu .jil,nilicr • Pariti y su^ alrecieclures ... ... ....... .... • Gr^n eiudad . . . . . . . . . . . .. . . . .. . . . . . . . . . • Ciuddd me^lia . . . . . . . . . . . . . . . . . . . . . . . . . . Nií,^rc^r^, c/c^ /tijr^.^ c/c^ /c^ •%u,^iilic^ • [^e meno^ cie 6 dñu^ . . . . . . . . . . . . . . . . . . . . • • • • De 6 a lU añv^ . . . . . . . . . . . . . . . . . . . . . . . . De ] I ^a 14 ^ñuti . . . . . . . . . . . . . . . . . . . . . . . De 1s a 17 añu^ . . . . . . . . . . . . . . . . . . . . . . . De má^ cie 17 añu^ . . . . . . . . . . . . . . . . . . . . . S^r,»u c/c^ c•,rtfcl,•c^cl^^,^ c/c^ /c,.^ rc^.^ic/,ru,c . . . . . . . . 77,061 -- 6s,K3U - N^í,»c^,•u c1c^ ^.^h.^^c^r^•uc•i^, ^ ^c^.^ . . . . . . . . . . . . . . . . . 39s ---- 395 -- y cumu Nrub (E , = -_^^;^3 ) + Prc^h (E ; = 1 - .r;^^ ) = 1 c^ec^uc:imu^ que V^ir (E, ) _ -t"^^3 ( 1 -- •^^r^ ) ^ V^^r (E^ ) ñ(^ I ti 1 A()1ti^ 1('A i-.tiPA!^c)1_A .!^^ I n« ^c^r l^^ ^ ^ert^,rh^icic^nc^^, humc^sceda^tica^ el métudu cíe MCC) da etitimadureti intiutici^.^nte^ dt^ le^ti ^^Ir^imttru^, de I^i t^uncicín de ^ruh^hilidacf lineal y tiu utilizaciún hace ^uhc.^^tim^^r las verdaderas variancias de los coeficientes, sesgande ^ los tests de significaei^in ^ie 1^r^ ^^Iriahles h^,ci^, I^i ^iCe^lliiClUn de hi^útesis. 1'^ir^^l I-e^ulter e^^te ^ruhlem^, ^ue^1e estim^ir^^e el mudelu ^ur el métc^dU de MCG, p^ra lu cu^rl se necesit^r de ^intemanu encuntrar una estimdciún consistente ^^r^i la varidncia de I^r^ rerturh^^ciunes, ^uestu que es descunucida. En este sentidu, 1d literaturd ecc^namétric^r' ^u^iere e^^timar e^t^i vdríuncia ^ur id expretiiún V^ir IE, )= i•, ( 1- i•, ) d^^nde ^^^ e^, el ^^ilcsr calcula^iu de I^i t^uncicín de ^ruhahilidad lineal estimdda ^ur MCO. I'eru, ^iehi^lu ^ , yue n^^ e^ta excluidu yue ciert^^s tiari^^nci^is se^in neg^rtivtis, se ^ret^iere tum^ir i^i ex^re^iún V^^r (^;,1 -- ^ ^.,( 1 - ^, )^ Etit^r <<^rt^xim^rci^ín nu cc^n^istente de I^i v4iri<rnci^r de la ^erturh^^cicín se utiliz^i en el c^,^^^ ^1e I^I e^tim^rci ^ n c!e I^, ^ruh^ihilid^ld de em^lec^ de las mujeres easacias, ^ur el métcuic^ cie 1^C'G (t^ihl^l -^). [_<< <^h^er^^^rc: iún ^ie lu^ resuli^rduti muestra yue lus ^^ir^imelrus estimac^os por este mét^^d^^ ex^erirnent^rn s^rri^rciune^, ^entiihleti re^pectc^ ^^ {^rs e^timaciuneti que pra^orciun^i t{ métud« de MC() (ct•. t^^hl^r ?). Ciertas v^^riahles, cumo la ed^^d de {^i es^usa u la rent^ men^u^,) del m^ir-idu, ^ierden cerca del 30 ^ur l00 de su efectu suhre lti probdbilidad de em^lee^; I^r intluenci^r de c^trc.^^ti determinantes comu el nivel de etitudios de la mujer o el númeru de hiju^ de 1 1<< 14 ^^ñu^;, ^ur e1 contr^^riu, r^umentan su ^ucier ex^licativo de 1K << ^b rc^r 1 U(?. L<< cun^i^ler^rciún de 1^r heterc>>cedusticid^ld de I^iti ^erturh^icic^nes ^ru^urciun^i estim^,^íure^ má^ eticiente^ que !u^ uhtenidu^ ^cyr MCC) (tahla Sj, ^eru l^i necesid^id cie r,tili^^rr una estim^rciún nu cun^istente de l^r v^iCl^inCl^i de la ^ert^,rhacic^n nc.^ garantila yue lc^ti MCG ^ru^urcionen luti etitimadores m^s eticientes de lus parámetrus ^iel mudelc^. Sin ^uder jcrl^ar l^i diterencia, este últimu procedimientu d^r ^redicciclnes ^iit^erente^ de l^r ^rc^h^ihiiid^id cundiciunal de realiz^iciún del ténc^menc^, aunque, evidentemente, nu lu^r^i limitarl^,^; ^rl intervalu ^U, 1^ (t^ahla b). ^ Ver^ McC;illiwr^^y, t~t. ti. ( 15t7U1. 87 f:STIMACION [^E MODELOS DE ELECCION CtJALITATIVA TAeLA 4 ESTIMACION DE LA FUNCION DE PROBABILIDAD LINEAL POR EL METODC) DE MCG Variablcs Coeficitnte Error standard r de Student Ela^ticidad (a) Ni^•el cl^ c^.^^rtcc/ir^s c/e lu e.^^nu.^u • Medio ................................. • Alto ................................... 0,2391 0,4508 0,0372 0,0467 ó,4274 9,ó5 31 0, 2055 0, 20^39 1,92^b - 0,6227 Eclctc/ cte lu e.^^^u.^^u ( en años) . . . . . . . . . . . . . . . - O,OOS4 0,002^ Suluriu mPnsrrul c1e! muric^u ( en francos 197^/ 1.000) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . - 0.02f^3 0.0041 6,^229 - 0,3554 In^^r^sv untcul nr, suluriul d^l mutrimcaniv (en francos 197K/ 1.000) . . . . . . . . . . . . . . . . . . . . . . - 0,0201 0,0154 1, 3063 - 0,059? I_ti,^^ur c^^ r^.i^ic/^nc•iu c/^ lct fumiliu • París y sus alrededores . . . . . . . . . . . . . . . . . . • Gran ciudad . . . . . . . . . . . . . . . . . . . . . . . . . . . . • Ciudad media ...... .. . .. ... .. .... .. . . . . 0,1324 0,13ó3 0,0462 0,049K 0,03t34 0,0369 2,óSK2 3,5643 1,2513 0,0124 0,10^4 0,0215 Ntít»erc^ c/e ltijr^.^^ c^Y !ct .Jumiliu • De menos de 6 años . . . . . . . . . . . . . . . , . . . . • De 6 a 10 años . . . . . . . . . . . . . . . . . . . . . . . . . • De 1 1 a l 4 año^ . . . . . . . . . . . . . . . . . . . . . . . . • De 15 d 17 años . . . . . . . . . . . . . . . . . . . . . . . . • De más de 17 años . . . . . . . . . . . . . . . . . . . . . - O,OS7H - 0,0649 - 0,06^09 - 0,0325 - O,OK6H 0,0237 0,01?0 0,0163 0,0235 0,015^ 2,43K^3 3,K 176 3,7362 1,3K45 5,4937 - 0,0369 - 0,1429 - 0,1 K25 - 0,0473 - 0,0744 Cr,n.^^runte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.5470 0,1234 4,4327 Cuc^/icir^ntc^ clc^ clrterininuc•iún . . . . . . . . . . . . . . 0,1770 - - - -- Ntírrrcjrr^ c/c^ uh.ti^c^r ^ •uc•iurre.^^ . . . . . . . . . . . . . . . . . (a) 790 L,as elasticidades se han evaluado ^n el punto med^o Icf. tabla 11. TAHLA S VARIANCIAS DE LOS ESTIMADORES, SEGUN EL. METODO DE ESTIMACION Ni ^ •^1 c/c> c^.titcrclir^.^^ c^^ lu ^.^^^^r^.ti•ct • Medic^ ........................................... • Alto ............................................. 0,1505 x 10-' 0,275ó x 10" 2 U,13K4 x 10- 2 o,21x1 x la-2 Eclucf clc^ lu c^.^^^w.ti^u . . . . . . . . . . . . . . . . . . . . . . . . . . ... . . . . . . O.lOK9 X 1()--4 0,7^04 x 10- s Sulctrir^ ^^tc^n.^trcr! c/^l ^nuriclu . . . . . . . . . . . . . . . . . . . . . . . . . . a,4761 x 10- 4 o,lóKl x 10-4 /rt^^resc^ cln/rul nc^ sulurictl ct'rl mcctrimuniu . . . .. . . . . . . . . 0,2924 x 10- 3 0,2372 x 10 -3 [ tc,^^ur clc^ rc^.^^iclYnc•rct c!^ !ct ./itc^tilict • París y sus alrededores . . . . . . . . . . . . . . . . . . . . . . . . . . . . • Gran ciudad ...................................... • Ciudad media ..................................... 0,2714 x l0- 2 0,1632 x 10" ^ 0,21 16 x 10" 2 0,24K0 x lOT 2 0,1475 x 10- 2 0,13ó2 x lU - 2 E.ti^i A[)ttiT1C°A ESF'AI^3^)l.A KK TABE.,4 S IC'^jntinu^^ciún) .ti'tírrtrrrr clc^ /r/jcr.r clc^ Ict lctrttilrtt • Ue menu^ ^ie b añu^ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C:^ b t^ IU ^^ñ^^^ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De 1 1 ^^ 1 a ^ño^, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • [.)^e 1S ^i 17 añu^ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . • De m^s^ cle 17 sma^ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.1170 x 0.45K0 x 0.4K40 x 0,772K x 0,6917 x 10^ 2 10^ -^ 10 ^ ^ 10- 3 10- ^ O,S617 x 10^ 3 0,2K90 x 10- 3 0,2657 x 10 - 3 O,SS23 x 10- ^ 0.2496 x 10 - ^ l^ABt_A b E'REUICCIt)NE^ C^E l_A PROBABIC_IDAD DE EMNC_EO, SEGUN EL METC)D^ DE ESTIMACION ^.2. MCC) MCG Pruh (^•,^ = 1 ^ .^^ ) 0,169tt 0,1711 C'ruh (^•B = 1^.^ 1 1,1432 l,OH95 Pruh (^•^^ = 1 ^.r 1 4,46U6 0,4302 C'ruh 1^•U = 1 ^.t^t^ 1 - 0,1319 - U,1 b04 l_A f•UNCIt)N DE PRUBABIL._IDAD t_t)GÍSTICA EI ^^n^íli^i^ le^^^ í^tice^ ^ e^ un^^ túrm^^ cie remec^iar los probiemas planteados p©r lu 1'uncicín ^ie prubahili^itt^i lineal. Se emplea t^nt^ en el caso de cfatos agrupados como en el cie c^b^er^^^icic^ne:^ inciiviciu^^le^, y utiliz^i como e^pecificación und versión e^tanciari^a^ía ^ie l^^ ley cie Verhul^^ t (1K3K), que ^e e^tima pc^r 1V^CC^ ic^^itu^; ^grupado^) o por el métuc^u cile mtixima verc»imilituc^ (c^^^to^ inc^ividuulesl. l.?.1. f^^^ri^t t^lctc •i^íit clc^! r^t^^clc^l^, Stipc^n^rimu^ qrte exi^te para caci^ m^dre cie támilia cierto número c^e ^^ño^ cíe e^tucliu^, pur deh^^jc^ ciel cual no trabaj^ y por encima del cual ^í tr^bdjd. Este nivel, yue ^e ^uele Il^im^^r tulcr^inci^^ ^, eti iinu v^riahle aleaturia que tie puecie caracteriZ^r por tiu t^^^nc;icín ^ie ^1en^id^ci • /Í., ^. ^n e^t^^^ cc^nciiciones, ^i ^e le ^trihuye un número cie dño^ ` l.^i liter^itur^i utili^^^ iRu^ilrnente I^i expre^ión «An^^litiiti C_ogit ^> (traclucción cie logit Analysi^). EI términc^ «lu^;it ^^ prupue^,tu pc^r Berk^un ( 1944) e^ la cuntracción de «Logi^tic Unit». Ver Berkson ( r^aa^, Cc^x ( 1970), Uumencich y Mc F-^clcien ( 1975 ^ , Ner{ove y C're^ti (1973). " Ver A^htc^n. W. D. (1972). t.^'ll!^1A( ION t)t-. Mt)t)t.I.U^ t)E f.t.t:C t^tOti ( l AI.I1A71^A Ky ^ie e^tu^iiu^ .^„ ^r un<< uh^er^ ^re: icín, I<< ^ruh^rhili(J<<cl ^1e em^^ iec) ^ie I^r mujer en el merc^rc[c^ Út'. tl'tih^i^t) tie t'.X^I't'.! ^ ^l ^Ur' I'r'c)i^ ( ^• ., _- I 1 = = [ ^( .^ ^ ,' l( .^ ^ cL^ 0 F:n el c^i^u en yue e^^t^r ^ruh^hilicl^ic^ e^t^ ^eterrninaci<< ^c^r un cunjttntc) ^le K ^t^riahle^ exú^en^i^ X;, tenc[remc)^; ^ur ^^n^rlc^^gía: E^r-c^h ( ^•, = 1) -= F(.^^, ^3) Mientra^ el ^tn^ili^iti [)rcahit ' ic^entitica t^i t^unción cie ^ii^trihuciún H a la cie un^^ v^iri^rhle aleatc^ria norm^l tipit^ie<«1^i, el an^ili^i^ lugit re^r-e^ent^ ^a ^rc^h^ihilid^^^i cie re^alir_^iciC^n Ciel ^uce^o ^ur I^ tuncicin lUgi^tica e^t^tn^^rizacla, e^ c^ecir-, ^ur 1 [)ruh ( ^•^ = 1 I = 1 + ex^ ( -.^^;^3) E^t^^ funciún eti el c^tsc^ ^^trticul^rr ^1e I^r etipecit^icticic^n que Verhulst ( IM3^) ^rc^^utio a raíz ^ie I^^^ trah^tjc^^ cie (,^^^etelet t 1^i^5), yuhr-e el cie^arr-ollv c^emC^^rtít^cu, q^le tr^tciuce I^^ ic^e^r de un^^ mu^er-^rciún en la ^rc^gre^ic.ín Ciel tencímenc^ c^e^^ité^ c^e h^ther- ex^er-imentadu un ritmc^ cie creeimientv <<celer^iciU. En el ca^c^ llnrV^ír'r^inte, e^tai t'unciún e^t^tnc^^ir-iz^id^^ ^e ex[^rey^i ^r^í 1 1 + ex^ (-h.t^) ['c^:^ee eiu^ ^I^íntut^t^ en Ica^ ^untc^^ ^• = U e^• -- I y el centru C.ie ^irnetrí^r cíe I^^ t•uncieín e^t^í en el ^urrta (.^- = U, .^' =[/?) (ti^ur^l ^). [.^r ^enCiiente en cac[^r ^untu de I^r t-uncic^n e^ i^tl^tl a ^f;. =h:.(1._:) cf.^^ ' Ver Tuhin. J. (195K). E-aTtMAC^tON r)r^ MODr-.t_Oti r)E r^:r.E^:C't'IOti ('l"ALITA"ft^'A HIGURA 3 RFi'RESENTACION GRAt-ICA DE l_A f-UNC:'ION E_OGIS^TICA fHSTAN[^ARI"LAUAI 1 I !t 1.^.2. ^.^-tir ^tcrc'rcj ^t ^ ^t ^! c'ct.1c ^ c^^^ clcrtc^.^^ u,^frrr^^crclu.l Supongamo^ que lu^ d^tos tratados se repdrt^+n en G grupos i, c^ictu uno cun r^, ub^ervaciones. En cada una c^e e^to^ grupos. !a prob^bilidad de empleo de la^ mujeres casddas puede estimarse par la frecuencia de ^^parición de e^te sucesu, eti decir, pur ^ ^^^J ^^' i ft ;r ^ ^ ^ ..., V ^ j^ donde ^^;^ tomd el valor I si la observación j del grupa i tiene und actividad prot'e^ional, y/o en caso contrario. En este caso con^reto, el modelo es: 1 1 + t^.t/^ ( --.^^; ^3 ) donde .r; representa el vectc^r de variables exógenas correspondientes al grupo i. Por una transformación simple, este modelo puede expresarse en la furma lineal siguiente In ^^' - _ .r;R 1 - ^; %^ . '-^igrEe asintóticamente una ley normal de Dado que se demuestra x que In meciia nula y variancia ^ r'' a^ _ [^^rl^;^ 1 ^ h,^^ ^` Ver Theil, H. (1971). ESTIMACION DE MODELOS DE ELECCION CUALITATIVA 91 el modelo transformado debe estimarse por el método de los minirrios cuadrados generalizados, para tener en cuenta el fenómeno de la heteroscedasticidad de las perturbaciones. l. 2. 3. ,^^ timuc^rún en el cuso ^le dutvs rncli ^^iduulPs Supongamos, como es el caso del ejemplo que tratamos aquí, que los datos utilizados son de tipo indi vidual. Para estimar los parámetros del modelo de probabilidad logistico, un primer enfoque consistente en particionar los individuos de la muestra, según los valores de ciertas variables que les son asignadas, permite utilizar el modelo [ogaritmico-lineal anterior. Ahora bien, aunque esta operación sea siempre posible de realizar, es preferible recurrir a un método de estimacián que preserve el carácter individual de los datos a fin de evitar el inconveniente de los grupos vacíos, de una parte, y de no reducir la información disponible cuando la muestra es pequeña, de otra parte. En este caso, se trata de estimar el modelo 1 Prob (v; = 1) - P; _ + exp t-.r;^i ) por el método de máxima verosimilitud. La función de densidad de la variable binominal v; es igual a .f^(v;) --- p^'(1 - p;)^^v' Supuesta la hipótesis de independencia de las observaciones, la funcián de densidad conjunia de v es el producto de las funcíones de densidad individuales. Entonces, la función de verosimilitud del modelo es igual a n L.(v,, .... V^, RO+ . ... Rk) _` ;) ^ VP^^( t^ _ p ^ ^!'; es decir, a ' n L(^,, ..., vn; ^,, .... (^k) ! ^ ;_^ 1 + exp ( -x;^i ) V^ exp ^`-x ^a ^ 1 + exp (-.r ;^3 92 ESTADiSTiCA ESPAÑ(^LA lu que podemos también escribir e x p (3' . L( ^^ ; , ..., ^A; ,, ..., R^r ^ - ,^ ^ [ 1 + exp (- C;a)[ Los esiimadores maximoverosímiles se obtienen derivando ln L respecto igudlando ei resultado a cero. Como In L = R r^ . -r;ti'; - ^ . In [ 1 + exp {.r;R)l A ^i deberá satisfacer la ecuación vectorial siguiente n ^ ti [ 1 + exp (-.z;all-'-^í = ^ x;^'; La función ln L es cóncava, así q:^e la solución de esta ecuación corresponde a un máximo global. Los estimadores de los parámetros del modelo de probabilidad logística son así consistentes, asintóticamente eficientes y asintóticamente normales. Con el tin de camparar los resultados de este modelo con los de la función lineal, la tabla 7 reproduce la estimación logística de la probabilidad de empleo de las mujeres. La maximización de la función de verosimilitud se ha obtenido por un método del gradiente y. Los tests de significación de las variables se construyen comparando el cociente entre el estimador y su variancia asintótica a una t de Student. La abservación comparada de los resultados (tablas 4 y 7) muestra cierta estabilidad de los niveles de significación de las variables. Los valores de las elasticidades de la probabilidad de empleo 10 son, sin embargo, muy diferentes de un modelo a otro; generalmente, la especificación logística las sobreestima en relación al modelo de probabilidad lineal estimado por MCG, pero lo contrario se produce en el caso de las variables referentes al nivel de estudios de la madre, 1os ingresos no salariales del matrimonio y su lugar de residencia. Estas diferencias implican variaciones importantes en las predicciones de la probabilidad condicional de acceso al empleo, proporcionadas y Ver Goldfeld y Quandt (1972). 10 La ventaja^que existe` en comparar elasticidadeslcn vez de efectos marginales se debe a que, en el modelo logís^ico, éstos no son constantes como en el modelo lineal, sino que varian en función del nivel de probabilidad en el que nos situemos. ESTIMACION DE MODELOS DE ELECCION CUAL.ITATIVA 93 por los diferentes modelos (tabla K), y dado que la especificacia" n logística tiene un poder explicativo superior, podemos, en una buena lógica, pensar que proporcíona, en promedio, mejores predicciones. TAeLA 7 ESTIMACION DE LA FUNClON DE PROBABII..lDAD LOGlSTiCA, PC1R EL METOD4 DE MAXIMA VEROSIMI LITUD Cceficiente Variab{es Error standard t de Student Elasticidad (a) Ni^^el de estudir^s de lu esnosu 0,1939 • Medio . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . • Alto ................................... ^,9K41 1,7913 0,2003 0,277ó 4,9135 6,4537 0,1903 Edur1 c!c lu esposu ( en años) . . . . . . . . . . . . . . - 0,0436 0,0179 2,4379 - 1,1527 Suluriu men.+^iul de/ murid^^ ( en francos 1978/ 1.000} . . . . . . . . . . . . . . . . . . . . . . . . . . . . . -0,22ó9 0,0424 5,3473 -O,ó532 lnkresv unuu/ n^^ suluriul de/ mutrimoniv (en francos 1978/ 1.000} . . . . . . . . . . . . . . . . . . . . . . - 0,0383 O,U914 0,4193 - 0,0258 0,7104 4,2686 2,6448 O,Q58ó O,ó923 0,2118 3,2693 0,1257 0,3005 0,2451 1,22ó0 0,0321 -0,4497 - O,ó 182 - 0,3407 -0,2065 - 0, 4%7 0,2014 0,1332 0,1235 0,1521 0,1706 2.2325 4,ó40S 2,4357 1,3575 2,9147 Cvnstunte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2,3222 0,84'73 2,8764 % de ^ ^uriunciu explieudu . . . . . . . . . . . . . . . . . . 22,917ó -- - Número de ^^hser^•uciones . . . . . . . . . . . . . . . . . ?90 - - Númeru de iteruc•ic^nes . . . . . . . . . . . . . . . . . . . . S - - Lrrxur de residenciu de tu ,jumitiu • París y sus alrededores . . . . . . . . . . . . . . . . . • Gran ciudad . . . . . . . . . . . . . . . . . . . . . . . . . . . • Ciudad media ...... .. ... . . . .. ....... .. . Númerv de h^os de lu fumiliu • De menos dc 6 años . . . . . . . . . . . . . . . . . . . . • De 6 a 10 años . . . . . . . . . . . . . . . . . . . . . . . . • De 11 a 14 años . . . . . . . . . . . . . . . . . . . . . . . • De 1S a 17 años . . . . . . . . . . . . . . . . . . . . . . . • De más de 17 años . . . . . . . . . . . . . . . . . . . . . - 0,0657 -0,3121 - 0,20óó - 0,0689 - O,U976 {a) Ls^s etasticidardes se han eva^luado en el punto medio (cf. tabla 1}. TABLA ^^ PREDICCIONES COMPARADAS DE LA PROBABILIDAD COND[CIONAL DE EMPLEO Modeio lineal (MCG} .Prob (v ^ = 1 ^ x A ) . . . . . . . . . . Prob ^v 8 = 1 ^ xe ) . . . . . . . . . Prob (,v ^ = 1 ^ x ^ ) . . . . . . . . Prob ^va - l ^xo^ . . . . . . . . . Modelo logistico (Máxima verosim.) 0,1711 O,1Só0 1, 0895 0, 4 302 0,9322 0, 4831 -- 0,1ó04 0,0256 ESTADISTICA ESPAÑOLA 94 2. EL Mf^DELO DE ELE^CI(JN MULTIPLE Para hacer el caso dnterior más realista, distingamos las madres de familia que trabajan a tiempo completo, de Ids que ejercen una dctividad profesional a tiempo parcial ". Así, para cada observación i, definiremos una variable múltiple de tres modalidades mutuamente excluyentes, a las que corresponden los sucesos siguientes: E^, _{ la madre no ejerce ninguna actividad profesional} { la madre ejerce una actividad profesional a tiempo parcial} E^ _{ la madre ejerce una actividad profesional a tiempo compieto} Para cada una de estas alternativas (designadas j= l, 2 ó 3) construiremos una variable ficticia detinida por: Y;^ = 1 si el suces© E^ se realiza para la observación i. Y;1 = 0 si no se realiza A cada una de estás variables se les asocia, pues, una probabilidad de realización que se trata de explicar en función de las variables exógenas x; . La influencia de estas variables puede aprehenderse, corno en el caso binario, mediante las especificaciones lineal o logística. Las generalizaciones de estas formas funcionales al modeio de elección múltipie, presentan análogos inconvenientes (función de probabilidad lineal) y ventajas (función de probabilidad logística) que los precisados en el cado dei modelo dicotómico. 2.1. GENERALIZACIÓN DEL MODELO DE PROHABILIDAD LINEAL Consideremos una variable múltiple de p modalidades y supongamos una relación lineal entre eltas y las variables exógenas del modelo. La j-ésima relación del sistema se escribirá entonces así Y^.; = X; ^i; + E ;^ para i = 1, . . . , n Y .Í --- 1, . . . , /^ donde y;^ toma el valor 1 si la modalidad j se realiza para el individuo i, y 0, en caso contrario. " En la muestra de referencia existe un 25 por 100 de mujeres que traba^jan a tiempo completo, y un t4 por 100, que trab^jan a tiempo parcial. 95 ESTIMACION DE MODELtaS DE ELECCIOIV CUAI,ITATIVA x; representa el vector (1, K+ 1) de las variables exógenas relativas a la ^-ésima observación (comprendida 1a constante). es el vector de orden (K + l, 1) de los parámetros referentes a la j-ésima modalidad. E;^ es el término de perturbación aleatoria. Bajo la hipótesis cie que E{E;^) = U, la esperanza matemática de la variable y;^ es igual a la probabilidad de realización del suceso E^ . Tenemos en consecue ncia ^ v;^ - P;^; - .,. , para r' _ ^ , . .. , n Y j - l , . . . . !^ Dado que la suma de ias variables ticticias es igual a l para cualquier observación i , se dernuestra fácilmente que: kj =0 t/K ^0 y que oj j^l donde ^30; representa ta constante de la j-ésima ecuación del modelo. Estas das condiciones implican que basta can estimar (^a -- 1) relaciones, para obtener los estimadores de las cceficientes desconocidas del modelo de elección múltiple. Como en el caso binario, las perturbaciones de cada ecuación j son heteroscedásticas e independientes, es decir, que l Var (E;;) _ -r,R,; (1 - .1;R; ) Cov (E;^, E^ y)= 0 para i^ l Pero como CaV (E;^, E;m) ^ -.t;^j_Ci^m Para j ^ m las perturbaciones no son independientes de una ecuación a otra. En estas condiciones, ias (^ - 1) relaciones del sistema deben estimarse de forma conjunta por el métoda de FSTADfSTIC A E5PAÑOLA lc^s MCG '`. Pdra a^plicdr e4te procedimiento es necesdrio halldr previamente una estimac,ún de la^ vari^incias y covaridncia^ de las perturbdciones. Como en el caso binario, pudemo^ utilizar las aproximaciones siguientes: V^r (E;^) _ ^ `',^( i - ^';^)} ^ CUV (^ ^^, E^^} - -^ I V;j, ^';m^ donde ^,^ e^^;,^ son los valores estimados de las j-ésima y m-ésima funciones de probahilidad lineal estimddas p^or MCO. Debido a estas aproximaciones, el procedimiento de !os MCG no puede proporcionar una estimación eticiente del mc^delo de elecciún múltiple. Además, incluso aunque la A P;^ es f necesariamente igual a i, el sistema lineal no puede garantizar que cada uno de los suma de las predicciones de las probabilidades relativas a un individuo A A valores estimados ( P; ^,..., P;P ) esté comprendido en el intervalo [ 0, 1 j. GENERALIZACl ^N DEL MODELO LOGÍSTICO 2.2. A partir de la versión multivariante de la función de distribución logistica estandarizada l F(Z,, ..., Z^) _ 1 + ^ . exp (--:.^) 1Niantel (196^ó) sugiere definir la probabilidad de realización de la j-ésima modalidad de la variable múltiple de la manera siguiente: P;^ _ '^ Véase Zellner (1962). exp (x;al) P ^ ^ eXp (.X;Qm) para i= 1, ..., rr Y .! - l, ..., n ESTIMAC'ION I^E MUUELOS DE E1_ECCION C.'L^AI_ITATIVA 97 En el caso de que se trate de datos agrupddo^, I^^ t`recuencia de aparición del fenómeno ( j^;j) sustituye a la probabiliciaci de realiZación del suce^o, de manera que se tiene ^ N; j = exp (-x;R;1 n ^ exp (.r;Rm ) para i = i , . . . , n y .^ - l , . . . , /^ rn=I donde .t; representa el vector de variables exógenas relativas al grupo i. F'or una transformación simple se puede escribír I n ^^ ^^- _ -r; ( para j ^ ^n ^rn^ - -^i^j 1 %^im Refiriendo cada una de estas frecuencias a un mismo denominador, se define un sistema de (^ - 1) ecuac iones que miden los efectos de las variables exóge nas sobre el logaritmo del cociente de las probabilidades. A partir de estas (n - l) relaciones, es posible deducir la reacción de cualquier cociente de probabilidades a la variación de las variables, pues ^i se tiene h /^ i j ln ^ -- - .t ;Rjrn ^rm ^ -i^r^Xm se deduce que 1 n ^ f,- -- .i ^ ^ I-^ j rr^ ^ 1-' ^ m^ l^fx Por las mismas razones que anteriormente, las ecuaciones del sistema se estiman de torma conjunta por el método de los MCG, tomando como estimación de las variancias y covariancias de las perturbaciones expresiones análogas a fas indicadas en el caso dicotómico simple ". " Ver Theil (1970). y^ F STAUtST'1C'a F SPAiv(^LA Cuan^ic^ {cas ciatu^ tr^itadc^ti son cie tipo individua! 'a , ios pdr^metros cie la^ ^ /^ ecuacione^ exp (.r,R^l Prob ( ^^;^ ^ 1) - P^^ =.. pard i = 1, . . . , n y.Í- i,...,r^ ^ ^ eXp ( -r^a,^) m=^ se estiman por el método de máxima verosimilitud restringido. Por analagía con e1 caso binario, la función de verosimilitud del sistema es igual a n ^-- ( ^' ^ ^ • . . . , ^^,^^ : (3^^ , , . . . , a r^^ ) ^ ^ P; i ^ , P 2 z , . . . , p^^p rn r^ 1 P p con^/^;^= l.y^^^,;= 1. Í^^ 1^^ Reemplazanda las prabdbilidades de redlización por su valor y tomarxio el logaritmo de la función de verosimilitud, se abtiene: exP (-xrRm ) In L = P ^ exp (.r;^i,„ ) ^^ ^ ^ o bien ti In L = ^ R; P ^^ exp (-C;(^,^) ,; ;_^ in=1 Teniendo en cuenta que las respuestas v;^ son exhaustivas, la verosimilitud del sis^ ^i^ = 0. En este caso, los estimadores ^i; tema debe maximizarse bajo la restricción j=1 de las parámetros satisfacen las ecuaciones vectoriates A ^ ^ exp (x;a1) 'x^ _^ x^ v;^ para j= 1, ^ e x p( x; a,^ ) m= , =0 1° Ver Bock (1970) o Press (19?2). 99 ESTIMACION UE MODELOS DE ELECCION CL.JAL[TAT[ VA La función In C. es cóncava, así que la solución de estas ecuaciones corresponde ^i un máxima global. Los estimadores de los parámetros del modelo son, pues, consistentes, asintóticamente eficientes y asintóticamente normales. La tabla 9 da los resultados del mcxielo de elección múltiple, en el caso de la explicación del trabajo de las mujeres casadas. E...ds tres ecuaciones estimacids hacen reférencia a la realización de los sucesos Et, Ez, E^ enunciados anteriormente. l,os resultados han sido obtenidos rnaximizando, bajo restricción, la función de verosimilitud del sistema por un método deÍ gradiente. Los tests de significación de las varidbles se han construido comparando a una r de Student los cocientes entre los estimadores y sus variancias asintóticas. Twe[..w 9 EST1MAClONES LOGISTICAS DE LAS PROBABILIDADES DE EMPLEO, PO ^ R EL METODO DE MAXtMA VEROSIMILITUD (a) N i ngu na acti vidad Actividad a tiempo parcial (E^) Variables Edud de !u espasu (en años) ... Suluriu mensuul del murido (en francos 1978/ 1.000) . . . . . . . . . Ingreso anual no satarial del matrimonio (en francos 1978/ 1.000} . . . . . . . . . . . . . . . . . . . . . Ccefic. ^ dc St. Coefic. ^ tdeSt, - 0,5689 - 1,0313 4,0869 5,2150 -- 0,1339 -- 0,15SS 0,(^363 O,S873 0,7027 1,1867 4,2979 5,6429 0,0289 2,3309 -- 0,0106 U,6U42 - O,O184 1,2599 1,3750 4,7256 - 0,2022 0,4932 - 1,1728 0,9170 0,4252 O,S278 -- 0,5214 0,4235 0,09ó1 0,1039 1,8902 3,4162 1, 3803 -0,088 0,29'94 0,3947 1,94ó4 0, 2969 1,1490 0,4639 0,1009 - 0,0663 2,1089 O,S868 0, 3281 1,9915 4,2057 1,81ó6 0, 8740 2,6783 0,0912 0,0875 0,21304 0, 2042 -- 0,0596 0,4830 0,6963 1,7728 1, 3634 0, 3473 -0,3599 - 0,4647 --0,3675 - 0, 2963 - 0, 2522 2,0657' 4,0226 3,5325 2, 3469 1,6944 1,5980 ^ -- 0,7203 0,9261 1,6109 2,4639 Lugar de residencia de la familia • París y sus alrededores ..... -0,3757 • Gran ciudad . . . . . . . . . . . . . . . -- 0,4956 • Ciudad media . . . . . . . . . . . . . . - 0,23U7 Númera dP hijas de lu.fumiliu • De menos de 6 años ..,..... 0,2688 • De 6 a 10 años . . . . . . . . . . . . . 0,3773 • De 11 a 14 años . . . . . . . . . . . . O,lS4S • De 15 a 17 años ............ 0,0920 • De más de 17 años .....,...' 0, 3118 C^^nstunte . . . . . . . . . . . . . . . . . . . - 0,8907 Número de observaciones . . . . . 790 (a) (E3) (EI> Ccefc_ t dc St. N«^e! de estudios de tu espasu • Medio . . . . . . . . . . . . . . . . . . . . • Alto . . . . . . . . . . . . . . . . . . . . . . Actividad a tiempo completo Las estimaciones twn necesitado 7 iteraciones. - 790 - 790 -- 1(X) E^s"fADiSTI('A F.SPA ^ IVf)[_A [_^^ «h>erv^^ciún de I^.}ti resultudc^ti mue^tr^^ yue, entre lati variable^ que son signific<^ti^^^^, el nivel ^1e estudiu^ ^ie la etip«^a, ^^Ito u inclusu medio, es una incitación imp^^rtante par^^ la elección del trahajc^ ^a ciempo completo, desanimándola, por el cuntraric^, ^^ un tr^ahajc^ a tiempo parcial y aún más a permanecer inactiva. [,_^i edad, sin emhargo, actúa de manera invertia, siendo la actividad a tiempo completo más frecuentemente elegida por las mujeres jóvenes, mientras las otras tienen mayor preferencia por la inaciividad. También el salario del marido actúa negativamente sobre la oferta cie trabajo femenino de manera global. FI número de hijos ciependientes de la famitia limita de manera importante a la mÉldre para dedicarse enteramente a una actividad profesional, sobre todo tii los niños ^^^n pequeñuti; sin emhargu, nu impiden aparentemente yue trabajen a tiempo parcial. Por último, la residencia de la familia en Paris o en una gran ciudad actúa positivamente para elegir la mujer un trabajo a tiempo completo, desanimándola a la inactividad profesional. C'ONCL USION Cualquiera que sea el método de estimación utiiizado, el modelo de regresión lineal de variable dependiente binaria no puede proporcionar estimadores consistentes de los parámetros desconocidos, tampoco puede imponer al valor calculado de la variable endógena que esté comprendido en el intervalo de variación de una probabilidad. El modelo logistico permite evitar estos dos inconvenientes, pero su facilidad de aplicación depende eñ gran manera del tipo de información tratada. Si los datos agrupados autorizan el ajuste de una formulación lineal transformada por el método de los mínimos cuadrados generalizados, los datos de tipo individual necesitan, por el contrario, la utilización de un procedimiento numérico para maxirnizar la función de verosimilitud del modelo. La concavidad de la función disminuye, sin embargo, la dificultad de! procedimiento de cálculo, permitiendo obtener estimadores consistentes, asintóticamente eficientes y asintóticamente normales. El madelo de elección múltiple no es más que la generalización del caso precedente. Con él pueden considerarse situaciones más variadas y reales, aunque es necesario ciertamente efectuar una esquematización de la realidad. Cada uno de los métodos mencionados para el caso binario son adaptables fácilmente para el modelo de variable dependiente múltiple, presentando, claro está, las mismas ventajas e inconvenientes aludidos anteriormente, aunque ahora se trata de ESTiMACiON DE MOUELUS DE ELFCC'IOlti CL:ALITA'I^I^"A 1(il estimar un mayc^r númeru de parúmetros para el mi^^ mo núrnero de variableti exógena^ inc.lui^ld^, en cada ecuación c^el sititema. REFERENCIAS ASHTON, W. D.: The Lukit Trurrs1vrrnutic^n. Hafner. New York, 1972. BERKSON, J.: «Application of the Logistic Function to Bio-Assay». Jc^urnct^ c^f^ ThP AmPric•un Stutisticul Assuciutivn, vol. 39, pp. 357-365, 1944. BoCK, R. D.: «Estimating Multinomial Response Relations^ . En Cuntributions to Stutistics unct f'ruhuhility: Es^.^uti}s^ in Merrtury vf ^ S. N. Ru^•. University of North Carolina Press, 1970. Cox, D. R.: Anulv.^^is c^f' Binury l^utu. Methuen. Londres, 1970. DoMENCICH, T. y MCFADDEN, D.: Urhun Tru ^ •P/ Uc^rrturtd: A Behu ^ ^ic^rul Anulvsis. North-Holland. Amsterdam, 1975. GOLDBERGER, A. S.: Ec•unumetric Thec^ry. Wiley. New York, 1972. GOLDFELD. S. M., y QUANDT, R. E.: Amsterdam, 1972. Nc^n Lineur Meth^ds in Ecvnometrics. North-Holland. L..ASS[BILLE, G., y NAVARRO GótrtEZ. L.: «Tratamiento Econométrico de las Variables Cualitativas». Re ^ ^istu Cuurlernc^.^ cte Ciencius ^Ecc^nvmicus ^^ Rmpresuriules, 8. Universidad de Málaga, 1981. MCGILL[VRAY, R. G.: «Estimating the Linear Probability Funetion^. Ecc^»ometricu, vol. 3^3, pp. 775-776, 1970. MANTEL, N.: «Models for Complex Contin,gency Tables and Polychotomus Dosage Response Curves» . Biometric•s, vol. 22, pp. 83-95, 1966. NERLOVE, M., y PRESS, S. J.: «Univariate and Multivariate Log-Linear and Logistic Models^. Runci^ Cur^c^rutic^n Renort, R. 1.306. Santa-Mónica (California), 1973. PRESS, S. J.: A^nliect Mcc/ti ^ •uriute Ancr/ysis. Holt. Rinehart Winston, Inc., 1972. QUETELET, A.: S^rr /'f^c^mme et fe dP ^ ^P/c^pnement cle ses ,^[rcrrlté.^^. Baehelier. Paris. 1835. THEIL, H.: «On the Estimation of Relationships lnvolving Quaiitatives Variables». Jut^rirul u/' Sociulc^ky, vol. 7b, pp. 103-1S4, 1970. Ar^eric•un THEIL, N.: Princi/^les c^%^ Ec^^nvmetrics. Wiley. New York, 1971. ToBiN, J.: «Estimation of' Relationships for Limited Dependent Variables». Lcc^n^^inetriccr, vol. 26, pp. 24-36, 195K. VERHULST, P. F.: «Notice sur la loi que la population suit dans s^n acoroissement». C^^rrespunuluncr Muthemetiy^ce ^t Phvsiyue, pp. 1 13-121, publicada por Quetelet, 1938. ZELLNER, A.: KAn Efficient Method of Estimating Seemingly Unrelated Regressions and Tests for Aggregation Bias». Jc^t^rnul c^J'th^ Americ•un Stutisticc^l As.cuc•iclltc^n, vol. 57, pp. 34K-368, 1962. 1()2 E.STAD[sTlCA ESPA!'^i0[.A ^UMM.ARY ESTIMATI©N O F THE (^UAL1'TATIVE CHOICE MUDELS tn its simplest expression, the mocie{s of qualitative reply associate a binary or dicotomic choice with a number of exogenous ch^racteristics aprioristically deemed pertinent. The treatment of these modefs, easily generalized in order to take into account a more complex reatity (multipte choice), hamper the usual hypotheses of e^onometric estimation because ihe explicated variable is identitied with a probability. To palliate these drawbacks, the classical linear speci#ication is replaced by the standard function of logistic distribution which is estimated by the method of maximum likelihood or by that of the generalized quadratic minimums, according to the nature of the data. The aim of this paper is to show the advantages or disadvantages of the different methods to estimate the models of qualitative choice, enlightening them with the empirical explanation of ihe probabie access of married women to the labour market. The results here presented are those of a sample of ?90 1~rench families, surveyes by the Institut de Recherche sur 1'Economie de I'Education in 1977. Key K^^^rds: Models of dependent qualitative binary and multiple variables. Probability estimation of the access af married women to the labour market by the tinear model by MCO and MCG and the {ogistic model by maximum likelihood. A^ MS 19^0. Subject classification: 62P20.