C E P A L ¡ c B l a I E foyo) INT-1740 Í/. 2 NACIONES 1.TN1DAS CENTRO LATINOAMERICANO DE DEMOGRAFÍA (CELADE) XX CURSO REGIONAL INTENSIVO DE ANÁLISIS DEMOGRÁFICO 1997 1. MÉTODOS CUANTITATIVOS ESTADÍSTICAS: MATERIAL DOCENTE MATERIAL DOCENTE (Para uso exclusivo de los alumnos) Santiago cíe Chile CURSO INTERNACIONAL INTENSIVO DEMOGRAFIA Organiza: Facultad de Ciencias Básicas Universidad de Antofagasta. DE UNIVERSIDAD FACULTAD CURSO D DE DE ANTOFAGASTA CIENCIAS INTERNACIONAL E M O G R BASICAS INTENSIVO A F.' I DE A APUNTES DE E S T A D I S T I C A Me. Jiinmy F.eyes Rocabado Ceparta.-ento de Materna ti cas Facultad de Ciencias Básicas ver;-dad de Antofagasta Mg. Juan Duarte Vargas Departamento de Matemáticas Facultad de Ciencias Básicas Universidad de Antofagasta UNIVERSIDAD DE ANIÜFAGASTA FACULJAD UC CIENCIAS BASICAS INSTITUTO NACIONAL DE ESTADISTICA S ¡ g P ¡ ¡ ¡ CEN.RO LATIKOAHERICABO DE DEMOGRAFIA lif^Sili \ % .CURSO ' INTERNACIONAL D . E M O APUNTES G -INTENSIVO R A F I DE A DE í S7 AD í ST I cA CsT./VV* •• '^'.V.'T.'^'ñ D Ü C P A L V '•'g. Jimmy Reyes Rocabado . Departamento de Ma toma ti m^ Mcj. Juan Duarte Varaos . t-^r,,r> )- - IV TASAS, RAZONES Y PROPORCIONES Cifras absolutas v frecuencias relativas ~ " Las estadísticas que resultan de las tabulaciones de diferentes tipos da datos (nacimientos, defunciones, casos de enfermedad» consultas, egresos hospitalarios,. etc,) proporcionan ndmeros absolutos que son muchas veces utilizábles ?'h directamente en Salud Pública» Por ejemplo, el ndmero do consultas otorgadas en un,consultorio extemo permite al administrador en salud estimar la cantidad de fr acreéursos necesarios para dar una atención suficiente? el ndmero de nacimientos es ctiin dato valioso para los programas de atención matemo-infantilf el ndmero de egre sos de un hospital muestra el volumen de hospitalización y sirve para calcular eos tos y rendimientos» Sin embargo, a posar de la importancia de las cifras absolutas, son las té"frecuencias relativas las que tienen una mayor utilidad» B.-jo esta denominación Snso incluyen las tasas, proporcionos» porcentajes y simples razones. Las frecuera tocias;relativas tienen la ventaja de. facilitar la presentación de las rolaciones. esqúe^exísten entro dos o más datos y, hacer, más sencilla la comparación do resulta» dos. ' * 1. _ Razone3 Son cuocientes "entré dos cantidades do igual o distinta naturaleza. Indican cuantas vecos sucode el hecho que está en el numerador con rospecto al hecho que está en el denominador. N9 do hombrof Ejemplo t Razón do mosculinidod Na do mujoros Indica cuántos hombros hay por cada mujer. Si se amplifica por 100> co sabrá cuantos hombros hay por coda lOO mujoros, on Chile 1982 habió 96 hombros por coda 100 mujeres. 5.521.067 Chilo 1982 = 5.754.373 x 100 p 95.9 Otro ejemplo x En el programa do otonción maternal se desea comparar la relación entro controlos y consultas de morbilidad otorgados on d03 Sorvicios do Solud on 1902. 1-4202 Atención runtcrnnl Servicio He Snlud Controles Oriento Sur 72.154 72.029 Consultos morbili'ío^ 72.568 07.041 W El examen do estas cifras absolutas hoco un pocodifícil I a comparocidn. una formo gruesa so puedo decir que ambos Servicios dieron igual niímero do controles y qu<2> on cambio, el nómoro do consultas por morbilidad fuo muy superior en 1 Sorvicio Sur. Rosulta más clara la comparación si so calculan los cuociontos °ntro ol numero do controles y G1 número de consultas en cada uno de los Sorvicios. Servicio 72.154/72.568 = 1 control por CBda consulta. Oriento 72.029/87.041 = 0.8 controles por cada consulta. Servicio Sur Se establece que el Servicio Oriente ha dado más controles por consulta quo ol Sorvicio Sur. Proporciones Son cuociontos entro do3 cantidades de igual naturaleza. Doscribon la rocción que una serie do sucosos que figuran on ol numerador roprosonta con ro&octo al total de sucosos de igual índole. Cunado ol resultado do esto cuociente o multiplica por 100 resulta un porcentaje, que e3 lq forma habitual de calcular sta frecuencia relativa. Icmplox En Chile en 1982 el Sistema Nacional de Servicios do Salud controló el stado nutricional de 1.160.813 niños menores de 6 años. En ol mismo año la Re- i(5n Metropolitana controló 390.464 niños de igual edad- Como la Región Motropoitana^es una parte del Sistema Nacional so puede calcular el porcentaje que re ~ resenton. los controles de esta Región con respecto al total dol país» <?g .i.-' •• r • • '*•" •:; - 390.464 1.160.813, X 100 .. Do osto modo so sobo quo 34# dol total do niños monoros do sois años n control nutricional en ol país, pertoncoon o lo Región Metropolitano. j. Es importante insistir que tanto los hechos que figuran en el numerador como los del denominador deben sor do igual naturaleza. De este modo el resultado fixprosa la importancia relativa quo el doto del numerador tiene con reepocto ol ten pal. - ! Los porcentajes tienen 1a vontaja de permitir una comparación fácil de pries que tienen totales diferentes, al referirlos a una baso comón que en esto aso es 100. Si suponemos dos Provincias en que se desea conocer si la mortaliód del menor de 28 días es diferente en importancia con respecto al total de nibs menores de 1 año, es más sencillo calcular los porcentajes que representan las efuncioncs de menores do 28 días con respocto ol total de defunciones de monoros e 1 año. Provincia Defunciones do monoros de 1 ono Defunciones de menores de 20 df.-ts US A> Concepción 502 242 43,2 Bio-Bio 207 131 45,6 En la provincia do Concepción las defunciones de menores de 20 rifas reasentan el 40,2% del total (1o defunciones infantiles, on cambio en la provincia 3 Bio-B.io reprosenton el 45.6%. -4202 I Imitaciones do los porcentajes y necesidad del calculo do tosas A pesar do su utilidad» los porcontojos tlonon limitaciones. SI so estudian» P o r ejemplo, las muortos por accidentes en dos grupos de edados on un noís X nos encontramos con lo siguionto* Total do dofuncionos Grupo do edad 48.999 306.025 15 a 24 65 a 74 Defunciones por occidcn+.o N» % 26,0 12.763 3,7 11.425 En esto coso podría concluirse que los accldentos son un peligro más * ~sorio pora los jóvenes» en los que más de uno cuarto porte de las defunciones so debe a accidentes, que pora las personas do mayor edad» en las que los accidentad - causan monos dol de las dofuncionos» Lo3 cifras anteriores no expresan roalroente el riesgo de morir por occidente» sino la importancia rolatlvo que osta causa tiene en el total de defunciones de cada grupo do edad» El conocimiento del riesgo no se obtiene con el cái cuío do los porcentajes; para ello hay quo introducir en la comparación un elemento importanto que os lo población expuesta al riesgo de sufrir accidontes» 'El rosultoíj quo se obtiene al dividir el número do muortos debidas a accidontes por >ía población expuesta oí riesgo do sufrir un accidonte es lo que se denomina tasa ri<íQrooHalidadpor accidento.• ; S s f w t v • - •• •• ••• •• ¿ V i - • Y ' í . ' ^ ' í •' "Vi •• • • • •• •••; . •'•• • c-orv/f o.. . • . u •• c.t r¡: .•»<; t' r» :v • J>v-" s'— ' ? 'V*r • ' v--3.; Tasas •:.,. Una tasa es un cuociento formado por tros elementos : -Un numorodor, que consiste en el nómoro de vecos quo ocurrió un dotorroinodo bocho on un período do tiempo dado y en un droo determinado. "Por ejemplo, el ndmero do cosos de uno enfermedad que so registró on un área durante un año. -On denominador, quo os l a población expuesta al riesgo do que lo sucoda ol fonómono que aparece on ol nuinorador. -Una constante por lo cual se multiplico el cuociento. Debido a que ol cuociento resultante en uno toso es siempre do valor inferior a lo unidad» óste se multiplico por 100, 1.000, 10.000 ó 100.000 de modo do tener cifras superiores a la unidad» lo quo facilita la interpretación. En efocto, es más fácil ontonder que la tasa de mortalidad do una región os 8 por 1.000 habitantes quo docir quo os O,008 por habitante. .Requisitos generóles do las tasas Es necesario nuo on unn tosa haya concordancia entro ol numerador yk e .dennminn^or en tres aspectos importantes» la naturaleza dol hecho, la zona googr fica y el período do tiempo dentro del cual ocurre ol hecho. k En relación con la naturaleza del hecho, debe usarse en el denominado la población de la cual haya emanado el hecho del numerador. Así, no podríamos tener una tasa de mortalidad por cáncer de lo próstata si en el denominador figt lo poLlación femenina. 1-4202 . El área geográfica debe sor la misma para ol numorador que para el denominador. Con respecto al tiempo, las tasas se calculan genoralmento sobre una anual. So prosonta un probloma on cuanto al denominador do la tasa, ya QUO debido a que la población varía a lo largo dol año, pueden hacerse distintas estimaciones de ella. Si la población se estima .al comienzo del período no ropre sonta toda la población expuesta ya que en esta población no figuran por ejemplo, los niños quo nacerán durante el año. Si la población que so usa es la estimada al final del año sucede lo contrario, yo quo no aparecerán en olla los que han fa llecido y los que han emigrado en el curso del año. De aquí quo es de uso habitual como representativa do la población media expuesta al riesgo la estimación o mitad del período, os decir, al 30 do junio del año en estudio. b a s o Tipos de tasas En general pueden distinguirse dos tipos principales de tasas* a) tasas crudas o brutos. b) tasas específicas. Cuando en ol denominador figura el tota 1 de 1a población su habla do tasas crudas porque no so consideran características como odad» sexo> etc. Es una medición gruesa do la fuerza do ocurrencia do un hecho. Cuando en el denominador so usa sólo cierto sector de la población» por ojomplo,: 'la 'población do" 20 a 25 años (en el numerador debe figurar el hecho referiHo¡vqueT,!afect'a sólo* a "esté" grupo'de edad) se' habla de tasas" específicas.""' Estás ta'sás son más refinadas y miden con mayor exactitud el riesgo que se desea conocer, ya que-en general los riesgos son diferentes segtfn las características • de las personas. . • cr« * ' - Por ejemplo, lo mortalidad es muy diferente en algunos grupos de odad y la toso crudo os sólo una ospocio do promedio do los diferentes tosas ospocíficas. A veces so habla improp i órnente do quo una toso os ospocíficn, Tal es el ca so do la tasa de mortalidad por una causa determinada, por ejemplo tuberculosis. Si en el numerador figuran todas las dofunciones por tuberculosis en ol denominador dr-Vo estor todo la pobloción y os por lo tonto una tasa cruda por uno causo específico. Las tasas que habituolmento so usan en Salud Pdblica so refioron a lo mortalidad, lo morbilidad, lo lotolidod y la focundidod3.1. Toso bruto do mortalidad Su numerador incluyo lo totalidad de las defunciones do ambos sexos, do todos los edades y por todas los causas, registradas o lo largo de un año calendario en un áreo determinado. Su denominodor es la población total do eso mi sma áreo estimada o mitod do período, os'docir, al 30 do junio dol mismo año. Tal como ocurro con todas los tosas de mortalidad, debido a quo en la pobloción expuesta ol riesgo de morir sólo algunos individuos hon muerto on el tórmino del año calendario, el denominador es sioinpro mayor quo el numerador y, pora obtener cifras enteros os necesario amplificar el cuociente entre dofunciones y población por uno constante que, en el coso do la tosa bruto es 1.000. Tasa bruto de mortalidad = _ Ng totnl de defunciones en un .•Ireo y año detormj nodos, x ~~ Pobloción total dol áreo ol 30 de junio de eso oño ^ QQQ 5cndn__cou¿a Tasa do mortalidad por causa s npfuncjones por una causa on un área y año determinados Población total al 30/junio de ose año y área ^qq qqq El denominador do las tasas por causa, en goncral, os la población total y por consiguiente so trato do tasas crudas por una causa o grupo do causas específicas. La construcción do estas tasas implica separar ol conjunto do todas los muertos diversos sub conjuntos atondiendo a la causa do muerto. Dichas muertes, si no hay otra especificación adicional, incluyen los defunciones do cualquier edad y ambos sexos quo han ocurrido por una misma causa o grupo de causas, Debido o 1a necesidad He disponer do tasas por causas do muorte cuya magnitud en la población puedo, ser muy pequeña y a fin do que 1a magnitud de las tasas do mortalidad por los diferentes causas sea facilmento comparable, la. constante que en ellas se utiliza es 100.000. - -i - e •ivoííí-t ioucnoo I Tasa de mortalidad materna = _ Muertos debidas o complicaciones del orobarazo, parto o puerperio x 1.000 (ó "'Uncidos vivos en ese año y área x 10.000), Se denominan muertes maternas aquellas cuya causa está relacionada con complicaciones del embarazo, parto o puerperio.y ellas constituyen el numorador do. la tasa, r-.. • .•• .. . .. . moiru Su' donoíninodor "podrían ser las mujeres entro 15'y-49 años-pero ol rios'g'o¡ específico''^quo1 indica el numorador sólo afecta a aquollas que en dicho año han tenido un embarazo, por lo tanto lo más adecuado sería colocar, ol nóinero de embarazadas. Como habitualmonto no se dispone de información fidotUgna- respecto a esto dato, so ha convenido internacionalmente utilizar como denominador ol nóinoro do nacidos vivos del mismo año en que sucedieron las muertes del numerador. La taso do mortalidad materna so define como la relación ontro ol número do defuncionos por causas relacionados con las complicaciones dei embarazo, por to o puerperio ocurridas en un año y área dadas y ol ndmero de nacidos vivos en el mismo año y áróa. Se puode expresar por 1.000 ó por 10.000. 3.2. Tasas específicas de mortalidad Seqón sexo* El riesgo de morir difiere segón ol sexo. Por olio es convonionto modir por separado la mortalidad de hombres y de mujeres. Tosa Mortalidad Masculina = _ Defunciones masculinas en un área y año determinados x 1.000 ~ Población masculina ol de ese año y área 30/vi Toso Mortalidad Femenino = _ Defunciones femeninas en un área y año deternñnor'or, Pobloción femenina al 30/vi de eso año y área x 1.000 Iguol que la tasa bruto de mortalidad» ambas tocas se amplifican por 1.000. Debido a que sus denominadores oon deferentes estos dos tosas no so puclcn sumar directamente poro reconstruir lo toso bruto de mortalidad. i La mortalidad difiero marcadamonte segvín la edad. Por eso corrientemente la medición do la mortalidad requiero medir el riesgo de muerto por odados. Al elaborar los tasas do mortalidad por edad puede llegarse a tal grado do especificación quo los subconjuntos do defunciones incluyan sólo edades simples, es docir, elaboro una tasa paro cada año do odad. Sin embargo, lo habitual os quo 5e trabaje con grupos do edades, usándose frecuentemente grupos quinquenales de od3d o bien grupos do mayor amplitud. Sólo pora las edades más jóvenes, on quo ol riesgo do morir cambia más rapidamento con la odad, está justificado construir tasas de mortalidad por edades simplos o aún por intervalos quo sean menos amplios que 1. año. Tasa de mortalidad por edad = _ Defunciones ~ Población de do un eso grupo grupo do de edad on un faca y año rfotorininados ^ 000 edad al 30/VI de eso ano y área Todas las tasas do mortalidad por odad so omplifican_por 1.000 • Estos tosa3 se pueden calcular soporodomonto poro cada sexo. En talos casos la doblo especificación do sexo y edad debo h-~orse tanto para las dofunciones como para la población. Ejemplo» Tasa mortalidad masculina do 20 - 24 años = _ Defunciones masculinas de 2Q-24 on un área y año determinados ^ qqq ~ Población masculina de 20-24 años al 30/VI para ese año y área Un caso especial dentro He las tasas de mortalidad por odad lo constituyen, los muertos de los menores do un año. El riesgo do morir es considerable moritel'iVás. alto on el. prinior año. do vida quo en las edades siguientes,".salvo las ¿fóBes roúyavanzadas». 1."" . . . . .. . *! .";* " '-" . ' " ' ' . ' • - " *" . -.-.Es prccisamonto on esta odad cuando la mortalidad os .m5s; sonsibfo. a ios'efectos dol ambiento y si las tasas son altas una buono proporción do ostas defunciones son ovitablos. Por olio esta medida es un indicador usual dol nivel do salud o interesa particularmente conocerla. Tasa de mortalidad infantil = _ Defunciones de niños menores He 1 año en un área y año determinados ^ Macidos vivos en eso año y área *• Tal como en la tosa bruta do mortalidad y los tosas do mortalidad por sexo y edad, la constante quo so utiliza en esta-taso es 1.000. El numerador de lo tosa de mortolidod infantil incluye los dofunciones do ambos sexos y por todas las causas que ocurren dentro do un año calondario y en un área determinado en los niños que ailn no han cumplido su primor año do vida. Dada la naturaleza do su numerador lo tasa de mortalidad infantil tieno ol corocter do una tasa de mortalidad por edad. Por lo tonto, debería osperorso quo su denominador fuera la población do menores de 1 año de edad, ostimada a mitad del mismo año calendario o que so refieren las muertes. Sin embargo, hoy razones metodológicas por los cuales so hace necesario el uso de otro denominador. • Entre estas rozones está el hecho de que la población menor do 1 año se omite en los censos en una proporción mayor., que la de cualquiera otra edad, y por ello su tamaño, para un oño censal y con mayor rozón en las estimaciones pora los años posteriores al censo, son más inexactas quo para los grupos do edades mayores. Por otra porte, los niños menores de 1 año que existen en una población depende c'cl nivel y las tendencias de la natalidad en los años recientes. En cambio, on los grupos do edades mayores los efectivos de población son menos sensibles a las modificaciones de la natalidad en los oños inmediatamente procedentes. 1-4202 27. Es por esto, que para estar a cubierto de las variaciones que existen los países respecto a la cabalidad de los censos y de las fluctuaciones que puede experimentar ol nivel de la natalidad, se ha convenido intornacionalmonte en utilizar como denominador de la tasa de mortalidad infantil la cifra de nacidos vivos dol año, en lugar de la población estimada do menores de 1 año. La tasa de mortalidad infantil se subdivido en dos componentes» Tasa do mortalidad noonotol = entre __ Defunciones niños menores do 28 ds. en un ¿rea y año determinados x ^ QOQ * Nacidos vivos en ese año y área *".'' Está tasa mido la frocuoncia do muertes quo ocurren on los menores de t, 20 ds. on un año calendario y on un área determinada por cada 1.000 nacidos vivos . en eso mismo año y área. Tasa de mortalidad infantil tardía — _ Defunciones de niños do 2B ds. a 11 mese3 en un ¿rea y año determinados „ ^ q^q ~ Nacidos vivos en ese año y ¿rea . La tasa do mortalidad infantil tardía mido la frocuoncia do muertos '' que ocurren en el primor oño de vida a partir del 28» día, en un año calendario y área dada por 1.000 nacidos vivos en ese año y área. ?*C. ~ ~Así'como"ontro "las muertos dol primer año 03 conveniente distinguir los / quo ocurren-en-las primoras 4' semanas-del resto de las muertes infantile,'tambi ón " es títil analizar 'Separadamente las'muertes de la primera seraana~de vida de'las" ¿ccorrespondientes, a lás 3 semanas siguientos. Si se rofieron estos nuevos dos sub^.. conjuntos a la misma cifra do nacidos vivos dol año so obtienen dos nuovas tasas quo sumadas equivalen a la tasa do mortalidad noonatal. Ambas se expresan igualmente por 1.000 . La tasa de mortalidad.de la primera semana so denomina tosa de mortalidad neonatal precoz y la do la segunda a cuarta somana tasa de mortalidad noonotol tord^ql Tasa de mortalidad neonatal precoz = — Oofuncionos de menores do 7 dios pn un área y nño determinados Nacidos vivos en ese año y ároa ^ qqq Esta tosa mide la frecuencia de muertes que ocurren en la primera semono do vid.o en un oño calendario y ároa dodo por coda l.OOO nacidos vivos del mismo año y ároo. Tosa de mortolidad noonotol tardía = _ Defunciones de niños de 7 o 27 dios en un ároo y o ño determinaos ^ ^ qqq Nocidos vivos en ese oño y áreo ' y Mide la frocuoncia do muertos que ocurren entre la segunda y cuarto se-» mona de vido en un oño colendorio y áreo dados por cada 1.000 nacidos vivos del mismo oño y áreo. Toso de mortolidod fetol tardío (o mortinotolidod) = Defunciones fetales tardíos (28 y + semanas de gestación) en un ároa y =:' oño' ^ictermi nodos Nocidos vivos en ose oño y á r o a — noo x 1. 28. Según el momento de la gestación en que se produce la muerte del producto de la concepción, las defunciones fetales se clasifican en precoces (menos ¿e 20 semanas do gestación) intermedias (20 a 27 semanas) y tardías (23 y más semanas de gestación). Las defunciones fetales tardías corresponden a los mortina tos y la s precoces e intermedios a los abortos. El registro do los dofunciono3 fetalos tieno una omisión importante. Ilota omisión ofocto princlpolmonto o las dofuncionos fotalos prococoa. Para las defunciones fetales tardías en cambio, el registro proporciona una información más completa, aunque siempre subestima la magnitud real dol problema. Su denominador tambión son los nacidos vivos por las razones oxpuestas en la tasa de mortalidad materno. Tasa do mortalidad perinatal = - Dofuncionos fetales tardías + defunciones de niños monoros do 7 días _ en un área y oño detorminados . x 1.000 "" Nacidos vivos en oso oño y área Esta taso mide ol riesgo de muerte que implico para ol producto de la concepción ol paso de la vida intrautorino a la vido extrauterino. 3.3 Medición de la morbilidad ~ V-j ": El ootudio-de la morbilidad tiene serias dificultados. Desdo luego, -a diferencia-dé larouorto-qúeocurre una sola'vo'z y en un moroento'bién dofiñi-" do y os un hecho permanente, la-enfermedad"puede ocurrir varias voces-en-la vi'dá',;do un individuo, ya que se trota de una misma enfermedad o do enfermedades distin tas y por último ellas pueden tenor duroción variable. - ~ En lo que so refiero a la modición de la enfermedad sepuedan distinguir tres tipos do unidades» 1). personas enfermas, 2) enfermedades, 3) episodios do enfonnedad. Por ejemplo, si una peroona tiene durante el año 2 resfríos y 3 episodios diarreicos, se contabilizará i - o) persono enferma* b) 2 enfermedad os} c) 5 episodios. -• Por este motivo el Comitó do Expertos on Estadísticas de Salud rócomienria quo on las estadísticas do morbilidad so especifique» cloramonto a cual ,1o estos tres criterios se refieren los dotos. En lo medición do la morbilidad interesa fundamentalmente medir la frecuencia de la enfermedad en la población, su duración y su gravedad. 3.3.a. Medición do lo- frecuencia do lo enfermedad So distinguen dos tipos» la incidencia y la prevalencia. -Tasa de incidencia Se denomina incidencia al número de cosos nuevos que se prosentan on un período de tiempo. Se refiero o enfermedades que comienzan durante un período definido y la tasa mido la frecuencia de acontecimientos quo ocurren durante el período. En la tasa de incidencia so incluyen en el numerador los casos nuevos (enfermedades o enfermos) registrados durante ei período y •el denominador se refiere a la población estimada en el punto medio ^él períodotasas rio incidencia pueden ser anuales pero también pueden referir so a cualquiera otro unidad de tiempo. 29. Tasa do incidencia = — Número He casoo nuevos en el período ^ ^ q q q q q Población a mitad del período La tasa de incidencia muestra la dinámica de la enfermedad y expresa e! riesgo de enfermar que tiene la población durante ol período obsorvodo -Tasa do prevaloncia Provnlongi^ » es ol número do casos (nuevos y antiguos) quo se rogistr en un tiempo o momento dado, por ejemplo, el primor día de un mes o ol último día de un año o ol promedio diario dentro do un período de tisem po. La toso do prevoloncia tiene como numerador ol nómoro do cosos qu están presentes en ese momontó y como denominador la población ostimod para el mismo momento. Tasa de provalencia = _ Número do casos existentes en un momento Hado Población en eso momento ^qq QQQ La taso, do provaléncla os una medida relativa cuyo sontido es cotopbroblo a la inform'oción quo proporcionan los censos de población y mido sólo lo' que existo o -prevalece en ese momento» Es necesario hacor notar que en ol numerador figuran todos los cosos tanto los quo se inici ron antes dol momento de medición como los cosos nuevos que aparecen e ose momento. Tratándose de enfermedades crónicas la prevalencia reflojo mejor que la incidencia la magnitud del problema en la comunidad. 3.3.b. Medición de la gravedad He la enfermedad Un aspecto do la morbilidad cuyo conocimiento tiene gran interós i la gravedad de la enfermedad. Ella puedo medirse en tórminos de la incapaciHaH quo produco. Por ejemplo, una enfermedad monor es aquella quo no es causa He ausencia del trabajo. Esto hace necesario tener una escala do incapacitan para medir la severidad dol cuadro. Además 13 medición tieno ol probl( ma He que la gravedad dependo no sólo He la enfermodad sino quo tambián Ho-l; características do los individuos que la padecen. Por ejemplo, un resfrío ce mún pueHe ser motivo para que una persona guarde cama, mientras otro individt con un resfrio do iguales condicionos continúa Hosarrollando sus actividades. Por estas dificultades el índico He gravedad do una enfermedadk]U< más so utiliza es la tasa de letalidad, que establece la relación entre los fallecidos por uno enfermedad y los enfermos que padecen eso enfermodod. -4202 30. Tosa de letalidad = _ Número de defunciones por una enfermedad dada ~ Número de enfermos de esa enfermedad x ^qq Mide la frocuoncia con que se produce la muorto en una onformodod. Esto 03 la tasa que permite establecer ol pronóstico do las enformedoc 3.3.C. Medición do la duración de la enfermedad La duración do la onfermodad os un dato aue interesa modir, entro otros razones» porque la enfermedad de mayor duración significa mayor costo. Puedo hacerse osta medición, on forma do un promedio. Por ojemplo, 60 onfernrx do tifoidoa estuvieron en coma un total de 1.080 días, la duración de la en • fermedad es entonces» Duración = ' ^'fto^'= i 8 fí *as e n Promedio Pora la medición de la duración es necesario dofinir previamont'o que se entiendo por enfermedad. En esto caso la duración se refiero al tiemj promedio dó estada on cama do los enfermos. Otras definiciones podrían tom; on cuenta, por ejemplo, el día de los primeros síntomas o ol día on quo so :: ' hizo el diagnóstico, etc. • •' ' ' • i-- f. .-..••• .•• • • . • . . ;...:....• • El promedio puedo obtenerse .-no solo en relación a los onformos (60 en ol ejemplo anterior) sino que puedo obtenerse para opioodios do enfer medod. Por ejemplo* en uno escuolo so registraron los resfríos do los alumn y se tuvo un total de 100roefrio3 on el año. Lo duración total do losrcsfri fue do 500 días. La duroción media de coda episodio fue, por lo tonto de 5 días. 3.4. Medición de lo fecundidad Lo medición do la focundidad so hoce a trovós do diforentos tipos de tosas que tratan do medir los niveles dol fenómeno en un área. Toso bruta de notojidod Es uno taso simple que relaciona los nacidos vivos registrodos en un área geográfica durante un año con la población total do esta áreo. Tasa bruta de natalidad = _ Nocidos vivos en un áreo y oño determinados ~ Pobloción totol al 30/VI on eso oño y ároo x ^ qqq Como incluyo o la pobloción totol (do torios los ododos y rio Ombor sexos) no puedo interpretorso como uno probobilidod porque en ol d.onominador hny pobloción quo no está expuesta al riesgo de tener un niño. Expresa mis bien la frecucncio do los nacimientos por cada 1.000 bobitontos. : Los tosos de notolidod son prácticamente las tínicas medidos do ft cundidod que es posible colculor paro áreas geográficas pequeños y permite t tudior los tendencias del fenómeno en un área determinarlo. 31. Cuando se comparan áreas diferentes hay quo ser extremadamente cuidadoso en la interpretación porque puedo haber diferencias on la estructura de la población especialmente on lo que so refiero a la composición por edad. do la población femenina y esta diferencia puede por sí sola dotorrninor diforencios en las tasas de natalidad. Tasa do fecundidad general Es esta una tasa m5s ospecífico yo que tiene un donominador la población potencialmento expuesta al riesgo de tener un nacido vivo: la población femenina en edad fértil. Tasa de fecundidad general _ _ Nacidos vivos nn un área y oño determinados . ~ Población femenina de 15 a 49 años al 30/VI x * en eso año y área. - Al tomar en cuento solomente a las mujeres y en el grupo de edad, expucs^ to ol riosgo es una tasa más dtil para hacer comparaciones entre zonas o coroparocionos internacionales. Taso de fecundidad por edad Esto taso tiene un nuovo rofinamionto y os más espocífico ya quo toma en cuenta no-solo ol sexo, sino >lo composición por edad» En efecto, :eh su numerador se anotan los nocimientos de madres de un grupo de edad determinada y en ol denominador la población femenina de esa edad. .• . . Tasa de fecundidad por odad = Nacidos vivos de mujeres do un grupo do edad en un _ área y año determinados . Población femenina de ese grupo de edad al 30/V1 en ese año y área. __ ^ OOQ Ej.x Nacidos vivos de mujeres de 15 a 19 años en un órea y año determinados Población femenina do 15 a 19 años al 30/VI en eso año y área. x . i * u u u Por lo general las tasas 'le focundidad por edad se calculan para grupos quinquenales de edades comprendidas entre los 15 y los 49 años, os decir, se calculan 7 tasas de fecundiad por edad. Otras medicas de fecundidad Los estudios demográficos mós finos de la fecundidad utilizan además de las tasas anteriores, las llamadas tasas de reproducción que tratan de medir el aporte futuro de la fecundidad al reemplazo do la población haciendo una corrección en los nacimientos utilizando la proporción de nacimientos femeninos. Como se trata de tasas usadas por especialistas romitiinos al lector a los textos de Demografía para su ostudio. W> Capitulo IV INTERPOLACION POLINOMIOS DE DE FUNCIONES INTERPOLACION El problema más simple de interpolación consiste en lo siguiente: Dado un intervalo [a,b] en el cual se hallan especificados los p u n t o s x Q , x 1 , x 2 , . . . , x n , y los valores de una cierta función ; f (x Q ) = y Q , f í x ^ = y 1 , f ( x 2 ) = y 2 , . . . , f(x n ) = y n , se requiere construir una función P(x) llamada función de interpolación que p e r t e n e z c a a una clase conocida de funciones (en particular la clase de las funciones polinomiales ) y que tome los mismos v a l o r e s en los puntos de interpolación que la función f(x), es decir, tal que: (1) P(xo) = yQr Píx^ = y,, P ( x 2 ) = y¿' ' • • ' p <xn> = ^n Geométricamente esto significa que debemos hallar un polinomio y = P n ( x ) de grado no superior a "n" que pase por los PUNTOS DE INTERPOLACION.y que satisfaga la condición (1)Conviene s e ñ a l a r que en nuestro caso la función y^f(x) estará siempre definida mediante una tabla de datos resultado de alguna observación. y El polinomio de interpolación encontrado se utiliza ordinariamente para aproximar los valores de la función y = f(x) para valores del argumento "x" que no sean los puntos de interpolación x o , x,, x 2 , . . . , x n . Esta operación se llama INTERPOLACION DE LA FUNCION. En general se distingue entre INTERPOLACION en sentido estricto e s cuando "x"- pertenece al intervalo decir, cuando el valor de "x" es .intermedio entre x Q y x n y EXTRAPOLACION cuando el valor de "x" no pertenece al intervalo [ x o , x p ] . Sin embargo nos referiremos siempre al término interpolación para significar tanto la .interpolación en sentido estricto como la extrapolación. 66 EJEMPLO. El'censo realizado, cada cinco años, en una ciudad, arroja los siguientes datos para los últimos 15 años. X 1980 y 70.350 1985 120.458 1990 130.790 Se pide determinar aproximadamente la cantidad de habitantes que habla en el año 1982 y los que habrá en el año 1992. SOLUCION. Este problema puede tener muchas soluciones, dependiendo del polinomio de interpolación que escojamos. Un gráfico de los datos es el siguiente: (t = 0 en 1980). fig.(2) fig.(3) y(miles) y(miles) En la figura 2 hemos unido los puntos de interpolación con una linea poligonal continua supóniendo que el comportamiento del crecimiento de la población podria se'r modelado por una función lineal (polinomio de primer grado ).cada cinco años. Sin embargo podemos suponer, también, que el comportamiento del crecimiento de la población puede estar modelado por una función cuadrática, esto es, por un polinomio de segundo grado, cuyo gráfico es una parábola. Recordemos que una parábola queda completamente determinada por tres de sus puntos. ¿ Cuál de las dos funciones es la que nos proporcionará la información más ajustada a la realidad ?. La elección del grado del POLINOMIO INTERPOLANTE no es fácil y con frecuencia está ligado a la posesión de información adicional por parte del investigador que está interpolando. En realidad es posible hallar la- ecuación de una recta y de una parábola sin recurrir a los métodos, algo sofisticados, de interpolación; para esto seria suficiente resolver un sistema ele 67 ecuaciones lineales en dos y tres variables respectivamente. Sin embargo c u a n d o se tiene una tabla de datos, que es lo usual en demografía, resulta, a la postre, más i'ácil y más cómodo este tratamiento especial mediante los llamados métodos de interpolación. PRIMERA F O R M U L A DE INTERPOLACION' DE NEWTON VALORES D E L ARGUMENTO IGUALMENTE ESPACIADOS S u p o n g a m o s que como la s i g u i e n t e : X y x . o y o se tiene una X 1 yi ; x función dada mediante x 2 una tabla n yn y2 para v a l o r e s igualmente espaciados de la variable independiente, esto es, x¡ = x 0 + i h (i=0,1,2,..,n), donde "h" (espaciado) es la distancia e n t r e cada dos puntos. Se requiere h a l l a r un polinomio P n (x) de g r a d o no superior a "n" tal que: P n ( x D ) = yQ, P n (x 1 ) = y t , ..... > P n (x n ) = y n E s t o significa, por ejemplo, que dados dos puntos"se hallará un polinomio de primer grado, dados tres puntos el polinomio será de segundo grado, dados cuatro puntos el polinomio será de tercer grado, etc. La fórmula de inter-polación de Newton, que nos da el polinomio de .interpolación, se escribe ordinariamente en la forma siguiente: (2) P n f x ) = y Q + g a y D 4- q(q-D ? o'y Q + 2¡ q(q-l)(q-2) 3; q(q-l)(q-2)...(q-n+l) + 1 o y n i , donde q a y Q +, x-x. y las ° a'y son las DIFERENCIAS FINITAS construidas utilizando los puntos dados por la tabla de datos y que están calculados en la TADIA DE DIFERENCIAS HORIZONTAL. 68 Esta fórmula resulta muy conveniente para interpolar una función dada cerca del punto inicial x . Conviene indicar que. cualesquiera de los valores de "x" dado por la tabla puede' ser considerado como valor inicial X q ; dependiendo del "lugar" donde se quiera interpolar. INTERPOLACION LINEAL Si la tabla de datos está conformada solamente por dos puntos el polinomio de interpolación será de primer grado; en cuyo caso tendremos la ecuación de una recta. Haciendo n = 1 en la expresión (2) resulta: P1(x) = y D + qoyc que es la fórmula de interpolación INTERPOLACION lineal. CUADRATICA Si la tabla de datos está formada por tres puntos, entonces, el polinomio de interpolación será de ségundo grado; en cuyo caso tendremos la ecuación de una parábola. Haciendo n = 2 en la expresión (2) resulta: ' q(q-D p 2 (x > = yo + q a y o + que es la fórmula de interpolación — : 2; 2 — ° y o cuadrática. Podemos seguir obteniendo los polinomios de tercer grado, cuarto grado, etc, sin embargo es suficiente para nuestros propósitos trabajar con los polinomios de primer y segundo grado. Estamos ahora en condiciones de resolver completamente el problema planteado al principio, esto es,, hallar aproximadamente la cantidad de habitantes que había en el año 1982 y que habrá en el año 1992. CASO LINEAL La tabla de d i f e r e n c i a s h o r i z o n t a l 1 10ftO X y °y0 0 5 10 70.350 120.458 130.000 50.108 9 . 54 2 ° de datos es la siguiente: Yr AZJ Si u s a m o s i n t e r p o l a c i ó n lineal para hallar la población en el año 1982, e s t o es, c u a n d o x = 2, tenemos que u s a r x Q = 0 como valor inicial y c o n s i d e r a r s o l a m e n t e las d i f e r e n c i a s hasta o y a tal como indica la fórmula. De e s t o se d e s p r e n d e e n t o n c e s que: x Q = 0 , yQ= 70.108, ayQ P o r o t r o la'do, p u e s t o que, i n t e r p o l a r es x = 2 r e s u l t a que: q = Finalmente 2-x, el punto = - = 0,4 5 2-0 de P 1 (x) = y o + q o y Q , P1(2) = 70.108 + P1(2) = 90.151 P o r lo t a n t o 90.151 personas. en el año = 50-108 y h = 5 en el cual queremos resulta: 0,4(50.108) personas. 1982 habría habido aproximadamente Para responder a la pregunta ¿ C u á n t o s habitantes habrá en el a ñ o 19 9 2 ? tenemos que tomar la recta formada por los dos últimos p u n t o s p u e s t o que, nuestra respuesta, está en la PROLONGACION de la recta formada por ellos. En esta s i t u a c i ó n nuestro valor inicial será x o = 5 . O b s e r v e que estamos tratando de interpolar en un punto más c e r c a n o a 10 que ¿í 5, sin embargo no podemos tomar como valor inicial a 10 p o r q u e en ese caso no tendríamos recta. 70 En efecto: 5 Xo= Como queremos , y o = _120.458, o y Q = 9.542, h = 5 interpolar en x = 12 resulta q = 12-x 5 o = _ 12-5 5 que: 7 _.- = _ 1,4 , . = 5 . Luego de P 1 ( x ) = y Q + <3 a y 0 tenemos: P 1 ( 1 2 ) = 120-458 + 1,4(9.542) P t ( 1 2 ) = 13 3.4 58 personas. Por lo tanto personas. en el año 1992, podría haber alrededor de 133.458 Utilizando la misma tabla de diferencias horizontal interpolar en x = 2 considerando: debemos CASO CUADRATICO xQ= 0, y Q = 70.108, a y Q = 50.108, o2yQ = -40.566 y ;'h = 5 Puesto que el v a l o r de q = 0,4, tal como lo habíamos calculado antes, resulta de: q(q-l) P 2 ( x ) = y o 7 +qay o -H — — a2yo, que 0,4(0,4-1) P_ (2) = 70.350+0,4(50.108)+ ¿ (-40.566) 2 P_ (2) = 90.393,2+(-0,12)(-40.566) = 95.261,1 personas. Por lo tanto en el año 1982 habría habido aproximadamente 95.261 personas. Este resultado superior en alrededor de 5.000 individuos, en relación al caso lineal, no deberia asombrarnos porque el segmento de parábola, entre los dos primeros puntos, está sobre el segmento de recta de dichos puntos. Ver fig(3). 71 ¿ Cuántos habitantes habrá en el año 1992 ?. Puesto que la parábola necesita tres puntos para quedar determinada tenemos que usar nuevamente el mismo polinomio para interpolar en x = 3 2, con x Q = 0, pero con dife-rente "q" . En efecto: q = Resulta entonces x-x h 2 = 6 que: P ? ( 1 2 ) = 70.350 + 6(50.108) + P2(12)= 12-0 = 12(12-1) 2 (-40.566) 370.998 + 66(-40.566) = 103.262,4 personas. Observemos que esta cantidad, menor que la del año 1990 se debe al h e c h o que alrededor del punto (10, 130.790) la parábola empieza a decrecer ya que la tendencia de la población sigue ese comportamiento. Sin embargo es poco probable que, en la realidad, la población disminuya tan rápidamente. Es en estos casos cuando la interpolación se transforma en un arte puesto que el investigador debe utilizar información adicional sobre el fenómeno que está estudiando. EJEMPLO. La siguiente es una tabla de los sobrevivientes a edades exactas, de Guatemala del año 1*950, comprendida entre los 20 y 50 años. X 20 30 40 50 64 .331 59.036 52.320 44.739. Hallar a) y b) 1 4 5 utilizando cuadrática respectivamente. SOLUCION. de diferencias Construiremos finitas. x 20 30 40 50 lx 64.331 59.036 52.820 4 4.739 en primer oyo -5.296 -6.216 -8.081 72 interpolación lugar la tabla o2yo -920 -1.865 0 3 yo -945 lineal y horizontal a) Puesto que 1 2 2 está entre los 20 y los 30 años el valor inicial x o = 2 0. Tenemos, entonces lo siguiente: X—2 0 x„= 20, y 0 = Aplicando 64.331, ay0 = -5.296, h = 10, q = la fórmula de interpolación lineal 22-20 = 10 =0, ?. . 10 resulta: lj2 = Yo + q^Yo = 64.331 + 0,2(-5.296)= = 64.331 - 1.059,2 = 63.271,8 Por lo tanto aproximadamente. hay, a la edad de 22 años, 63.272 personas b) Como 1 4 5 está entre los últimos tres puntos debemos aplicar la interpolación cuadrática entre ellos. En este caso x 0 = 30. Resulta entonces que: 45-30 x 0 = 3 0 , y 0 = 5 9 . 03 6 , oy 0 =-6.216, o y 0 = - l . 865, h--10 y q = 2 = 1,5 10 A p l i c a n d o la fórmula de interpolación 145 145 cuadrática'tenemos: 1,5(1,5-1) = 59.036 + 1,5( — 6 - 215) + (-1.865) 2 = 59.353,5 - 9.3322,5 + 669,4 = 50.382,9 Por lo t a n t o aproximadamente. hay, a la edad de 45 años, 50.383 personas SEGUNDA FORMULA DE INTERPOLACION DE NEWTCN VALORES DEL ARGUMENTO DESIGUALMENTE ESPACIADOS ¿ Qué ocurre cuando los valores de la variable independiente ^ están desigualmente espaciados ?. En este caso la primera fórmula de interpolacción de Newton no puede aplicarse. Sin embarco mismo Newton nos da la respuesta a este problema. Puesto que los datos obtenidos mediante la observación no siempre son complntos, 73 * más de alguna vez será necesario interpolar con valores del argumento desigualmente espaciados. Para definir un método de esta naturaleza necesitamos, en primer lugar, generalizar el concepto de diferencias finitas a las denominadas DIFERENCIAS DIVIDIDAS. DIFERENCIAS DIVIDIDAS Supongamos tabla: que se tiene i o |1 y0 yi X y una función definida X2!; y 'I mediante x n donde la diferencia entre don puntos consecutivos cualesquiera distinto de cero; esto es x¡ +l -xj > 0. Los cocientes: [x.,x. 1 J— —1±-L—-i- , (i=0,1,2,...) X iM"X¡ se denominan divididas de primer orden. Por ejemplo,[x Q , x 1 ) = y -y [xj,x 2 ] = —-—x 2~ x 1 divididas de este y -y0 *—2_ y [X2,x3]= x la es diferencias yi~y Q x r x / o * e t c , son algunas diferencias 3~ x 2 orden. Análogamente se definen las diferencias divididas de segunde orden [x ¡ ,x ¡ ,x¡ [X ]= » + i'X» + 2 ~ *l>*t+il , (i=0,1,2....) X Por ejemplo [x , x.,x„] = ¡ + 2~X¡ [x ,x )-[x , x 1 0 ^ X dividida de seojundo orden. orden se definen en la forma x x x x t ¡' ¡n' ¡i-2' ¡>3 j 2 " X es una diferencia 0 Las diferencias siguiente: divididas I ' xi4 2' X M X 74 v \>3 X i v de i' Xi t I ' X ¡ torcer ^ Por ejemplo [ x., x „ , , x . ] = ^ — es una x 4 -x, diferencia dividida de tercer orden. En general las diferencias divididas de orden "n" se hallan a partir de las diferencias de orden (n-1) mediante la relación de recurrencia que se ha aplicado. Las diferencias divididas se disponen en una tabla como la siguiente: TABLA DE DIFERENCIAS X x 4a. x,, Xg] [x t , x 2 ] x2 [ X 2 , Xg ] X3 X4 [ Xj , X 2 , X^ ] O0,x, , x2,x3] [ X j , X 2 , Xg , X 4 ] [ X Q , X j , X 2 , X^ , X 4 ] tx2, x3, x 4 ] Y4 EJEMPLO. y 3a. o X1 X 2a. la. y DIVIDIDAS Formar las diferencias divididas de la función definida mediante la tabla siguiente: 0 132.651 0 148 . 8 7 7 o, 3 o", 4 o, 7 1 5 7 . 4 64 166. 375 1 9 5 . 112 o, 9 2 1 6 . 000 SOLUCION. Aplicando sucesivamente la relación de recurrencia tenemos: 148 . 377-132 .651 [X0,x1]= = 81,13 0,2-0 157.464-148.877 [x,,x 2 ]= = 85,87 0,3-0,2 75 35,87-81,13 [xo,x1,x?]= 15,8 0,3-0 y asi sucesivamente. Los resultados finales de este proceso están especificados en la tabla que sigue: la. x > 2a. 3a, 4a. L 0 : 132.651 í 0,2'. 14 8.877 i 0,3; 157.464 81, 13 15, 8 85, 87 89, 11 1 j 0,4 > ; 166.375 j 0,7: 195.112 1 16,2 1 16,7 95,79 1 17,3 104,44 I 0, 9 j 216.000 U t i l i z a n d o el concepto de diferencias divididas, podemos representar, ahora, la fórmula de interpolación de Newton para v a l o r e s del argumento desigualmente espaciadps. En fecto: P(x) = y D + •h [x o ,x,] (x-x Q )+ [x0,x,,'x2] (x-x o ) (x-x,)+ ... •b [ x Q , x 1 ,x 2 , . . . , x n ] (x-x Q ) (x-x,) (x-x 2 ) (x-x n ,) EJE11PLO. La siguiente es una tabla de los sobrevivientes hasta los 15 años de una cohorte de 100.000 nacidos vivos. x 0 .100 . 000 2 92 . 376 5 90.697 10 39 . 870 Utilizando la segunda fórmula de interpolación de Newton, estime los sobrevivientes a la edad de 4 años. SOLUCION. En primer diferencias divididas. lugar construiremos la tabla de la. X 0 4a. 3a. 2a. 100.000 -3.812 - 2 650, 5 92.376 - 559,6 5 90.697 10 89.870 -60,12 49,3 - 165,4 A continuación aplicamos la segunda fórmula de Newton. P(x)= Y 0 + + [>VX,J (x-x0)+ [x 0 ,x, ; x 2 ] (x-x Q ) (x-x 1 ) + [ x Q / x 1 , x 2 , x 3 } (x-x D ) (x-x,) (x-x 2 ) . Puesto que interpolaremos en x=4 debemos reemplazar, x por 4, en el polinomio; reemplazar y x 2 , por sus respectivos valores; y reeemplazar las correspondientes diferencias finitas. En efecto: P(4)= 100.000 + (-3.812)(4-0) + 650,5(4-Ó)(4-2) + + (-60,12)(4-0)(4-2)(4-5), es decir, P ( 4 ) = 1 0 0 . 0 0 0 - 15.248 + 5.203,2 + 480,96 = 90.436,16 Es decir, se espera que hayan sobrevivido aproximadamente 90.436 personas. EJEMPLO. á la edad de 4 años Un lago es repoblado con 100 peces en el año 1975. La tabla siguiente muestra la observación del crecimiento de esta población a partir de 1980, en. los años que se indican. t 1980 1982 1986 N(t) 1. 000 2 . 000 4 . 166 1987 4545 Calcular aproximadamente la población en el año 1985. (t=0 en 1980 y t=7 en 1987) 77 SOLUCION. La tabla de diferencias divididas t _ N (t) la. 0 1. 000 2 2 . 000 6 4 . 166 2a . es la siguiente: 3a . * 500 2,41 4 , 21 514,5 -27, 1 379 4 . 545 7 Aplicando la fórmula de interpolación de diferencias divididas tiene: P(5) = 1 . 0 0 0 + 500(5-0) f 2,41(5-0)(5-2) + P(5)= 1.000 + 2.500 + 36,15 - 42,1 = 3.494 se 4,21(5-0)(5-3)(5-6) peces. De lo a n t e r i o r se desprende que en el año 1905 hubo aproximadamente 3.494 p e c e s . INTERPOLACION LINEAL INVERSA Supongamos que hemos tomado la siguiente información del censo de una ciudad. (x=0 en 1980) X y 0 5 10 196.000 210.000 275.000 y deseamos saber en qué año hubo 250.000 habitantes. La respuesta a esta pregunta no es tan inmediata. Notemos que hasta ahora, en general, hemos respondido lo siguiente: ¿ Cual es el valor de la variable dependiente si conocemos el valor de la variable independend.iente ?, ó bien, ¿ Cual es el valor de "y" cuando conocemos el valor de "x" ?. Ahora debemos dar respuesta a .la pregunta, ¿ Cuál es el valor de la variable independiente cuando conocemos el valor de la variable dependiente ?, dicho de otro modo, ¿ Cuál es el valor de x cuando se conoce el valor de y ? 70 Para dar respuesta a esta pregunta utilizaremos, con algunos arreglos, la misma fórmula de interpolación lineal de Newton para valores del argumento igualmente espacindoerdemos que la fórmula de interpolación lineal es la siguiente: a i) y = yD + q Y0' x-x. donde, ü) a = Puesto que tenemos que conocer, ahora, el valor de x, x de la ecuación ii). Del despeje resulta que: x = x o + qh , donde q será ahora , q = despejamos y-yr Estamos en condiciones de dar solución al problema en cuestión. En efecto, construyamos la tabla de diferencias finitas de acuerdo a los datos de la tabla. x y 0 196.000 14.000 5 210.000 .65. 000 10 275.000 Considerando los datos diferencias se tiene: >V=5, Aplicamos q= la fórmula X - y-yr dados 51.000 por el problema la tabla = 0,615 y h = 5 de 65.000 °Yr x = x que de 250.000 - 210.000 + qh resulta que: + 0, 6.15 (4) = 4 + 2,46 = 6,46 "Esto significa 250.000 habitantes. y a mediados 79 de 1937 años. hubo aproximadamsnte EJEMPLO - La siguiente Labia ele valores presenta los sobrevivientes a edades exacta» de una generación de 100.000 nacidos vivos entre los 5 y 15 años. 5 X 92.476 | 10 15 92.321 92.052 ¿ A qué edad hubo aproximadamente sobrevivientes ? SOLUCION. La tabla de diferencias 92.100 finitas es la que sigue: X 92.476 92. 321 . 92.052 5 10 15 -114 -155 -269 De los datos del problema y de. la tabla de diferencias se tiene la siguiente información: y-yQ X Q = 10 q = 92.100 - 92.321 = ayn Aplicando la fórmula x — 10 + Este resultado 14,1 años. = 0,82 y h = 5 -269 x = x Q + qh resulta: (0,82)(5) = 14,1 años. indica que hubo 92.100 sobrevivientes a la edad de v 60 V CURSO INTERNACIONAL INTENSIVO D E M O G R A F I A í' ESTADISTICA Organiza: Facultad de Ciencias Básicas o Universidad de Antofagasta. Patrocinan : tne DE U N I V E R S I O A O DE A N T O F A G A S T A F A C U L T A D OE C I E K C U S . _H A S IC A S INSTITUTO NACIONAL DE ESTADISTICA SSSSA?;, CENTRO LAT I N O A K C R I C A N O OE OEHOGRRFIA me CURSO INTERNACIONAL INTENSIVO DE D E M O G R A F I A APUNTES OE ESTADISTICA Mg. Jimmy Reyes Rocabado Departamento de Maternati cas Facultad de Ciencias Básicas Universidad de Antofagasta Mg. Juan Duarte Vargas Departamento de Matemáticas Facultad de Ciencias Básicas Universidad de Antofagasta í INDICE I.- INTRODUCCION II.- Pag. 1 METODOS DE ENCUESTA- Pag. 2 III.- PRESENTACION OE LA INFORMACION IV.- TASAS, RAZONES Y PROPORCIONES Pag. — V.- ESTADISTICA DESCRIPTIVA Pag. 22 VI.- TEORIA ELEMENTAL OE PROBABILIDADES Pag. -¿ VII.- DISTRIBUCIONES DE PROBABILIDADES MAS USUALES Pag. :i VIII.- MUESTREO PROBABILISTICO Pag. 22 IX.- PRUEBAS DE HIPOTESIS E INTERVALOS DE CONFIANZA X.- APLICACIONES DE LA DISTRIBUCION JI-CUADRADO • APENDICES : TABLAS ESTADISTICAS REFERENCIAS Pag. 2'. Pag. =5 — Pag. Pag.115 Pag.118 R E F E R E N C I A S WAYNE, Daniel " Estadística con aplicaciones a las Ciencias Sociales y a la Educación" Me. Graw-Hill Colombia 1981. D'OTTONE, Horacio " Estadística Nivel Universitja río " OSTLE, Bernard " Estadística Aplicada " Edit. Limusa Ni ley S.A. México 1973 H, Gough " Estadística I " Programa de Postgrado en Pro gramación CELADE-Santiago OIVISION DE BIOESTA Indicadores de Salud " DISTICA Y BIOMATEMA Escuela de Salud Pública TICA Facultad de Medicina Universidad de Chile I. INTRODUCCION En este curso se estudiará el uso de algunos de los métodos de la estadística en el canpo de la demografía y en los estudios sociales. Empezaremos con xana descripción muy breve del canpo de estudio que se llama " la estadística siguiendo con una caracterización de un estudio estadístico típico de una población grande y de la organización de los datos que provienen de tal estudio. Luego veremos algunos conce£ tos básicos de la fundamentación teórica de la estadística, enpezando con la idea de las probabilidades y del maestreo prdbabilístico. En los capítulos siguientes verenos varios métodos que permiten el análisis de grandes cantidades de datos en forma resumida, y el cálculo de estimado nes de características específicas de una población. Finalmente veremos los conceptos de distribuciones y de la inferencia estadística en la pre sencia de errores aleatorios, con determinados métodos de análisis e inferencia muy utilizados en estudios de poblaciones hunanas. ¿ Qué es la estadística ? El " Diccionario de metodología estadístia " (G. Gonzalvo, Edicio nes Mora ta, Madrid, 1978, p. 81), define la estadística coto sigue : " Estadística : Técnica o proceso matemático de recogida, descripción, or ganlzací6n, análisis e interpretación de datos numéricos. Como la inves tigación busca una expresión cuantitativa, la estadística constituye un instrumento fundamental de medida y de investigación." Continúa oon dos variedades de estadística : " Estadística descriptiva (o analítica) : Compendia o simplifica afirmaciones referentes a medidas realizadas sobre una población ... Six-ve para la descripción nunérica de un grupo particular. Ninguna conclusión va más allá del gnpo descrito, y cualquier similitud con los de fuera del grupo no puede ser garantizada. Los datos describen este grupo y sola mente éste. " " Estadística deductiva : Ccrrprende el proceso de muestreo o selección,pa ra su estudio, de un pequeño grupo al que se supone ccnro representativo de otro más numeroso y del cual procede. El pequeño grupo se denomina muestra; el grupo mayor población, conjunto universo." Notas : 1) en el caso de la estadística deductiva se suele ha blar de la inferencia estadística. 2) en este curso se hablará indistintanente de población o universo? sin enfoargo, el término conjunto se reserva rá para otro uso. Canpos de aplicación de la estadística. La estadística se puede aplicar a cualquier entidad que se puede describir, aun parcialmente, en términos de características cuantitativas y cuyos elementos pueden ser observados ya sea directa o indirectamente. Aporte de la estadística al análisis demográfico. Dado que una preocupa ción muy inportante del demógrafo es, en primer lugar, el conocimiento de las características básicas de poblaciones humanas (su nCmero, estructura por sexo y edad, fecundidad y mortalidad, comportamiento migratorio y di£ tribución espacial, actividades económicas y mucho más), las cuales se pueden medir con más o menos precisión, la estadística descriptiva sirve para recolectar, ordenar, resumir e interpretar información sobre estas poblaciones. En segundo lugar, la estadística deductiva (o inferencia) proporciona herramientas para profundizar la interpretación de esa infor nación , y para investigar relaciones entre características, las cuales no sienpre se pueden observar directamente. Tanbién proporciona indicadores de la calidad o confiabilidad de los datos básicos, además de las medidas resumidas o deductivas que se extraen de ellos. El siguiente esquema, del libro " Estadística Demográfica " (üni vursidad de Costa Rica, 1960, Contenido e Introducción ) indica una posi_ ble interpretación de la estructura de los estudios demográficos : " Generalidades sobre recopilación, análisis e investigaciones demográficos Recopilación de datos demográficos Estadística general de la población Estadística de la mano de obra Estadísticas vitales Estadística administrativa Las nuestras en la recopilación de datos demográficos Análisis de las informaciones demográficas Tabulación de los datos Análisis estadístico Interpretación y presentación Investigaciones demográficas básicas " Métodos estadísticos y métodos científico, puntos de convergencia y de di vergencia. Método científico: observación de fenómenos bajo condiciones experimentales contro ladas 3 deducción de leyes naturales supuesto que los resultados son reproSu-cibles modelo determinístico Método estadístico : observación bajo condiciones parcialmente controladas deducción/inferencia supuesto de una parte determinada y una parte aleatoria ( desoorc cida) elaboración de modelos para explicar el caTportan\iento óe la rar te aleatoria los resultados de un experimento son reproducidles sólo sproxLü^ damente II. METODOS DE ENCUESTA. En este capítulo queremos considerar las características genere les de los estudios que tratan de obtener y analizar información de pccla ciones reales, teniendo en cuenta todos los problemas prácticos óe estudios de este tipo. Nuestro punto de vista aguí será más la medición a la descripción de'la población, que la inferencia en el sentido de la estadística clásica, que veremos en los Últimos capítulos de esta asignatura. Siendo nuestro enfoque principal el canpo de los estudios socioeconómicos de las poblaciones humanas, empezaremos con una discusión de las etapas de tina encuesta típica real. En primer lugar pedreros considerar los aspectos generales siguientes : - El nacimiento de una encuesta - -Las etapas principales de una encuesta - Las etapas principales de la planificación de una encuesta El nacimiento de una encuesta - La necesidad de obtener información - La especificación de los objetivos - Consideración de fuentes alternativas de catos - La necesidad de hacer una encuesta Definiciones Encuesta : Una encuesta incluye la recolección de catos sdere una : varias características de algunos elementos ce una población con la meta de aprerder lo más posible sobre el carprrtamie-.tc: de estas características en la población total. La encuesta debe desarrollarse teniendo en cuenta los conceptos, rétodos y procedimientos claramente definidos. Los catos recolectaics serán recopilados para estimar las características de la población. Censo : Una encuesta <^ue trata de obtener datos de todos los ele-rentos de la población. Encuesta por muestro : Una encuesta que busca datos sólo sobre algunos elementos seleccionados de la población. Normalmente los elementos seleccionados son una fracción imxy pequeña de todos los elementos de la población. Ventajas del maestreo ; Costos reducidos Rapidez Exactitud Carga reducida para la población Posibilidad de obtener información detallada Censo puede ser necesario : Población pequeña Necesidad de obtener información para áreas pequeñas Restricciones legales Una encusta puede ser descriptiva o analítica : Descriptiva : El objetivo primero es de estimar algunas caracteristi cas de la población. Analítica : El objetivo primero es la verificación (o el rechazo) ae una hipótesis, o el análisis de las relaciones entre características. Las etapas principales de una encuesta Especificación de los objetivos de la encuesta Identificación de la población bajo estudio Preparación del marco maestral Confección del cuestionario Diseño maestral Recolección de datos Procesamiento de los datos Control de errores Estimación Evaluación y análisis de los datos Publicación Las etapas principales de la planificación de una encuesta Objetivos de la encuesta Estudio de factibilidad Equipo de proyecto Presupuesto Calendario Definición de la población bajo estudio Datos que se deben recolectar y análisis previsto Precisión exigida Métodos de recolección de datos Trabajo de terreno Métodos de muestreo Métodos de digitación y procesamiento de los datos Métodos de verificación e inmutación Métodos de estimación Tablas que se deben producir Control de la no-respuesta Encuesta piloto Ciclo de retroalimentación Objetivos de la encuesta Se definen en término de los datos requeridos para obtener las oonclu siones deseadas Importancia de la precisión que se trata de lograr Consecuencias de decisiones malas basadas en datos inprecisos Efectos sobre el presupuesto y sobre el calendario de actividades En relidad, los objetivos se modifican durante la preparación de la encuesta Estudio de factibiliuad Normalmente se debería efectuar un pequeño estudio preliminar para po der decidir si la encuesta realmente puede proporcionar la informa ción requerida Equipo de proyecto Es el grupo de personas encargadas de llevar a cal» la encuesta El gerente de proyecto es miembro del equipo Normalnente, el equipo incluye representantes de varios cairpos especializados : El campo sustantivo de estudio de la encuesta ( demógrafo, soció logo, economista, experto en salud pública, — ) Metodología de encuesta/maestreo (estadístico) Computación (analista/programador) Operaciones regionales ' Cada persona tiene sus tareas especializadas Tüdo el equipo debe mantenerse al día en cuanto a todas las etapas del proyecto Todos participan en la planificación de cada etapa Presupuesto Identificación de los recursos necesarios y los recursos disponibles : Dinero Personal capacitado Carputadoras y otros equipos Otro Calendario Hay que establecer fechas límite para cada etapa mayor del proyecto El gerente de proyecto controla estas fechas para respetar los límites globales de tienpo para terminar el proyecto Definición de la población bajo estudio Es necesario definir con cuidado la población bajo estudio, y la población para la cual se quiere tonar decisiones basadas en los resul tados de la encuesta Datos que se deben recolectar y análisis previsto Hay que decidir exactamente qué datos se buscan ¿ Cavó se van a utilizar ? ¿ Cuáles resultados se publicarán ? ¿ Cuáles resultados serán sólo para análisis interno ? Inportancia de una boleta bien preparada Precisión exigida Es necesario decidir qué nivel de precisión es suficiente para el aná lisis y para las decisiones sobre políticas Se habla de la conflabilidad de los resultados El nivel de la confiabilidad está estrechamente ligado al tamaño de la muestra, entonces a los costos del proyecto • Métodos de recolección de datos Generalmente, es posible elegir uno entre varios métodos disponibles para la recolección de los datos : Entrevista personal Entrevista por teléfono Encuesta por correo Medición directa Archivos administrativos Combinaciones de estos métodos Trabajo de terrero Ttodas las operaciones de terreno deben ser planificadas con gran coidado y bien controladas sobre la marcha para garantizar la obtención de datos ccrrpletos y correctos Capacitación del personal : Entrevistadores Supervisores Personal que digite los datos Verificación de los datos sobre la marcha y control de las respues tas Verificación que la última etapa del muestro se hizo correctamente Visitas repetidas para minimizar la no-xespuesta Métodos de maestreo Hay varios métodos que se pueden utilizar para seleccionar la muestra Se trata de elegir lo más apropiado, temando en cuenta : Consideraciones operacionales Costos Información necesaria para la preparación del marco maestral Entre los métodos que parecen factibles, se ocupara el tamaño de la muestra que requiere cada método para lograr la precisión requerida con el costo de cada alternativa Métodos de digitación y procesamiento de los datos Hay varios métodos para captar los datos : Codificación manual Tarjetas perforadas Digitación y verificación ("key-edit") Lectura óptica Hay varios métodos de procesamiento de los datos : Tabulación manual Procesamiento por corputadora : con programas escritos para el proyecto específico con "paquetes software" para análisis estadístico (SPSS,SAS MINITAB, SL-MICRO, EMDP, PANDE-I, CHECZDIT,...) Los métodos elegidos para estas dos etapas deben ser compatibles Métodos de verificación e iuputación Verificación (control) : Métodos que tratan de identificar los dates incarpletos, incorrectos o incoherentes 8. Irtputación : Métodos para corregir los problemas identificados durante la eta pa de verificación En ambos casos hay una selección de métodos Es necesario especificar ocnplétamente los pasos operacionales de la inplementación del método elegido para los datos de esta encuesta Normalmente es necesario prever la preparación de programas para la ocqputadora Métodos de estimación Son procedimientos matemáticos para calcular las estimaciones de las características de la población a partir de los datos maestrales Incluyen procedimientos para la estimación de la conflabilidad de esas estimaciones La selección del método es normalmente dictada por la selección del plan de muestreo Tablas que se deben producir Tablas que se publicarán cono resultados principales de la encuesta Tablas que se prepararán sólo para ciertos usuarios Datos que se conservarán para ser analizados por el equipo de proyec tos o sus colegas Control de la no-respuesta Hay varios métodos para reducir la tasa de no-respuesta : Carta de presentación Propaganda Visitas repetidas En última instancia, es posible a justar los factores de ponderación para corregir el efecto de la no-respuesta sobre las estimaciones Encuesta piloto "Pre-test" de algunos de los pasos de la encuesta, sobre todo la boleta o Encuesta piloto de todas las etapas El pre-test puede ser solamente cualitativo, por ejenplo tratando de identificar problemas con un borrador de la boleta, o sirviendo para la formación de los entrevistadores Una encuesta piloto debe normalmente comprobar todos los procedimien tos de la encuesta, hasta la producción de las tablas A menudo la encuesta piloto proporciona resultados preliminares cuan • titativps que permiterj yrejorar la alocación de los recursos para la 'encuesta principal ' " " , 9 Si este tipo de encuesta se hace por primera vez, la encuesta piloto es inprescindible Estos dos tipos de prueba pueden permitir msjorar de manera significa tiva la encuesta principal Se cbtiene información útil scbre los costos y el tienpo que realmen te hay que prever para las etapas mayores Ciclo de retroalimentación Ttodo lo que se aprende durante la planificación y las operaciones de la encuesta, proporciona información iirportante que permite mejorar los métodos cuando la encuesta se repita, o cuando se haga otra encue£ ta del mismo tipo general La redacción de documentos claros explicando los métodos utilizados y las lecciones aprendidas, es esencial para que esta información sea útil más tarde III. PRESENTACION DE LA INFORMACION 1.- NIVETES DE MEDICION Los niveles de medición son diferentes escalas que se usan para me dir o describir objetos, individuos u otras entidades y se dividen en : natuoal Escalas ordinal De Intervalos , Discreta Continua E^nalR Nominal : Es aquella que mide o describe asignando " nam bres " a los objetos, individuos u otras entidades y se visan cuando se quiere medir una cualidad o atributo. Por e jaro lo : Profesión ( Médico, Ingeniero, Profesor, etc. ) Color de pelo ( rubio, negro, etc. ). Estado Civil ( casado, soltero, viu do ) . Escala Ordinal : Es aquella que jerarquiza u ordena permitiendo indicar la posición relativa de los distintos elementos clasificados. Por ejenplo : Rendimiento de un curso Grado de dificulatad de una prueba El desarrollo de un país Escalas de Intervalos a) Discreta : es aquella que puede temar sólo ciertos valores en el intervalo considerado y no admite valores intermedios. Por ejennLo núnero de hijos, nChero de estudiantes, etc. b) Continua : es aquella que puede temar cualquier valor en un inter valo dado, por ejenplo : peso, estatura, rendimiento, etc. 1ABLAS ESTADISTICAS Las tablas estadísticas sirven para presentar los datos nurréricos cb tenidos en algún estudio en forma clara y ordenada. las etapas principales en la construcción de una tabla.son: a) Definir los propósitos de la tabla : según los propósitos se aistinguen dos tipos de tablas : i) Tablas de frecuencias, donde el material se clasifica según un solo criterio. ¿i) Tablas de asociación , donde se desea mostrar la relación entre dos o más variables en las unidades de observación. La definición de los propósitos ayuda a determinar los criterios de clasificación a usar en la tabla y el sentido en que deben analizarse los datos. Por ejenplo , i) Si el propósito es mostrar las edades de un gru po de estudiantes, sólo se enpleará un criterio de clasificación la edad y se construirá una tabla de distribución de frecuencias. ii) Si el propósito es en carrbio, mostrar la relación que existe entre la edad y el rendimiento del estudiante, entonces se hará una tabla de asociación con dos criterios de clasificación, la edad y el rendimiento. Observación, Una manera práctica de definir los propósitos de la tabla es a través de la formulación de la o las preguntas que se intenta contestar con la tabla. Tor ejemplo , para el ejenplo i) anterior se podría preguntar ¿ Cuál es la distribución por edad de los estudiantes ? y en el caso ii) ¿ Hay relación entre la edad de los estudiantes y su ren dimiento ? b) Colocar un Título Las tablas deben tener un título cue especifique : i) Qué se presenta : Por ejenplo : estudiante, profesores, rendimiento, ezc. ii) Cónto se clasifican las unidades de observación : Por ejenplo, estudiantes según edad, pruebas, según resultado estudiantes según rendimiento, etc. 11 iii) Donde fueron obtenidos los datos : Por ejemplo : Departamento de Matemáticas del Lioeo Liceo de Hartares de Antofagasta, etc. iv) Cuando se registraron los datos c) Asignar las escalas de clasificación a filas y columnas i) Cuando hay un solo criterio de clasificación de las cbserva ciones, se colocará la escala de clasificación en la primera columna. Ejemplo clasificación por edad EDADES N°OBSERVñCIONES 0-4 10 5-9 14 10 - 14 25 TOTAL 49 ii) Cuando hay mas de un criterio se preferirá colocar la esca la con mayor número de grupos o categorías en la primera co lumna Ejemplo Al clasificar por edad y. rendimiento a un grupo de estudiantes RENDIMIENTO EDAD BUENO 0-4 13 20 23 66 5-9 11 19 58 10 - 14 14 23 29 37 TOTAL 38 61 99 198 REGULAR MALO TOTAL 74 iii) Cuando hay dos escalas de clasificación y una se refiere a los antecedentes y otra a las consecuencias, es preferible colocar los antecedentes en la primera columna y las conse cuencias en la fila superior. Ejemplo Para estudiar la relación entre tipo de enseñanza y rendimiento en una prueba. ! 12. RENDIMIENTO TIPO DE ENSEÑANZA BUENO REGULAR MALO TOTAL TRADICIONAL PERSONALISADA TOTAL Ejemplo resuelto : Construir una tabla para mostrar si la postulación a la Univer sidad depende del tipo de educación y del sexo. TITULO : Postulación a las Universidades según tipo de educa ción y sexo. Servicio de Selección y Registro de Estudiantes Uni versidad de Chile 1985. Escala de clasificación Son 3 : postulación, tipo de educación y sexo. El tipo de educación se ubica en la primera colunna, pues es posible dividirlo en un número mayor de grupos, los otros dos criterios se colocarán en las filas superiores. Colocación de datos numéricos Para cada sexo y para cada tipo de educación el desenlace es postula o no postula; CCXTO el interés de nuestro estudio es la postulación sólo se colocará el N° ce postulante. TIPO DE EDUCACION MASCULINO FEMENINO ; TCT?iL POSTULAN 384 65,1 590 1.010 1.006 71,5 1.407 916 TOI7-L | 1 69.9 1.445 ' 75,0 1.221 ! Industrial 145 78,4 185 3.924 74,3 5.281 ! Técnica 452 75,2 601 40 Agrícola 11 .00,0 11 14.699 80,9 30.514 28.170 e:,9 34 378 j 26.697 80,2 33,336 34,094 80,4 42.419¡ Cient. Hizn. NOCt. Coinercial Cient. Hum. Diur. TOTALES POSTULAN 85,1 47 | 34 72,3 47 1 Ejercicios 1 -- Indique en los datos que siguen , qué escala de clasificación 1¿= cc rresponde ( marque con una x ) ESCALA DE CL--SIFICACIO.-' DATOS Tamaño grupo familiar NOMINAL ORDINAL DISCRETA Previsión social Número de hijos vivos Nivel socio-económioo Actividad económica Ingresos económicos Nivel educacional N° de piezas en la vivienda Material de construcción Sexo Talla Desarrollo ps i corrotor Diagnóstico de la enfenredad Temperatura Presión arterial Gravedad de la enfermedad N° de días de hospitalización 2.- Construya una tabla estadística para mostrar la distribución os frecuencias de diagnóstico en estudiantes con problemas ce arrendire 3.- Construya una tabla para mostrar el efecto Ge dos tra tari en tos er. la evolución del aprendizaje en estudiantes con retardo renta!. ( El tratamiento puede ser con estímalos y sin estímales y la evolución del aprendizaje se mide si el estudiante mejora, sic-_e empeora ) 3.- Construcción de una tabla de distribución ce frecuencias T-ara ;1 de una escala de intervalos continua Reglas generales : i) Se ordenan los datos en forma creciente ii) Determinar el mayor y el menor entre los datos recopilados y c & vi) Colocación de un título, el cual debe contener en forma clara y lo más corrpleta posible la información necesaria para su fácil conprensión TIPOS DE GRAFICOS a) Gráficos lineales Se utilizan para presentar información, especialmente en el caso de escala de intervalos continuo. Consiste en un par de ejes car tesianos donde en la abscisa se ubican los valores de la variable y en la ordenada los cambios de la misma mediante una escala de tipo aritmético. Cada pareja de datos se representa por un punto. Luego habrán tantos puntos caro parejas de datos, los que se unen mediante segmentos rectilíneos. Ejenplo Tasa de mortalidad infantil. Santiago 1S40 - 1967 rt<JrtT7IUt>«D P0<? iOOO loo lío tío 4 lo no <oo «o to ko ao ii to 48 ÍO IH t í 1$.9 AMOS b) Ilistogramas Se utilizan de preferencia cuando en el eje horizontal aparecen una escala de intervalos continua. Está formado por rectángulos de igual base y cuya altura es proporcional a la frecuencias respectiva conforme a la indicación en el eje vertical. Para su irejor presentación es conveniente que todos los interva los de clase sean de igual tamaño. Algunas veces se aoostunbra a unir los puntos medios de la parte superior de cada rectángulo mediante segrrentos rectilíneos ; gráfico así formado se denomina polígono de frecuencia el Ejemplo Con respecto al ejemplo del peso de 40 estudiantes ¿ ÍAÍ 17 h / 4<í 123 <34 <Jí OI "" <14 «1» «54 <«3 "J k . los histogramas o gráficos de Barras pueden adoptar varias formas Así tenemos : i) Gráfico de barra sinples Se utilizan para comprobar cifras totales expresadas en unida des originales. Cada barra tiene una longitud proporcional a la frecuencia de la variable, la que puede leerse en la escala vertical. Cuando las cifras se refieren a algún atributo, las barras pue den dibujarse horizontal mente con el objeto de colocar fácilmente a la izquierda de la figura la leyenda correspondiente . Ejenplos 1.- Ntrnero de estudiantes atendidos en colegio x por año 2.- Distribución de estudiantes según tipo de educación ¿O JO »o v///\ ZZZZZZZZ2ZZ21 777777\ ///z//////\ ii) Gráfico de Barras Agrupados Se utilizan generalmente para ccnparar dos variables según la frecuencia oon que se presentan ( frecuencia porcentual ) Por Ejenplo : Porcentaje de estudiantes accidentadas según gravedad de las le siones en diferentes edades. iii) Gráficos de Barras Subdivididos Es un gráfico muy apropiado para mostrar la composición propor cional de distintas categorías. No es conveniente hacer mas de tres subdivisiones. Gráficos Sectoriales Se utilizan para los mismos casos que los gráficos de barras, con la limitante que toda frecuencia debe expresarse cairo proporción del total. Esta proporción determina el 360° de la con respecto a los circunferencia total que debe limitar el sector que representa la frecuencia correspondiente. Ejenplo Resultados obtenidos con tratamientos A y B Ejercicios Propuestos 1.- Construya el (los) gráfico (s) adecuado para presentar la in formación que aparece en las tablas siguientes y haga una pe queña interpretación de ellos. i) Retiro de estudiantes del Ciclo Básico según causa Area Occidente 1972. CAUSAS SALUD ECONOMICOS TRASLADO % N° 93 12,0 236 30,4 7• . F — C "7 O/ OTRAS 391 TOIAL 777 50,3 ii) Rendimiento académico por Departamento del Liceo X RENDIMIENTO DEPARTAMENTO HORAS HABILES MATEMATICAS FISICA BIOLOGIA QUIMICA ARTES ED. FISICA MUSICA 1980 3.7 6.9 5.3 4.8 6.6 2.6 3.3 HORAS TRABAJADAS 4.1 7.1 5.5 5.1 6.7 7.8 3 20 Los datos que aparecen a continuación corresponden al H" de personas del grupo familiar de algunas familias . Construya una tabla de frecuencia y clasifique estos datos en ella y anexa el gráfico correspondiente. 6 4 5 4 4 5 4 3 7 3 7 8 4 8 8 5 7 3 6 10 8 11 2 5 6 5 2 7 4 6 4 3 3 5 7 5 4 7 7 6 6 6 3 5 5 2 6 4 3 10 7 7 7 6 3 4 2 4 5 10 11 8 4 9 8 5 9 • 4 6 12 5 4 5 5 8 8 5 3 3 8 6 3 8 3 9 4 6 7 7 4 4 5 6 4 3 3 2 6 3 4 • 21 IV TASAS, RAZONES Y PROPORCIONES Cifras absolutas y frecuencias relativas Las estadísticas que resultan de las tabulaciones de diferentes tipos de datos (nacimientos, defunciones, casos de enfermedad» consultas, egresos hospitalarios, etc.) proporcionan ndmeros absolutos que son muchas veces utilizábles directamente en Salud Pública. Por ejemplo, el ndmero do consultas otorgadas en un consultorio externo permite el administrador en salud estimar la cantidad do recursos ncceearios para dar una atención suficiente} el ndmero do nacimientos es un dato valioso para los programas de atención materno-infantilf el niímero de egre sos de un hospital muestra el volumen de hospitalización y sirve para calcular eos tos y rendimientos. Sin embargo, a posar de la importancia do las cifras absolutas» son las frecuencias relativas las que tienen una mayor utilidad. B.-jo esta denominación se incluyen las tasas, proporciones, porcentajos y simples razones. Las frecuencias r .lativas tienen la ventaja de facilitar la presentación do las rolaciones que existen entre dos o más datos y hacer más sencilla la comparación de resultodos. 1. Razones Son cuocientes ontre dos cantidades do igual o distinta naturaleza. Indican cuantas veces sucodo el hecho que está en ol numerador con respecto al hecho que está en el denominador» Elenmlo « Rozón do mosculinidod = N' «jo hombrea — N« do mujeres Indica cuántos hombros hay por coda mujer. Si se amplifica por 100, co sabrá cuantos hombros hay por coda 100 mujoros, on Chile 19Q2 había 96 hombros por cada 100 mujeres. 5.521.067 Chilo 1982 = 5.754.373 x 100 = 95.9 Otro e.iomplo « En el programa do atonción maternal se dosca comparar la relación ontre controles y consultas do morbilidad otorgadas on dos Sorvicios do Salud on 1902. Servicio do Salud Oriente Sur 1-4202 Atención nmtornnl Consultos morbilirtn^ Controles 72.154 72.568 72.029 G7.041 í>:- 22. El examen da estas cifras absolutas hace un poco difícil la comparación. En una forma gruesa se puedo decir que ambos Servicios dieron igual ndmoro do controles y que, on cambio, el ndmoro do consultas por morbilidad fuemuy superior on ol Sorvicio Sur. Resulta más clara la comparación si so calculan los cuociontoc ontro ol número do controles y ol ndmoro da consultas en cada uno de los SorvicioG« Sorvicio Orionto 72.154/72.568 = 1 control por cada consulta. Servicio Sur 72.029/87.041 = 0.8 controles por coda consulto. So establece que el Servicio Oriente ha dado tnás controlos por consulta quo ol Sorvicio Sur. 2. Proporciones Son cuocientes entro dos cantidades de Igual naturaleza. Describen la fracción quo uno serie do sucosos que figuran on ol numerador roprosonta con rospoeto al total do sucosos do igual índole. Cunado el resultado do esto cuociente so multiplico por 100 resulta un porcentaje, que es la forma habitual, de calcular osta frecuoncia relativa. Ejemplo» En Chile en 1982 el Sistema Nacional de Servicios do Salud controló el estado nutricional do 1.160.813 niños menores do 6 años. En ol mismo año la Región Metropolitana controló 390.464 niños de igual edad. Como la Región Metropolitana es una porte del Sistemo Nocional so puede calcular el porcentaje que re presentan los controles de esta Región con respecto al total dol país» 390.464 X 100 1.160.813 Do osto modo so cabo quo 34% dol totol do niños monoros do sois años un control nutricional on ol país, pertoneoon a la Región Metropolitana. Es importante insistir que tanto los hechos que figuran en el numerador como los <Jel denominador deben sor do igual naturaleza. De esto modo el resultado expreso lo importancia relativa quo el dato dol numerador tieno con rocpocto al to-i tal. Los porcentajes tienen la vontaja de permitir una comparación fácil de series que tienen totales diferentes, al referirlos a una baso común que en esto caso es 100. Si suponemos dos Provincias on que se desea conocer si la mortalidad del menor do 28 días es diferente en importancia con respecto al total do niños menores He 1 año, es más sencillo calcular los porcentajes que representan las do funciones de menores do 28 dios con respocto ol total do defunciones de menores de 1 cfu>. Provincia Defunciones do menoros do 1 oño Concepción Uio-Bio 502 287 Defunciones He menores de 20 df.-is Us 242 48,2 131 45,6 En la provincia de Concepción las defunciones de menores de 23 días represento n el 4 0 f d e l totol de defunciones infantiles, on cambio en la provincia He Oio-Uio representan el 45. 1-4202 23. 1.imitaciones de los porcentajes y necesidad del cálculo do tosas A pesar do su utilidad, loa porcontojos tionen limitaciones. Si so estudian, por ejemplo, las muortos por occidentes en dos grupos de edodos on un país X nos encontramos con lo siguionto» .. Grupo de edad Totnl do dofunciones 15 a 24 65 o 74 48.999 306.025 Dofuncionos por occidente Nfl * 12.763 26,0 11.425 3,7 En esto coso podría concluirse quo los accidentes son un peligro más serio para los Jóvenes, on los que más do una cuarta parto do las defunciones so debo a occidentes, que pora las personas do mayor edod, en las que loe accidentes causan monos dol 4% de las dofuncionos. Las cifras anteriores no oxprosan roalmente el riesgo do morir por occidente, sino la importancia rolativa que osta causa tiono en el total do defunciones de cada grupo do edad» El conocimiento del riesgo no so obtiene con ol cál culo do los porcentajosj para ello hay quo introducir en la comparación un elomento importanto quo os la población expuesta al riesgo de sufrir accidontos. 'El resulta^ quo se obtiene al dividir ol ndmero do muertes debidas a accidentes por la población oxpuosta al riesgo do sufrir un accidonte es lo que se denomino taso de mortalidad por accidento. 3. Tosas Una tasa os un cuociente formado por tros elementos : -Un numorador, quo consisto on el ndmoro do vocos quo ocurrió un determinado _ liücho en un período do tiempo dado y en un área determinada. Por ejemplo, el ndmero do casos de una enfermedad que so registró on un ároa durante uñ año. -Ún denominador, quo os la población oxpuosta al riesgo do quo lo sucoda el fonómono quo aparece en ol numerador. -Uno constante por lo cual se multiplica el cuociente. Debido o que el cuociente rosultante en uno tosa os siempre de valor inferior o la unidad, óste se- multiplico por ICO, 1.000, 10.000 ó 100.000 de modo de tener cifras superiores o la unidad, lo quo facilito la interpretación. En efecto, es más fácil ontonder que la tosa do mortalidad do una región es 8 por 1,000 habitantes quo docir quo es 0,008 por habitante. Peni'1 si tos generales do los tasas Es necesario QUO on uno toso hoya concordancia entro ol numerador Y el denominador en tres aspectos importantes» la naturaleza dol hecho, la zona geográfica y el período do tiempo dentro del cual ocurre ol hecho. En relación con la naturaleza del hecho, debe usarse en el denominador la población de la cual haya emanodo el hecho del numerador. Así, no podríamos tener una tasa de mortalidad por cáncer de la próstata si on el denominador figura la población femenina. 1-4202 nominador. El área geográfica debo sor lo misma para ol numerador que f-cr; el de- Con respecto al tiempo, las tasas se calculan generalmente scfcre una baso onual. So presenta un probloma en cuanto al denominador do la t2S2| ya quo debido a quo la población varía a lo largo dol año, pueden hacerse distintas estimaciones de ella. Si la población se estima al comienzo del período no reprc senta toda la población expuesta ya que en esta población no figuran por ejenplo, los niños quo nacerán durante el oño. Si la población que 60 usa es la al final del año sucede lo contrario, yo quo no aparecerán en olio los que han fa llecido y los quo han emigrado en el curso del año. De aquí quo es do uso habitual como representativa de la población cedía expuesta ol riesgo la estimación o mitad del período, os docir, al 30 do Junio del año en estudio. Tipos de tasas En general pueden distinguirse dos tipos principales de tasasi a) tasas crudos o brutas. b) tasas específicas. Cuando on ol denominador figura el tota 1 de lo población su habla ¿o tasas crudas porque no so consideran características como odad» sexoj etc. Es una modición gruesa do la fuerza de ocurrencia do un hecho. Cuando on el denominador so usa sólo cierto sector do la población, por ojomplo, la población do 20 a 25 años (en el numerador debe figurar el hecho referido quo afecta sólo a esto grupo de edad) se habla de tasas específicas. Estas tasas son más refinadas y miden con mayor exactitud ol riesgo que se desc-a conocer, ya quo on general los riesgos son diferentes según las características de las personas. Por ojomplo, la mortalidad os muy diferente en algunos grupos de e*ar y la tasa cruda oa sólo una ospocio do promedio do las diferentes tosas cspocííicas. A vocos so habla impropiomento do quo una tasa os específica. Tal os el ca so do la taso do mortalidad por una causo determinada, por ejemplo tuberculosis. SI en el numerador figuran todas los dofuncionos por tuberculosis en el denocir.ídor d' "•o estar toda la población y os por lo tanto una tasa cruda por una cau<: específica. Las tasas que hobitualrnento se usan en Salud Pdblica so refieren a Iz mortalidad, lo morbilidad, la lotolidad y la fecundidad. 3.1. Tasa bruta do mortalidad Su numerador incluyo la totalidad de las defunciones do a:r¿cs sexes, do todas las edades y por todos las causas, registradas a lo largo de un año c;londario en un área determinada. Su denominador es la población tctsl «"o esc misma área estimada a mitad do período, os docir, al 30 do junio dol r.is-r.o cr.i. Tal como ocurro con todas las tasas de mortalidad, debido a quo en la pcclacií-, expuesta ol riesgo do morir sólo algunos individuos han muerto on el t'rsino oño calendario, ol denominador es siompro mayor quo el nurr.crador y, pera cbter.cr cifras enteros os necesario amplificar el cuociente ontre dofuncionos y pcbls:: por una constante que, on el caso do la tasa bruta es l.OCO. Tasa bruta do mortalidad = _ N° total do dofuncionos on un ¿rea y año determinóles x ^ QQQ ~ Población total dol área ol 30 de junio do oso año 1-4202 Según causo Tasa do mortalidad por causa = _ Defunciones por un? couso on un ¿ron y nfio dotermlnnrtos QQ x ~ Población total al 30/junio de ose año y área El denominador do las.tasas por causa, en gonerol, os la población total y por conslguiento so troto do tasas crudas por una causa o grupo do cajs específicos. ' La construcción do estas tasas implica separar ol conjunto de todas las muertos diversos sub conjuntos otondiendo a la causa do muerto. Dichas raut tos, si no hay otra ospecificoción adicional, incluyen los defunciones do cualquier edad y ambos soxos quo han ocurrido por una misma causa «j grupo de causas Debido a la necesidad de disponer do tosas por cauero <->e muerte cuyc magnitud on la población puedo ser muy poqueña y a fin de que lo magnitud de le tosas do mortalidad por los diferentes causas sea facilmento comparable, la cor tonte que en ellas se utiliza es 100.000. Tasa do mortalidad materna = _ Muertes debidos a complicaciones del ombornzot porto o puerperio x 1.000 (ó Nacidos vivos en eso año y área x 10.003). Se denominan muertes maternas aquellas cuya causa está relacionada c complicaciones del embarazo, parto o puerperio y ellas constituyen el numora<?c do la tosa. Su denominador podrían sor las mujeres entre 15 y años pero el rí go específico que indico el numerador sólo afecta a aquellos que en dicho oñc h tenido un embarazo, por lo tanto lo más adecuado sería colocar ol nómero do Cͱrazadas. Como hobituolmonte no ce dispone do información fidedigna respecto a esto dato, so ha convenido iiiternacionalincnto utilizar como denominador ol n<fc«c de nocidos vivos del mismo año en que sucedieron las muertes del numerador. La tasa de mortalidad materno so define como la relación entro ol r.i ro do dofuncionos por causas relacionadas con los complicaciones del embarazo, to o puerperio ocurridos en un año y área dadas y el ndmero de nocidos vivos er. mismo otio y área. So puado expresar por 1.000 ó por 10.000. 3,2. Tosas específicos de mortalidad Sogtín sexo» El riesgo de morir difiere sogtín ol sexo. Por ello es conveniente morir suporodo la mortalidad do hombres y de mujeres. Toso Mortalidad Masculino = - Defunciones masculinos on un área y año determinados ^ ^ ~ Población masculina al 30/V1 do oso año y área Toso Mortalidad Femenina = _ Defunciones femeninos en un área y oño determinados x 1.000 ~ Población femenino al 30/vl de eso año y áreo Iguol que la taso bruta de mortalidad, ambas tosas so amplifican por 1.000. Debido a que sus denominadores son doferentós estes des tcs;s nc s: . pueden sumar directamente pora reconstruir la tosa bruto Wo mortclido'3. 1-4202 Sculn QrÍQrj | La mortalidad difiero marcadamente segdn la edad» Por eso corrientemonte la medición do la mortalidad requiero medir el riesgo de muerto por odadoe. Al oloborar los tasas do mortalidad por edad puede llegarse ¿ tal grado do especificación quo los subconjuntos do defunciones incluyan sólo odades simples, es docir, so elabore una tasa para cada año de odad. Sin embargo, lo habitual os quo sé trabajo con grupos do edades, usándoso frecuentemente grupos quinquenales de odad o bien grupos do mayor omplitud. Sólo pora las edades más jóvenes, on quo ol riesgo do morir cambia más rapidainento con la edad, está Justificado construir tasas do mortalidad por edades simplos o atín por intervalos quo sean menos amplios quo 1 año. Tasa de mortalidad por edad = _ pefuncloncs de un grupo do edad on un área y año determinados ^ qqq ~ Población de eso grupo de edad al 30/VI de eso año y ároa Todos las tasas do mortolidod por odad so amplifican^por 1.000 . Estos tasas so pueden calcular soparodomonto poro coda sexo. En tales caso6 lo doblo especificación do sexo y odad debo h"~orse tanto para las defunciones como para la población. Ejemplo» Tasa mortalidad masculina do 20 - 24 años = _ nefunciones masculinas do 20-24 en un áron y año determinados ~~ Población masculina de 2024 años al 30/VI para ese ano y área * Un caso especial dentro do las tasas de mortalidad por odad lo constituyen las muertos de los menores do un año. El riesgo do morir es considerable monto más alto en el primor año do vida quo en la6 edades siguientes, salvo las edades muy avanzadas. Es precisamente en esta edad cuando la mortalidad os más sensible a ios efectos dol ambiento y si las tasas son altas una bueno proporción de estas defunciones son evitables. Por ello esta medida es un indicador usuol dol nivel do salud o intereso particularmente conocerla. Tasa do mortalidad infantil = _ Defunciones de niños menores de 1 año en un área y año determinados . Q^Q Nacidos vivos on eso año y área Tnl como en la tosa bruta do mortalidad y las tasas de mortalidad por sexo y edad, la constante quo so utiliza en esta taso es 1.000. El numerador de la toso de mortalidad infantil incluye las defunciones du ambos sexos y por todas las causas que ocurren dentro do un aíio calendario y en un ároa determinada en los niños que odn no han cumplido su primor año de vida. Do^a la naturaleza de su numerador la tasa do mortalidad infantil tiene ol carácter do uno tasa de mortalidad por edad. Por lo tanto, debería esperarse quo su denominador fuera la población do menores do 1 año do edad, ostimodo o mitad del mismo año calendario a que so refieren la3 muertos. Sin eruborgo, hoy razones metodológicos por las cuales so hace necesario el uso de otro denominador. Entre estas razones está el hecho de quo la población menor do 1 año so omite en los censos on una proporción mayor.- que la do cualquiera otra edad, y por ello su tamaño, para un año censal y con mayor razón en las estira clones para los años posteriores al censo, son más inexactas que para los grupos do edades mayores. Por otra parto, los niños menores de 1 año quo existen en una población depende del nivel y las tendencias de la natalidad on los años recientes. En cambio, en los grupos do edades mayores los efectivos do población son menos sensibles- a las modificaciones do la natalidad en los años inmediatamente procedentes. 1-4202 27. Es por esto, que para estar a cubierto de las variaciones que existen entre los países respecto a la cobolidad de los censos y de las fluctuaciones que puede experimentar ol nivel do la natalidad» so ha convenido intornacionalmonto en utilizar como denominador do la tasa do mortalidad infantil la cifra de nacidos vivos dol año, en lugar de la población estimada do menores de 1 año. La tasa de mortalidad infantil se subdivido en dos componentes» Tasa rjo mortalidad noonotol = _ Defunciones niños menores de 28 ds. on un área y año determinados ^ ^ QQQ Nacidos vivos en eso ario y ároa Esta tasa mido la frocuoncia do muertes quo ocurren on loe menores do 20 ds. on un año calendario y on un ároa determinada por cada l.OOO nacidos vivos en oso mismo año y área. Tasa de mortalidad infantil tardía = _ defunciones de niños do 2fl ds. a 11 meses en Un área y año determinados ^ QQQ Nacidos vivos en ese año y área La tasa do mortalidad infantil tardía mido la frocuoncia f1e muortos que ocurren en ol primor oño do vida a partir del 28« día, en un año calendario y ároa dada por 1.000 nacidos vivos en ose año y área. Así como entro las muertos del primer año es conveniente distinguir los quo ocurren en las prirooras 4 semanas del resto de las muertes infantiles, también estítilanalizar separadamente los muertes de la primera semana de vida de las correspondientes a lás 3 semanas siguientes. Si so rofieron ostos nuevos dos sub~ co'njuntos a la misma cifra do nacidos vivos dol año so obtienen dos nuevas tasas quo sumadas equivalen a la tosa do mortalidad noonatal. Ambas se expresan igualmonto por 1.000 . La tasa de mortalidad .do la primera semana so denomina tasa do mortalidad neonatal precoz y la do la sogunda a cuarta somano tasa do mortalidad noonatal tardía^ Tasa do mortalidad neonatal precoz = - Defunciones de menores do 7 días on un ¿roa y nño determinadas ~ Nacidos vivos on eso oño y ároa ^ qqq Esta tasa mido la frecuencia de muertes quo ocurren en la primera somano do vida en un oño calendario y ároo dada por cada 1.000 nacidos vivos dol mismo año y ároa. Tosa do mortalidad neonatal tardía = _ ncfunci oner. do niños de 7 a 77 días en un área y ano determinaos ^ ^ QQQ ~ Nacidos vivos on ese año y áreo Mide la frocuoncia do muertos quo ocurren entre lo segunda y cuarta semana do vida en un año calendario y ároa dados por cada 1.000 nacidos vivos del mismo año y áreo. Tasa de mortalidad fetal tardía (o mortinatalidad) = Defunciones fetales tardíos (28 y + semanas do gestación) on un área y _ oño determinados ___________________ Nacidos vivos on ose año y ároa 1-1202 i x \ 000 28. Seguir) el momento de la gestación en que se produce la muerte del producto de la concepción, las defunciones fetales se clasifican en precoces (menos de 20 semanas do gestación) intermedias (20 a 27 semanas) y tardías (23 y más semanas de gestación). Las defunciones fetales tardías corresponden a los mortlna tos y las precoces o intermedias a los abortos. El rogistro do los dofunclonoa fotalos tieno una omisión importante, lista omisión ofocto principalmente o las dofuncionos fotoloa prococoa. Para las defunciones fetales tardías en cambio, el registro proporciona una información más completa, aunquo siempre subestima la magnitud roal dol problema. Su denominador también son los nacidos vivos por las razones expuestas on la tasa do mortalidad materna. Tasa do mortalidad perinatal = Dofuncionos fetales tardías + defunciones do niños menores do 7 días _ en un área y ano dotormi nados ^ ^,000 ~ Nacidos vivos en ose año y á r e a - Esta tasa mide ol riesgo de muerte que implica pora el producto de la concepción ol paso de la vida intrauterina a la vida extrauterina. 3.3 Medición de la morbilidad El estudio de la morbilidad tiene serias dificultados. Desdo luego, a diferencia de la muorto quo ocurro Una sola voz y on un momento bien dofiñido y os un hocho permanente, la enfermedad puede ocurrir varias vocoo on la vida do un individuo, ya quo se trata do una misma enfermedad o do enfermedades distin tas y por dltimo ellas pueden tonor duración variable. - •• En lo que so refiero a la modición de la enformodad se puod«n distinguir tros tipos do unidades» 1) personas enfermas, 2) enfermedades, 3) episodios do enfermedad. Por ejemplo, si uno poroona tiene durante el año 2 rosfrios y 3 episodios diarrcicos, se contabilizará i - a) persona enfermaj b) 2 enfermedades} c) 5 episodios. •• Por este motivo ol Comitó do Expertos on Estadísticas de Salud rocornicnda quo on los ostodísticas do morbilidad so especifiquo claramonto a cual do ostos tres criterios se refieren los datos. En la medición do la morbilidad interesa fundamentalmente medir la frecuencia do la enfermedad en la población, su duración y su gravedad. 3.3.o. Medición de la frecuencia do la enfermedad So distinguen dos tipos» la incidencia y la prevalencio. -Tasa de incidencia So denomina Incldoncla ol número de cosos nuevos que se prosentan on un período de tiempo. So refiero o enfermedades que comienzan durante un período definido y la tasa mido la frecuencia de acontecimientos quo ocurren durante ol período. En la tasa de incidencia so incluyen on el numerador los casos nuevos (enfermedades o enfermos) registrados durante el período y ol denominador se refiero a la población estimada en ol punto medio dol período. Las tasas do incidencia pueden ser anuales pero tainbión puodon roforirso a cualquiera otra unidad do tiampo. 1-4202 29. Tasa de incidencia = _ Ndmoro Ho cagoo nuovos en el perforo Población a mitad del período ^ ^ QQQ La tasa de incidencia muestra la dinámica de la enfermedad y expresa el riesgo de enfermar que tiene la población durante ol período obsorvado. -Tasa do prevalencla Prevoloncio » es ol ndmero do casos (nuevos y antiguos) quo se rogistran en un tiempo o momento dado, por ejemplo» el primor día de un mes o ol dltimo día de un año o ol promedio diario dentro do un período de tienipo. La taso da prevaloncla tiene como numerador ol ndmoro <-1o casos que están presentes en ose momento y como denominador la población ostimoda para el mismo momento. Tasa de provalencia = _ Ndmero do cosos existentes en un momento doHo Población en ese momento ^QQ QQQ Lo tosa de provalencia es una medida relativa cuyo sontido es comparable a la información quo proporcionan los censos de población y mino sólo lo que existe o prevalece en ese momento. Es necesario hacer notar que en ol numerador figuran todos los casos tanto los quo se inicia ron antes del momento de medición como los casos nuevos que oporocen en oso momento. Tratándose de enfermedades crónicas la prevalencla reflojo mejor quo la incidencia la magnitud del problema en la comunidad. 3.3.b. Medición do la gravedad ^o la enfermedad Un aspecto do la morbilidad cuyo conocimiento tiene gran lnterás os la gravedad da la enfermedad. Ella puedo modirse en tórminos do la incapacidad quo produco. Por ejemplo, una enfermodad menor es aquella quo no os causa de ausencia del trabajo. Esto hace necesario tener una oseóla do incopoci(Od pora medir la soveridaH dol cuadro. Además la medición tiono ol probloma F'E quo la gravedad depende no sólo de la enfermedad sino que también HO las características do los individuos que la padecen. Por ejemplo, un resfrío comdn puerle ser motivo paro que una persona guarde como, mientras otro individuo con un resfrio do iguales condiciones continda dosorrollendo sus actividades. Por estas dificultades el índico do gravedad do una enfermedad quo más so utiliza es la taso de letalidad, quo establece lo relación entre los fallecidos por una onfermodod y los enfermos quo padecen oso enfermodad. 1-4202 Tasa de letalidad = _ Ndmero de defunciones por una enfermedad dada Ndmero de enfermos de esa enfermedad x ^qq Mide lo frocuoncia con quo so produco la muorto on una enformedod. Esto os la taso que permite establecer ol pronóstico do las onformcdadoG 3.3,c. Medición do la duración de la enfermedad La duración do lo onformodad os un dato gue interesa modir, ontro otras razones, porque la enfermedad de mayor duración significa mayor costo. Puedo hacerse osta modición on forma do un promedio. Por ojomplo, 60 onformo3 do tifoidea estuvieron en coma un total de 1.080 días, la duración de lo en formedad es entonces» Duración = ^'¿Q"1 = 18 días en promedio Para la medición de la duración es necesario definir proviamonto quo se entiendo por enfermedad. En esto caso la duración se roficrc al tiempo promedio do estada on cama do los enfermos. Otras definiciones podrían tomar on cuenta, por ejemplo, el día do los primoroG síntomas o ol día on quo se hizo el diagnóstico, etc. El promedio puedo obtenerse no solo en relación a los enfermos (60 on el ejemplo anterior) sino quo puede obtenerse pora opioodios do enfermedad. Por ejemplo» en una escuela so registraron los rosfrio3 do los alumnos y se tuvo un total de lOOroefriog on el año. La duración total do losrcsfrios fue do 500 días. La duración media de cada episodio fue, por lo tonto de 5 días. Medición de lo fecundidad La modición do la fecundidad so hoce o travós de diforentos tipos do tosas que tratan do modir los niveles dol fenómeno on un ároa. Tasa bruta de natalidad Es una tasa simple que relaciona los nacidos vivos registrados en un ároo geográfica durante un año con la población totol do esto áreo. Tasa bruta do natalidad = _ Nacidos vivos en un área y oño determinados . Pobloción totol al 30/VI on eso año y ároa x 1 , u u u Como incluyo o 1a pobloción total (do todas los odados y do ambos sexos) no puedo intorprotarso corno una probabilidad porque en ol denominador h"¡y población quo no está expuesta ol riesgo de tener un niño. Expresa más bien la frecuencia do los nacimientos por cada 1.000 habitantes. Las tasas do natalidad son prácticamente las dnicas medidas do fecundidad que es posible calcular para áreas geográficas pequeños y permito es tudiar los tendencios dol fenómeno en un área determinada. "* 31. Cuando so comparan áreas diferentes hay quo ser extremadamente cuidadoso en la interpretación porque puedo haber diferencias on la estructura do la población especialmente on lo que so refiero a la composición por edad do la población femenina y esta diferencia puode por sí sola dotorininar diforencias en las tasas de natalidad. Tasa do fecundidad general Es esta una tasa más ospocífica ya que tione un donomlnrtdor la población potencialmento expuesta al riosgo de tener un nacido vivo» la población femenina en edad fértil. Tasa ^e fecundidad general _ _ Nacidos vivos on un área y año determinados . ___ ~ Población femenina de 15 a 49 años al 30/VI x i , u u u en eso año y ároa. - •• Al temor en cuenta solamente a las mujeres y en el grupo de edad expuesto al riosgo es una tasa mástítilpara hacer comparaciones entre zonas o comparaciones internacionales. Tasa de fecundidad por edad Esta tasa tiene un nuovo rofinomionto y os más específica yo quo toma en cuenta no solo ol sexo, sino la composición por edad. En ofecto, en su numerador se anotan los nacimientos de madros de un grupo de edad determinada y on ol denominador la población femenina de esa edad. Tasa de fecundidad por edad = Nacidos vivos de mujeres de un grupo do edad en un _ ároa y año dotonnlnados Población femenina de ese grupo do edad al 30/VI en ese año y área. x ^ QQQ Ej.t Nacidos vivos de mujeres de 15 a 19 años en un áren y año determinados . ^^ x Población femenina do 15 a 19 años al 30/VI en ese año y área. Tur lo general las tasas de fecundidad por edad se calculan para grupos quinquenales de edades comprendidas entre los 15 y los 49 años¡ os decir, se calculan 7 tasas de fecundiad por edad. Otras medidos dp fecundidad Los estudios demográficos más finos de la fecundidad utilizan además de las tasas anteriores, las llamadas tasas de reproducción quo tratan de medir el aporte futuro de la fecundidad al reemplazo do la población haciendo una corrección en los nacimientos utilizando la proporción do nacimientos femeninos. Como se trata do tasas usadas por especialistas remitimos al lector a los textos de Demografía para su estudio. BlOCSTAD./l-4202/Correg. y reimp./Enero 1984/spa. V. ESTADISTICA DESCRIPTIVA Medidas de Posición Tienen por ctojeto la obtención de un valor que resuma en sí toe las rediciones. La mayoría de ellas tratan de ubicar el cor.tro la distribución. La egresión numérica de estas medidas es siempre un valor oe 1 riable conprendido en su recorrido. a) Media Aritmética Es la medida de posición más conocida y utilizada, para su c<_ lo se haoen las siguientes consideraciones : Media para datos no agrupados Se calcula sumando todas las observaciones X^^.., X^ y se vi de por el número total de ellas y se denota por X o K [x] gún convenga. // así tenemos X= n l 1 h = M [ x] 1 n Ejenplo : Encontrar la media de los siguientes datos : 35, 51, 55,-53, 54, 52 Usando la calculadora Casio fx - 120 se tierje : "SD". INV [ac] 55 [m+] 54 54 [mí] 51 |m£} 55 [m+] 52 [m+[ = 53,375 Media datos agrupados En este caso las n observaciones están acrupacas er, ~ de clases con marcas Y., Y,,., Y i ¿ v funcicr.~s absoluta; f.. m * ..., fm luego el valor de la media se calcula rer m - 2 Vi I T = m l h i=1 JzL Vi Ejemplo : En la tabla construida anteriormente en la cual se agru paron los pesos de 40 estudiantes se tiene que el peso promedio es : 12 l f yL 1 - 1 x = lJ 1 = 147,25 Ib. 40 Media de Submuestras ( o subpoblaciones ) Cuando existen varios grupos o submuestras las cuales forman una par tición de una muestra global ( es decir no tienen elementos comunes y en conjunto forman la muestra global ) . De estos grupos se conoce su tamaño n. Jy su media Y. Jy se desea determinar la media de la mués i i — tra global. Esta se calcula de la siguiente forma I L Y = n, i Y. i i=l ; p = N° de grupos n = Tamaño muestral global n P = I n, i=l Ejemplo : En un colegio de 65% de los funcionarios son Profesores el 15% Inspectores, el 15% Administrativos y el 5% Auxiliares. los Profesores tienen una edad promedio de 45 años, los Inspectores de 28 años, los Administrativos de 35 años y los Auxiliares de 25 años. ¿ Cuál es la edad promedio de los funcionesrios ? Respuesta - _ 0,65 n 45 + 0,15n 28 + 0,15 n 35 35 + 0,05 n = 0,65 = 39,95 45+0,15 Propiedades de la Media i) aX + k = a X + k Li) k = k ii) X - X =0 28+0,15 35 + 0,05 25 34. b) Mediaría La Mediana es una medida que divide la distribución en dos grupos con igual número de observaciones. Una vez ordenadas las observaciones en orden creciente o decre ciente, llamaremos mediana, que de no tárenos por Me al valor de la variable que supere a lo sumo a la mitad de las observaciones y sea superado a lo sumo por la otra mitad. Para su cálculo pueden presentarse dos casos : i) Datos no agripados - Ordenar los datos según magnitud - Determinar la posición correspondiente a la mediana es decir n+-l la posición 2 ; en que "n" representa el N° de observa ciones. n+1 - Ubicar el valor correspondiente a la observación 2 Nota Cuando el número de observaciones es par; no hay una ob servación central sino dos: en este caso se adopta el cri te rio de definir la Mediana como el prcmedio de estas dos observaciones centrales. Ejenplo Dados los siguientes datos : 18, 14, 16, 17, 19, 22 ordenándolos se tiene 14, 16, 17, 18, 19, 22. como hay seis datos; tenemos dos observaciones centrales 17 y 18; luego Me = 1 7 + 1 8 = 1^5 2 ii) Datos agrupados Cuando los datos están agrupados, no es posible individualizar rápidamente la mediana y sólo es factible determinar el Ínter valo en que se encuentra. Para esto se enpieza por establecer la menor de las frecuen cias absolutas acunuladas que supere a la mitad del tal de ob servaciones; es decir es necesario encontrar un valor j para el cual F. > 3 ra Me — C M = Y1 . . + e 3-1 Y'. , = 3-1 y luego aplicar la siguiente fórmula pa 2 j , — - F ( 2 j-1 ) f. 3 límite inferior del intervalo j-ésimo 35. F. , = Frecuencia absoluta acumulada del intervalo anterior al 3-1 j-ésimo c. = arrplitud o anchura del intervalo j-ésiiro 3 En el ejenplo donde se presentaba el peso de 40 es_ Ejemplo n = 20, buscando en la columna de. fre tudiantes se tiene : cuencias absolutas acumuladas verros que F^ = 23 > 20 luego j = 6 Por lo tanto la mediana está en el intervalo 143 - 148 ; luego 5 (20 - 15 ) 8 Me = 143 + 25 = 143 + = 146, 125 c) Moda Es un estadígrafo de posición que puede definirse como el valor observado más frecuente; es decir; el que presentó una frecuencia mayor. Se le emplea de preferencia a otros estadígrafos cuando se desea señalar el más canGn o típico y se le denota como M^ En una distribución de frecuencias con intervalos iguales, la Moda puede considerarse cano la marca de clase del intervalo Mo dal , es decir; el intervalo de mayor frecuencia. Por ejemplo en el caso de los pesos de 40 estudiantes se tiene que M d = 145,5 si se desea precisar el valor de la moda para datos agrupados en distribuciones de frecuencia se pueden utilizar las siguientes fórmulas : f M, = Y' -l + c . d 3 3 1 M, = Y . . + C. d j-l j 3+l f 3-l f. 3 ^ + Vi "j-1 " 'j-^ + M, = lim inf (j) + Cj Mx + M2 <f 3 " Vi1 M, = f. - f. 1 3 3-1 M-j = f . - f . 2 3 3 +1 ''edia ogcmétrica Se usa especialmente en los casos en que existe una tasa de crecimiento relativamente constante. Se usa tartfoién de preferencia cuando es conveniente dar inportancla a los valores pequeños i) Dates no agrupados La media geométrica de un conjunto de n valores positivos se define ccrro la raíz n-ésima del producto de los n valores n /— < ^ se denota por M^ luego M^ = / X1 — Xn i) Datos agrupados y Si se tienen n datos agrupados en m clases o intervalos con marcas de clase Y., Y_.. Y y frecuencias absolutas f., 1 ¿ m x f-.-., ¿ f respectivamente, entonces la media geométrica está dada por: Cano el cálculo de la expresión anterior es muy largo se ado¡o ta el siguiente criterio : aplicando logaritmos a ambos lados se obtiene : m l log M = ^ t t log Y. — = M [ log y] n es decir el logaritmo de la media geométrica, de una variable es la media aritmética del logaritmo de esa variable. Sjemplo En el ejemplo de los pesos de 40 estudiantes se tiene: 86,663 log M q = Mg = = 2,1667 40 146,79 .'•isdia AmSnica La Media Arrrónica denotada por M^ se define ccmo el valor recí- proco de la Media Aritmética de los valores recíprocos de la variable . Es decir. O1 M [I] I -i- 1=1 1 . , X. Catos Agrupados Ojanco se tienen n observaciones agrupadas en m clases o interva i. los con marcas de clase Y., Y_,.. Y í,, i.,,., f 1 L. m V "h 1 2 y frecuencias absolutas m resoectivamente entonces » — M m 1 y m ái l i ^ íí \ n Ejenplo : Para el peso de los 40 estudiantes "h 40 0,2735 = 146,25 f) Cuartiles, deciles y percentiles Los cuartiles son valores que dividen una serie de datos en cua tro partes iguales, dejando el 25% de los casos en cada una. Los cuartiles sen 3 y se denotan por QL , i = 1, 2 , 3. Les deciles son valores que dividen la serie de datos en 10 par tes iguales, dejando el 10% de los casos en c/u. Los deciles son 9 y se denotan por D^. Los percentiles, dividen la serie de da tes en 100 partes, dejando el 1% de los casos en c/u. Los percen tiles son 99 y se denotan por P^. Ccservacicr.es i . Sabemos que la mediana divide la serie de datos en dos partes de janee- el 50% de los casos en c/u; de modo que tarrbién poderos ll—arle percentil 50 ( P 5 Q ); decil 5 (D5) o cuartil 2 (Q2) ii; Se puede ver que los cuartiles y los deciles son un caso partí cular ce percentiles; por lo que sólo veremos el cálculo de é£ tos y para calcular deciles y cuartiles haremos la analogía correspondiente ! • Cálculo de percentiles para datos no agrupados Si tenemos una serie de "n" datos ordenados por magnitud en tonoas el valor del percentil r-ésimo ( r = 1,2,...,99) está por la observación o dato que ocupa el lugar en caso que —— ; 100 n o sea un númsro entero, se ten —£ 100 drá que interpolar. Ejenpio : Dada la siguiente serie de datos ordenados 42, 42, 43, 45, 47, 50, 53 y necesitamos calcular el percentil 67 <P 67 ) _ ^ . . Calculamos el valor (rH-1) r 100 = 8 • 67 100 = 536 _ , = 5,36 100 ta ta luego el percentil 67 se encuentra en la 5 servación; luego debemos interpolar luego 47 Pg? ^oTÜ P y la 6 ob - está entre 47 y 50 JO, 0.64- 67 - 4 7 5 0 . 0,36 - P 67 0,64 = 0,36-50 + 0,64 • 47 = 48,08 O/ Cálculo de Percentiles para datos agrupados Si teneros una serie de n datos agrupados en m clases o intervalos y necesitamos calcular el percentil r (P^). Para ello es necesario prirrero identificar el intervalo que lo contiene y ésto se logra encontrando la menor de las frecuen cias absolutas acumuladas que supere el valor -—~ 100 Es decir hay que hallar el intervalo j-vlsimo tal que F. > n 3 ' 100 , luego el valor de P se pa / n• r p r = Y C 'j-1 r = 1, 2, Ejenpio + ~ Fj-i j \ loo f. 3 99 : Para el caso del peso de los 40 estudiantes se cssea calcular el peso mínimo del 20 % superior del total de estudiantes, es decir PgQ 40 * 80 = 100 32 100 y el intervalo j—ésirro es [158 - 163) 5 (32 - 32 ) luego P g o = 158 + 3=9 158 Luego el 20 % superior de los estudiantes nimo de 158 libras o el 80% tiene un peso mí inferior de los estudiantes tie ne un peso máximo de 158 libras. 2.- Medidas de dispersión La idea de dispersión se relaciona con la mayor o menor concentración de catos en "¡torno a un valor central, generalmente la media aritméti_ ca. dispersión pequeña dispersión normal dispersión crarde a continuación examinaremos algunas medidas que pretenden cuantificar esta dispersión en una distribución de frecuencias: a) Varianza La varianza ce una distribución de frecuencia de vria variable X es la media aritmética de los cuadrados de las diferencias entre les valores de la distribución y su media aritmética . Se denota per 2 S o V (X) y se calcula de la siguiente forra : I ~ x)2 para datos no agru-:-;coG i=l S" = V ¡X) = x m l _ 2 f. (v. - X) -i -i para datos agrupad"; i=l Ejerplc . : ?ara el caso del peso de 40 estLidiar.-es ; . v. - Y "1 (y. - Y) 2 I j 1 f. :y, - Y)2 12 ! lueco c2 _ , r f- ( Yv - Y) i x i i=l 40 S_x_ = b) Desvi-v-ión Estandard . Se define corro la raíz cuadrada positiva de la varianza y se denota por S^ y se mide en las mismas unidades que la variable. Luego : S = + / S2 = + / v (X) Prooieáades de la Varianza i) si = m lr 1/ „ (y.i - X )' Lf. V y ± i=l 2 m - -2 j f i (y* - 2yiX + X ) i—1 m y¿ m 2 fi Yi Ü LT m fi Y. i LI f. i + X2 - 2X m 7 r f. YT ¿ 1 1 x2 -±=i n 7 - x2 ii- V (k) = 0 k cte. Lii V (a;-: + k ) = a 2 V (X) Coeficiente de Variación Se utiliza cuando las variables en dos distribuciones se expresan en 'unidades diferentes. No tiene sentido conparar algunos de los estadígrafos de dispersión presentados, pues ellos quedan influen ciados por el valor nurrérico de dichas unidades. ?rr ejerpio una desviación estardar de 2,7 kilos ¿ Es mayor que '.-"..•>. do 0,43 años ? . Esta dificultad se puede superar mediante el cogíIcLente de variación, que no depende del sistema de unidades ernpLeacos y se calcula ccrro el cuociente entre la desviación están dax y ñ¿ rredia aritmética y se denota por : x 3.- Tablas bicLrensionales Ar.teric—er-.te se ha considerado el caso de distribuciones de valores ce una so la variable. A menudo se presentan las observaciones respec to a ees -ariables en forma simultánea. Por ejenplo peso y edad ce un gn=.-a-ce estudiantes, estatura de padre e hijo, ingreso y gastos por f£r¿l.:a, etc., en este caso se habla de distribuciones bidimsnsio nales las cuales tairbién es posible agruparlos en tablas de distribu cián óe ¡frecuencias conjuntos, cuando el N° de observaciones es mu.- grarce, e incluso es posible averiguar si existe alguna relación funcional er.tre ambas variables. a) PrgS"3r-.t-3CiÓn ce los datos Si el :ca de observaciones es reducido los datos pueden presentarse en fama sinple por ejenplo : Salario y gasto en alimentación en 6 SAIAOD S (x) 73 65 69 76 83 47 CiSISS 48 40 48 43 53 33 $ (y] cua-Tic los datos son más numerosos se pueden agrupar en una tabla fe &<le entrada o tabla de distribución de frecuencias conjunta. ?=_ra confeccionar este tipo de tabla es necesario determinar les intervalos ce cada variable por separado í=;--pio : Edad (y) Y N° de caries (X) con un grupo ce 30 ni 8 10 9 10 10 30 Z;\ la últirra columna se observa las frecuencias abs: y la Qltirra fila las frecuencias absolutas para Y y cen'cr: ce la tabla se tienen las frecuencias conjuntas y cenotar-rros rcr f.._. y corresponde a la frecuencia del i-ésimo intervalo para y simo intervalo para Y . En esta tabla pocemos calcular : X,Y,Y0 b) Ccvarianza Es una medida que cuantifica la relación entre dos variables. Re presenta el grado de variabilidadconjunta y se define ocnc la media de los productos de las desviaciones respecto a sus crrrespon dientes medias aritméticas Y se denota por Cov (X,Y) i) Datos no agrupados m £ Cov (X,Y) = (X± _ - X) (yL - Y ) _i=l n ii) Datos agrupados Cov (X,Y) donde m 1 l l <x.-x) (y-j-*) f¿j = m = N° de intervalos para X 1 = N° de intervalos para Y x.= marca de clase del intervalo i-4si~c para x x y_.= marca de clase del intervalo j-ésir.o para y Nota : Para efectos de cálculo de la ccvariaras entre x e y s liza la siguiente fórmula que se deduc la fórmula anterior. Cov (x,y) = ~XY - "x • Y Ejeiplo : Calcular la covarianza en el eje~lc anterior 5 4 v f. . :•1:. Y . I i: 3 5 - -- j J Cov (X, Y) = XY - X-Y n =34,3-5,27 4 n 5,73 = 4,1:29 43 I.- Ajuste de modelos por mininos cuadrados Al graficar dos variables, la nube o conjunto de puntos adopta diferen tes formas, las que se pueden esquematizar en una linea mas sencilla y proporcionar así una idea del tipo de relación funcional entre ambas variable. Esta relación funcional permite la posibilidad de predecir (• o estimar ) el valor de una variable dado el valor de la otra . El problema es, entonces, trazar través de la nube de puntos la lí- nea que mejor ajuste los datos, para haoer las predi.cciones. Cerro pedemos trazar infinitas líneas la buscada debe ser única y ópti ma en el sentido de que el error de estimación o diferencia entre el valor observado Y. y el estimado Y* sea lo más reducido posible (sea minino ) . El mejor modelo será error de estimación aquel que minimice la suna de los cuadrados del n l i=l ( Y i-V 2 La función más simple utilizada caito ajuste es la de primar grado en * X cuya expresión analítica es Y = ax + b y que se denomina recta de „ regresión de Y en X , donde X es la variable independiente ( tema cualquier valor ) e Y es la variable dependiente ( depende del valor cue tome X ) y ax+b jes pariré tros son la pendiente "a" y la ordenada en el origen "b". .es valores de a y b que minimizan la función F (a,b) = l (y± - y* )' i=l A _ oov (x,y) XY - X Y a — . — son ^ —r b = Y - a Y * La recta de regresión de X e Y es X = CY + d y por el mismo, método cov (x,y) y d = X - CY poderes hallar que C= £jgclo Dada la siguiente tabla en la cual se muestran el ingreso (x) ce 10 familias y los gastos en alimentación (y) x I73 ¡65 69 76 83 47 70 58 65 70 y | 48 ¡ 40 48 43 53 33 43 39 43 45 a justar una recta para estimar los gastos en alimentación. Solución Cero se cesa estimar los gastos en alimentación ( variable y), en tcr.ces ésta es la variable dependiente luego la ecuación de regresión es : , , , A y = ax + b donde a = cov (x,y) = XY - X Y = 2985,1 -'2940,6 88,04 x 44,5 88,04 b = el modelo es : = 0,5055 Y - aX = 43,5 - 0,5055 67,6 = 9,3282 Y = 0.505 x + 9.3282 ¿ Culi serían los,gastos en alimentación pa ra vina raí ni lia cuyo ingreso es de 52 dólares ? y* = 0,5055 • 52 + 9,3282 =35,6 dólares Correlación lineal «U. a justar una recta a un conjunto de puntos, a veces, los pun tes se encuentran relativaii-entc próximos a la línea y otras, quedan / bastante dispersos en torno a ella. Luego es necesario determi nar una medida que cuantifique esta " aproximación " Esta itedida se denomina coeficiente de correlación lineal denota do por p R^ y está dado por : cov (x,y) _ XV - X Y ~ S S x y S x S y NOTAS i) -1 < P <1 - 'xy ii) si >0 direros que hay correlación directa iii) si <0 diretes que hay correlación inversa iv) si = 1 diretes que hay correlación directa perfecta v) si = -1 diremos que hay correlación inversa perfecta vi) si = 0 diremos que no hay correlación lineal Eiarpio El coeficiente de correlación lineal entre el ingreso y el gasto en alimentación en 10 familias es : O = iiiü ' = 0,902 • / / 88,04 * 27,65 luego hay una correlación directa casi perfecta. Mcdelo Exponencial Es de la forma Y = a-b y para ajustar este tipo de modelo, se re c'jce a un modelo lineal simple aplicando logaritmos y para hallar ics par ¿Te tros se procede de igual forma que la anterior. El mcdelo reducido queda : log y = x log b + log a,que es de la forma y' = a'x + b' luego a' = ^ donde y' = log y, a' = log b, b' = log a 2 S x ; b' = Y7" - a' Y y para obtener a y b se aplican los correspondientes antilogaritmos Modelo Potencial Es de la forma y = ax*3 , para obtener los parámetros a y b se pro cede ce la siguiente forma log y = log a + b log X haciendo y' = log y; b' = log a , a' = b , x' = log x C-íro saber cuíl de estos modelos debemos ajustar a un conjunto de catos ? La respuesta la proporciona el coeficiente de correlación lineal entre las variables correspondientes ^ , fxlogy , flogX/y < flogx el valor de | j 7 | más grande nos proporciona un "irejor" ajuste Modelo a ajustar r>sra C ; xy Para f , 'x log y Y = ax+b o x = a'y + b' y = ab Para ft 'log x, y Para R , log x, log y x = at? b y = a x o x t> * = a' y. VI TECRIA ELEKH2JTAL DE PROBABILIDADES ión 1 Sea £ un Experimento aleatorio -Llamaremos espacio r.usstrai n al conjunto de todos los resultados posibles cel experimsr.to. iCn 2 Sea .Vun espacio de muestras asociado a un experirento í. i) llamaremos suceso a cualquier subconjunto de r. ii) llamaraios suceso elemental a los sucesos cr:~ tengan solo un resultado posible iii) Di renos cue dos sucesos A y B de ü son mutusronte e:-: fluyentes ssi- no tienen resultados comunes: es decir A.AB = o y 0 iv) son sucesos, llamados suceso seguro y suceso ir. z/jsible respectivamente. CbservaciÓr, Si un experimento £ tiene caro espacio de muestras asociado a r. cuando éste se realiza una vez, entonces !1 x !) x..j(fl (r. veces) (.".") es el espacio muestral cuando se realiza el exp. r. veces. l o g y 47. r-sfinici6r. Clásica de Probabilidad Si un suceso A puede ocurrir en h formas de un total ce r. forras pcsi bles e igualmente probables, entonces la probabilidad ce que ccuria h n casos favorables r. elementes ce A ex suceso A es P (A) = — = = — n' casos posibles r. elerer.tcs ce f< la posibilidad de no ocurrencia de A es p ) ( A C = = ÍI n = - n Ü n 1 - P (A) Observación i) Si A es un suceso entonces 0 <_ P (A) 1 ii) P (A) + P (A°) = 1 Propiedades de P i) P ( o) = 1 y P (0) = 0 ii) Si A y B son mutuamente excluyen tes entonces P (A/15) = C Ü i ) P (AUB) •= P (A) + P (B) - P (AAB) iv) si A c v) si A c B«^P (A) <_ P (B) B =í>P (B-A) = P (B) - P(A) Probabilidad condicional Definición Sea B un suceso dado tal que P (B) > 0 entonces la proba bilidad de un suceso A condicionado a la ocurrencia ce B se define por P (A/B) { A n = p Definición B) (B) • y se lee crobíbiiidsñ ce A dado E Sea A y B sucesos, entonces diremos que .-. y = ; pendientes si P (An B) = inda - P (A) • Pr- eservación i) P (A fl B) = P (B) P (A/B) ii) si A y B indep. P (A/B) = P (A) y P (B/A) = ? ÍI-' Ejenplo resuelto En un estudio hecho en el Servicio de Selección y ?.er.istr: de Istu diantes de la Universidad de Chile, sobre el nCrero ¿e pos-ul=ntes a las Universidades Chilenas y el sexo , se obtuvo la siguiente i:\formación: 1 48. POSTULA A LA UNIVERSIDAD SEXO TOTAL SI NO FEMENINO 10 12 22 MASCULINO 82 96 178 TOTAL 92 108 200 a) Si se elige al azar un estudiante de este muestra de 200 ¿ Cuál es la probabilidad de que : i) Sea de sexo femenino ii) No haya postulado a la Universidad iii) No haya postulado y sea de 'sexo masculino iv) Haya postulado a la Universidad y sea sexo femenino v) Son independientes los sucesos ser postulante a la Universidad y ser de sexo masculino vi) Si se eligen al azar dos estudiantes ¿ Cuál es la probabilidad de que : i) Al menos uno sea de sexo femenino ii) los dos hayan postulado a la Universidad iii) Ninguno sea de sexo femenino Solución a) Sean los sucesos F : sexo femenino P : postulante a la Universidad M : sexo masculino P 1 : no postulante luego 22 i) P (F) = 200 108 ii) P (P1) 200 96 iii) P (P'ntí = 200 10 iv) P (PDF) = v) P (PHM) = 200 82 200 P (P) = 92 200 P (M) = P (P) P (M) = 0,4094 j¿ 0,41 = P (P O M) Luego no son independientes 178 200 n 4 9 . b) Sean los sucesos : F i : el i-ésimo estudiante es de sera femenino Pj. : el i-ésimo estudiante postula a la Universidad i) ? (FjO F^) + P (F^ A F 2 ) + P (Fl O F 2 ) = = P (F1) P (F^ / F ) + P (F^) P ( F 2/ f C } + P(FX) PC^/F^ 22 178 + 178 _ 22_ + 22_ ( 21_ 200 199 200 199 200 = Q 21 199 ii) P (P, O P 0 ) = P (P,) P(P 9 / p ) = — - • — 1 ¿ 200 199 iii) P 1 ¿ = P(F?) P( F° c) « x = 0,21 Í2i . iZZ. = 0,79 20Q igg Ejercicios propuestos 1.- En un curso de M alumnos existen r (r< M) alumnos con problemas de aprendizaje. Se les aplica una prueba uno por uno hasta encontrar uno con problemas. Describa un espacio de Muestras para este experimento. 2.- Suponga que a los alumnos del problema 1 se les aplica la prueba hasta encontrar a todos los alumnos con problemas de aprendizaje. Describir un espacio de mués tras para este experimento. 3.- Considéranos cuatro individuos- ajb, c y d. Supongamos que el orden en el cual se colocan estos individuos re presenta un resultado del experimento. Sean A y B los sucesos definidos como : A = {"a" está en primer lugar ) B = {"b" está en segundo lugar } i) Anote todos los elementos del espacio muestral ii) Anote los elementos de los sucesos A A B y AÜB 4.- Suponga que A y B son sucesos para los cuales P (A) = x; P (B) = y; P (AAB) = z Expresar cada una de las probabilidades siguientes en términos de x, y, z. i) P (A°U B c ) ii) P (A°n B) iii) P (A°U B) iv) P (ACA B°) 50. 5.- En un curso existen 10 alumnos normales; cuatro con problemas de aprendizaje y dos con retardo. i) Si se elige un alumno al azar. Encontrar la proba bilidad de que : a) No tenga ningún problema b) Tenga retardo c) Sea normal o tenga un retardo ii) Si se eligen dos alumnos sin reenplazo . Encuentre la probabilidad de que : a) Arrbos sean normales b) A lo menos uno sea normal c) Exactamente uno sea normal d) Ninguno sea normal e) Ambos tengan retardo f) A lo mas uno sea normal g) Ninguno tenga retardo 6.- La siguiente tabla muestra la distribución de 400 estu diantes según aprobación en una asignatura y reforza miento REFORZAMIENTO RESULTADO TOTAL SI NO APRUEBA REPRUEBA. 140 110 250 50 100 150 TOTAL 190 210 400 a) Si elegimos una persona al azar ¿ Cuál es la proba bilidad de que ? : i) Aprueba y haya tenido reforzamiento ii) No aprueba dado que tuvo reforzamiento iii) No tenga reforzamiento dado que aprueba iv) No apruebe o tenga reforzamiento b) Los sucesos " aprobar • " y " Tener reforzamiento " ¿ Son independientes ? 7.- Sean A y B dos aptitudes. Dado que estas aptitudes son independientes y que las probabilidades de que un estudiante presente las aptitudes A y•E son 0,50 y 0,75 respectivamente. a) ¿ Cuál es la probabilidad de que un estudiante pre sente ambas aptitudes ? b) ¿ Cuál es la probabilidad de que un estudiante presente por lo menos una aptitud ? c) ¿ Cuál es la probabilidad de que un estudiante no presente ninguna aptitud ? VII DISTRIBUCIONES DE PROBABILIDADES MAS USUALES 1.- Distribución Bincmial Si p es la probabilidad de ocurrencia de un suceso en un solo ensayo de un experinento y q = 1 - p es la probabilidad de no ocurrencia del suceso entonces la probabilidad de que el suceso ocurra exactamente k veces en n repeticiones independientes del experimento está dada por : ? (X=k) = (£) p k (l-p) n-k ; k= 0, 1, 2,..., n esta distribución de probabilidades discreta recibe el nombre de distribución binomial de paráretros n y p Requisitos para aplicar la distribución Bina-nial - Debe haber un ntinero fijo n de ensayos - En cada ensayo los resultados posibles son sólo dos ; denominados " éxito " y " fracaso " - L~ probabilidad de ' éxito " debe ser igual en todo los ensayos - Les ensayos deben ser independientes entre sí Propiedades Media o valor esperado = n p der.lación estandar = ¿np (1-p) Eie-pio resuelto El fracaso escolar en un colegio es habitualmente de un 10%. Si se eligen dos estudiantes del colegio al azar ¿ Cuál es la probabilidad de q-je : i) Uno de ellos fracase y el otro apruebe ? ii) Los dos fracasen ? iii) Los dos aprueben ? i 52. So'.-ciír, Sea X = N° de fracasos en dos estudiantes cor. p = 0,10 ; q = 1 - p = 0,90 i) ? ÍX=1) = (*) (0,1o)1 (0,9o)1 = 2- 0,90 = 0,18 es decir de dos estudiantes hay un 18% de posibilidades de que uno fracase. ii) P (X=2) = 2 7 (p (0,10) 0 (0,90) = 0,01 es decir, hay un 1% de posibilidades de que ambos fracasen iii) ? (x=0) = (Q) (0,10)° (0,90)2 = 0,81 es decir hay un 81% de posibilidades de que ambos aprueben . Si en el colegio se matriculan 200 alumnos ¿ Cuál será el N° esperado de fracaso escolar ? X o esperado = n p = 200 (0,1) = 20 se espera que fracasen 20 alumnos Ejercicios Propuestos 1.- Si el 20% de los estudiantes de ton colegio presenta problemas de aprendizaje a) Determinar la probabilidad de que dé 4 estudiantes elegidos al ' azar de este colegio : i) Uno tenga problemas de aprendizaje ii) Ninguno tenga problenas de aprendizaje iii) A lo más dos tengan p robla ñas de aprendizaje b) Si en un año determinado se matriculan 400 estudiantes en este colegio ¿ Cuál será el número esperado de estudiantes con problemas de aprendizaje ? 2.- En una asignatura determinada generalmente el 10% de los estudian tes reprueban. Si se inscriben 20 estudiantes en esa asignatura: a) ¿ Cuál es la probabilidad de que ?: i) cinco estudiantes reprueben ii) a lo mis 3 estudiantes reprueben b) ¿ Cuál es el número esperado de reprobación ? En un colegio determinado generalmente el 10 % de los estudiantes egresados no ingresa a la Universidad. Hallar la probabilidad que de un total de 4 estudiantes egresados de ese colegio no ingresan a la Universidad, i) como mucho 3 iii) entre 1 y 3 ii) entre 2 v 4 iv) 2 o más 4.- Si el 20% de los estudiantes tienen por lo menos un defecto fís co. Determine la probabilidad de que de 4 estudiantes eieciccs al azar : i) Uno tenga defecto física ii) Ninguno tenga defecto físico iii) A lo más dos tengan defecto físico 5.- Un estudiante tiene 2/5 de probabilidad de reprobar er. un exsm a) S<L realiza cuatro exámenes . Halle la probabilidad de que e estudiante repruebe en : i) Dos exámenes ii) Por lo ríenos en un examen iii) Más de la mitad de los exámenes b) Si en vn mes realizó veinte exámenes ¿ En cuántos cree usted que tendrá éxito ? Distribución normal Una de las distribuciones de probabilidades continuas irás inrortar. es la distribución normal o de Gauss Y viene daca por la función f (x) donde p - media de la distribución 0" = desviación estandar Cbservaci ones i) La función f (x) de la distribución normal no se erpieará pa resolver problemas de aplicación ii) Hay una curva normal diferente para cada par ce valeres ( u,(f ' pero todos tienen las mismas características, ii) La distribución normal se utiliza cuando se tiene una variahls escala de intervalos continua con distribución es frecuencias ; rrétrica y curo histograma tenga la forma de una ca~-ar.£ 54. ) La distribución queda ccnpletamente definida por el promedio y la desviación estandar. El promedio nos informa sobre la ubicación del centro de la distribución sobre el eje horizontal y la des viación estandar refleja la dispersión ( abertura de la campana ) Por ejerrplo si = i fijo Definición Si X es una variable que se distribuye normal cono media p. y des_ viación estandar(Tentonces la variable estandarizada Z = x se distribuye normal de media 0 y desviación estandar 1 y recibe el norrfore de distribución normal estandar. Cálculo de Probabilidades con la Distribución Normal Estandar El área total limitada por la curva de la distribución normal estandar y el eje horizontal es uno : El área bajo la curva comprendida entre - CD y un valor específi_ co Z io denotaremos por 0 (Z) y este valor aparece en la tabla del apendice 1 para valores de Z entre -3 y 3. Luecc para el cálculo de probabilidades tenemos i) F ( Z<_a ) = 0 (a) ii) P ( a<Z<b ) = 0 iii) F í 2>b) = 1 - 0 (b) - 0 (a) (b) Eje~los 1.- Hallar 0 (1,82) ; 0 (1,96) ; 0 (-2,58) 2.- Calcular P { -0,47 <_ Z <_ 0,94 ) = 0 (0,94) - 0 ( -0,47) 3.- Calcular P ( Z <_ 0,94 ) = 0 ( 0,94 ) 4.- Calcular P ( 1,96 <_ Z ) = 1 - 0 (1,96) Observación i) Si una variable X se distribuye nonval do medin ^u y varianza 0' 55. 2 ( /a, (f ) 2 ii) Cuando una variable X ~ N ( ju, <T ) con u ^ lo denotaremos por X ^ N 2 0 y <f len tonces para el cálculo de probabilidades es recomendable e£ tandarizar la variable de la siguiente forma Si X « N (u, (T2) entonces Z = X ~U rj N (0,1) luego : P I X Í ^ P I Z Í )= U P (X > b) = P ( z > ^ ü ) — ( = — 0" P (a<X<b) = P ) o ( ^ < Z < — — <r - - <r o Ejenplos Si X ^ N (9,9) Hallar P ( 5< X< 11 ) y P (X > 5) Solución Si X/vJN (9,9) Z= — P ( 5 < X < 11) = A; N (0,1) 3 5-9 P ( — <Z< 3 3 = 0 (2/3) - 0 = P ( x > 5) 11-9 2.) ( - 4/3) 0,6536 = P ( Z > = 1-er ( - i ) ) 3 = 1 - 0,0918 = 0,9982 Ejercicios propuestos 1.- El peso verdadero de los estudiantes en una escuela tiene una distribución normal con nedia 32,0 kilos y desviación estandar 2,46 kilos ¿ Cuál es la probabilidad de que un estudiante que está en esa escuela pese por lo menos 32,5 kilos ? 2.- Si Z ~ N (0,1). Hallar a) P ( -1,2 < Z <2,4 ) b) P ( 1, 23 < Z <1,87 ) c) P ( -2,35 < Z <-0,5 ) d) P ( Z >_ - 1,64 ) e) P ( -1,96 < Z < 1,96 ) 56. 3.- Si las alturas de 300 estudiantes se distribuye normal 2 trente con media 68 pulgadas y varianza 9 pulgadas ¿ Cuán tos estudiantes tienen altura : i) Mayor de 72 pulgadas ? ii) Menor o igual a 64 pulgadas ? iii) Entre 65 y 71 pulgadas iv) Menor o igual a 68 pulgadas 4.- El Departamento encargado de evaluar a los estudiantes que ingresaron a un determinado colegio, los clasifica se gún su rendimiento en tres tipos A,B y C. El 15% de los estudiantes; los de mejor rendimiento son de la clase A, el 10%; los de peor rendimiento son de la clase C y el resto es de la clase B. Si suponemos que el rendimiento de los estudiantes se distribuye normalmente con una media de 30 puntos y una desviación estandar de 2,5 puntos y el Departamento reprueba inmediatamente a los alumnos de la clase C. Hallar : i) La puntuación mínima para que el estudiante sea clasi_ ficado octro de la clase A. ii) La puntuación máxima para que el estudiante sea repro bado inmediatamente 5.- Supongamos que los puntajes de una prueba se distribuyen normaliT*=nte con una media de 22,5 puntos y una desviación estandar de 5,25 puntos. 1 profesor reprueba a todo aquel estudiante cuyo puntaje en la prueba es menor o igual a 20 puntos. Hallar el porcentaje de reprobación en esa prueba. ristribución ji-cuadrado Esta es una Distribución del tipo continua que se obtiene consideran do muestras de tamaño "n" ; extraídas cada una de ellas de una pobla ción normal con desviación estandar Si en cada nuestra calculamos la expresión n l ( xi - X >2 -i—^ * tenemos que su distribución es una distribución cr muestral y se le conoce con el ncmbre de distribución ji-cuadrado y que se denota por "X. Características i) Es una distribución asimétrica ii) Sólo toma valores positivos y es asintótica oon respecto ai eje 2 horizontal ( 0 < <00 ) iii) Está caracterizada por un Cínico parámetro V = n-1 denomina- do " grados de libertad " iv) El área comprendida entre la curva y el eje horizontal es 1 (0 100% v) Su gráfica para algunos valores de V es : se distribuye COTO una j i-cuadrado oon V = n-1 grados de libertad lo denotaresrros por X A-X (r_]_) Cálculo de percentiles Ji-cuadrado en tabla 2 Si el área comprendida entre 0 y "X es < entonces la tabla r.os pro 2 porciona el valor del percentil "X a un nivel «X. con V erados ce libertad. > /oi .—» Ejenplo resuelto En la figura se nuestra el gráfico de la distribución "XI con 5 grados de libertad. Hallar el valor del percentil correspondiente para el ci al : a) El área sombreada de la derecha sea 0,05 b) El área sombreada de la izquierda sea 0,20 \ c) El área total sombreada sea 0.05 X* 58. Solución a) X iS) = o.iS b) O.iO c) "X.* tsVo.831 0.0 2 5 = «.3 0.<)?S -O.0JS 7Í Ejercicios propuestos 1.- Para una distribución Ji-cuadrado con 12 grados de libertad 2 hallar el valor del percentil X tal que P a) El área de la derecha sea 0,05 b) El área de la izquierda sea 0,99 c) El área de la derecha sea 0,025 Si la variable \¡) y definimos P ( U < X ) — p 2 = área comprendida entre 0 y el percentil "X Hallar el valor de X 2 2 P ) = 0,025 tal que : a) P ( U >X P b) P ( U <X2 ) = 0,05 P c) P ( X 2 , < U < X 2 , ) = 0,90 pl - p2 3.- Hallar la mediana de una distribución Ji-cuadra con : a) 9 g. 1b) 28 g. 1. c) 40 g. 1. 2 4.- Hallar los valores críticos de X , para los cuales el área P en la cola derecha de la distribución Ji-cuadraco sea 0,-15 si el N°de grado de libertad es : a) 8 b) 19 c) 40 ¿; 2 5.- Hacer el problema 4 si el área de la cola derecha es 0,01 - Distribución t de Student Si se consideran muestras del tamaño n, extraidas de una pobladí,r. normal ( o aproximadairente normal ) con media u y si para cada TTUSS1 * ( X — ai ) / tra se calcula la expresión t = — — y n - 1 ; utilizanoc ia _ S iredia muestral X y la desviación estandar S; se obtiene una distri bución muestral oonocida con el nombre de " distribución t de Stu5=r * y diremos que t i se distribuye cctno una t de student con y = n-1 c: dos de libertad lo que denotaremos pot t ^ t ^ j Observaciones i) Para grandes valores de V o n ( n > 30 ) la curva de la distribución t de student se aproxima a la curva ce la distribución ncrr. estandar laalgunos siguiente : ii) es Para valores de V la curva de la distxibucién t de srufsr V = 40 ———i , -1 Cálculo de percentiles t -3 < -1 o i x 3 mediante tablas El área total comprendida bajo la curva y el eje horizontal es ur.c Si el área ccnprendida entre - CD y t¿es o- entonces la tarla res el valor del percentil t¿a un nivel <*• cor. v grados ce libs~ii. -í t Ejemplo resuelto En la figura se muestra el gráfico de una distribución t de student con 9 grados de libertad. Hallar el valor t para el cual : a) El área sombreada de la derecha sea 0,05 b) El área total sombreada sea 0,05 c) El área total no sombreada sea 0,99 d) El área sombreada de la izquierda sea 0,01 e) El área de la izquierda de t sea 0,90 Solución a) t b) o.OJ6 xt-OlS c) -¿ . I O) =3.25 "o <<-i5 d) 61. Ejercicios propuestos 1.- Hallar los valores críticos de t para los cuales el área de la co la derecha de la distribución t de student sea 0,05 si el número de grados de libertad es igual a : a) 16 b) 27 c) 5 2.- Hallar los valores de t para la distribución t de student con grados de libertad que satisface cada una de las condiciones si guientes : a) El área entre -t y t sea 0,90 y = 25 b) El área a la izquierda de -t sea 0,025 y =20 c) El área a la derecha de t más el área a la izquierda de -t sea 0,01 y = 5 d) El área a la derecha de t sea 0,55 y =16 3.- Para una distribución t de student con 15 grado de libertad hallar el valor t tal que : a) El área a la derecha sea 0,01 b) El área a la derecha sea 0,10 c) El área a la izquierda sea 0,95 d) El área conjunta a la derecha de t y a la izquierda de -t sea 0,01 VIII MUESTRE» PROBABILISTICO Definición de la población y creación del marco muestra!. Posición de esta etapa entre las etapas principales: DEFINICION DE IOS OBJETIVOS DEFINICION DE LA' POBLACION Y Y CREACION DEL MARCO MUESTRAL 03NCEPCI0N DE LA BOLETA SELECCION DE LA MUESTRA RECOLECCION DE IOS DATOS PROCESAMIENTO DE LOS DATOS ESTIMACION . Importancia de definir bien los objetivos . Tres tipos de objetivos: . Objetivos ideales::: las metas originales de la encuesta . Objetivos definidos: los que parecen razonable desde el punte de vista de las operaciones. . Objetivos actuales : los que son finalmente los resultados se propone obtener. Plan de muestreo . DISEÑO MUESTRAL . METODO DE ESTIMACION . METODOS DE EVALUACION DEL ERROR MUESTRAL Elementos del diseño muestral (para la extracción de la muestra) Población objeto y población sujeto . Marco muestral Unidades de muestreo . Unidad de análisis Unidad de respuesta Unidad de referencia Tamaño de la muestra . Métodos de selección de la muestra que Métodos de estimación (para la inferencia a la población) Como calcular las estimaciones de las características poblaclona3.es a partir de la muestra. Evaluación del error muestral (medición de la conflabilidad) Procedimientos para estimar los errores muéstrales, particularmente la varlanza muestral. Factores que se deben considerar en relación con el plan de niuestr-eo . Consideraciones cperacionales y administrativas . Calidad de los datos disponibles. Conflabilidad requerida. Costos Definición de la población El conjunto de todas las unidades que se quiere estudiar A menudo se llama el universo de la encuesta . Depende de los objetivos de la encuesta (y vice versa) , Se necesitan definiciones claras: . de las características de las unidades. . de la ubicación geográfica de las unidades . del período de referencia de la encuesta A menudo una buena definición de la población es muy difícil. Casi siempre se puede describir en términos generales, pero es muy difí cll determinar si ciertas unidades pertenecen o no a la población. Población objeto La población que se quisiera estudiar . El Conjunto de unidades al cual los resultados de la encuesta deberían aplicarse. Población sujeto (muestreada) La población realmente cubierta por la encuesta La población de cuyas unidades se puede recolectar datos, teniendo en cuenta las restricciones operacionales . Entonces el conjunto de unidades a lo cual se aplican realmente los resultados de la encuesta . Frecuentemente bastante distinto de la población objeto . Sucede a menudo que el usuario de los resultados no entiende la diferencia entre estas dos poblaciones. . Importancia de bien documentar las diferencias Características deseables de la población Unidades claramente definidas Población conforme con los objetivos de la encuesta Población sujeto lo más cerca posible de la población objeto Período de referencia bien especificada . Disponibilidad de datos necesarios para la definición del marco —oes Marco Muestra! Es la lista de todos los elementos de la población sujete . Es la herramienta concreta que permite la identificación ce las Unid que se deben estudiar . Determina la manera de acceder a la población . Es a partir del marco muestral que se seleccionan las unidades £ est Características deseables del marco muestral . Debería contener la lista de todos los elementos de la poblad en suj (en el caso de un censo como en el caso de una encuesta por maestreo) . Debería Identificar cada elemento de manera precisa . ubicación municipal, número de teléfono, nombre y apellidos,., según el caso . Puede Incluir Información adicional . método preferido de contacto . información relevante a la estratificación . Información sobre el tamaño o la importancia de 1= unid ai . referencia a otros listados o archivos . la fecha de la última verificación de les demás datos El marco muestral tiene un popel importante en: . La definición de la población sujeto El método de recolección de datos El método de selección de la muestra Creación del marco muestral . La población sujeto está dividida en unidades ze mués:reo . El marco muestral es una lista de todas las ur-Lóades c= muezireo, algunas de sus características . Hay tres casos: Caso simple: La unidad demuestreo es la unicaü (el elerner.-ie de la población. Ejemplo : Población sujeto: los alumnos de una. universidad Unidad de la población : un alu—no Unidad de muestreo : un alu.-~.no Marco muestral: lista de todos les alumnos Caso medio: La unidad de muestreo es un grupo de unidades ce la población Ejemplo : Población sujeto: los residentes ce una ciudad, de 18 o más años de edad. Unidad de la población: persona ce 18 o mis añ; 3 de edad, residente en la ciudad Unidad de muestreo: Marco muestral: vivienda (u hogar) lista de todas las viviendas de la ciudad (o lista de todos los hogares) Caso complejo: Marco muestra! multl-etápico, teniendo cada etaca su unidad de muestreo Ejenplo: Población sujeto: los residentes de una ciudad Unidad de la población: residente de la ciudad No hay listado de los residentes, ni de Iss vivien das Tres niveles de unidades de maestreo: sector de empadronamiento cc-rsal . manzana . vivienda Las etapas: lista de sectores selección de algunos sectores . lista de manzanas en cada sec~or seleccionado selección de manzanas lista de viviendas en cada rar.zana seleccionada selección de viviendas Se trata realmente de una Jerarquía de marcos parciales Se pueden distinguir cuatro tipos de marco muestral: Marco en forma de lista . Se prepara una lista de todas las ujiidades de mués-reo Normalmente corresponde a los casos "simple" y "medio" citados arriba Marco de áreas . Lista de áreas de enumeración, es decir una lista de unidades geográ ficas Normalmente implica más de un nivel de unidades Corresponde al caso "complejo" de unidades muéstrales . Importancia de la cartografía Otro Por ejemplo, permutaciones de ciaras para la selección aleatoria de número de teléfono . La relación entre las unidades del "marco" y las unidades de la población puede ser muy indirecta Combinado . Jerárquico . Ejemplo: Primera etapa:es un marco de áreas, digamos de secto res censales. Se seleccionan varios sectores. Segunda etapa: una lista completa de las viviendas en cada sector seleccionado . Múltiple . A menudo, es posible utilizar una lista de una parte importante de la población, pero la lista queda incompleta. Se puede utilizar un marco de áreas para completar la cobertura de la población Ejemplo: Encuesta sobre la producción de vino en Chil«. Hay una lista de los 25 productores más importantes, representando quizás 85 - 90$ de la pirxlucclón aicio nal. Para cubrir los pequeños productores, se puede utill zar también un marco de áreas basado en las partes rurales del país. Factores que afectan la selección del marco muestral Los objetivos de la encuesta . La población sujeto Los costos . Datos administrativos disponibles . Otros datos externos disponibles Recursos humanos Recursos materiales . Calendario Es muy difícil contar con un marco muestral que corresponda bien a la población sujeto Problemas de los marcos muéstrales Dos problemas mayores: . Mantener al día la cobertura del marco . Mantener al día la clasificación de las unidades Los tres errores posibles en cada caso: Elementos que faltan (sub-cobertura, omisión) Nacimientos, Inmigraciones, divisiones . Elementos ajenos (sobre-cobertura) . . Muertes, emigración, fusiones Repeticiones . Elementos correctos, incluidos dos o más veces en el marco ¿Cano poner al día la cobertura? Cuatro posibilidades: La encuesta misma Ejemplo: Productores de vino en quiebra, descubiertos al memento de hacer las entrevistas sobre la producción • Esfuerzo especial para poner al día los sectores cue se van a selec clonar para una encuesta en el futuro . Personal del instituto de estadística visita algunas regiones y prepara listas de todas las viviendas en ciertcs sectcres Nuevas listas administrativas . Ejemplo: lista anual de todas las clínicas, p-:r provincia y municipio, proporcionada por el ministerio de salud Nuevos datos administrativos Ejemplo: ministerio de hacienda proporciona ur.a lista de tccas las empresas realizando exportaciones de m~s de $ l.OOO.OOOen el año 1986 ¿Cómo reconocer unidades distintas? Ejemplo: en el listado de restaurantes de Santiago, se encuentre.-; Pisa 4 Vientos Apumanque y Pizza Cuatro Vientos Apoquirrio' 6529 ¿Cómo se puede saber que se trata de la misma unidad? Tal listado puede incluir 15.000 restaurantes, por lo tanto se necesita algo más metódico que la opinión de un empleado que conoce varios restaurantes en su barrio, a fin de evitar problemas graves de omisión o repetición Clasificación de las unidades Importancia de las definiciones y de los sistemas de clasificación Mala clasificación de una unidad puede dar omisión o sobre-cobertura . Ejemplo: En una encuesta de hogares, cuya última unidad de selección es la vivienda privada ocupada como un lugar comercial (por que hay un bar en el primer piso) es un caso de omisión; la clasificación de una tienda no ligada a una vivienda privada, como vivienda, sería un caso de sobre-cobertura ¿COITW poner al día la clasificación? Tres posibilidades La encuesta misma . Durante la recolección de los datos, se pueden incluir algunas preguntas para verificar la clasificación de la unidad, y eliminar las que no corresponden. Así se puede reducir la sobre-cobertura Otras encuestas . Si todas las encuestas incluyen preguntas sobre la clasificación, las unidades de tipo "B" encontradas en la encuesta "A" se pueden entregar a la encuesta "B" y vice versa . Sin embargo, este nétodo tiene grandes problemas de coordinación de práctica Datos administrativos . A veces incluyen información que se puede utilizar para verificar la clasificación en el marco muestral Unidades de encuesta Unidad de muestreo : unidad seleccionada Unidad de análisis : unidad de descripción o inferencia para la población Unidad de respuesta: unidad que proporciona las respuestas Unidad de referencia: unidad a la que se refieren los datos recolectados 69. Ejemplo: Objetivo: Encuesta sobre la mano de obra (población eccníricér.er.ze activa) Unidad de muestreo : vivienda Unidad de análisis : individuos y familias Unidad de respuesta: una persona responsable que se encuentra en la vivienda Unidad de referencia: cada miembro del hogar, de r¿s ce años de edad Ejemplo: Objetivo: Recolectar datos sobre los hogares (familias exterdidas) Unidad de muestreo : vivienda Unidad de análisis : hogar (familia extendida) Unidad de respuesta: jefe de hogar, o de familia nuclear Unidad de referencia: familia nuclear Muestreo probabilístlco Cada unidad de la población tiene una probabiliad no-nula de ser se leccionada Esta probabilidad se puede medir La nuestra se selecciona de manera aleatoria Se utilizan las probabilidades de selección para calcular las estimaciones para toda la población a partir de la muestra. ilay varios métodos de muestreo probabilístlco. Un diseño .uestral puece puede utilizar uno de ellos, o una combinación de varios. Ventajas del muestreo probabilístloo . Objetividad . Los métodos de estimación tienen una justificación trónica El método de muestreo determina el método de estijn'.iión . El error muestral se puede medir . Normalmente, el error muestral es más pequeño que en -1 ciz: de riu:-? treo no-pnobabllístico Muestreo aleatorio simple (MAS) . Una muestra con tamaño pre-determinado seselecolora de una lista ce re das las unidades de la población Cada unidad tiene la misma probabilidad de selección . Si se selecciona una sola unidad de una población, de N unidades, cada una tiene una probabilidad de 1/N de ser seleccionada Para una muestra de más de una unidad, cada unidad tiene la misma probabilidad de selección, y cada combinación ce unidades tiene la nisra probabilidad de selección Ehtonces cada muestra de n unidades tiene la misra probabilidad ce se lección, y cada unidad tiene una probabilidad de selección de n/i:. . Se saca una unidad a la vez hasta que se tenga la muestra de ta.-r.afb deseado Hay dos métodos de muestreo aleatorio simple: Conrop.islclón(MASCR) . Cada unidad de la población queda disponible para, cada selección La misma unidad puede ser incluida varias veces en la mjestra Sin reposición (MASSR) . Una vez seleccionada, ' una unidad no se puede seleccionar otra vez en la misma muestra, entonces la rruestra tiene unidades distintas Este método es lo más utilizado en la práctica Ventajas del MAS Su simplicidad . MASSR da estimaciones más precisas que « Desventajas del MAS . MASCR penrite duplicación Hay que seleccionar muchos números alea"crios . MASCR ni MASSR hacen uso de información adición?.! disprrible sotre la población Información necesaria para el marco muestral Sólo una lista que identifique cada unidad de li poblcrión ion : Un pueblito donde viven seis hombres: Arturo, Bernardo, Carlos, David, Ednundo y Francisco a : MASSR de dos hombres para hacer un trabajo Hay solamente 15 muestras posibles: AB BC CD DE AC ED CD DF AD EE CF AE BF AF Cada persona tiene una probabilidad de selección de 5/15 = 1/3 Cada pareja ( = cada muestra) tiene probabilidad de selección de 1/15 Corro sacar la nuestra: A B CD E F Dar a cada persona un número, por ejemplo se hace 1 2 3 1 5 6 Utilizar una tabla.de números aleatorios Empezando al comienzo de la primera fila de la tabla, se encuentran las cifras 5939 entonces Edmundo (5) y Carlos (3). harán la tarea Sí se hubiera empezado con la fila 20, columna 55, la maestra sería Bernardo y Arturo (número aleatorios 82270J.0 ...) ; si fuera una se lección por MASSCR, el pobre Bernardo tendría que hacer ambas mita- • des del trabajo. TABLA DE NÚMEROS ALEATORIOS 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99 00 01 02 03 04 59391 99567 10363 06059 11250 58030 76364 97518 19550 24591 52090 77204 51400 64432 36863 82718 04615 25670 16706 55368 87024 27062 98342 99612 31721 82848 96621 61891 59790 94333 04190 43910 27101 32803 34936 96574 01896 37855 67708 02566 90464 03991 06235 15297 00972 29065 51141 33316 28612 00100 03 06 07 00 09 95068 54463 16074 92494 15669 80620 472 57 62677 63157 56689 3591 1 7 3800 57412 76593 35602 14530 91017 13215 91316 40844 33020 36239 31369 03505 53256 00428 71824 62233 72389 81872 39936 83671 00027 96363 3521.3 31855 39892 7 3yi7 52887 09040 34 334 60510 02002 01087 34471 64065 37092 04420 66091 74441 10 11 12 13 14 99116 15696 97720 11666 71628 75486 10703 15369 13841 73130 84989 65178 51269 71681 78783 23476 90637 69620 98000 75691 52967 63110 0.3388 35979 41632 67104 17622 13699 39719 09847 39495 53908 33423 81899 61547 39100 71087 67453 07449 18707 17217 84148 43269 47985 05489 74073 11670 56720 46967 69 9 4 4 15 16 17 18 19 40501 22518 75112 80327 60251 51089 55576 30485 02671 45548 99943 98215 62173 98191 02146 91843 82068 02132 84342 05597 41995 10790 14878 90813 48228 88931 86211 92879 49268 81366 73631 365134 22281 95441 34598 69 361 67466 16703 15496 72856 05375 69373 06352 20168 66762 15417 40054 00077 09271 17002 20 21 22 23 26 57430 73528 25991 70308 12477 82270 39559 65959 16630 09965 10421 34434 70769 09134 96657 00540 88596 64721 59900 57994 43648 54086 86413 63806 59439 75888 71693 33475 406 72 76330 66049 43132 42740 39310 24596 21511 14414 06175 35434 77515 47676 79949 82750 24057 09577 33444 05193 66240 74739 91071 25 26 28 29 83266 76970 37074 03712 20207 32883 00076 65190 06514 56062 42451 10237 44705 30101 69727 1 5579 39515 60624 70295 94443 30155 79152 98336 54656 64936 29793 74 790 84401 054 17 00 366 40914 39357 97610 43189 27227 65990 091)56 7U735 6(304 0 05158 16235 73579 46703 72701 50326 1 7 7 77 92339 90265 72606 59566 30 31 32 33 36 74261 66(181 05617 26793 65900 32592 49863 75018 74951 72850 G6538 0 8 4 78 47750 95466 40737 27041 96001 67(314 74307 54719 65172 10000 29575 1 3330 52056 05532 14U i o 10526 4 2664 01596 07571 7U54 5 66192 U551 5 03045 R06Ü? 09 ? 5 5 4 íi á 6 6 206 3 2 35067 39205 59064 27050 05477 03134 65360 072 10 40467 3362 5 70322 35 36 37 30 39 27366 56760 72880 .7 7 0 0 0 20640 42271 10909 43338 30100 07019 44300 98147 93643 03062 21500 73399 34 736 58904 50103 51459 21105 33063 59543 47961 4 7971 03200 95256 23943 83041 29002 73457 12 7 31 11231 25070 13990 4 309 3 66590 03260 23746 29226 05192 50771 65930 55903 2 3600 40657 03665 01501 44115 1507 3 21 Eficiencia Para comparar los distintos métodos de muestreo, se usa el concepto de eficiencia o eficiencia relativa . Si la varianza muestral del método "A" es más pequeño que la del mé todo "B", con muestra del mismo tamaño, se dice que "A" es más eficiente que "B" La eficiencia relativa de "A" (con respecto a "B") es simplemente: varianza según "B" variánza según "A" . Si se dice que el método "A" es más eficiente que el método "B", quie re decir que las estimaciones de "A" son más precisas que las de "B" La identificación de "eficiencia" y "precisión" en el párrafo anterior corresponde al uso común y corriente en la estadística, cuando normalmente se consideran sólo estimadores insesgados. Sin embargo, en el caso general, se trata de dos casos distintos Hay que distinguir dos términos: Precisión : Se trata de considerar la variabilidad de las observaciones con referencia al promedio de las mismas observaciones, tomando en cuenta todas las muestras posibles. La medida básica de precisión es la varianza (V) Exactitud : Se considera la variabilidad de las observaciones con referencia al valor verdadero en la población, tomando en cuenta todas las muestras posibles La medida básica de exactitud es la media cuadrática de error (MCE) Si un estimador es insesgado (tiene sesgo B= 0), su precisión y exactitud son lo mismo, dado que MCE = V + B 2 Estrictamente,"'la Idea de eficiencia se debería identificar con la exactitud, entonces digamos que: Entre dos estimadores, el estimador con menor varianza es más preciso, y el estimador con menor MCE es más eficiente, o tiene mejor exactitud 1 > ; 74. B BAJA BAJA PRECISION EXACTITUD (sesgo grande) •ALTA BAJA PRECISION EXACTITUD (sesgo grande) BAJA BAJA PRECISION EXACTITUD (sesgo requeño) ALTA PRECISION ALTA EXACTITUD (sesgo pequeño) Fac:cres que determinan precisión y exactitud Error muestral Error no-muestral, o error de observación Error muestral Error atrlbuible al hecho de observar sólo una muestra (una fracción) de la población Fuentes posibles: Tamaño de la muestra y de la población Variabilidad de las características estudiadas er. la población Diseño muestral Método de estimación Salvo en el caso de un verdadero censo, sienpre hay vari ansa maestral TaTábién puede haber sesgo muestral Error no muestral Existe en los censos como en las encuestas por muestreo También puede incluir conponentes de varianza y de sesgo FUentes posibles: Errores de cobertura del marco muestral Errores de clasificación Errores de respuesta y de no-respuesta . Imprecisión de las preguntas, problemas de interpretación Sesgo de los entrevistadores Mal período de referencia . Mala aplicación de los procesos de recolección de les catc-s Errores de transcripción o de codificación Errores de digitación Errores de control y verificación Errores de imputación Muestreo sistemático Necesita un intervalo de muestreo y un número de arranque aleatorio El intervalo de muestreo es K = n/N El arranque aleatorio es un número entero R entre 1 y k Las unidades R, R+k, R+2k, ... , R+(n-l)k Ejemplo: N = n = k = son seleccionadas 153-000 granjas 9-000 " 153-000 / 9-000 = 17 Si se selecciona el arranque aleatorio R = 21, 38, 55, 72, 89, 104, ... , 152.987 las granjas con número son seleccionadas R tiene la probabilidad 1/k = 1/17 de ser cada uno de los valores 1, 2, ... , k Hay k muestras posibles, cada una con probabilidad de selección 1/k La probabilidad de selección de cada unidad de la población es l/k=n/N. Esto es el muestreo sistemático lineal Generalmente, N no es múltiple exacto de n Sin embargo, hay varias modificaciones sencillas El tamaño del intervalo muestral puede ser redondeado, tomando el va lor entero inferior o superior a k Esto puede dar una muestra un poco más pequeño o más grande que n, según el valor de R. Se puede utilizar el muestreo sistemático circular, con R selecciona do aleatoriamente entre 1 y N Ejemplo . N = 11, n = 3, k = 1 (redondeado) Supongamos que R = 10 Las unidades seleccionadas tendrían las posiciones 10, 1^, 18 pero la población tiene sólo 11 unidades Las unidades realmente seleccionadas son 10, 1*1-11, y 18-11, es decir 3, 7 y 10 Para mejorar la cobertura muestral de la lista, en la práctica no se redondea k directamente, sino los valores R, R+k, R+2k, ... , indivi dualmente Ventajas del muestreo sistemático La selección es más simple que con MAS, porque hay que sacar sólo un un número aleatorio A menudo proporciona estimaciones más precisas que MAS, sierdo muestra distribuida de manera más uniforme en 3.a población la Ventajas del muestreo sistemático La selección es más simple que con MAS, porque hay q-.E sacar sólo un un número aleatorio A menudo proporciona estimaciones más precisas que MAS, siendo la muestra distribuida de manera más uniforme en la población Desventajas Periodicidad : Si la lista es£a ordenada de tal manera que la carac terística por medir tiene un patrón cCclico cuyo período está en relación con el intervalo muestral, la precisión de la estimación puede ser muy mala No hay estimador insesgado de la varianza muestral Información necesaria para el marco muestral Una lista de todas las unidades de la población Muestreo estratificado Utiliza información disponible para mejorar la representación de los varios grupos de la población Si es conocido (o sospechado) que la variable de Ínteres está correlacionada con otra variable, y si la información sobre la segunda va riable está disponible para cada unidad muestral, la población se puede dividir en grupos que son los más homogeneso posibles, respecto a esta variable Estos grupos se llaman estratos Cada estrato se trata como una sub-población independiente y una par te de la muestra se selecciona independientemente dentro de cada estrato El método de selección de la muestra puede ser diferente entre los distintos estratos El muestreo estratificado proporciona no solamente estimaciones para toda la población, sino que también separadamente para cada estrato o grupo de estratos Las variables usadas para la estratificación pueden ser de naturaleza geográfica o no geográfica ¿Porque estratificar? (Ventajas) Para mejorar la precisión de las estimaciones para toda la población Para obtener estimaciones para cada estrato Por razones administrativas Para aprovechar diferentes métodos de muestreo en varias partes de la población Pretores que determinan la eficiencia de la estratificación La selección de la (s) variable (s) de la estratificación El número de estratos Los limites de los estratos La afijación de la muestra entre los estratos Deventajas Más complejo que MAS o muestreo sistemático puro Información para estratificación debe estar disponible para cada uni dad, y debe ser más o menos precisa Información necesaria para el marco muestral Lista de todas las unidades de la población 79. Valor (es) ¿e variable (s) de estratificación para cada unidad o Frsibllidaá de una división de la población en unidades geográficas ijación (alocacicr.) de la muestra entre los estratos .-.fijación proporcional La mis~3 fracción de muestreo en cada estrato El ta~3o de la muestra es proporcional al número de unidades en el estrato ¿fijación r.o proporcional Si se sabe que la variabilidad de la(s) variable(s) de interés es rr.uy diferente entre los varios estratos, o si los costos de la re-colección de los datos son muy diferentes, estos factores se pueden tomar en cuenta Hay varios métodos de afijación, por ejemplo: . Afijación óptima: Método complejo que aumenta el tamaño de la muestra en estratos con mayor varianza o menor costo . . Afij ación de Neyman: Cerno la fijación óptima pero utiliza sólo información sobre la varianza . Afijación ... : (sin nombre especial pero quizás lo más u til en la práctica): como la afljaclón óg tima pero utiliza sólo información sobre los costos Afljacicr. proporcional a "X" Corro la afljaclón proporcional simple pero utiliza información setre otra variable correlacionada con la variable de Ínteres, a información sobre el tamaño de las unidades Muestreo por conglomrados Requiere una población que puede ser estructurada de manera Jerárqui ca Ejemplo : Persona viven en viviendas Un grupo de viviendas es una manzana El conjunto de manzanas es una ciudad Un conglomerado es una unidad de muestreo que incluye varia unidades de la población Ejemplo : Una vivienda se puede ver como un conglomerado que consta de varias personas o Una manzana se puede ver como un conglomerado de varias viviendas El muestreo por conglomerados es un método que selecciona conglanera dos enteros como las últimas unidades maestrales, e incluye en' •• la muestra todas las unidades de la población que se encuentran dentro de los conglomerados seleccionados La selección de los conglomerados se puede hacer por MAS, muestreo sistemático o cualquier otro método probabilístico, si la información necesario par la aplicación del método está disponible Ejemplos de poblaciones con conglomerados Población estudiada Variable de interés Unidad de la población Conglomerado Escuela secundarla Planes de Carrera Alumno Clase Tráfico por un puente Origen y destino Auto Período de tiempo Aeropuerto Gastos de los turistas Pasajeros saliendo del país Vuelo (avión) Ventaj as Se puede utilizar aún cuando no hay lista de las unidades de la población No es necesario preparar una lista completa Si la recolección de los datos se hace por entrevistas personales, es posible reducir los costos y el tiendo de viaje de manera importante, especialmente en el caso de poblaciones morales muy dispersas Desventajas Menor precisión, generalmente, debido a la tendencia de las un vecinas a ser más o menos semejantes con respecto a sus caract cas de interés Información necesaria para el marco muestral Una lista de los conglomerados o La posibilidad de construirla El valor del muestreo por conglomerados, sobre todo desde el p de vista de la precisión, depende mucho de"la relación entre 1 raleza del conglomerado y la variable estudiada Ejemplo : Los conglomerados son hogares, sierrio la unidad población la persona La variable de interés puede ser el nivel material de o la religión de los individuos Se puede suponer que no vale la pena entrevistar a caá bro del hogar, porque la respuesta de cada uno sería ma Es decir que se puede esperar una correlación intracls fuerte Entonces todo el conglomerado no puede proporcionar en dad mucho más información que cualquier individuo del hablando para todos Si se entrevista a todos los individuos, el tacaño ef de la muestra (en términos de la información obtenida} reducido, conparando a una muestra aleatoria del rrisrc de personas Entonces este diseño tendría una varlar.za elevada, ccr con la varianza de la muestra aleatoria simple Se dice que el diseño tiene un alto "efecto del r.lseñr decir que tiene baja eficiencia Al revés, si la correlación entre los eler.-er.tcs cel congl. es negativa, como sería el caso en un esrj-iio de üstrl'r de la población por sexo y edad, un congicr.erado p-uc-ie efe mente proporcionar más información que ur. número ec'.iival-er indlvlduos seleccionado independientemente En este caso el efecto del diseño es menos que uno, e; que el diseño por conglomerados es rr.ís eficiente que ño aleatorio r.lmple 2. Ehccnces, desde el punto de vista de la varianza, un diseño maestral basado er. conglomerados es más eficiente cuando cada conglomerado es lo irás hecerogeneo posible, o sea cuando cada conglomerado representa rrás o menos una "mini-población" Comparar con el caso de estratificación, donde el diseño es más eficiente cuando los estratos son homogéneos, y la mayor parte de la variarla se encuentra entre los estratos Cada estrato proporciona una pai*te de la muestra; si el estrato es Informaoíón sobre su contenido Er. el caso de los conglomerados, sólo algunos son seleccionadas, y todas unidades deben ser entrevistadas, entonces es preferible cue caca conglomerado de la mayor información posible, es decir que el conglomerado sea heterogeneo, y que hayan diferencias entre los distintos conglomerados Si se sospecha homogeneidad dentro de los conglomerados (es cecir correlación itraclase positiva), es preferible buscar un número más grande ce conglomerados pequeños 83. Muestreo multi-etápico Indica cualquier diseño utilizando dos o más niveles o etapas de mués treo Requiere una jerarquía de dos o más niveles de unidades de muestreo El proceso general: Construir una lista conpleta de unidades de la primera etapa (unidades primarlas) Utilizando un rnetodo de muestreo apropiado, seleccionar una mués de unidades primarlas Dentro de cada unidad primarla seleccionada, y sólo dentro de es tas unidades, construir una lista de todas las unidades de la se gunda etapa (unidades secundarlas) Seleccionar una muestra de unidades secundarias dentro de cada una de las unidades primarias seleccionadas Si hay más de dos etapas, dentro de cada unidad secundaria selec clonada, hacer una lista de todas las unidades del tercer nivel Seleccionar una muestra de ellas dentro de cada unidad secundaria ya seleccionada, etc. La etapa final puede ser la segunda, tercera, cuarta, ... según el diseño En casos reales, diseños con dos o tres etapas son comunes; es muy raro encontrar un diseño con más de cuatro etapas A menudo, la última unidad muestral es el elemento de la población Sin embargo, en la mayoría de las encuestas de hogares, la última unidad muestral es el hogar o la vivienda mientras el elemento de la población es la persona Un buen marco muestral es necesario para cada etapa Generalmente, el marco de unidades primarias es más completo, y más establece en el tiempo, que los marcos de unidades de las últimas e tapas, es decir las unidades más pequeñas Ejenplo: Si las etapas de un diseño son provincia: sector cen- sal: hogar: persona, la primera etapa es muy estable, la definí ción de la segunda podría cambiar cada diez años (con el nuevo censo), pero las unidades de tercera y cuarta etapa pueden cambiar en cualquier momento (nacimiento, fallecimiento, mudanza, ...) Normalmente, las unidades de primera y segunda etapa se definen en términos de áreas censales u otras regiones administrativas, mientras las últimas unidades se basan en listas más recientemente actúa lizadas DT cada etapa, la selección de la muestra puede utilizar cualquier método de muestreo,con probabilidades iguales o desiguales ... .Ejemplo: Una encuesta sobre la producción agrícola necesita visitas personales para la verificación de los datos fiscales y para la observación directa de los campos. Los costos de los viajes son altos y no se puede obtener un listado completo de las fincas Dentro de la provincia, hacer una lista de las 31) reglones agrí colas Seleccionar 7 regiones por MASSR Calcular la población total de cada una de estas 7 regiones, se gún datos del último censo Utilizando la población como medida del tamaño, seleccionar 3 municipios dentro de cada una de las 7 reglones, con probabili dad proporcional al tamaño de cada municipio dentro de cada re gión Para cada una de las 21 municipalidades seleccionadas, hacer una lista completa de los granjeros Eh cada municipio, seleccionar 10 granjeros por MASSR; en el ca so de un municipio con menos de 10 granjeros, tañarlos todos ¿Porqué utilizar muestreo multi-etápico? Si un marco muestral apropiado para otro método no existe no se puede construir dentro del tienpo y del presupuesto disponibles Puede ser factible, para cada etapa, recolectar la información nece sarla para la preparación de la próxima etapa, por ejemplo datos pa ra un segundo nivel de estratificación A menudo es posible reducir los costos de viajes y de la recolección de los datos de manera importante Si el efecto del diseño (coeficiente de correlación intraclase) que reduce la eficiencia de un diseño por conglomerados es muy fuerte, se puede disminuirlo con un diseño multi-etápico Es posible utilizar distintos métodos de muestreo en las varías eta pas, o tal vez en las distintas unidades de una misma etapa Ventajas No es necesario listar toda la población Se puede eliminar una parte de las pérdidas de eficiencia asociadas con el puro muestreo por conglomerados Desventajas Particularmente sin uno o más de las etapas utiliza muestreo con pro habilidades desiguales, la estimación y más aún la estimación de la varianza pueden ser demasiado complejas Información necesaria para el marco muestral La posibilidad de construir el marco para la próxima etapa dentro de las unidades seleccionadas en una etapa determinada, incluyendo la información necesaria para la aplicación del método de muestreo ele gido Muestreo con probabilidades desiguales El muestreo pr-obabllistico requiere la posibilidad de calcular la probabilidad de selección de cada unidad de selección No necesita que esta probabilidad sea la misma para cada unidad Si se sabe que hay diferencias importantes entre las unidades con respecto a una variable que se puede llamar una medida de la importancia o del tamaño de la unidad, esta información se puede utilizar en el diseño muestral Si esta medida del tamaño está más o menos directamente relacionada con las variables de interés, se puede utilizar uno de los métodos que se llaman "con probabilidad proporcional al tamaño" (PPT) La probabilidad de selección de una unidad es proporcional a su tamaño, representada como una fracción del tamaño total de la población multiplicado por el número unidades que hay que seleccionar La medida del tamaño puede ser el número de elementos más pequeños contenidos en la unidad, o su área geográfica, Ingreso, etc. Se han desarrollado varios métodos de muestreo con PPT. Dos de los más importantes son: PPT aleatorio El tamaño total de la población se calcula y a cada unidad se le asig na una parte del recorrido total que corresponde a su parte del tamaño total Para cada unidad requerida en la muestra,se selecciona un número alea torio entre 1 y el valor del tamaño total La unidad cuya parte del recorrido total incluye este número esta seleccionada La selección se puede hacer con o sin reposición Si se hace sin reposición, la parte del recorrido total que correspon de a cada unidad ya seleccionada se debe omitir para la próxima selec clon, lo que necesita recálcular las probabilidades cada vez. Esto puede ser complicado PFT sistemático Se calcula y se acumulan las medidas de tamaño como en el caso anterior El método básico de muestreo sistemático se aplica utilizando el tamaño total én lugar del número de unidades Se divide el tamaño total por el tamaño n de la muestra para obtener un intervalo de muestreo basado en las medidas de tamaño Ventajas Si la coi-relación entre la medida del tamaño y la variable de interés es fuerte (y positiva), se mejora la precisión de las estimaciones de manera muy importante Desventajas Es necesario conocer el tamaño de cada unidad El cálculo de las probabilidades de selección y de las estimaciones es muy complejo El cálculo de las estimaciones de la varianza es mucho pero aún Si hay unidades muy grandes con respecto al tamaño total, se pueden presentar problenas de selección múltiple, o puede ser necesario tra tar independientemente estas . unidades Información necesaria para el marco maestral Una lista de todas las unidades de la población con su tamaño o Una lista de áreas geográficas con su tamaño R E S UM EN Hay dos tipos básicos de proceso en el diseño muestral: Estructura de la población Estratificación Conglomerados Selección de unidades Mtestreo probabilistico con o sin reposición probabilidades iguales . MAS sistemático probabilidades desiguales . PPT aleatorio . PPI" sistemático Muestreo no probabilístico MUESTRED PROBABILISTICO Muestreo aleatorio simple A veces difícil de seleccionar las unidades Puede ser caro Generalmente menor varianza (mayor precisión) que diseños multi-etá picos Muestreo sistemático Selección más sencilla que MAS Problema de periodicidad Muestreo estratificado Generalmente mejora la precisión Se necesita datos adecuados sobre todas las unidades, para estratificar Muestreo por conglomerados Mas barato que MAS Generalmente menos preciso que MAS Se simplifica la construcción del marco muestral Muestreo multi-etápico Más barato que MAS Generalmente menor precisión que MAS pero mayor que pur: maestreo per conglomerados Construcción del marco muestral requiere listas de unidades per etapa sólo dentro de unidades seleccionadas a la etaoa anterirr. IX PRUEBA DE HIPOTESIS E INTERVALOS DE CONFIANZA Todo lo que se desarrolle en el presente capítulo está bajo el contex to de que la información básica que se posee,está obtenida a nivel muestral (no inportando el tamaño de ella, grande o pequeño), y con el análisis de ella poder sacar conclusiones válidas, confiables acerca de lo que sucede en la po blación de donde provienen las muestras A. PRUEBAS DE HIPOTESIS PARA PROPORCIONES E INTERVALOS DE OONFTANZA Hay muchos problemas prácticos en que la respuesta que se obtiene, o el comportamiento de la variable aleatoria, sólo admite dos valores. Ellos Generalmente un "si" o un "no", en sentido cuantitativo un "1" o un "0" . Este tipo de problemas tiene la proporción "p" como parámetro de la población Ej emplo: - Un alumno reprueba o aprueba una asignatura - Un alumno repite o es promovido de curso - Una dueña de casa utiliza o no utiliza un cierto producto - Una persona confía o desconfía Puede que nuestra población o universo sean todos los alumnos de la ciudad que se matriculan en Enseñanza Media. El problema a estudiar puede ser "La proporción (o porcentaje) de reprobados" En el muestreo se puede considerar un "Exito" una persona que reprue ba un determinado curso y "fracaso" cuando ocurre la situación contraria Un éxito (p) se registra con un UNO y el "fracaso" (q) se registra con un "cero" (0). Por lo tanto si "Y" es una variable aleatoria cuyos posibles valores son cero o uno, entonces en una muestra de tamaño n, se obtiene una pro porción maestral p. T. A P Y 1=1 Un Intervalo de confianza (1 -oO n Yi O A < p £ 1 A p + q = 1 para la verdadera proporción p en en la población, basado en la información de una muestra grande es 90 p- Z Da TI 2V Se -orna una ruestra aleatoria de 100 estudiantes de 8 o 1 años y se les consulta acerca de su preferencia por determinada asignatura (ccistellano). 30 contestaron afirmativamente y 30 = 10 100 0,3 = 0,7 Un intervalo del 90% para los alumnos de 8 v o que prefieren la «pistura de Castellano es •3) - Z.^sL. i / o , 3 x 0.?' é ¿ " V 100 p -í (0.3) + £ 1- .v/ — V• 2 100 Se toma una muestra aleatoria de 200 alumnos en el 1 e r año básl ¿e una ciudad para estudiar la proporción de dlslexias. En ' la • stra observa-ros 25 niños con problemas de dlslexla. ¿Cuál es el er.-alo de confianza del 95% para la verdadera proporción de dis_cos en l e i año básico de esa ciudad. £ = JÜL « JL , $ . 200 1 + 8 ~ 8 (0,125) (6.875) z 1- ^r 200 iras de Hipótesis ótesls nula ctesis --nativas * Ho : P = P o H : P = Po f a) 1 b) H. : P 1 0 < c) H 1 : P 0 —p Q-—i o o - = z observado Diferencias entre Proporciones Cuando se hace una misma consulta, en problemas distintos, tenemos una proporción para cada población. Por ejemplo: se estudia la proporción disléxicos en niños y niñas de 1 de año Se obtiene una muestra aleatoria de 150 niños (varones) y se observa que hay 15 con problemas de dlslexia Se obtiene una muestra aleatoria de 200 niñas y se observa que hay 25 - J5150 1 p- = - -i10 = n2 10 — inn 200 ¿ ; ; q = p 2Q Q ; n = = 150 200 ¿ Intervalos de confianza para la diferencia de proporciones a p (P X - P 2 ) ± \ I — q l r- l+ p X 2 A q n2 2 con n^ y n 2 >• 30 Dócimas de Hipótesis H o : P, - P 2 é = ÍP1 ~ P2> ~ A U1:P1-P2 ^CÍ . / Pljl n /> Pl n l Cuando Z . está fuera del intervalo obs - Z-. '1- 2 j á 2 entonces rechazamos H Puede también plantearse la hipótesis de que H o H 1 : P : P 1 ~ P2 = J 1 " ^ cf P 2 c f 2 * = Z obs entonces el estadístico de prueba sigue siendo P2) (Pl ~ A A Pl q l p + q 2 l n "" A A n obs 2 2 y se rechaza HQ, en favor de H p cuando ^ ^ Similarmente para la hipótesis H o : P, - H 1 : P 1 " P2 = CÍ 2 ^ cf P Rechazamos H cuando o Z - Z l-<^ obs ^ Tamaño de la muestra Cuando las variables que investigamos es del tipo de dlcotómlca, es decir f 1 Si el sujeto posee la característica en estudio = Í lo Si no posee la característica n £ A y p = 1 = N Yi 2 A 1 Y 1 = 1 _± = ¿ es el estimador de P = — =• n n N y nosotx-os estamos interesados en saber ¿Cuál es el tamaño de la muestra que debo tomar para tener un nivel de confiabllldad deseado, aceptando un error de muestreo fijo? 7 Esto nos lleva a: nQ = ' \ 2 — \1 P • 0 dorde 1 - ck es el nivel de confiabllldad deseado d : error de muestreo aceptado p : valor teórico de la proporción en la población Casi siempre el valor de P, y por lo tanto Q = 1 - P, es una expre- 93. sión numérica entre cero y uno que maneje el investigador de acuerdo con: a) Antecedentes que él tiene del comportamiento de la proporción P en la población b) Resultado de una muestra piloto El valor ? . Q, es máximo cuando P = 0,5 y por lo tanto maxlmiza oara un Z. y d fijos, cuando el cociente ^o > 0,05 " 2 N lar el tanaño muestral, y este será "n" , se debe calcu- N Aplicaciones de la t de student una variable en estudio de interés es una población cualquiera, puede ser: - Nivel de fecundidad - Cociente intelectual - Estatura - Peso - Edad - Temperatura, etc. Estas variables, originalmente obedecen al apellido de continuas, puesto que rara cada --edición que hagamos el "valor exacto" es muy difícil de obtener puesto que dependen del instrumento y la unidad de medida con que se obtienen a) Resulta importantísimo- saber que cuando se obtiene una muestra de la población en estudio y en ella obtenemos un valor X de la caracte rística o variable en estudio ¿cuál es el rango en que se encuentra el verdadero valor promedio de la población, 'Ju", para esa variable? 1 2 2 ( d o n c e l es promedio en la población desconocido) promedio muestral desviación estandar muestral tamaño de la muestra A 2 valor de tabla para nivel de significación grados de libertad = 94. Para el caso de eos muestras Independientes es decir cuando los elementos de una de ella no están asociados de ninguna manera con los de la otra, p>ode~>os hacer inferencias respecto de la diferencia entre dos promedios. Un problema interesante es decidir si la dlferen cia obtenida a nivel muestral es o no significativa. Para resolver este problema recurrimos al estadístico que nos sirve para decidir si es significativa la diferencia observa da a nivel muestral, con nivel de confiabllldad (1 - cA), de cualquie ra de las siguientes tres hipótesis planteadas 1. H ° H 1 : Li. ^ 1 v A l 0 ¿ = </ r a nivel de significación <Á *0 X1 bajo H n l S 2 1 ~\ + n^ + n^ - n 2 2 ~ J S 2 1 \ ín 1+ / • n n 2 2 y decimos que la diferencia observada a nivel muestral es significativa si t Q b s está fuera del intervalo (-t-j_ con jj = r.. + 1 2 - 2 grados de libertad H o H 1 H o H1 ••Al-/A2=¿c :/¿1-/{2><Jc ; ) 95. ^nplo: Se aplica ur. test que mide cociente intelectual a una muestra alterna ce 25 niños de un colegio, todos de la misma edad, y se tuvo cue: X = 90 con s = 15 Deseamos saber con un 95% de conflabilidad, entre que valores se encuentra el cociente intelectual de todos los niños de esa edad en el colegio _ .. - (x A b e - C.X estadístico tQbs s nos sirve para decidir cualquiera de las tres siguientes pruebas de hirctesis. i. ü 0 H^ i- JL( ^ bajo H a nivel de significación o C tenemos que (X -_/< o ) y n - 1 = y J rechazamos H o t obs si t , está fuera del intervalo obs con grados de libertad y 2 " = n 2 a nivel H 1 o —oncos t eos = (X V n-1 „ y se rechaza H cuando ° . ^ t, i con l) = n - 1 grados de libertad ros 1 - ' ' y 0 a nivel oL y se rechaza H cuando (X -/L ) \/n-l obs es menor que ~ A c o n )J ~ n ~ 1 EF^os d e libertad Ir. intercalo de confianza de nivel (1 - oí ) para la verdadera diferen cia entre los promedios a nivel de población está dado por 1 1 2 \/ n jS^ n l + 'nl + n2 + n 2~ ^ n l • n 2' X APLICACIONES DE LA DISTRIBUCION JI-CUADRADO Muchas veces los resultados obtenidos de muestras no sienpre coinciden o concuerdan exactamente con los resultados teoricos esperados según las reglas de probabilidad. Por ejenplo : consideraciones teóricas nos dicen que cuando una moneda correctamente fabricada se lanza 100 ve ees y se cbserva la superficie superior, deberíamos obtener " 50 cazas " y " 50 sellos ", es muy raro que se obtengan exactamente estos resultados. Supóngase que en una determinada muestra se observan una serie de posibles sucesos S ^ S 2 ... 0^ respectivamente, S^ que ocurren con frecuencia 0 ^ llamadas FRECUENCIAS OBSERVADAS y que según las reglas de probabilidad se espera que ocurran con frecuencias e^, e 2 -. e^ respectivamente, llamadas FRECUENCIAS TEORICAS O ESPERADAS. a) PRUEBA DE BCNDAD DE AJUSTE La prueba ji-cuadrado (chi-cuadrado) puede ser empleada para determinar de que forma, distribuciones muéstrales o tablas de frecuencias pueden ser ajustadas o llevadas al comportamiento de distribuciones teóricas de probabilidad, ccrro el caso de una distribución normal, bi_ nomial, Poisson, etc., y con algún grado de confiabilidad decidir si se ajustan los datos empíricos o muéstrales a alguna (s) de esa (s) distribución (es). Para tal efecto se plantean dos hipótesis de trabajo : H Q y H^, llana das hipótesis nula o de prueba e hipótesis alternativa. Para resolver con cual de ellas tendremos que quedamos, en base del análisis de los resultados obtenidos, seguiremos al siguiente procedi miento. a.1.Planteamiento de las hipótesis i) Hipótesis Nula H Q : Los datos muéstrales ajustados a una deter_ minada distribución de probabilidades, efectivamente proviene de ella. ii) Hipótesis alterna H^ : Los datos muéstrales no provienen de la distribución de probabilidades teórica a que se ajustaron a.2.Nivel de Significación : a ( Probabilidad de error ) Nivel de con fianza 1 - a. Si el nivel de confianza es de 0,90, significa "pro bable " 0,95 significa " muy probable "0,99 " altamente probable " a.3. Estadístico a usar k 2 X I (O ,=1 observ. = - e. ) 2 e i donde Ch : frecuencia derivada en la clase iésima e^ : frecuencia esperada en la clase iésirra k : número .de clases, sucesos, intervalos, etc. Ejemplo El ndmero de alumnos por senaria gue sufren algún tipo de accidente, en un gran sector escolar, durante las 36 semanas del período escolar es la siguiente : y N" de alumnos accidentados 0 1 2 3 4 6 8 10 6 6 total N° de semanas frecuencia Los datos anteriores nos indican que el ntinero de accidentes escola res por semana tiene una distribución de Poisson, con una significa ción del 5% ? Solución Las hipótesis a plantearse son : Hq : El número de accidentes escolares por serrana sigue una distribución de Poisson H^ : El número de accidentes escolares semanales no proviene de una distribución de Poisson La distribución de Poisson tiene la siguiente expresión Matemática P (x =k) = k : donde X es la variable aleatoria k = el valor que tema la variable aleatoria A =prcmedio e=constante = 2,71828 .... corro no conoceros A, buscaremos su valor haciendo una estimación basa do en los resultados observados ( muéstrales ) * 0 (6) + 1 (8) + 2 (10) + 4 (6) + 5 6 + 8 + 1 0 + 6 + 6 (6) 82 = 3 6 2,211 s2 99. Procedemos a calcular con este valor X , las probabilidades esperadas, que multiplicadas por el total de semanas, nos entre gan las " frecuencias esperadas " a.4. Región de rechazo R = { X 2 / ' ¿ d b s e x V m > ^crítico 3 4-eC Í7Trr~ — > 2 Buscamos en la tabla de la distribución "X , el valor que llamare 2 mos "Xc r £ t i c o pa^a lo cual debemos conocer " LOS GRADOS DE LI BERTAD " con que estamos trabajando y el nivel de significa - ción a " de nuestra prueba de la hipótesis Hq V = k - 1- m k = número de clases, sucesos, intervalos, etc. m = núnero de parámetros de la distribución a.5. Regla de decisión 2 2 Si X ± ) s > "Orático entonces rechazamos H Q para quedamos con la hipótesis H^, es decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas. O lo que es lo mismo, los datos muéstrales no provienen o no se ajustan a la distribución teórica ( con nivel de significación a ) 2 2 Si "X , < X . entonces no rechazamos H n , es decir, los obs — critico 0 datos maestrales ajustan o provienen de esa distribución ( con de significación a ) (2,28? e" A P, = P (X=0) = 1 2 - 2 8 . e 0 ! OO ' 100. FRECUENCIAS PROBABILIDADES ESPERADAS A P1 A P2 = P (X=0) = = P (X=l) = :_ o: = 1 -2.28 (2.28) e 11 e -7 • = 0,i02284 0.233208 P3 4 = P (X=3) = P5 A A A A A * A A A f.=P, i 1 « 35 = 3.6c f^=P^x3c =9.57 21 A A 0.2658571 = P (X=2) = A f2=P2x3S = 8.4 2 -2.28 (2.287 e A P (2.28)° e~ 2 - 2 8 = P (X=4) = 3 -2.28 (2.28) e 31 4 -2.28 (2.28) e 4! 0.2020514 f,=P.x3ó =7.27 4 4 0.1151653 f5=P5x3ó =4.15 Luego procedgnos a confeccionar la siguiente tabla X FRECUENCIAS OBSERVADA 0 i 6 8 2 3 10 6 4 6 FRECUENCIAS ESPERADA J. 3.63 8.4 9.37 X 1.21 1.46261 C.01905 C.C1932 :.221S6 4.15 C. £24 Luego debemos buscar el punto crítico c el X Determinamos V = k-l-m (O..—J2 / e, Js crítico : grados de libertad k = 5 puesto que hay cincc intervalos m = 1 puesto que la distribución tiene un parl~etrc es ti mado \ Entonces V = k - 1 - m =5-1-1=2 El nivel de significación a = 0.05 2 "X. (a = 0.05) = 7.81 v>=3 Por lo tanto, para decidir la hipótesis cor» que nos cuedarsro 2 2 tenernos que conparar el X ^ ^ con el \ r £ t i c o X2, obsv. =2.55 X2 obsv. = 7.81 2 X, < X obsv. 2 crítico, entonces No rechazamos H Q ; es decir los datos provienen o ajustar. a lana distribución de Poisson, con una significación a = 0.05 2 Desarróllanos otro ejenplo de aplicación de l a X a la prueba de bondad del ajuste. La puntuación final en Matemáticas de 80 estudiantes de eos c sos de cuartos medios de un Liceo, en escala de 0 a 100 pente* se registró en la siguiente tabla INTERVALOS "i 40.5 - 50.5 12 50.5 - 60.5 20 60.5 - 70.5 17 70.5 - 80.5 18 80.5 - 80.5 8 90.5 - 100.5 5 El investigador desea saber si los rendimientos de les curscs es probable que se ajusten a una distribución normal ce prdee bilidades. Esta distribución nos exige conocer dos parámetros; /i = prcmedio de la población 2 G = varianza de la población Ellos son estimados mediante el praredio aritmético X ce 2 muestra y la varianza muestral S respectivamente. la f \ \% tez. En este caso X = 66.125 S = 14.26 La distribución normal de probabilidades tiene cano funciór. ra temática : 1 , — (X - >2 fJi G' f (x, ja,(¡ ) = /TT?" Nosotros no ocuparemos esta expresión algebraica, si no cue con el promedio X y la desviación estandard S obtenidas de los catos recopilados, procedemos a la " estandarización ce los lírai tes reales de los intervalos " lo que nos permitirá calcular las probabilidades esperadas mediante el .manejo de una tabla es tadística llamada : Distribución normal estandard o típica. Ejenplo de estandarización : Z. = límite real del intervalo - X i z = 1 40.5 - 66.125 14.26 = _ 1 8 Construimos la siguiente tabla INTERVALOS REALES ' INTERVALOS ESTANDARIZADOS PROBAS ILID;CIS FESCOCIAS ESPERADAS ES?Z7A2AS 40.5 - 50.5 -1.80 -1.1 C.GS76 50.5 - 60.5 -1.10 -0.39 0.214S 0.214=:-:=:= 1" 60.5 - 70.5 -0.39 0.31 0.2734 0.2-:---.-=:=:: 70.5 - 80.5 0.31 1.01 0.2221 80.5 - 90.5 1.01 1.71 0.1126 90.5 - 100.5 1.71 2.41 0.0356 I 1 Seguidamente colocamos dos columnas, que llevan las frecuencias observadas, frecuencias esperadas y nos permiten calcular X2 observ. i ( Q j - y i*=l e; 103. FRECUENCIAS ESPERADAS 12 8 20 17 0.5294 17 22 1.136-1 18 18 0 8 9 3 5 r - ^ . - s (0, - e,)2 /e. FRECUENCIAS OBSERVADAS . u o 2 0.1111 1.3333 , 2 P°our lo tanto procedemos a determinar el "^• c r £ t i c o conn V = k - l - m = 3 ccoim k = 6 por haber 6 intervalos m = 2 por haber estimado dos parámetros co:n o = 0.1 2 Ett.tonces "X. .. critico QaaoX2u cbserv. = 6.25 =5.11 tfto re-chazamos H Q < "X-2 crítico = 6.25 y podemos decir con una significación a =0.1 ode -que los rendimientos en matemática de los dos cuartos años «Je Liceo siguen una distribución normal de probabilidades. «Otra distribución de probabilidades inportante en el ámbito so • dio educacional es la distribución de probabilidades Bincmial cuya expresión algebraica es : B (X = k ; p; n) = C¡ p k (l-p)n~k terree X variable aleatoria que puede tomar cualquier valor natural emfcre o y n ( 0 < _ k < _ n ) p-: probabilidad de éxito del suceso : ccrrbinaciones de k objetos sobre los n disponibles n: (n-k)! k¡ EEj e r r ó l o C^ J = 51 (5-3)! (5 • 4 • 3)x(2 • 1) 31 — - — (2 • 1) = (3-2-1) 120 = 2x6 10 104. Ejenpio En una población hay 100 familias que tienen cinco hijos cada una. Una investigación es realizada a objeto de saber cuantos hijos varones hay en ellas o los resultados son N°DE HIJOS VARONES (k) FRECUENCIAS OBSERVADAS ( N° DE FAMILIAS ) 0 38 1 144 2 342 3 2C7 4 164 5 25 Nos preguntamos si estos recolectados provienen de una distri_ buciín bincmial. Para poder ajustar a estos datos a una distribución bincmial deberos calcular el prcmedio aritmético X = 2.47 puesto que para este caso X = n p y nos permite estimar "p" A P = X- = n 2.47 5 0.494 que para objeto de nuestros cálcu los lo aproximaremos a p = 0.5 y con el determinar : las ,pro habilidades esperadas y las frecuencias esperadas. Por ejemplo P (>:=2; p=0.5; n=5) = C? (0.5)2 (1-0.5)5"2 "2 120 = 10 (5-2) I 2 1 -6.2 En te roes P (X=2; p=0.5; n=5) = 10 x (0.25) (0.125)= 0.3125 105. N° DE HIJOS V. (k) PROBABILIDADES 0 c5' (0.5)° 0 1 < 2 3 4 5 (0.5)5^ = (l)x(Dx(0.03125) = 0 .03125 0 .03125x1000=31 (0• 5) 1 (0.5)5"1 = 5x(0.5)x(0.0625) = 0 .15625 0 .15625x1000=156 (0• 5) 2 (0.5)5"2 = 10x(0.25)x(0.125) = 0 .3125 0 .3125x1000 = 312 = 10x(0.125)x(0.25) = 0 .3125 0 .3215x1000 = 312 (0• 5) 4 (0.5)5"4 = 5x(0.0625)x(0.5) = 0 .15625 0 .15625x1000= 156 (0• 5) 5 (0.5)5"5 = lx(0.03125)xl 5-3 (0.5) J (0 4 <5 4 FRECUENCIAS ESPERADAS ESPERADAS 0 .03125 0 .03125x1000= 31 Seguidamente procedemos a colocar las columnas FRECUENCIAS OBSERVADA y J FRECUENCIAS ESPERADAS (0¿ - e±)2/e± 38 31 1.5806 144 156 0.9231 342 312 2.8846 287 312 2.0032 164 156 0.4203 25 31 1.1613 el Y 2 , observ. = 8.9631 2 Seguidamente determinamos el "X-cr£tico V= k - 1 -m = 4 puesto que k = 6 intervalos m = 1, por haber estimado un parámetro y con a = 0.1 = 7.78 critico 2 La regla de decisión la obtenemos al conparar \ , b s e r v crítico e l 106. Corra "X2, observ. = 8 . 9 5 > "X2 critico = 7.78 Rechazaros H^, en favor de H^, es decir los datos muéstrales no provienen de una distribución bincmial con un nivel de sic[ nificación a = 0.1 2 Sin erbargo si a = 0.05 y 9= 4, el \-j-ftico = 9.49 y en es te caso no rechazamos Hq, y debemos concluir, que con ese nivel de significación, los datos maestrales nos indicarían que el núrrero de hijos varones en familias de cinco hijos se ajusta a una distribución bincmial. ?) Intervalo de confianza (1-cQ para la varianza de la pcfolación Es mjy importante determinar un intervalo de confianza para la varían za ce la población cuando se tiene una muestra de " n eleirentos " de dicha población. La teoría de Inferencia Estadística nos señala que (X¿-X)2 I a i=l C G2 además I S2= (xi (n-1) - X) 2 ^ L y (x. - x)2 S 2 i=l = n - 1 ?cr lo tanto (X.. - X)' \ i=l ~ (T '(n-1) X (n-1) 107. En una tabla X 2 y con %> = n - 1 grados de libertad, determinamos pun y en el intervalo de confianza 1 - a para d es o tanbién (n-1) a 2 S b (n-1) < i o »2 S a Cuando el tamaño de la muestra es grande, ambas expresiones anteriores tienden a coincidir Ejenplo 2 En una muestra de 10 observaciones se encuentra que la varianza S es 2 igual a 15. Hallar los límites de confianza del 90% para (T Desarrollo 2 En una tabla X ubicamos la línea para determinar "a" y "b" y el intervalo pedido es V = n-1 = 9 grados de libertad 108. c) Contraste de hipótesis respecto de una sola varianza Supóngase que interese determinar si una varianza de población ha cam biado con el tierpo, o si la varianza de una distribución es diferente de cierto valor fijado. Para este fin, se contrasta la hipótesis de nulidad H0 : tf2 6l = 2 (J"Q es la varianza conocida o algún valor hipotético. conde La hipótesis H^ depende del problema que se considere. 2 Si X es una variable aleatoria que se distribuye Normal { p ; G ) y si 2 una muestra de tamaño n d§ X de una varianza S , entonces dado el ni vel ce significación, el estadígrafo de contraste es 2 n 2 2 rasuren : Contraste de H Q : (f = (TQ o 0011 2 H., cuando X ( p, N <J ) y n ( X i - X ) I i=l 2 1 n H Regla de decisión : Rechazar Hq si donde a nivel a y 1 cr > s 0 < al n r n i, ^ s 2 s 2 - -> Cr - Y 1 < (T- 2 U 6 2 C - 2 \) = n-1 2 ( v 1 , 1—a^ X2 *(>>,a) 0 n s 2 a u o > i c o tairtoién c 3 = 2 n S * u o cx/2) * n - S -v^ ( y ; l-a/2) 1 c.jenplo Aplicado Se desea determinar si la varianza de los I.Q de los estu¿ié--.^£s cierto distrito escolar es mayor que 250. Una muestra aleatoria d= a. ' estudiantes del distrito de una vananza de 2/5. Contrastar la hiD tesis de que la varianza de los I.Q se mantiene en 250 al r¿v=l ¿el ' Desarrollo - Las hipótesis a contrastar o prcbar son : H Q : (J"l= 250 v/s Hx (JZ > 250 : - Determinamos el valor del Estadígrafo de contXcis ts "Y2 obsrev. = 0 _ ¿ X - leemos en tabla"X 2 ( i ) = 2 obsrv. 29. 9 5 % ) = 3 0 = X = 2 7 5 = ^ ^ - Decisión : 2 cctiD"X.". cbsrv. = 33 < C,= i 42.6 entonces No rechazamos Hg, es decir, los resultados muéstrales nos dican que se mantiene en 250 la varianza poblacional del I.Q ¿= 1 estudiantes. c.- Contraste de Independencia Esta prueba permite al investigador determinar si existe asociarlo., tre dos variables con escala de medición Nominal u Ordinal. Frecuentemente se encuentran problemas que exigen una " clasificadoble ", o " bidimensional " de los datos observados, cereral-er.t= en tablas llamadas de " doble entrada ", y se desea analizar si te algún tipo de relación entre las eos variables. Supongamos que se tienen "n" observaciones que se distribuya.-, cor.;' tamente oon respecto a dos variables C y R; cada una de las reales se clasifica en varias categorias, clases o intervalos. Sean C^, C^r Sean r^, r^, C^ r fc las k clases de variable C las t clases ce Variables R Las variables C y R son mutuamente excluyen tes. Cada observación representa la ocurrencia de un suceso coniur.zo ( r i , C_j ) con i = 1, 2, ..., t j = 1, 2, k La muestra de n observaciones puede entonces estar distribuida en C x R casilla, de la siguiente manera 110. e R C 1 • C2 r l f ll f 12 .... - r 2 f 21 f 22 .... r. i f il - r f tl t TOTAL f f• 1 D f lj f . 2 ' TOTAL f lk f l- f 22 f 2k f 2- f f ik ' f. i* ij f t2 Se C f tj n f.k f'3 f donde f^ : frecuencia con que ha ocurrido él suceso conjunto (r^, C^) f j : frecuencia con que ha ocurrido el duceso Debemos calcular a partir de la tabla anterior las frecuencias espera das : A f A f. . ID = (f '1 .) (f, ) i = 1 j = 1 t k La metodología a usar para el contraste de Independencia es la siguien te i) Planteamiento de las hipótesis Hq : No hay asociación (correlación) entre ambas variables H^ : Existe asociación entre ambas variables ii) Determinar nivel de significación con que se va a trabajar iii) Determinar los grados de libertad V = (t-1) • (k-1) iv) Estadístico a usar A observ. i i j=l J i=l (f„ f. . ¿O v) Región de Rechazo R = { X2 / X ^ > X 2 (1-a) 1 observ. (t_1} (k_1} 2 111. Eje.Tplo Supóngase que se desea averiguar si hay alguna asociación significati va entre el nivel de formación académica y rendimiento laboral para un -crupo de 200 empleados.' El nivel de formación académica se clasifica en tres clases : Escuela Básica, Escuela Media, Escuela de Especialización. El rendimiento en el trabajo (laboral) se clasifica como : excelente bueno, regular. Los datos son los siguientes FORMACION ACADEMICA RENDIMIENTO ESCUELA BASICA ESCUELA MEDIA ESCUELA DE ESPECIALIZ. TOTAL EXCELENTE 10 40 10 60 BUENO 30 30 20 80 REGULAR 10 30 20 60 TOTAL 50 100 50 200 Desarrollo Deberos de inmediato calcular las frecuencias esperadas f _ . En es te caso 1 = 1, 2, 3 f. 1 = excelente y Esc. Básica = j = 1, 2, 3 f •1 x n f 1» = 50x60 _ 15 200 112. TABLAS DE FRECUENCIAS ESPERADAS FORMACION ACADEMICA RAIMIENTO ESCUELA MEDIA ESCUELA BASICA 100 x 60 _ 50 x 60 _ EíCZLEMTE 50 X 60 _ 3Q 200 200 50 x 80 _ 50 x 50 w 200 50 x 60 _ 50 x 60 _ 200 200 Cero el estadístico a usar es XObserve. = = 2Q 200 100 x 60 _ 15 15 200 100 x 80 _ OQ 200 P3GULAR ESCUELA DE ESPECIALIZ 15 200 l I A ( f.. - f.. )• j=l i=l JQ A f. . JQ JO entonces procedemos a calcular su valor X 2 ooserve. = —(10— 2 -—15) — 15 A •f (20 - 20)2 - 30)2 +. (10 - 15)' 45 30 (30 - 20)2 (10 - 15)2 +. (30 - 30)' 30 15 (20 - 15)' (40 -f-. •-. -fA 20 + 20 15 Fijando un nivel de significación del 1% , o lo que es lo mismo, un 99/¡de confianza ; y V = í 3 " 1 ) t 3 " 1 ) = 4 g.l. " X c r £ t i c o = 13,3 Nuestra decisión debe ser la de rechazar Hq ; puesto que = 17.5 > X 2 . = 13.3 ccservc. critico Es cecir, existe asociación entre antes variables, lo que implicaría que la formación académica y el rendimiento laboral está relacionado. Observación 1 Poínos también llegar a calcular un coeficiente de correlación (r) dado que la categorización o niveles en que fueron medidas las varia bles son atributos y además es una tabla cuadrada de k x k o tanbién t x t, (30-40)2 40 = 17.5 1 "observe. r f N I N => (k - 1) => r 17.5 = 200 (3 - 1) = 0,20 32 r = 20,92% y además, sierrpre para este tipo de tablas ce asociaciír. C <_ r ^ Por lo tanto, r : se denomina correlación ce atributos. Observación 2 Cuando la tabla bidimsnsional o de contingencia, etc. tiene ¿ios f y dos columnas ( k = t = 2 ) y presenta la siguiente estru—ura I II A 3 1 a 2 NA B b l b 2 n N 1 TOTALES para calcular el ^ TOTAL N2 E N 2 "Xobserve. , , debe utilizarse una f£—üa esre~ que contenpla una corrección llanada corrección de Y ates 2 observe, corregido = N ( ialb2 - a 2 b J N 1N2 N - I N )2 AN3 Ejemplo El número de estudiantes de cada una de dos clases A y £ que =rrt reprobó un examen determinado es el siguiente APROBARON CLASE A 72 CLASE B 64 Mediante un nivel de significación a = 0.05 ensaye la hipótesis no hay diferencia entre las dos clases Desarrollo Las hipótesis que se plantean para ensayar son HQ : No hay diferencias significativas entre las dos c H^ : Existen diferencias significativas 2 Calcúlanos el "^jjggj^ °° n I a corrección de Yates N x = 72+64 = 136 N 2 = 17 + 2 3 = 40 N- = 72 + 17 = 89 N_ B = 64 + 2 3 = 87 A - a2b^ | = | 72 23 - 17 64 1568 i = 568 _ X 176 ( 568 - i 176)2 i = 2 = observ. corr 136x40x89x87 2 Determinamos X 2 (1 V =1 Y a a = 0,05 y V = (2 - 1) (2 a) = 3.84 ^observ. * °'9627 < Crítico = 3 "84 No podemos rechazar H Q El coeficiente de correlación de atributos es r = {¡ °'9627 176(2 - 1) = 0.0523 ~ 5,23% o AI'L : NIJK'I:.S A p é n d i c e I PERCENTILES D E LA DISTRIBUCION CHI-CUADRADO C O N V G R A D O S DE LIBERTAD (AREA SOMBREADA = p ) r Xo.995 Xo.99 Xo.nt XO.90 x s V1 /o.Ti ;¡ /0.30 v2 /0.25 7.0.10 .,1 ¿0,03 Zo.112 3 Zu.o i- /'I.OH5 3.84 2.71 5.99 4.61 7.81 , 6.25 9.49 7,78 1.32 2.77 4,11 5,39 0.455 1.39 2.37 3,36 0,102 0,575 1.21 1,92 0,0158 0.211 0.584 1,06 0,0039 0.103 0.352 0,711 0.0010 (1.0506 0.216 (1.4 84 0.0002 0.0201 0.115 0.2V7 0.0000 0.0100 0.072 (1.2U7 11.1 12.6 14.1 15.5 16,9 9.24 10,6 12.0 13.4 . 14,7 6.63 7.84 9.04 10.2 11,4 4.35 5.35 6.35 7.34 8.34 2.67 3.45 4.25 5.07 5.90 1.61 2,20 2.83 3.49 4,17 1.15 1.64 2.17. 2.73 3.33 0.K3I 1.24 1 .69 2.18 2.70 0.554 0.872 1.24 1.65 2.09 0.412 0.676 0.989 1.34 1,73 20.5 21.9 23.3 24,7 26,1 18.3 19.7 21,0 22.4 23,7 16,0 17.3 18,5 19.8 21.1 12.5 13.7 14.8 16.0 17,1 9.34 10.3 11,3 12.3 13,3 6,74 7.58 8.44 9,30 10,2 4.87 5,58 6.30 7,04 7,79 3.94 4.57 5.23 5,89 6.57 3.25 3.82 4.40 5.0! 5.63 2,56 3.05 3,57 4.11 4.66 2.16 2.60 3.07 3.57 4.07 30,6 32,0 33.4 34,8 36,2 27.5 28.8 30,2 ' 31.5 32,9 25,0 26.3 27,6 28,9 30,1 22,3 23.5 24.8 26.0 27,2 18,2 19,4 20,5 21.6 22.7 14,3 15.3 16.3 17,3 18.3 11,0 11.9 12,8 13,7 14,6 8,55 9,31 10.1 . 10.9 11,7 7.26 7,96 8.67 9.39 10,1 6.26 6,91 7.56 8,23 8.91 5.23 5,81 6,41 7.01 7.63 4.60 5.14 5.70 6.26 6.84 40.0 41,4 42.8 44,2 45,6 37,6 38,9 40.3 41,6 43,0 34,2 35.5 36.8 38.1 39,4 31.4 32.7 33,9 35,2 36,4 28.4 29,6 30.8 32.0 33.2 23.8 24,9 26,0 27.1 28.2 19.3 20.3 21.3 22.3 23.3 15,5 16.3 17,2 18.1 19.0 12.4 13,2 14.0 14.8 15,7 10,9 11,6 12.3 13.1 13.8 9.59 10.3 11,0 11.7 12.4 8.26 . 8,90 9,54 10.2 10,9 25 26 27 28 29 46,9 48,3 49,6 51,0 52,3 44,3 45,6 47.0 48,3 49.6 40,6 41.9 43.2 44.5 45,7 37.7 38,9 40,1 41,3 42.6 34,4 35.6 36,7 37,9 39.1 29.3 30,4 31.5 32,6 33,7 24.3 25.3 26.3 27,3 28.3 19.9 20.8 21.7 22.7 33.6 16.5 17.3 18.1 18,9 19.8 14.6 15.4 16.2 16.9 17,7 13,1 13.8 14,6 15,3 16.0 11.5 12.2 12.9 13.6 14,3 10.5 11.2 ll.R 12.5 13.1 30 40 50 60 53,7 66.8 79.5 92,0 50.9 63,7 76,2 88,4 47.0 59,3 71,4 83,3 40,3 43,8 55,8 51,8 67,5 63.2 79,1 ' 74,4 34,8 45,6 56.3 67,0 29.3 39,3 49,3 59.3 24.5 33.7 42.9 52.3 20,6 29,1 37.7 46,5 18.5 26.5 34.8 43,2 16.8 24.4 32.4 40.5 15.0 22,2 29.7 37.5 13.8 20.7 28.0 35.5 70 80 90 100 104,2 166,3 128,3 140,2 100,4 112,3 124.1 135,8 95,0 106,6 U8;l 129,6 77,6 88,1 98,6 109,1 69.3 79.3 89.3 99.3 61,7 71.1 80.6 90,1 55,3 64.3 73.3 82,4 51.7 60.4 69.1 77.9 48.8 57.2 65.6 74.2 45.4 53.5 61.8 70.1 43.3 51.2 59.2 67.3 7.88 10.6 12.8 14.9 6,63 9.21 11.3 13,3 16.7 18.5 20.3 22.0 23.6 15.1 16.8 18.5 20.1 21,7 12.R 14.4 16.0 •17.5 19,0 10 11 ' 12 13 14 25.2 26,8 28.3 29,8 31.3 23,2 24,7 26,2 27.7 29.1 15 16 17 18 19 32.8 34,3 35.7 37.2 38,6 20 21 . 22 ' 23 24 i 2 3 4 6 6 7 8 9 * ' 7 5.02 7.38 9,35 11,1 90.5 101,9 113.1 124,3 85.5 96,6 107,6 118.5 P r o c e d e n c i a : Cntherinc M . T l i o m p * o n . Table <>/ p c r c c n t i i g c pnims u f th,• j r iIími í/iiiiíuii. nictrika, V o l . 32 (1941). c o n permiso de los ¡mUircs y editores. Hio- 7.43 • 8.03 8.64 9.26 9.89 l'I.NIl JlfllS Apéndice II L'IÍRCENTILT!S {(„) DE LA D I S T R I B U C I O N I DE S T U D E N T C O N V G R A D O S DE LIBERTAD ( A R E A S O M B R E A D A = ¡>) y 'li.M s 'o.vv 'g.»lJ i 2 :i 63,66 9.92 5.K4 4,60 31,82 6,96 4,54 3.75 12.71 4.30 3.IK 2,78 6.31 2.92 2.35 2.13 3,08 1.89 1.64 1.53 1,376 1.061 0.978 0.941 1,000 0.816 (l.7f.5 0.741 0.727 0.617 0.584 0,569 0,125 0.2X9 0.277 0.271 0,158 (1.142 0.137 0.134- 5 (i 7 8 y 4.03 3,71 3.50 3.36 3.25 3.36 3.14 3.00 2.90 2.82 2.57 2.45 2.36 2.31 2.26 2.02 1,94 1,90 1.861,83 1.48 1.44 1,42 1,40 1.38 0.920 (1.906 0.896 o,i;X'.! 0,883 0,727 0.718 0.703 0,559 0.553 0.549 0,546 0,543 0,267 0.265 0.263 0.262 0,261 0,132 0.131 0.130 0.(30 0,129 10 11 ía 13 14 3.17 3.11 3,06 3.01 2,98 2.76 2.72 . 2.68 2,65 2,62 2.23 2.20 2.18 2,16 2.14 1.81 1,80 1.78 1,77 1,76 1.37 1,36 1.36 1.35 1.34 0.X79 0.876 0.873 0,870 0.H68 0.700 0.697 0.695 0.694 0,692 0.542 0.540 0,539 0,538 0,537 0.260 0.260 0.259 (1.259 0,258 0,129 0.129 0.128 0.128 0.128 15 10 17 18 1U 2,95 2.92 2.90 2,88 2,86 2.60 , 2.58 2,57 2.55 2,54 2.13 2.12 2,11 2.10 2,09 1.75 1.75 1,74 1.73 1,73 1.34 1,34 1.33 1.33 1.33 0.866 0.865 0.863 0.862 0.861 0.691 0.690 0.689 0.688 0.688 0,536 0,535 0.534 0,534 0.533 0.258 0.258 0,257 0.257 0.257 0.128 0.128 0.128 0.Í27 0,127 20 21 22 23 2-1 2,84 2.83 2.82 2.81 2,80 2,53 2,52 2.51 2.50 2.4') 2.09 2.08 2.07 2.07 2.06 1,72 1.72 1,72 1,71 1.71 1.32 1.32 1.32 1.32 1.32 0.860 0.859 0.858 0.858 0,857 0.687 0,686 0,686 0.685 0,685 0.533 0,532 0,532 0,532 0.531 0.257 0.257 0.256 0.256 0.256 0.127 0.127 0.127 0,127 0.127 25 20 27 28 2a 2.79 2.78 2,77 2.76 2.76 2,48 2.48 2.47 2,47 2.46 2.06 2,06 2.05 2.05 2.04 1,71 1.71 1,70 1.70 . 1,70 1.32 1.32 1.31 1,31 1,31 0,856 0.856 0.855 0.855 0,854 0.684 0,684 0,684 0,683 0,683 0,531 0.531 0,531 0.530 0,530 0.256 0.256 0.256 0.256 0,256 (1.127 0.127 0.127 0.127 0,127 30 40 CU 120 «L 2.75 2,70 2.60 2.02 2.58 2,46 2.42 2,39 2,36 2.33 2.04 2.02 2.00 1,98 1,96 1.31 1,30' 1.30 1.29 1,28 0,854 • 0,851 0.848 0.845 0.842 0.683 0.681 0,679 0,677 0,674 0.530 0.52'J 0.527 0.526 0,524 0.256 0,255 0,25-t 0.254 0.253 0.127 0.120 0.126 0.126 0,126 PraceJí'iieiíi: 'o.i j 1.70 1.6X 1.67 1.66 1,645 U.711 U.'iCi ."i R . A . l i s l i e r y F . Y n i c s . S t n i i u i c u l Tuhh-s j o r llinloníml, Agricultural u n j Metliiul Kcseun/t (5." edición), T a b l a III. ü l i v c r and B o y d L i d . , l i d i m b u i g u , con permiso de los autores y editores. Apéndice ]ff TABLA I. /Valores de la fundón distribución normal estándar* <D(z) = f 0 -3.0 —2.9 -2.8 -2.7 —2.6 -2.5 —2.4 -23 22 —2.1 —2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.3 -1.2 -l.l -1.0 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 -0.0 1 •> — L = e ' " ' 1 2 du = P(Z ¿ 2) 3 4 5 6 7 8 9 0.0013 0.0010 0.0007 0.0005 0.0003 0.0002 0.0002 0.0001 0.0001 0.0000 ¡| 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 j 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 ¡¡ 0.0035 0.0034 0.0933 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 j 0.004" 0.0045 0.0044 0.0043 0.0041 O.OÍWO 0.0U39 0.003S 0.0037 ¡ 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.00,9 ¡ O.OOS2 0.0050 0.007S 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0107 0.0 IW 0.0102 0.0099 0.0096 0.0094 0.0091 O.OOS9 0.0087 0.0139 0.0156 0.0132 0.0129 -0.0126 0.0122 0.0119 0.0116 0.0113 0.0179 0.0174 0.0170 0.0166 0.0162 0.0I5S 0.0154 0.0150 0.0146 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0,0197 0.0192 0.0188 ! 0.0287 0.02S1 0.0274 0.026S 0.0262 0.0256 0.0250 0.0244 0.0238 5 0.0359 0.0352 0.0344 0.0335 0.0329 0.0322 0.0314 0.0307 0.0300 ¡ 0.0446 0.0456 0.042 7 0.04ÍS o.a: 09 0.0401 0.0392 0.03S4 0.0375 ¡ 0.0543 0.0537 0.0526 0.0516 0.0505 0.0495 O.OJS5 0.0475 0.0465 | 0.0668 0.0555 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0570 O.OSOS 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0968 0.0951 0.0934 0.0918 0.0901 0.0SS5 0.0S69 0.0Í53 O.OS58 0.1151 0.113.1 0.1112 0.1093 0.1075 0. J 056 0.1038 0.1020 0.1003 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1S4I 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.2119 0j090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1 S94 0.2420 0.2389 0.23 5S 0.2327 0.2297 0.2266 0.2236 0.2206 0—177 0.2743 0.2/09 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.24S3 0.3085 0.3050 0.3015 0.29SI 0.2946 0.2912 0.2S77 0.2843 0.2SI0 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.322S 0.3192 0.3156 0.5821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0_JS97 0.4602 0.4562 0.4522 0.44S3 0.4443 0.4404 0.4364 0.4325 0.4286 0.5000 0.4960 0.4920 0.4SS0 0.4340 0.4801 0.4761 0.4721 0.46SI • B. W. Lindgren. Stalisiical Throiy. New York: The Macmillan Co„ 1960. 0.0014 0.0019 0.0026 0,0036 0.004S 0.0064 0.0084 0.0110 0.0143 0.0183 0.0233 0.0294 0.0367 0.045J 0.0559 0.0681 0.0823 0.0985 0.1170 0.1379 0.I6II 0.1867 0.2148 0.2451 0.2776 0.3121 0,3483 0.3859 0.4247 0.4641 TABLA 1. 4>(z) = f ' (Continuación) — L e - ' ' 1 2 du = P(Z J-®v/2 n 2 3 0.50S0 0.5478 0.5871 0.6255 0.66Í8 0.6985 0.7324 0.764: 0.7939 0.8212 0.8461 0.S6S6 0.SSS8 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9S30 0.9S6S 0.9S98 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.84S5 0.8708 0.8907 O.90S2 0.9236 0.9370 0.94S4 0.9582 0.9664 0.9732 0.9788 0.9S34 0.9S71 ¿ 2) : 0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 O.S 0.9 1.0 l.l 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2,9 0.5000 0.5598 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7S8I 0.8159 0.8413 0.SM3 0.SS49 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9S6I 0.9Í93 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 3, 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000 2.1 1 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.S665 0.8S69 0.9049 0.9207 0.9345 0.9463 0.9564 0.9648 0.9719 0.9778 0.9826 0.9S64 C.9S96 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9901 0.9925 0.9943 0.9957 0.996S 0.9977 0.99S3 4 5 0.5160 0.5199 0.5557 0.55°5 0.5948 0.5987 0.6331 0.6368 0.6700 0.6736 0.7054 0.70S8 0.7389 0.7422 0.7703 0.7734 0.7995 0.S023 0.8264 0.8289 0.850S 0.8531 O.S 729 0.8749 O.S925 0.S944 0.9099 0.9115 0.9251 0.9265 0.9382 0.9394 0.9495 0.9505 0.9591 0.9599 0.9671 0.9678 0.9738 0.9744 0.9793 0.979S 0.9S3S 0.9842 0.9874 0.9S78 0.9904 0.9906 0.9927 0.9929 0.9945 0.9946 0.9959 0.9960 0.9969 0.9970 0.9977 0.9978 0.9984 0.9984 6 0.5239 0.5636 0.6026 0.6406 0.6772 0.712) 0.7454 0.7764 0.8051 O.S315 0.S554 0.6770 0.S962 0.9131 0.9278 0.9J06 0.9515 0.9608 0.9686 0.9750 0.9S03 0.9546 0.9S8I 0.9909 0.9931 0.994S 0.9961 0,9971 0.9979 019985 7 8 0.5279 0.5319 0.5675 0.5714 0.6064 0.6103 0.6443 0,6480 0.6808 0.6844 0.7157 0.7190 0.7486 0.7517 0.7794 0.7S25 0.8078 0.8106 O.S 340 0.8365 0.8577 O.ÍJ99 0.8790 0.S8I0 0.8950 0.8997 0.9147 0.9162 0.9292 0.9306 0.941S 0.9430 0.9525 0.9535 0.9616 0.9625 0.9693 0.9700 0.9756 0.9762 0.9S08 0.9SI2 0.9S50 0.9S5-1 0.9SS4 0.9SS7 0.9911 0.9913 0.9932 0.9934 0.9949 0.9951 0,9962 0.9963 0.9972 0.9973 0.9979 0.99S0 0.9985 0.9986 9 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7S52 0.8133 0.S3S9 O.Í62I 0.8530 0,9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9SI7 0.9857 0.9S90 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 UNIVERSIDAD DE ANTOFAGASTA FACULTAD DE CIENCIAS BASICAS FACULTAD DE INGENIERIA /r i :-: :-:-: : :-:-: :-:-: : : : :-: TALLER DE APLICACION DE LAS TECNICAS. DÉ CONTROL DE CALIDAD •' • SR- MAGISTER RENE MALUENDA M." ANTOFAGASTA - CHILE PARA EMPEZAR Cuando te preparas para ir de viaje a una ciudad que no conoces, empiezas mirando mapas y libros. Así determinas la mejor forma de llegar a la ciudad, qué posibilidades de clientes hay en ella, quiénes son las personas en cada una de las empresas que puedan pasar a formar parte de la clientela, y la mejor manera de salir de la ciudad. Prepararse para usar STATGRAPHICS no se diferencia de prepararse para un viaje de negocios. Tienes que aprender : - dónde están las teclas en el teclado del ordenador que uses con STATGRAPHICS. - cómo poner en marcha STATGRAPHICS. - cómo están organizados STATGRAPHICS. - cómo tener STATGRAPHICS. los diferentes medios estadísticos de acceso a los muchos medios estadísticos que ofrece - cómo se comunica contigo STATGRAPHICS. - cómo usar variables y ficheros para almacenar ios datos de STATGRAPHICS. - cómo salir de STATGRAPHICS. Este capítulo te explica todo esto con detalle para que puedas dar los pasos básicos necesarios para usar STATGRAPHICS. EL TECLADO BEL ORDENADOS. Incluso para poder hacer las operaciones más sencillas en STATGRAPHICS, necesitas saber algo sobre algunas teclas importantes en eltecladodel ordenador (por ejemplo, la tecla ENTER, las teclas de función, y ias teclas de control del cursor)- lo que hacen y dónde se encuentran. Las figuras 2-1, 2-2, y 2-3 muestran tres de lostecladosmás comunes e indican la posición de estas teclas importantes. 1 Tecla Backspace (Retroceso) r—Tecla Enicr (Entrada; Teda Tab ¡Tabulación — Tocia Esc (Escapoi — lóelas do función — 11 1 r 1 1 Teclas para control 1 1 1 I 1 1 1 1 1 1 III Toda Cirl (Control) Teda Ail (Allomo) —1 1 Barra . espadadora 1 11 1 I L-Tecla Deletc (Bonrar) Tecla End (Finí —Tocia Home (Casa) Tecla de — mayúsculas Figura 2-1. Teclado del ordenador personal de IBM 1 • Tecla Enter (Entrada) (—Tecla Esc (Escape) -Teclas para control del cursor Tecla Backspace (Reiroceso) • Tocia 'lab (Tabulador) — Teclas de—, función I 1J i | • n n n n r r D i fech de mayúsculas Tecla Ctrl (Control) Tecla Alt(Alicmo)—1 C C ! »i i «i i 1 • | : 1 i| i ¡Ii II r I Tocia de mayúsculas_J Barra espadadora —' Figura 2-2. Teclado del IBM PC AT I L Tecla Delcte(Borrar) Tecla End (Fin) L-Tccla Home (Casa) Tecla Tab (Tabulador) Tecla Esc —, (Escape) | Teclas de función 11 1 1 '1 1 r- Tecla Backspace (Reiroceso) |—Tecla Home (Casa) 1 •• •••• ••[ 'II 1 1 lll» 1 1 1 1 • • • • • • • • • • • • • r n M 1 • • • • • • • • • • • c z i ,1 11 IIII1IIIIIIIIII Tecla de J mayúsculas Tecla Ctrl (Control) 1 1 Barra -J espadadora 1 1 1 1 1 11 1 1 II I I . 1 ll 1 1 " T Tfccla de —' mayúsculas Tecla Ctrl(Control) Tecla Alt (Alterno) — Figura 2-3. Teclado de 101 teclas U 1i ^—Teclas para control del cursor •Tecla End (Fin) •Tecla Delete (Borrar) En esta guía (y, sobre todo, en este capítulo), aprenderás lo que hacen estas teclas importantes. Pero hasta que te hayas familiarizado con su posición, pon una marca en esta sección para que puedas volver a ella cuando te haga falta.' Ahora estás listo para poner en marcha STATGRAPHICS. PUESTA ER MARCEA DE STATGRAPHICS. Hay tres pasos sencillos que dar para poner en marcha STATGRAPHICS. Pero, antes de darlos, tienes que saber el nombre del directorio (una zona en el disco del ordenador) donde se encuentran los ficheros de sistema de STATGRAPHICS. Si no estás familiarizado con el ordenador y con los mandos de DOS (Sistema Operativo de disco) usados en el ordenador, pídele a un amigo o a un compañero de trabajo que te ayude a determinar el nombre del directorio de STATGRAPHICS y a poner en marcha STATGRAPHICS. 1.- De ser necesario, enciende el ordenador y todo el equipo que tengas conectado a él (la impresora, por ejemplo). 2- Cuando el ordenador esté listo para empezar a trabajar, verás en la pantalla un indicador de DOS (que generalmente es C: ). Tienes que ir a la zona del disco (el directorio) donde se encuentran los ficheros de sistema de STATGRAPHICS. Para ir a un directorio, se escribe CD (cambio de directorio) seguido de la barra inclinada invertida, y del nombre del directorio, y luego se pulsa la tecla Enter. ( La tecla Enter se usa, para indicarle al ordenador que ya se ha terminado de escribir la información). Por ejemplo: para ir a un directorio llamado STATG, escribe CB STATG al aparecer el indicador de DOS. C : CD STATG. y luego pulsa la tecla Enter. 3.- Cuando el ordenador muestre el próximo indicador de DOS (C: STATG > en este ejemplo), escribe STATGRAF C : STATG > STATGRAF 5 7 pulsa la tecla Enter para poner en marcha STATGRAPHICS. Después de esos tres pasos, en seguida STATGRAPHICS presenta en la pantalla varias líneas explicativas (la primera línea, "Loading STATGRAPHICS...", indica que se está cargando el programa). Luego, STATGRAPHICS presenta una serie de mensajes en la pantalla. Primero se ve el "indicador de derechos de propiedad" con detalles sobre el sistema de STATGRAPHICS en uso, tal como se muestra en la Figura 2-4 (Si tu pantalla puede mostrar colores (sí tienes un monitor de color), el indicador de derechos de propiedad empezará con un color 7 cambiará a varios colores después de unos momentos). Figura 2-4. Indicador de derechos de propiedad de STATGRAPHICS Luego se ve un mensaje, como en la Figura 2-5 , diciendo que STATGRAPHICS está leyendo el directorio de datos. Esto significa solamente que STATGRAPHICS está preparando unos datos que hemos incluido para usarlos durante las prácticas con STATGRAPHICS. ^ r STATGRAPHICS in R«a4lnj SIAICAAfHICS 'dat» 'il lr»ctory * * ; rl«a«« wiit. - |j ~. • •• -.i»—- •> w-:. Sartal U . n i . n : S.a hunbtr: 1Z34S CopyrljM 138S-1SÍ1 SIÍC. !»«. an4 tlallalleal Craphlca Carp.r.tIon. Lic."1.1 t.rtw.r.: All rljKta roaarvod. IMautKarlaaí rrproduct»on oí m i l i.flw.r. la f r > M ) l t > < and vl.l.l.» U.S. CopyrljhL L>ui. CrapMca i r l v » r » ara praprtatary praducta af Craphlo latinar. tyalana, Inc. SIAtCIAPHICS U • rajlalarad Irada-ark «f SUtlatlcal Craphlca Cerp. S*»l«n I M U i l l l I n j . Muí» patltnt. I M s utll t»k» « f«" xonant». Figura 2-5. Mensaje de Lectura de datos del directorio de STATGRAPHICS Por fin, aparece la pantalla (presentación de información que llena la pantalla del ordenador) llamada Menú principal, que se muestra en la Figura 2-6. STATCRAPHICI ílalUtlc.t C r a p M c a SyctrDATA A. i. C. B. nOMCEnENI Ai«S S V S I W ITII Lililí Data *P.^na je-»cnt S^aCan Cfwlrarwant J t » p e r t Urjtor and C r a ^ M c s 'aplay Crapr.tca «Urtbvita» lint L. ti. H. 0. SERIES moccounts Foracaat Ir.j Ouallty Control SnootMn; lina Sarlat Analycli rtoniMC bmo otscicriut siAriirics t. Plottlnj í«ntlll«t T. Dazerlptlve r.«thod« C. Eitl-tllon Tallin, H. DitIr 1button F-jnctlona C. I aratory Data Anal^ata AOVAKCtO FROCIDURÍS O.0VA Í«J RÍCRESÍlCM OKOLVSIS J. Apaléala ai Carlanca K. Ra.ratalori C^líttf I I nATHEnftJ J C AL nnD USCS PROC EDURES U. natKa-attcal TuncClona U. Haerott and 'Jaer f'Jncllcre r P. O. R. S. I. Calador leal Data Analista nultlvarla'.a nalho¿« KonparanaIr 1c nalhodc Sanpltn; Exparlnanlftl D.xtjn .-ijeo' cur asr * kay a * te' hl jhi I jh t ~da a 1 r ad "aaol t on.' I h a n ' p r m CttIEft. Z l i W S SSavacr Ifrt.er S -'J^TZi ?Uara ' I OCnd ' 9C.vtca XBQglt? jrfOIJ'" ~ Figura 2-6. Dlaplat, Menú principal de STATGRAPHiCS 7 Como verás en seguida, el Menú principal facilita el acceso a los instrumentos estadísticos ofrecidos por STATGRAPHICS. Pero antes tienes que enterarte de una zona muy especial en las pantallas de STATGRAPHICS - la línea de estado. LA LINEA DE ESTADO Mira las tres últimas líneas del Menú principal que se muestra en la Figura 2-6. Estas tres líneas, juntas, forman la línea de estado. Excepto en los casos en que se esté mostrando una gráfica, siempre verás la línea de estado al final de la pantalla. Aunque la línea de estado da mucha información, hay tres zonas que debes observar de cerca en esta guía : la primera línea, la del medio y los extremos de la última línea. STATGRAPHICS usa la primera línea para mostrar instrucciones, información, y mensajes sobre errores. Por ejemplo : la primera línea de la línea de estado en la Figura 2-6 dice: "Usa las teclas del cursor para seleccionar la sección deseada". Luego pulsa ENTER. En este caso STATGRAPHICS dice cómo usar el Menú principal, sobre lo que aprenderás más en la sección siguiente. STATGRAPHICS usa la última línea para informar sobre siete aspectos diferentes. Pero hay dos zonas especiales que debes vigilar durante tu trabajo con la guía : los extremos derecho e izquierdo de la última línea. Como se ve en la Figura 2-6 , el extremo izquierdo de la última línea dice : ÍNPUT STATGRAPHICS usa esta zona de la línea de estado para decirte lo que está haciendo el sistema. Cuando STATGRAPHICS muestra la palabra INPUT en esta zona, el sistema está esperando a que tú le digas lo que quieres hacer. Cuando STATGRAPHICS muestra la palabra PROCESS en esta zona, el sistema está haciendo lo que tú le hayas dicho que haga. Conforme vayas por la guía verás que STATGRAPHICS muestra, por lo menos, otra palabra en este zona. Fíjate con cuidado a ver si puedes determinar lo que STATGRAPHICS te diga. La. segunda zona especial, en el extremo derecho de la línea final, no aparece en la Figura 2-6. ¿Por qué? Porque esta zona solamente se muestra después de que se haya seleccionado un instrumento estadístico con el que trabajar. Antes de que termines de leer este capítulo verás aparecer la palabra BAR en esta zona. Mira a ver si la ves y si puedes determinar lo que STATGRAPHICS te quiere decir. Ahora estás listo para enterarte de los procedimientos estadísticos que ofrece STATGRAPHICS, y para aprender el sistema de menúes que usa STATGRAPHICS para organizarlos. LOS MENUS. La organización del sistema de menús de STATGRAPHICS es semejante al organigrama de corporación de Worldwide Products (porciones del cual se muestran en la Figura 2-7) Organigrama de Worldwide products. Contabilidad Personal Ventas Mercadotecnia Relaciones públicas Distribución de productos Gestión de productos Farmacéuticos Cosméticos Alimenticios Investigación y desarrollo 9 Los empleados de Worldwide Products están agrupados en divisiones como contabilidad, personal, ventas, mercadotecnia, e investigación y desarrollo. Cada división de la compañía tiene varias secciones. Por ejemplo : dentro de la división de mercadotecnia hay secciones separadas para relaciones públicas, distribución de productos y gestión de productos. Dentro de la sección de gestión de productos hay tres gerentes para tres tipos diferentes de productos - farmacéuticos, cosméticos y alimenticios. Cuando se pone en marcha STATGRAPHICS, se ve el Menú principal (véase la figura 2-65. En forma parecida a como el organigrama usa las divisiones de contabilidad, personal, ventas, mercadotecnia, e investigación y desarrollo para agrupar a los empleados de acuerdo con la función principal de su trabajo, el Menú principal de STATGRAPHICS usa seis categorías para agrupar los medios estadísticos de acuerdo con su función principal: - Gestión de datos y Utilitarios de sistema - Trazado y Estadística descriptiva - ANOVA y Análisis de regresión - Procedimientos de series temporales - Procedimientos avanzados - Procedimientos matemáticos y del usuario. ISIAICRAPHICS S t . l l i t l c . l Cr.pMct Syite. DOTO nflNACEfiEKr amo s v s í t n u n u m s A. Dita f U n . 3 , „ , „ t B. Env!ron«<»nt C. Rcport Ur!t«r »n<| Cr«pMc« I i p l i y O. Cr.pMc» A t t r l b u t , , PLOrilKC AMO OESCRIPIIUE SIBIISIICS S. P I a 11 Inj functlons P. D « i c r l p t l u « ftalhods C. £.U~«tlon «nd I f i t (nj H. D l u t r l b u t l o n r u n c t l o m I. E*plor«tory 0«t« A n « l v c l » Uní L. n. M. O. SERIES TROCEDURES ForrciiLlnj 0u«11ly Control SnoolMrtj l l - o S*r1«t Anslyct! APUAKCE» PROCEt>U«ES P. C*t*sorlc«l D»t» ( t m l ^ c u O. n u l t l u . r l . t . n<thod< R. Honp»r»n»lrlü Kalhoda S. IIn5 T. Exp«rl~fntil Declgn AMOUA ANO RECRESSIOM AHALVSÍS V Figura 2-8. Menú principal de 10 S T A T G R A P M í C S El Menú principal de STATGRAPHICS también hace referencia a 22' categorías secundarias dentro de las seis categorías principales (véase la figura 2-6)- Las categorías secundarias como Gestión de datos, Entorno del sistema, y Escritor de informes y Visualizador de gráficas (en la categoría de Gestión de datos y Utilitarios del sistema) del Menú principal de STATGRAPHICS son similares a las secciones de relaciones públicas, distribución de productos, y gestión de productos (en al División de mercadotecnia) del organigrama. Hasta aquí, el Menú principal de STATGRAPHICS es igual que el organigramA de Worldwide Products. Pero en el organigrama hay tres categorías secundarias productos farmacéuticos, cosméticos y alimenticios que figuran como funciones de la gestión de productos. ¿Dónde figuran los instrumentos estadísticos en el Menú principal de STATGRAPHICS? Por ejemplo : ¿Dónde están los instrumentos estadísticos para la categoría secundaria de Gestión de datos? A diferencia del organigrama, STATGRAPHICS no puede mostrar de una vez todos los medios estadísticos de que dispone. Por ello, cada categoría secundaria del Menú principal de STATGRAPHICS tiene otro menú asociado con ella un menú secudario. Cada menú secundario indica los instrumentos estadísticos que hay disponibles en ese categoría secundaria. La sección siguiente de esta guía explica cómo ver los menús secundarios en la pantalla. Pero, por añora, examina la Figura 2-9 que muestra el menú secundariio para la categoría secundaria de Gestión de datos. s i COJO M&XNCENEXT 1. 2. 3. 4. t ' " U i « CARNR k s y i " :(!<:? JKPUI D l « p t i y D*l« D l r a c t o r y f 1 I » Op«r*»t!s>*« I - c e r l C»t« r i l t a Expert D»t* f l l n TE M j M I j M dnlrcd prOC«ÁUR•. • THAN p r « i c EHTER".."" 3S«v«r «Prt.er S ' " ' K t ' ': • 8C~d • • SO«vlc. lPQuIL DlipWy F i g u r a 2 - 9 . M e n ú s e c u n d a r i o d e gestión de d a l o s 11 El menú secundario de Gestión de datos que aparece en la Figura 2-9 indica los procedimientos estadísticos usados para meter y manejar los datos el procedimiento de Operaciones con ficheros, el procedimiento de Importación de ficheros de datos, etc. Observa que el título del menú secundario (enmarcado en la parte superior de 1 a pantalla) es también el nombre de la categoría secundaria Gestión de datos. Por ello, en el resto de la guía, la expresión menú secundario hace referencia a una categoría secundaria (como Gestión de datos o Funciones de trazado) del Menú principal. Además, en el resto de la guía el término procedimiento se refiere a cualquiera de los instrumentos estadísticos (como Operaciones con ficheros e Importación de ficheros de datos) ofrecidos por STATGRAPHICS. Ahora que sabes lo que es el Menú principal y lo que son los menús secundarios, estás listo para aprender como llegar a un menú secundario y seleccionar un procedimiento estadístico. SELECCION DE PROCEDIMIENTOS. Imagínate que la sección de personal quiere que les hagas una gráfica de barra. (La gráfica de barra, una gráfica bastante común, usa barras horizontales o verticales para representar cantidades). La gráfica de barra tendrá que mostrar el número de empleados en cada una de las cinco divisiones de Worldwide Products: contabilidad, personal, ventas, mercadotecnia, e investigación y desarrollo. ¿Por dónde empezar? Cuando pones en marcha STATGRAPHICS y el sistema presenta el Menú principal, el cursosr (el subrayado intermitente que indica en qué parte de la pantalla estás) se encuentra en el menú secundario de Gestión de datos (véase la Figura 2-10). 12 SI6ICPAPHICS Sta11 titea i CripMct SyttcM DOTA A. 8. C. 0. TIME L. n. K. 0. n««nCCn£Mt ANO SYSIErt U I t L I T I ES Data Hana3»n«nt Syct«« Env/l r on M «nt fUport U f i t t p and CrapMcc Raplay Cr.phlci «tlrlkutil SERIES PROCEDURES Forecaítlns C u t l l l y Control Snoothln? !!..« Serlas A n á l i s i s PLOITIMG AHO CESCR1PIIUC SJAIISI1CS £. P l o t t l n j f u n c l l o m T. Dncrl¡>tlv« flilheái C. E i t l M i t l e n f i T r i t l n j K. 0fstrí6ut(on Tunctlonc 1. Exploralory 0*1* A n t l y i l t APUAMCED PROCEDURES P. C i l r j o r l c a l Data A n a l y t l l 0. fluUlvarUtr MetSodc R. Honptrantlrlc Methode S. S a - p U n j 1. Experimental Deslgn AÍ10UA AHO RCCRtSSION BK01YS1S J . Anal^tlc «T Varíate* K. Rajrtcclan ftnit^cU nATMEnATICAL AMD USER PROCEDURES U. P i t h f N i U c a l Funetlons V. Raeros 4nd Uccr funcltonc jwut • H 'Ui<'curxor'k l yc lo h l j M l j h t d e i l r r d ««ellon. 2Edlt JSavacr « r n . c r S , , r . tCo . • 7U»r« Ihan p r o » EHTER.'.' 8C-d S D . v l c 18Qult': Dltplay Figura 2-10. El menú principal Nota también que "Data Management" (Gestión de datos) aparece enmarcado en color. Cuando una parte del Menú principal o de un menú secundario aparece enmarcada en color, decimos que está "seleccionada". (Si tienes monitor de color-si la pantalla del ordenador puede mostrar muchos colores-el enmarcado puede ser del color que elijas (o puedes dejar el color que STATGRAPHICS lo selecciones). Si la pantalla puede mostrar un color solamente (se trata de un monitor monocromo), el enmarcado siempre aparece en ese color). El primer paso para seleccionar un procedimiento estadístico es ir al menú en el que esté el procedimiento. Para seleccionar un menú secundario desde el Menú principal, usa las teclas que controlan el movimiento del cursor. A estas teclas las llamamos teclas de control del cursor, y están situadas en la parte derecha del teclado (de ser necesario, consulta de nuevo los diagramas de teclado en las Figuras 2-1, 2-2, 2-3). Antes de seguir adelante, prueba a pulsar la tecla de control del cursor que tiene la flecha hada la derecha. El cursor (y la selección) se van a la derecha, al menú secundario de Pronóstico. Pulsa la tecla con la Flecha hacia abajo. Se selecciona el menú secundario de Control de calidad. Prueba con la tecla End (fin). El seleccionado ahora es el último menú secundario-Macros y Funciones del usuario. Pulsa la tecla con la Flecha hacia la izquierda. Se selecciona el menú secundario de Análisis de regresión. Pulsa la tecla con la Flecha hacía arriba. Se selecciona el 13 menú secundario de Análisis de Varianza. Para terminar, pulsa la tecla Home (casa). La selección vuelve al primer menú secundario- Gestión de datos. Como ves, se usan las teclas de control del cursor para moverlo (y seleccionar) diferentes puntos de la pantalla. Antes de volver a la tarea original, pulsa la tecla de función Fl. STATGRAPHICS muestra una pantalla que contiene información para ayudarte (véase la Fig. 2-11). Ezcepto en los casos en que se esté viendo una gráfica, la tecla de función Fl (Help) (Ayuda) está siempre a tu disposición - para recordarte cómo llegar a un procedimiento estadístico o para describir uno que quieras emplear. Mira ahora la línea de estado. La primera línea te dice "Press Esc to return" (Pulsa Esc para volver). Pulsa la tecla Esc (Escape). El sistema vuelve a la pantalla de STATGRAPHICS en la que estabas - el Menú principal. STATCfiAPHlCS On-LIno Halp F a e l l l t y SIATC&APH1CS la l « l » j r » t « 4 «yeta** «f a l o t l a t i e a l and frophlca procadurva dealjnod to é l i l i t w t i r i |n •xplorlnj »nd nodaltnj d«ta. Iho consista of ovar 2S8 functloni « r j i n l i t ^ Into fc M j o r catajoria» »n4 22 t u b c i t a j e r l i t <tub««nuc). I® p r p e t t i i prtct4uri» you f t r s t calact • sub«anu and thart chooto tha daslrad functlon f r o « that tubMinu. To salaet tho d««!rad sub«fnu # uta UP tho Arrow haya («calad on th«.rl)Nt «Ido HOnl AfiROll • PCUP of yowr h*yboard. Novo tha M s h l l j h t i n j 7 91 s (MI* to tha daalrad aubning ind proas tha Kntar k i y . LEFT RICIII X S V Vou can alto Indícalo tha dostrad nRROU nRROU procoduro b^ o n t o r i n j tho eanntnd nana 5 sand p r r t t l n j tho Cntcr kty, or by o n t o r f n j tha l o t t a r or nu»*b«r I d a n t l f y l n j DOUH your ehotca and p r a u l n j tha Entar hay. EKD 1 lHe lhFUT fiRROU 2 1 PCDM 3 '• j ' ~ Prt*« PjUp'or PjDn for *ero halp.* Prass I t o te'ratCirn. •* ' ?Uar» 8C"d SDovlca 189ull2Ed11 3Savfcr « P r i t e r S . 4. &Co. 01 cp1«y Figura 2-11. Servicio de ayuda en linea de STATGRAPHICS Ahora estás listo para volver a la tarea original- producir una gráfica de barra de los empleados en cinco divisiones de Worldwide Products. El menú secundario de Funciones de trazado contiene el procedimiento de Gráficas de barra. Para producir una gráfica de barra tienes que ir a menú secundario de Funciones de trazado. Pulsa la Hecha hacia abajo (control del cursor) hasta que quede seleccionado el menú secundario de Funciones de trazado (véase la Figura 2-12). (Si pulsas la Flecha hacia abajo más veces de las necesarias, usa la Flecha hacia arriba para corregir el error). 14 SIBTCROrHICS Statlatlcal C r a p M e a Syala» Oflifl no«BCsn£«r AXD SVSIEJI U T Í L I U E S A. Data rwnasanant 8. Saltan CnvIronMsnt C. Raport Ur.ltar and C r a p M e a D. C r a p M e a Attrlbutaa R«pl»y lint L. n. H. O. SERIES PRDCCDURES Peracaatlng Duallty Control S-oolKlnj Tt«a tarta* Analyala nevando PLOTTIHC ANO DISCRlPTIVf IIOIIST1CJ t. floltlnj;Funotloñd P. Daacriptlva Nothodi C. Iitlnatlon ini Taitlnj H. Dlatrlbutlan Punctlana X. Kttploratary Data Bnalysla moctcnixcs P. Catasarlcal Data Analyaia g. nultlvarlata nathoda R. Honparanatrle Rathoda íifpllnj T. tiiparlnanlkl Daatgn nATHEnniICBL AKD USER PROCEDURES U. HathaHatlcal Punctlona V. rtacroa and Ummr Punctlona A.MOVA ANO R5CRÍSSI0H BNOLVSIS J. Ana 1 ya 1 a of Uarlanca K. Rasraaalon Analyala tHalpfj 2 W U Í S 3S»vao^ V r t i o r T V « r i " SCnd'--' SDáwloa ISQuItj DUpIay V / Figura 2-12. Menú principal con selección del Menú secundario de Funciones de trazado A continuación tienes que ver los procedimientos (instrumentos estadísticos) disponibles en el menú secundario de Funciones de trazado. Una vez seleccionado este menú secundario de Funciones de trazado, pulsa la tecla Enter. (Se usa la tecla Enter para decirle a STATGRAPHICS que vaya al menú secundario seleccionado para procesar lo que se selecciones en el menú secundario). STATGRAPHICS presenta en la pantalla el menú secundario de Funciones de trazado en la pantalla (véase la Figura 2-13). Este menú secundario indica que hay siete procedimientos (instrumentos estadísticos) uno de los cuales es Gráficas de barra. PLOIJlKC Fl'KCJJOnS 1. 2. 3. 4. 5. l. X-V Lina and Seatlarplota f.j( t lp¡ a X-V Plata X-V-Z Lina and Scatlarplol» n u l t l p l a X-Y-Z Plotí Earcfcarlc PIccNirtt ?. Co«Fon»n» Llnr Charla "''"^U»* cui-ior Wsy» U M j h l l j ' - t dcalrvd prc»c»dur«. JH«lp-'" ?í¿lt Jl*wcr Ifrlicr S tCo-"' 7V*rí" ¡fPUJ 7h»n*pratfl E K T E R." . P C S D e v l c a lBQvjlt 1 D i . p l «y Figura 2-13. Menú secundario de Funciones de tra?.adu 15 Desde un menú secundario se llega a un procedimiento de la misma forma que se llega a un menú secundario desde el Menú principal- empleando las teclas de control del cursor. Pulsa la Flecha hacia abajo varías veces hasta que quede seleccionado el procedimiento de Gráficas de barra. Luego pulsa la tecla Enter para activar la selección en el menú secundario y llegar al procedimiento de Gráficas de barra. STATGRAPHICS muestra la pantalla de entrada de datos para la Gráfica de barras (véase la Figura 2-14 ) la primera de varias pantallas asociadas con el proceso de Gráficas de barra. En la próxima sección, aprenderás lo relacionado con las pantallas de entrada de datos. 0trcb*rL« D*t» vvctors: rS-'***'*}" s r - f-- 1 • Prlnary labala: ¡ ^ : Saeondary labal*: ~ ' • i >t - _ _ . . . . . "i Tabulata: Va* Error b a r V T " J w " > " " lH«lp i' ZEJIt •*" 1 C c p l a t a Inpul H a l d a t n i prata T i . 3Savacr «Prtacr S • *>• : tCo Alara' 8C~i • DIcplay ' SD.vlc. íeOultí BftR : . J Figura 2-14. Pantalla de entrada de datos para Gráficas de barra Nota: En esta guía se usa el Menú principal y los secundarios para llegar a los procedimientos estadísticos. Pero STATGRAPHICS permite emplear mandos (como BAR para el procedimiento de Gráficas de barra) para llegar a los procedimientos estadísticos. Una vez te familiarices más con los procesos de STATGRAPHICS, podrás usar mandos para llegar a los procedimientos de manera más directa que a través de los rnenús. Observa que cuando llegas a un procedimiento estadístico (como el procedimiento de Gráficas de barra), STATGRAPHICS muestra el nombre del mando asociado en la línea de estado en el extremo derecho de la tercera línea (véase la Figura 2-14 ). 16 PANTALLA DE ENTRADA DE DATOS. Mira la pantalla de entrada de datos de Gráficas de barra en la Figura 2-14. Observa que : - la palabra "Barcharts" (Gráficas de barra) aparece en la parte superior de la pantalla. - hay cinco grupos de palabras a la izquierda de la pantalla (Data Vectors, Primary Label, etc.). - cada grupo de palabras tiene un cuadro a la derecha. - si la pantalla es de color, un cuadrado (el que está al lado de las palabras "Data Vectors") aparece destacada de un color diferente del que tienen los otros. - un cuadrado (el que está junto a la palabra "Tabúlate") ya tiene información en el. La palabra "Barcharts" (Gráficas de barra) en la parte superior de la pantalla indica que ésta es la pantalla para la entrada de datos para el procedimiento de Gráficas de barra. Las palabras a la izquierda de la pantalla se llaman nombres de campo, y los cuadrados adyacentes se llaman campos. Campos son zonas de la pantalla usadas para la entrada de datos o para decirle a STATGRAPHICS lo que se desea hacer. Los nombres de campo indican la información que se debe escribir en los campos correspondientes. E cuadrado que aparece diferente en un monitor de color se llama el campo activo. El campo activo siempre es el campo en el que se encuentra el cursor. Por eso, conforme se mueve el cursor de campo a campo, cambia el campo activo. (Nota: Si la pantalla tiene un solo color, todos los campos son del mismo color, pero el campo activo es el que tiene el cursor). Observa también que STATGRAPHICS ya ha puesto la palabra Yes (Sí en el campo Tabula te (Tabular). Cualquier palabra o número puesto por STATGRAPHICS en un campo se llama opción por defecto. La opción por defecto que STATGRAPHICS ofrece es el valor más comúnmente usado en ese campo. Si tú no indicas un valor diferente en el campo, STATGRAPHICS usa la opción por defecto al procesar el procedimiento estadístico. 17 A veces, el campo que contiene la opción por defecto es también un campo conmutable uno en el que no se puede poner información, pero cuyo valor se puede cambiar. ¿Cómo se puede cambiar el valor si no se puede meter información?. En la próxima sección aprenderás cómo poner datos en un campo y cómo cambiar el valor del un campo conmutable. EHTRADA DE DATOS. Ahora que ya has llegado a la pantalla de entrada de datos para Gráficas de barra (véase la Figura 2-15), estás listo para decirle a STATGRAPHICS el tipo de gráfica de barra que deseas producir. Se quiere crear una gráfica de barra sencilla de los empleados de Worlwide Products para mostrar el número de empleados en cada una de las cinco divisiones. I.reli.rtl Cata vact.rm: frlnary lihlii Wo.ft4.ry l i x i n •rerrnitT E S g U S - T ? f e V J .H(CTtffT3igg3¿¿52rrSgST'-r ? r '.'i-r- n I . k u U l a ' y.a Irr.r H r . . 3Í.WI0P <írt«s2 sEGSí TV»I-«?!Í SP.VÍC IBOUHÍ Dl.pl.y • MJÜE3LÍ Figura 2-15. Pantalla de entrada de datos para Gráficas de barra i d Primero., tienes que darle a STATGRAPHICS los datos que quieras analizar información sobre las divisiones en las que trabajan los empleados. Para este ejemplo vamos a suponer que hay un total de 15 empleados y que están repartidos por las cinco divisiones en la forma siguiente: 1 empleado en la División 1 (Contabilidad) 2 empleados en la División 2 (Personal) 3 empleados en la División 3 (Ventas) 4 empleados en la División 4 (Mercadotecnia) 5 empleados en la División 5 (Investigación y desarrollo). Cuando aparece por primera vez la pantalla de entrada de datos para Gráficas de barra, el cursor se encuentra en el campo Data Vectors (Vectores de datos); es decir, el campo Vectores de datos es el campo activo. Escribe los números siguientes en el campo de Vectores de datos (cerciórese de poner entre los números un espacio como delimitador): 122 3 3 3 4 4 4 4 5 5 5 5 5 Como verás, los números representan a los empleados según la división en la que trabajan un empleado en la división 1, dos empleados en la división 2, etc. Si te equivocas al escribir los números, puedes usar la tecla Backspace (Retroceso) para borrar hacia atrás hasta llegar al error y poder escribir correctamente los números. No hace falta usar etiquetas (nombres como Contabilidad, Personal, etc.) para las barras de un trazado tan sencillo, así que omite los campos Primary habéis y Secondary Labels (Etiquetas primarias y secundarias). ¿Cómo se va de campo a campo en la pantalla de entrada de datos? Pulsa la Flecha hacia abajo (control del cursor). El cursor baja una línea en el campo Data Vectors. Pulsa la tecla End. El cursor va al principio de la línea. Prueba la Flecha hacia la derecha y la Flecha hacia la izquierda. El cursor se desplaza una posilción en la dirección correspondiente. Para pasar de un campo a otro en la pantalla de entrada de datos usa la tecla Tab.). Así pues, para pasar el cursor al campo Tabúlate y activarlo, pulsa la tecla Tab tres veces. Antes aprendiste que no se puede meter información en un campo conmutable, pero que se puede cambiar el valor que contiene. ¿Cómo es posible? En un campo conmutable, STATGRAPHICS pone todos los valores posibles. Pulsando la Barra espadadora repetidas veces se pasa (conmuta) por el ciclo de todos ios valores posibles. Después de activar ei campo Tabúlate (con el cursor dentro de él), pulsa la Barra espadadora una vez. Ahora el campo Tabúlate contiene la palabra No. Pulsa 19 la Barra espadadora otra vez. El campo Tabúlate tiene de nuevo la palabra Yes (sí). Es decir, STATGRAPHICS da los dos valores posibles para este campo-Yes y No- y tú cambias (conmutas) el valor en el campo pulsando la Barra espadadora hasta llegar al valor deseado. Antes de producir la Gráfica de barra, hay una cosa más que tienes que saber en relación con la entrada de información en las pantallas de STATGRAPHICS cómo se comunica STATGRAPHICS contigo por medio de señales auditivas. Lo aprenderás en la próxima sección. SEÑALES AUDITIVAS. Si tu ordenador puede producir sonidos, STATGRAPHICS usa dos señales diferentes para comunicarse contigo. Las llamamos trino y bocina. Estas señales te dicen que has hecho un error. En este momento, la pantalla del ordenador debería aparecer como se muestra en la Figura 2-16. D*t* vtotorct « pn«ry Í.b.u: 7*> «7 ** . ** C. I » i r ^ r s ^ ' T ^ ^ a WVÍVTÍ W Jacarear* labal.: ItUUn: Vaa Crror Figura 2-16. Pantalla de entrada de datos para Gráficas de barra con los d3tos de los empleados Ti:>i la tercia Tab para activar el campo Error Bars (Barras de error). Luego pulsa la cecia cy varias veces. El sistema hará sonar un trino cada vez que pulses la tecla F5. para decirte que, en este momento, la tecla F5 no hace nada. (De hecho, el 20 sistema hará sonar un trino cada vez que pulses cualquier tecla que no sea adecuada para la acción a llevar a cabo). Ahora escribe tu nombre de pila en el campo Error Bars y pulsa la tecla de función Fó (Go) (Adelante) para decirle a STATGRAPHICS que procese la información puesta en la pantalla. El sistema hace un sonido de bocina para indicarte que hay una entrada que no está bien. ¿Oué es lo que está mal? La primera línea de la linea de estado explica el error: ERROR : cannot plot error bars when data is being tabulated. (No se puede trazar barras de error mientras se tabulan datos). Siempre que oigas la bocina, mira la línea de estado; comprueba la información entrada e intenta de nuevo. Antes de que se pueda procesar esta pantalla tienes que corregir el error-quita tu nombre del campo Error Bars. Usa la tecla Tab para activar el campo Error Bars, y luego borra tu nombre con la tecla Delete (Borrar), letra por letra. Ahora pulsa F6 (Go) (Adelante). ¿Qué pasa?. STATGRAPHICS muestra una pantalla nueva llamada Opciones de Gráficas de barra (Véase la Figura 2 -17 ) y hace sonar la campana para decirte que el sistema te está esperando. Observa que se usa la tecla de función F6 (Go) (Adelante) para decirle a STATGRAPHICS que procese la información. Celor Ftil Figura 2-17. Pantalla de opciones pora C-rúfie:;."; ue bnrra 21 Como se ve en la Figura 2-17, la pantalla de Opciones de Gráficas de barra muestra (y permite que se cambien) muchas opciones por defecto, incluso el título en la parte superior de la gráfica de barra. Vamos a usar las opciones por defecto en esta pantalla, así que estás listo para generar la gráfica de barra. Pulsa F6 (Go) (Adelante) y STATGRAPHICS mostrará en la pantalla la gráfica de barra de empleados por número de división (Véase la Figura 2-16). O 1 2 3 * S Figura 2-18. Gráfica de barra de los empleados por número de división Ahora que ya has generado la gráfica de barra, estás listo para volver al Menú principal. Siempre que quieras terminar el proceso en marcha o salir de la pantalla en uso, pulsa la tecla Esc (Escape). Para volver al Menú principal, pulsa la tecla Esc varias veces hasta que aparezca el Menú principal en la pantalla. (Si pulsas la tecla Esc desde el Menú principal, STATGRAPHICS te preguntará si quieres terminar la sesión (salir de STATGRAPHICS). Para corregir el error y volver al Menú principal, pulsa la letra N (No) en el teclado). ¡Enhorabuena! Has aprendido mucho sobre cómo usar STATGRAPHICS. Pero hay unas cuantas cosas más que tienes que aprender antes de pasar al Capítulo 3Tienes que entender como usar títulos y variables para almacenar los datos de STATGRAPHICS, y tienes que aprender los pasos apropiados para salir de TT i Tí^c i D'u rp-C FICHEROS T VARIABLES Cuando se empieza un proyecto, lo primero es reunir los materiales necesarios. Por ejemplo, si durante el fin de semana planeas archivar los papeles que se hayan amontonado en una esquina de la mesa del despacho, es probable que durante la semana vayas a buscar carpetas, etiquetas y bolígrafos de colores y que los guardes en un cajón hasta el fin de semana cuando estés listo para empezar a archivar. Antes de usar un procedimiento de STATGRAPHICS, tienes que reunir todos los materiales necesarios. En el caso de los procedimientos de STATGRAPHICS, generalmente los materiales son variables que contienen juegos de valores de datos relacionados. Por ejemplo, acaso quieras emplear una variable llamada complaints (quejas) para tomar nota de comentarios negativos recibidos sobre las hamburguesas de Worldwide Products. También podrías usar una variable llamada hamburgers para tomar nota del peso de las hamburguesas conforme salen de la línea de producción. Como en el caso de las etiquetas en los archivos, se puede modificar (editar) las variables siempre que no se las esté usando en un procedimiento de STATGRAPHICS. De la misma manera que usas un cajón para guardar las carpetas y el resto de los materiales hasta el fin de semana, en STATGRAPHICS se usa un fichero para almacenar una o más variables relacionadas. Los ficheros permiten encontrar fácilmente las variables a la hora de usarlas. Por ejemplo, puedes emplear un fichero llamado QUALITY (CALIDAD) para agrupar las variables complaints y hamburgers (quejas y hamburguesas), puesto que las dos se relacionan con la calidad de fabricación de las hamburguesas de Woriwide Products. Para comprender más fácilmente el concepto de ficheros y variables de STATGRAPHICS, piensa en un archivador de oficina. En el archivador empleas carpetas para guardar documentos relacionados. Por ejemplo, un archivador llamado CORPORACION para guardar comunicaciones distribuidas a toda la compañía y listas de números de teléfono de los empleados. O una carpeta en el archivador llamada PERSONAL para guardar listas detalladas de las horas que hayas trabajado y de las tareas que hayas llevado a cabo. Las carpetas se llaman ficheros en la terminología de STATGRAPHICS, y las hojas con información dentro de las carpetas se llaman variables. En tu trabajo, usarás muchos ficheros y variables con información sobre diferentes aspectos del funcionamiento de Worldwide Products. En los Capítulos 3 y 4, aprenderás cómo crear ficheros y variables. En el Capítulo 5.. aprenderás cómo tomar ficheros y variables de otras fuentes y usarlos con STATGRAPHICS. En otras 23 partes de la guía usarás ficheros y variables que te hemos proporcionado con STATGRAPHICS. Si instalaste los juegos de datos muestra al instalar STATGRAPHICS en el ordenador, esos ficheros y variables están preparados para que los uses. Lo último que tienes que aprender es cómo salir de STATGRAPHICS. La próxima sección describe los pasos que tienes que dar para hacerlo. SALIDA DE STATGRAPHICS. Hay tres pasos que tienes que dar siempre que quieras salir de STATGRAPHICS. (Si quieres continuar ahora con el Capítulo 3, deja esta sección hasta que estés listo para salir de STATGRAPHICS). PRECAUCION : Para proteger programas y datos, sigue siempre estos tres pasos antes de apagar el computador. 1.- Pulsa la tecla Esc varias veces hasta que la pantalla muestre el Menú principal de STATGRAPHICS. 2.- Pulsa otra vez la tecla Esc. STATGRAPHICS pregunta con un mensaje en la pantalla: "si se desea poner termino a la sesión" con Y/N. 3.- Escribe una "Y" pulsa la tecla Enter. RESUMEN. En este capítulo aprendiste : - cómo poner en marcha STATGRAPHICS. - cómo están organizados los procedimientos (instrumentos estadísticos) en STATGRAPHICS. - cómo llegar a los muchos procedimientos ofrecidos por STATGRAPHICS. - como se comunica STATGRAPHICS contigo. - cómo usar variables y ficheros paja almacenar los datos de STATGRAPHICS. - cómo salir de STATGRAPHICS. MANEJO DE DATOS CON EL EDITOR DE DATOS. En el Capítulo 2 aprendiste que hay dos formas de proporcionarle datos a STAGRAPHICS : creando ficheros y variables y usando ficheros y variables que provienen de otras fuentes. En este capítulo y en el Capítulo 4 vas a aprender cómo crear y modificar (editar) tus ficheros y variables que alguien te dé. Por ejemplo, en las tres lecciones siguientes vas a crear variables con datos para 14 productos cosméticos fabricados por Worldwide Products. El fichero llamado COSMETIC tendrá las variables sales, nxüts, onhand, y producís (ventas, unidades, disponibles, y productos). En STATGRAPHICS, las variables se crean, almacenan y editan empleando diferentes métodos. En este capítulo vas a aprender a trabajar con las variables empleando el editor de datos en el procedimiento de Operaciones con ficheros. (El editor de datos es un editor tipo "hoja de cálculo" que permite editar (modificar) una tabla de información). CREACION DE VARIABLES NUMERICAS. En esta lección crearás un fichero nuevo llamado COSMETIC empleando el procedimiento de Operaciones con ficheros. También crearás y almacenarás tres variables numéricas- sales, oníts, y onhand- dentro del fichero COSMETIC empleando el editor de datos del procedimiento de Operaciones con fichero. La Lección empieza, en el Menú principal. A la. hora de crear ficheros y variables nuevos, el primer paso es usar los menús para seleccionar el procedimiento de Operaciones con ficheros. El procedimiento de Operaciones con ficheros esta, en el menú secundario de Gestión de datos, así que empieza seleccionando eí menú, secundario de Gestión de datos en el Menú principal (véase la Figura y l ) . - De ser necesario, usa latecla.Home (control del cursor), para seleccionar el menú secundario de Gestión de datos. 25 SlAiCKnpMlcr Elattallcal [ r i r M c i ty.t.. MIA A. B. C. 0. nflHACIntKI Ano SVSIIn U I l L l t U S Dáto'llanajo^ónt Syaton SnvIronMvnt Raport Urltor and Criphlci Raptay Craphlcs Attributas Tlnc L. n. H. 0. I I R U I PROCIDURIS Porocaatlnj Quallty Control S«ootMnj II»» Corita Analytla P L 0 U 1 N C AMO OESCRIPIIUt IlflllSIICS I. Plottlnj Functlona f. Doccrlptlv* ílathoda C. CctlMJtlon ar*d Tostlnf H. Dlltrlbutlon Functlong I. Exploratory Data Análisis ADUAHCÍO PROCIPURES P. Catajorlcal Pata Anal^ila S. Hultlvarlato flathod» R. KonparaM«trlo ftathodc S. Sa-pllnj T. C»parln«ntal Oacljn AHOUA AHO RECRESSIOH PKALVSIS J. Analyala of Uarlanca K. Rajroailon Anal^ili HATHEMATICAL AHO USER P R O C I O U R K U. KalNaHatlcal Furvotlana V. nacrot and Uaar Functlons lH.lpg 2MIC1 3S«wiec «Prtier SjSTÍÍ íto.'JS jHPUIíi" ?V*'ct3. BCndfrl SOcvJc» ie9«JtS Dlipla* Figura 3-1. Menú principal con el menú secundario de Gestión de datos seleccionado - Pulsa la tecla Enter. "una vez se pulsa la tecia Enter para procesar ia selección en el Menú principal, eí sistema presenta el menú secundario de Gestión de datos (véase la Figura 3-2). Añora puedes seleccionar el procedimiento de Operaciones con "ficheros en el menú secundario de Gestión de datos. - Usa la Flecha hacia abajo (control del cursor) para seleccionar el procedimiento de Operaciones con ficheros. Figura 3-2. Menú secundario de Gestión de datos con e! procedimiento de Operaciones conficheros seleccionado - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar la selección en el menú secundario de Gestión de datos, el sistema presenta la pantalla de entrada de datos para Operaciones con ficheros (véase la Figura 3-3). Se usa esta pantalla para indicar el fichero que se desea usar y la operación a llevar a cabo. r i ¡ w OparatIon« SlfllCRAPHICS ril> Oparttlon*: fl. Copy 1. Cr I l l a C. Idlt O. trata I . Jo Ir. C. Rac&da ' H. « a n a » r . Prln* 1. Spllt J. Updata Daftlrad opiritton: J OMOUfl OCCATfi CflRCflIA RflMCOrt r l l a a an Dala Priva - C: SS1M C\Om As cniri InPDnja IROKORI LOCUM ISOftIA IVOSJACI Ululp '-; Z W l t i i 3S«vter <Frt«cr inpui^ji iCoí'-J* " nuDflTft « 7V»r«'•> BCni'.f' 9D*wlc« J60ult» Duplas FILE; Figura 3-3. Pantaila de entrada de dalos para Gestión tíc ficheros 27 Ahora puedes indicar el nombre del fichero y la operación a llevar a cabo. En esta 1 A/^/^i nA Tin AWTsl AO*- 1o AT\A*"0/mÁ« /^A i^CvlCii Se vci 01 enxpiecu ;a upci a'vivii U / í i f n ' T^O uvuiuxi A^AOr o, llf^ f HtlATTA ccii ulu. li^tnri n u c w holíiici>av COSMETIC 7 entrar en el editor de datos. Esta información se especifica en la pantalla de entrada de datos para Operaciones con ficheros (véase la Figura 3-4). - Escribe el nombre del fichero cosmetic en el campo File Ñame de STATGRAPHICS. El cursor se desplaza automáticamente al campo Desired Operation (Operación deseada). - Escribe la letra C (para la operación Edit) en este campo. rila Opirillont SIAICRAPHICS rilf MU: Oparatlonc: cosx.tto A. Copy fi. Croata D. C r i c » C. Joln C. Racoda H. donan* C. Edlt t. I. Spllt Prlnl J. Updata Delirad oparatlon: C riln AHOUA ocofltfl CARDAIA RAnpon . lHelp '. 2 ! ¿ U IMFUI CASEI rsDAia on Data Drlua - C:\STflrC\DiUfK (nFDAIA jnOnOnC L0CL1M HUOAJA (10MLIN JUOSIACE Coóptala Input fllldl and prasc.FC. 3 S a v . t r IFrtccr S tCo 7Uarx BC»d " 9Dcv!ce IBOult Dltplay FILE ' Figura 3-4. Pantalla de entrada de datos para Gestión de ficheros una , , ^ ver completada Pulsa F6 (Go). Al pulsar F6 (Go) para procesar lo que se haya puesto en la pantalla de entrada de datos para Operaciones con ficheros, el sistema crea al fichero y entra en el editor de datos (véase la Figura 3~5 )• Observa que el sistema también muestra una ventana en blanco para Añadir otra columna. Una ventana es un recuadro que aparece en la pantalla y te pide que des más información. Al igual que en las pantallas de entrada de datos, las zonas seleccionadas en las ventanas se llaman campos. Observa también el nombre del fichero, COSMETIC, en la. parte superior central de la pantalla. Los nombres de fichero en STATGRAPHICS siempre aparecen en se escribe en letras mayúsculas : cosrnetic a COSMETIC. mayúsculas; si *t Bou: Colu«n: minúsculas, 0*1» U l t e r r i l i t COSnETlC el sistema las -convierte Hunbcr of Col*: Rcu Aá d kddltlanel colu-ir* "l i . * Typn'' K uitfth: 13 Itnjlh Tvp-'Uth C W t . ' T O ' - ' , 1 1 1 W ^ r tnt • r* CP" » á 11 *w» r I » >i I « ' t ;/p«: • • n¿1 u U t h " 7 ' V-. " f , T1 I H . I p * , 2Xdlt^« 3S»v/«or 4Prl m r S » « o - -'.. ?U»r« "• BC~4'?- SOaulo* íeQúlt} J/ieUir.-; DUpUy flLI^.,^; Figura 3-5. El Editor de datos de STATGRAPHICS con la ventana para Añadir otra columna Ahora hay que crear una variable llamada sales (ventas) para poner en ella las ventas (en millones de dólares) de productos cosméticos. La ventana para Añadir otra columna se emplea para indicar el nombre de la variable- sales- y la amplitud de la nueva variable (véase la Figura 3-6). La amplitud de una variable es el máximo número de caracteres o dígitos que se quiera asignar a cada valor de datos. Nota : A diferencia de los nombre de fichero de STATGRAPHICS, que siempre usan mayúsculas, los nombres de las variables pueden ponerse en mayúsculas, en minúsculas o combinando las dos. SALES, Sales, y sales son tres variables diferentes aunque contengan las mismas letras. Al escribir los nombres de las variables en esta, guía, cerciórese de escribirlos exactamente en la forma indicada. - Escribe las letras sales en el campo Ñame (Nombre). - Pulsa dos veces la tecla Tab para ir a campo Width (amplitud). - Escribe el numero 10 encima del número 13 en el campo Width a SUPIIC al Naw: fia Pata «¿llar >Ua< tOS»lHe Kuwkap a f Cal«I Add addltlonal colunn «*«a: talaa . Ivpa: H Uldth: IB lanjth Typ'Uth f tntar'or' «dit varlabla nana, typo, and uldth.' - lHalp.'j 2Idlt"3 3Sav>cr •ífrticr S . IhPUTü'. 6C« ?Var« 8C«d SOavIc* IBOuIt : FILE' Figura 3-6. Ventana para Añadir otra columna una vez completada - Pulsa F6 (Go). Al pulsar F6 (GO) para procesar lo entrado en la ventana para Añadir otra columna, el sistema crea la variable sales en el ediltor de datos y presenta una columna en blanco para usarla en la entrada de datos (véase la Figura 3-7). Observa que el sistema también muestra una ventana nueva, en blanco, para Añadir otra columna. Curaor at Raut C.lu-n: data Editor rila: COSnCT1C n.MlnVM Roui: 0 hu-b.r of Cola: 1 Rau a•1•a 1 2 3 .& 5 c. 7 •i Ddd addll1 on* 1 colu.n 9 3 16 11 lypa: n 12 13 Uldth: 13 H Lanjth e Tvp'Uth N'IS Intar or ailt va r iafc 1 a" ni«< ."\ypa. aní\u 1fith." lHilp i 2l4ít • • 3S ava cr «Prticr i.'. ;tCo ,T , . ^•rs..'. 0C»d' SOaulca lUOult Dltplay FI LE If.PUT Figura 3-7. La columna de la variable sales en e! cdilor de datos con ln ventana pnra Añadir otra columna 30 El próximo paso es poner los valores de los datos en la columna de la variable sales. Pero antes hay que pulsar la tecla Esc para quitar de la pantalla la ventana para Añadir otra columna (véase la Figura 3-6 )- Pulsa la tecla Esc. linjth • Typ'Uth H'tt _ IH-Tíra ZX41t& 3i*v.er V r l u r SOpl¡H Wotüíí ?V»C»Sí epvSfiá lamias SDtvlóJ leOjltJ v i „ u „ Figura 3-8. La columna de la variable sales en el editor de datos 31 Ahora estás preparado para entrar los valores de los datos (en millones de dólares) para la variable sales (véase la Figura 3-9). Como quieres que cada valor ocupe una celda (fila) de la columna de la variable, pulsa la tecla Enter después de escribir cada valor. Usa la tecla Backspace para corregir los errores. - De ser necesario, usa la tecla Home para seleccionar la opción para Save Without Exit (Almacenar sin Salir). - Escribe los valores indicados más abajo en la columna de la variable sales, pulsando la tecla Enter después de cada valor. 407 .293 -276 .274 .255 -253 .246 .245 240 .239 .223 -211 .200 .259 - Pulsa dos veces la tecla Home para volver a la primera celda. Curtor • t Rou: Coluto: Ron 14 1 Data Editor Filo: COSnEIlC rtiKlnun Rouc: HuMber of Colc: 13 1 salee 1 Z 3 4 S i 7 8 9 ie 11 12 13 14 . 497 " .233 .276 .274 . 255 . 2S3 .248 . 24S .248 .239 .223 .211 .280 . 189 L«n 3 th Typ'Uth Precí IHelp IhPUT 13 M'I8 t ha F6 Vey lo cava updatrd d» l a or thp FS >• ty othar opllonc. 2£ J i l 3S«v«cr 1 P m c r SOplc tCo ?u«.rc 803 9Pcvlcc IBOult Clipl.y FILE Figura 3-9. La variable sales en ei editor de dalos - Pulsa F6 (Go). Una vez se pulsa F6 (Go) para procesar las entradas en el editor de datos, el sistema presenta el menú-ventana para Almacenar. Como en el caso de la ventana, el menú-ventana ofrece dos o más opciones para que tú elijas una. La opción Save Without Eat (Almacenar sin salir) del menú-ventana para Almacenar permite almacenar los datos y continuar dentro del editor de datos para poder añadir otras variables al fichero COSMETIC (véase la Figura 3-10). - De ser necesario, usa la tecla Home para seleccionar la opción para Save Without Exit (Almacenar, sin Salir). Curcor at Rou: Colunn: Rou Data Editor F U . : COSntTIC ftaKlnuH Rouc: Jlunber oí Colc: 13 1 tales i .107- • 2 3 4 5 í .233 ' ' .274 .2 7i • ZSS -21S a .246 a .239 7 Saua utthouL'axlt Saua and extt íe .223 u .211 12 13 14 • 28Í . 183 Lenjlh Ij Jyp'L'Lh K'ie lHrlp InCUI 2Edlt rílshllght declrad antry and precc E.1IER to c a l a c t . j S . v i c r 4Prlicr S £Co ?U>rt 8C-<¡ SDavIce IBOult Oltpl.y FILE Figura 3-10. Menú-ventana para Almacenar, con selección de la opción Save Without Exit (Almacenar sin Salir) - Pulsa la tecia Enter. 33 Una vez que se pulsa la tecla Enter para procesar la selección hecha en el menúventana para Almacenar, el sistema vuelve al editor de datos (véase la Fig. 3-11). Cursor it Bou: ColUHB¡ 1 1 Dato CÍU.r Pilo: COÍnIIIC lliHlnUH Raúl! H Hunbar of Cola.' 1 .<8 7 " .233. ..'V: .276:;_ • 25S . : .253 7 a ,21S'' ' 3 . 24B 18 .23311 .223' 12 .211'. • 13 .288 :..' . 11 . 183 ' L.njlh 14 1 2 3 s i T^p'Ulh h'ta r~~rpro«»"tl»«"rC"Vo»i ta* aa<j«~updatad"iJ«ta''or"tho"rS"><a>/T/'ír*»thor.'op liona; lH«lp:.J 21411.* 3S»vter «Prticr SOpt» r .IMPUIT;,- . ?U«r«;i 8Cxd>7r SD.ulc» lOOÚtf. oitpua riLi^. 7 Figura 3-11. Editor de datos de STATGRAPHICS Ahora hay que crear otra variable. Mira la línea de estado en la Figura 3-11. La tecla F5 aparece definida como Opts (Opciones). Pulsa F5 (Opts) para llegar al menú-ventana de Opciones del editor. En este menú-ventana selecciona la opción Add Additional Column (Añadir otra columna) para poder crear otra variable (véase la Figura 3-12). - Pulsa F5 (Opts). - Usa la Flecha hacia abajo para seleccionar la opción para Añadir otra columna. Figura 3-12. Menú-ventana de Opciones del editor con selección de la opción para Añadir otra columna 34 - r u.ioci Í--Í i-^i'í catci Al apretar la tecla Enter para procesar la selección hecha en el menú-ventana de Opciones del editor, ei sistema presenta una ventana en blanco para Añadir otra columna "'véase la Figura 3-13-1Decimos qu.e está "en blanco", aunque va hay dos campos que tienen valores. ¿Por que? Porque los valores que aparecen son opciones por defecto. Hay que indicar el nombre de la columna a añadir y, si se quiere, los valores de las opciones por defecto. Figura 3-13. Ventana en blanco para añadir otra columna Ahora estás preparado para, crear una variable numérica, (una variable contenga números solamente) llamada units. La variable units tendrá, las ventas (en miles de unidades) de productos cosméticos. Usa la ventana para Añadir otra columna al objeto de indicar el nombre de la nueva variable (véase la Fig. 3-14). - Escribe la palabra units en el campo Narne (Nombre). que Cwraor at Rou: Co1 uno: Rou Data Editor M i » : COSnEIlC naxtnUM Rouc: Hunbcr of Colt: 11 1 aalaa 1 • 233 ¿íátefci 2 3 < s b fldd addlllonal 7 8 3 íe ít colunn Naxa: I*pa: 1 12 13 14 Uldlh 13 . las Lanjth lyp'Uth M E3S3ii¿t=^Vi< , <f : ?nnt»rTor"odl t"utr lab la 'nana,"" typa." and'ul dthT< " . ' • l H a l p - ^ T l d t t S ) 3Savaor <frtaor S -ní/Wi ICo V i 7Uaraly B C - d - ' i S D . v l o . IBOult'j INTUIR oupua riLZ;_->' Figura 3-14. Ventana para Añadir otra columna una vez completada - Pulsa F6 (Go). Una vez que se pulsa F6 (Go) para procesar lo entrado en la ventana para Añadir otra columna, el sistema presenta una columna en blanco en el editor de datos, para contener ios valores de los datos de units. Observa que ei sistema también presenta una nueva ventana en blanco para Añadir otra columna (véase la Figura 3-15) Cursor « t RcuCe 1 u»»ni 1 2 3 4 S ( 7 a 9 ¡9 11 12 13 H •>e7 r . 2S3 ' . 27C ': .771 .2SS . 2S3 . .218 .215 : .218 . 239 .223 .211.280 ' .169 L1 * 51 h 14 ' IHtlp • 2iá\\ P PtL» Editor r i w : COSnEIlC 1 ".UI n»Ki>iun Rout: Mo«b«r of CoI«: Add « d d l t l e n t l n 2 c«k : Uldth: 13 8 £nt«r cr « d ! t v t r i t b l * typ».'»A<J uldth. 3 S « c r 4?rt»cr S " • * LCo.*7U»r«. ; 0C«<3 V • Sr#vloc DUpUy lüOult 1 r I LE • __J Figura 3-15. La columna de la variable uniLs en el editor de datos con la ventana para Añadir otra columna jV Antes de poner datos de la variable uníts, vamos 3. crear otra variable para 23. n^^K/l'í/í /^A A ^üuuuau iii Y ^ücOLi i.v "aiopviliL/it *V.iÍAA ^ A íim^o \>c ^^ ^ Ha T\rA/íllAt-AA AAAwÁfÍAAr / pi vuu'.iwo wciucuwo. Esta nueva variable, onhand, tendrá una amplitud de 10. Usa la ventana para Añadir otra columna al objeto de indicar el nombre de la nueva variable y su amplitud- el número máximo de dígitos que vayas a poner en cada valor de datos (véase la Figura 3- K'X Escribe ía p3.23.brs. onuscd en el campo Ksuus (Nombré/ de 2s Vvüt3H3. para Añadir otra columna. Pulsa la tecla Tab para pasar al campo Witdth (Amplitud). Escribe el numero ÍO encima del número 13 on el campo'Width (amplitud). Cala l i U o r COSntUC Cursor »t Rou: Co lunn: Rou rilo: noxlnun Rou«: Hueibar of Colai M 2 uní It «ala» 1 Z 3 •4I ¿274» 5 6 addltlonal colunn 7 8 9 10 11 12 13 14 I. 183 l«n3th T.jzsuth Jyp« : H Uldts: 18 - 14 M'lí " 8 K'13 p-r--Intar'or aáit varlabla " « t i typa, ' aná' ul áth: ' - ~ ' "lH.lp": 2 I ¿ U - ' SSavaer 4P rt.cr S< tCo"--:i TU.r. v BC-d -" 3D.vlo. l e Q u U ; ni i rjjp Di.pt.y TI LE.". C. JKPUT-*. .. Fi-ura 3-16. Ventana para Añadir otra columna una vez completada - Pulsa F6 (Go) 37 Una vez que se pulsa F6 (Go) para procesar lo entrado en la ventana para Añadir Afro AAlu^^l 1 71 «llATT^ uua wiuiüiia, ci oio^cii.ia vi^ra id uuc»a vUiuLiiilia, Ou.xxa.ii<~t, O ArAA^I /í A I'"* a. la «acri íci columna de la variable units (véase la Figura 3-17). Observa que el sistema vuelve a presentar otra ventana en blanco para Añadir otra columna. Cursor ot Rou: Colunn! Doto Editor rilo: COSniIIC flíxlwjñ X1o4ui: Ku«bor of Ce 11: 3 1 2 2 4 5 l 7 Add addltlenol Cftuxn a 3 11 ISP«: H 11 •' 2 Z 3 %É 12 Uldth: 13 14 .183 lonjth 14 í « Typ'Uth «'18 H'13 M'18 rí^TTOT^r^^tBUt'wUíit'-wufciiSMH»^ lH.lp'=g 2Id 11*; 3S«u«or 4Prt«ci' SKVáCH ítÜSSj 7V.r¡C «C-df» 9P«y.lcJ IBOulCí Dl.pl.y LILl£lS Figura 3-17. La columna de la variable onhand en el editor de datos con la ventana para Añadir otra columna Ahora hay que poner los valores oe los oatos de las dos variables units y onhand Pero antes tienes que usar la tecla Esc para quitar de la pantalla la ventana para Añadir otra columna (véase la Figura 3-16). - Pulsa la tecla Esc. Cursor »t Rou: Colunn: Dito Editor filo: COSnEI1C rUKlwun Routt 14 Kunber or Cois: 3 1 .487 293 " ' .1 U3 . .274 ">' i 4 s .274•í. i'. ti V i .25 253 "i* t 7 .248 8 .245' • • • ' ** r 5 .240 • a • • I..Í •: « • ' V * t l 18 .239 3 11 .223 J : z .211 13 . 288 14 . 109 2 - • . - *.» * Lonjth 14 1 1 lyp'Uth «'ID M'13 M'IB f ' ' " ~ F r » e « Ihc f & ' k t y ' t o i¡ « v . upd « » d d . t » or lHclp * 2Edlt;;- : 3S.vtcr 4Prt«cr SOpti tCo líirui •: rs V « y C c r T o h o r o p t lona. ?0'«ri ' SDoulc» lBQult ' Hlipl.s riLE ; Figura 3-1S. ICditor de datos de STATGRAPHICS 1 IIÍVUCI uouro vu íao v-niauitro uiiit¿> y kjllUCCHÍU navio, ^astr i<i ng. Usa la tecla Backspace para corregir errores. Pulsa la tecla Enter después escribir cada número. - Usa las teclas Home y Tab para poner el cursor en la primera celda (fila) de la columna de la variable units Escribe los valores siguientes en la columna de ia variable units, y pulsa, la tecla Enter oespu.es de cada valor. i A i. v i ? 1 s v i : i..j o o i. 11 1¿ 4 1 i» K . .j -¡s ^ 0 0 OÍ-, i-" .1 v S O _,> v 4 7 T: i Usa la Flecha hacia arriba y la tecla Tab para poner el cursor a la izquierda de la primera celda de la variable onhand. Escribe los váiói'és 9i£üieíiué9 en la Colüiíiiia de iá váíiábie óñhaüu, y paisa la tecla Enter después de cada valor. 9 61 67 56 56 70 63 29 41 59 63 33 4 32 Cursor ot Row: Co¡u*n: Hou «ilfl 1 r«e Z a iZ'íJÍSS « 'ssc^síT s . rzt;^ t 14 3 Doto Editor filo: CDInlIK tton 1 m i h hwnbor o f Rows: Colo*. 14 3 enhinj 7 a 7239 a 18 11 1Z m-jg 1j 3hUS?Js Lin 1f 4iBi! U II H't Typ Uth H'l« í'll ET rW /J stZn t.< ra t li HH Ü? lj jat ih vr fr aT3S»V«'o¿ 4trt.ora»SOpUg ««SitS ?SUc*Ea «Cr<SS5 sb«vtó« l9Qu|t~ k.I.T(£'Í DUpUy ULtíais Figura 3-19. Las variabies units y onhend en e! editor de datos - PUISB F6 (Go) Una vez que se pulsa F6 (Go) para procesar lo entrado en el editor de datos, el sistema presenta el menú-ventana Save (Almacenar). Ahora vas a almacenar los datos y a salir del editor de datos Selecciona la opción Save and Exit (Almacenar y Salir ) en el menú-ventana para Almacenar (véase la Figura 3-20). - Usa la Flecha hacia abajo para seleccionar la opción Save and Exit -.'Almacenar y Salir) Curiar al Pcw! 1« 3 C. I . " : Cata [¿ltor rila: C O t n l U C unt ta 3 1 . 487 - 1« z .233 12 (1 3 .276 t 17 4 .274;^--\;' 13 S4 s - 2S5 •:.,( 22' , í i ~ -í l .253 - :•r 11 - 78 7 .248 I.V.". :.. 41 . ta?6 :: as'— 23" 3 .249 38 41 18 22 S3 21 11 .223 63 12 .211 39 33 13 . 268 S8 4 14 . JB3 47 32 14 Lanjlh 14 14 H'18 « ' 1 3 M l s h l l j h t á a i l r a á « n l r y and p r a t » " tCo lHalp 2£¿ It 3Sautcr 4 F r l i c r S 1NPUI IIAMIhui RDUI: ttu*«b«r oT14Cola: 3 Savt ullhout a x l t Sa««'arid'axlf-»'-s: ÍK1IR to l a l a c l . 7Uart~ 8C~d " SDavlca IBOult" oi.pi.v, mi J Figura 3-20. Menú-ventana Save (Almacenar) cun selección de la opción Save and Eait (Almacenar y Salir) - Pulsa la tecla Enter Una vez que se pulsa ?a tecla Enter para procesar la selección en el menú-ventana para Almacenar, e! sistema almacena los datos y sale del editor de datos. Después, el sistema presenta la pantalla File Contents (Contenido del fichero) del fichero C0SME7ICS (véase la Figura 3-21). En la pantalla se ven todas las variables del fichero COSMETICA La longitud de una variable es el numero de lilas en la columna de la variable- el numero de valores que contiene la variable. Cada una de estas V .-J.I I-11 U V L L T UIIO. longitud de 14. (Si tienes más filas después de la 14, mira las instrucciones en la Lección 3-5 para borrarlas) ruivi <a ^uci vuivs vi wnu?iiiu<¿ uv ia v m lauiw ÍXHVÍ». miia ia unva uvi VÍWLUU. T i A T S A Í / • . V N " P i / rv. T t f^ ^Arwif AA«+A*\*/ÍAU7XAuiia n m «cuiauir. TTO^^KI A l.CJI vpCivii u vuio^iay - y pt'i ijjíocArnArc^iA!wawriijuy Pero antes tienes que seleccionar la variable en la pantalla ficheros. de Contenido de - Pulsa la tecla Horne, si hace falta,, para seleccionar la variable sales. The f o l l o u l n g Uar t kb1 a • alai ' unlta onhand virllllit ara c u r r a n t l y UldtS T^pa Rank 18 13 18 lanjth ln tha i l l a Date i H; 11'12'98 1 1 ÍI'IZ'SB 14 14 Praca EHTCR hay for aach v a r l a b l a III.Ip 2 £ ¿ 11 3S.vacr < P r l i c r S 1MPUI U'12'SO COSnETIC: Una Co—<enl 11U3 11=13 I1U3 to ba e¿lta¿, or proal A=fill D^DIeplay. ÍCo 7U«rt BC~4 SOaulce lOOult. ritpl.y PILE • • Figura 3-21. Pantalla de Contenido de fichero con el fichero COSMETIC con la variable sales seleccionada - Escribe la letra D (opción Display-visualizar). Una vez escrita la letra D (opción de visualizacion) en la pantalla de Contenido de ficheros, el sistema presenta, el contenido de la variable sales. La pantalla de Contenido que se muestra en ia Figura 3-22 presenta el nombre de la variable, su longitud y los valores de los datos. Desde esta pantalla no se puede editar los valores almacenados en ia variable. En la Lección 3-2 aprenderás como crear una variable de caracteres - una variable en la que puede haber letras y números La lección 3-2 empieza en la pantalla de Contenido de ficheros, asi que usa la tecla Esc para volver a la pantalla de Contenido de ficheros - Pulsa la tecla Esc para volver a la pantalla de Contenido de fichero. / 1 "X 1 Uirl.bl.: COSHETIC.<•!•> 6.487 (Unjth • 14) 8.293 9.276 8.274 8.2SS 8.2S3 8.248 B.24S 8.24 C 137 8.233 C 11 > 8.223 ci:> 6. 2 1 1 8.2 C13> <14> 8. 183 Pr«««'IicT Cur«or"ktyt'or'Poj» Mu»btr: lH«lp<< 2t4ltr2 3S«vicr 4Prt«er SPrt.ft JWUT.iv Uo • •. 7U«r>.; •••. f.9. i:r«n:i SDtvlc» IBOult? Dii>i.y nu Figura 3-22. Pantalla de Contenido de la variables sales CREACION DE UNA VARIABLE DE CARACTERES. En esta lección aprenderás cómo crear una variable de caracteres llamada producís usando el editor de datos. Almacenarás la variable en el fichero COSMETIC que consiste en la Lección 3-1La Lección 3-2 empieza en la pantalla de Contenido de ficheros. La pantalla de Contenido de ficheros indica todas las variables que hay en el fichero COSMETIC (véase la Figura 3-23). Querernos ahora ver todas las variables en el editor de datos. Mira la Línea de estado. La. opción A (All -Todas) te permite v er ei contenido de todas las variables. - Escribe !a letra A (opción All-Todas). Tha follauln) u a r l i b l n ara currantly ln tha fll« COSHEIIC: Varlabia Uldth T*p« Rank unlta onhand 13 M 18 H lanjth Pata 1 14 1 H Co~-anl 1I'12'SB 11:13 U'12'38 U"-13 PTfPran'SKTIH'kas'rór'aach'varlikl» lHalpt3 2Edlt\ 1 ; 3Sav«cr «Prlter S JKP.UlJ- Tt~a lo "k« adltaJ, or : pra««" A«A1I 1 D'Dl.play:.-'• ICo TVar» - BC~j'r : S D n » U » iBQultu Olipta* TI IX'Jl- Figura 3-23. Pantalla de Contenido del fichero con la variable sales Una vez que escriba la letra A (para la opción AU-Todas) en la pantalla de Contenido de ficheros, el sistema presenta las variables sales, units, y onhand en el editor de datos (véase la Figura 3-24). Cursor at Roy: Colimo: .487 .233 .276 .274 .205 6 • 2S3 7 . 3 B •24 3 .24284S ia .239 11 .223 12 .211 13 . 208 14 . ICO LeojtK 11 1 3 4 5 2 TafUlh M'l® 1 1 JE. 12. 3. 13. 22. 11. 41. 3S. 39. 22. 26. 39. se. 47. 14 K'13 Oata Editor COSnEIIC rile: HokImuh Rot/c: 24 Kunber of Colc: 3 i 3. • 6i.;- ; 6 7. ¡i. SI. 78. 63. 23. 41. 53. 63. 33. 4. 32. 14 Prest the F6 Vey to i w r updaled dala or tho F5 kcy for olher o p l l o n t . lHelp ZEdll 3Savicr 4 P r U c r SOpli 6Go 7U»rt 8C-d SDtulce IMfUI DUplay FILE íeOult l-igura 3-24. Las variables sales, uniLs, y onhand en el editor de datos 43 Ahora tienes que crear otra variable- products- a la derecha de la variable onhand La variable prodncts tendrá los nombres de los 14 productos cosméticos. Observa la línea de estado. La tecla F5 (Opts) (Opciones) te permite ver otras opciones. Pero antes de que uses F5 (Opts) tienes que poner el cursor en la columna de la variable onhand. - Usa la tecla lab para poner el cursor en ia columna de la variable onhand - Pulsa F5 (Opts). Una vez que se pulsa F5 (Opts), el sistema presenta el menú-ventana de Opciones del editor. Para crear una variable nueva, tienes que seleccionar la opción para Añadir otra columna, en el menú-ventana de Opciones del editor (véase la Figura 5-25). - Usa la Flecha hacia abajo para seleccionar la opción Add Additional Column (Añadir otra columna). r e t i r a 3-25. Menú-ventana de Opciones cíeI editor con selección de la opción AdiJ Additional C o l u m n ( A ñ a d i r otra c o l u m n a ) - Pulsa la tecla Enter. -11 > Una vez que se pulsa la tecla Enter para procesar la selección hecha en el menúventana de Opciones del editor, el sistema presenta la ventana para Añadir otra columna (véase la Figura 3-26). Cursor at Rou: Co iu*n: niHlNun Rout: 14 Pato Editor C l l a : COSttEIlC Hu^bcr of Cois: 3 onKirt "3. i .107— : ti. 2 . 17. 3 4 .2?6 st. 5 SS. 6 .t. .1 41,'í'í- ' ' 78. 7 .248 C 13. e . 24S; .V.if 3S.. 23. 38. 3 .240^..^ 233K^;--; 22. i . ; ,41. ís . .223* •« 26. .-' ." S3. n ; 63. 2ll^''rr: 'J 38. 1z 33. . 2 8 0 " — * , ' ( £ 8 ¿ . 13 . 103' •* ! 47. ' ' 4. 32. 1j 4th 14 Lan M 14 Typ'Uth H'10 «'13 «'18 ftdd addltlonal cotuno Mana: Typm: ti V.;." Kntor'or adlt varlabl* na«t. typa»- and utdth. 7Uars" 8C«d 30a*,Ice 18Qult IHolp'j 2Edlt~.j 3Savtcr 4?rticr S íCo. DUrU* MLE IMPUT ' Figura 3-26. Editor de datos con la ventana Add Addilional Column (Añadir otra columna) Para crear la variable producís, se indica ei nombre de la nueva variable eii ia ventana para Añadir otra columna (véase la Figura 3-27). También se usa la misma ventana para indicar que produets es una variable de caracteres con una amplitud de ';0. - tscr:be la palabra produets en el campo Ñame (Nombre) de la ventana. Add Addition.il Column (Añadir otra columna). - U¡a la tecla Tab para poner el cursor en el campo Tvpe (Tipo). - Escribe la letra C (Caracteres) en el campo Tvpe. - Usa la tecla Tab para poner el cursor en el campo Width (Amplitud). - Escribe ei número SO encima, dei numero i .3 en ei campo width (Amplitud). Tita editor r i l e : COSnEIlC Curcor at Rou: Co1u«n: Rou ca las ' ' 3. 61." • : 17. 12. s . 2SS - Lonjth 14 N ' 18 IH.Ip IHrUX - 2£dtl Typ'UtS 14 3 uní 1 Í . " 4 e 7 r r : ': IB. 2 -233 : 3 1.276 V. ' • : 8. •4 1 . 2 7 4 •.; 13. 6 -2S3-. 7 .243:' ' 8 i.24S'. 3 .249 18 .239 • 11 (.223 12 ¡.211 13 .283 14 . 189 flaxlxun Rout: Hunbcr oT Cois: ; St. Sí. : 78. 13. 22. 11. : 41. . 35. 38. 22. 26. 39. 58. 47. Qdd a d d l l l o n a l : 2s. 41. S3. ' 63. • colu^n product* " ryp»: C Uldth: 38 33. 4. 32. 14 H'l» Entar or Prtier S 3Savacr 4Prt 14 H'13 adlt warlakl«>a-or"lyp»P «ní'uUlhí'f;:" 7Uar«'.1 8C«4 ' SDovIoo lBDult., Dltplay riL(>' ' Figura 3-27. Ventana p3ra Añadir otra columna una vez completada - Pulsa F6 (GO). Una vez que se pulsa F6 (Go) para procesar lo entrado en la ventana para Añadir otra columna, el sistema crea una columna en blanco para la nueva variable (véase la Figura 3-26). Observa que el sistema también presenta una ventana en blanco para Añadir otra columna. Curtor *t Rou: Co lunn: Rou Datft t J I t o r M l « : COSACTIC producís units 2S«VÍ»¿IÍ n*MÍMun Rou*: 14 Hunbvr of Cois: A 4frl«ci; SSglíSS tCoJ-iUl ?l¿ir>25 1 S í i y l o i lSQultV 01ipIay niiítzs Figura 3-28. La columna de la variable producís en el editor de datos y la ventana Add Addilional Column (Añadir otra columna) Ahora hay que poner valores de datos en la nueva variable products. Pero antes hay que usar la tecla Esc para hacer desaparecer de la pantalla la ventana para Añadir otra columna (véase la Figura 3-29). - Pulsa la tecla Esc. Curiar ai ?:«: Column: Rou 1 Z 3 4 5 i 7 8 3 18 11 12 14 13 aalaa .2S3¿-> .245 .239» .223-:'.'.• .211* -i. .2B01': .183 <«. 13. 2 2 . x -. * v , •' X I . : : 41. 35. . 22. • 26.' 38.: sa. 47. - tillar fila: COSnETIC rtMlniM Rouc: hurtbar oT Cola: 14 4 producta onhand unltt .-487TT~" i « r ; •7 ~ .233 ' : ¿ r ' 12. • ' •• .274 Tata 2 4 . '1 t • 'i « M X X i s 1 X 2 4 S X 3 ( j «SU, ,K. ¿--v .•>< *•-..• ¿ít-oul-.-.-ri-.r-;.. 14 14 B Lanjth 14 Typ'Uth K'18 M-"13 «'IB C'3B ríí-i-rpr.n^tha F6 kay to' «av« vj><!it«d ¿at»"«r7th«"rS"V»a ror'othar' «ftltm:"'" 'lHatp-i 2 H U " BSauier 4Prtacr X C p t a ' IC».'."^ ' ?Uar« ' BC»d - •>' 9Davlc« lBOult: JMPUI Dlxpl»»» riLE1";1'; Figura 3-29. La columna de la variable products en el editor de datos Ahora todo esta preparado para entrar valores de datos para la nueva variable products Puedes emplear las teclas de las flechas (arriba, abajo, derecha, e izquierda) 7 las teclas Tab, Home, y End además de la tecla Enter para ir de una parte a otra dentro del editor de datos. Usa la tecla Backspace (Retroceso) para corregir errores. Acuérdate de pulsar la tecla Enter después de escribir cada uno de los nombres (véase la Figura .3-30). - Escribe los nombres que se indican a continuación en la columna de la variable producís. Madness Perfume Sweetness Períume Roses Períume Sea Foam Cologne Madlv Musk Cologne / o Simmering Spice Cologne Dusty Dawn Lipstick. Sultrv Sunset Lipstick Red Red Rose Lipstick Hint of Rose Powder Basically Beige Powder Ptainly Peacli Powder Ocean Blue Sliadow Barely Brovn Sliadow Cursor at Rou: Colu^n: 14 4 Cata Editor F i l e : COSHEIIC naxlnun Rous: HuMber or Cola: 11 1 producía t > 3 4 s ( 7 S 3 le ii 12 13 11 .'487 ~.< .233 .276 .271 " .2SS" • • .263 .248 - .245 .248 -233.. .223 • •• • .211 .288 ' ' .183 • - r i Ha ¿na a a* Par ru».e . 1. J 1«."— T - 7 T J 12.. Euaatnaaa Períuna . ) : 8. •••'ii R o t a i ' P t r r u H a . í . - - ' , - v - — i.-'-'..' > Sam FoanCo ] c j n a *', ¡ 22. ' .^ 1 - - M dadla nusk Colosna • •" * st.y S l n x a r l n j Jplca C o l o j n a . •„ • U. 79. • - . 41.— 63.— Duat^'Daun 3s. 23. . S u l t r y Sunsat L i p s t i c k ' . ' ' 1-' • 38. Rad Red Rosa L i p s t i c k " ^ ' " . 41. " i 53.4 Hint or.! Rosa Poudarr • •••. -.-f.-.'. . : 22... — : ' . •• * • - 26. 63. • Bastea 1 l y ' g a l g a Poudarr ; , 33. P l a l n l y Paach Pouder' . 33. i l ; S8. ri. Occan Blue Shadou i 47. 32. Barely Broun Shadou -S.T 61.67.S6.V , Lcnjt», 14 14 14 13 Ivp'u-th «'18 rt'13 «'IB C'38 * Frttt tha F6 key to n v l vpdatad data or tha FS kay Cor othar optlonc. ;w«Ip 2Edlt 35.v»cr 4Prtacr SOpta 6Co 7U»ra BC-d SDaulca lOQult MPUI Dltplay PILE Figura 3-30. La variable produets en el editor de datos - Pulsa F6 (GO). Una «Tez que se pulsa F6 (Go) para procesar las entradas en el editor de datos, el sistema presenta e! menú-ventana para Almacenar. Hay que almacenar los datos y salir del editor de datos. Selecciona la opción Save and Exit (Almacenar y salir) en el menú-ventana para Almacenar (véase la Figura 3-3 O- - Usa la Flecha hacia abajo para seleccionar la opción Save and Exit (Almacenar y Salir). 1< Rou 1 2 3 4 s ( 7 8 3 IB 11 12 13 14 uní t c tilit .246 .233 w .223 '. .211 .IES 38. . . • ol 2 2 . • , 26. - i 38. • SB. " * 47. f-—:^ • flaHlnun Rouc! ftvrtbar of Cola: 14 4 praduela «.í«..a"rarf-a ~ 'tí i Cvaalnaia farfu-• ' ftaaa farfu.a -Vi^l^C. Zs^'i'-íz^' Saa foa» CalcjnaT^"- " -' '-fi-vt/-' le." ::" '-" *" " .23:12. .271 1 ¡s.: '•' _ • n.-tr.' . 2SS ' : 2 2 : ' " .253 :: . i u ; • .245 yf/'-'l • 14 Lan5 th H' IB Tsp'Uth 3."u SI. • 47. Sí. ' 56.". . Fadly flulh Colojna •- —^-j tic-arlnj Cplc» Celejnt 78.'63." ' r / Dutty D ! Sultry 23.'.. ' Rad P«d Sav» ulthout « K l t 41. Hlnfof • 53. Cava* and' axltL\r?: tailcal 63.• 33. Ocaan 8 lu» "Shadói?**;1' 4. Baraly Broun Shadou 32. 14 14 14 C'38 praii IKIIR-'to"•• 1 act. 6Go ' 7Uart's' 8C~d ' SDaulca lBOull Dlcplay M'13 H'18 ' H I j M l j h t daalrad «ntry and IHelp ' - 2Edlt. JKPUI Dais t d l t o r fila: cosnrnc 4 Coíunnl : 3Savccr 4frtier S MLI Figura 3-31. Menú-ventana Save (Almacenar) con selección de la opción Save and Exit (Almacenar y Salir) - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el menúventana para Almacenar, el sistema almacena los datos y sale del editor de datos, y luego presenta la pantalla de Contenido de ficheros. Observa que la pantalla de Contenido de ficheros ahora presenta información sobre la nueva variable produets. a continuación vamos a examinar el contenido de la variable produets. Se usa la opción D (Display- Visualización) de la pantalla de Contenido de ficheros para ver la. variable produets en el editor de datos. Antes hay que seleccionar la variable produets en la pantalla de Contenido de Ficheros (véase la Figura 3-32). - Usa la tecla End para seleccionar la variable produets. 49 Ih» follouln3 Uarlable sales units onhand produets uirliblil ar» currtntly ln th« f i l a COSflEIlC: Ca»«trt UlJth Typa Dtnk Lmjth Data II-Í H N M C 14 14 14 14 38 1]'12'3B Il'i2'98 1I'12'38 U'12'38' 12: SÉ. 12: SE 12: Sb 1Z:S6 18 13 18 38 1 1 I 2 P r o a » ENTER kay for a . c h v a r l a b l o lllalp 2Edlt 3Savscr 4 P r t s c r S IMPUI t » t>a o d l l o d , ar p r o í s A ' A l l D - D l a p l a y . fcCo ?U.r« BC-d ' S O a u t » lOOult Dlcplay fILE Figura 3-32. ran(:illj de Contenido de fichero del fichero COSMETIC con selección de la variable pruducLs Escribe la letra D (para visualizar) Una vez que se pulsa D (para la opción de visualización), el sistema muestra la pantalla de Contenido con la variable produets (véase la Figura 3-33). La pantalla de Contenido presenta el nombre de la variable, su longitud (número de valores y amplitud permitida para cada valor), y los valores de los datos. No se pueden editar los valores de los datos en la variable desde esta pantalla de Contenido. Uarlahla: COSflEIIC. producte U a n j t h * 14 3B> C lífladness Ptrfyn < 2 ) S u o a t n o i s Perfuma < 3)Ra a a a P o r f u i a < 4 ) S « a Foax Colo^na < SJftadly nuih Colojnv < C ) S ( « N » r l n 3 Splca C o l o j n o < 7)Dua ty Daun L l p a t l c k < S J S u l t r y Suncat L t p c t l c k ( 9>Rad Rad Reía L l p c t l c k <18>>llnt or Roca Poudar < l l > B a c l c a l l y Balsa Poudar <l2>PlaInla Poudar <13)0c#ar» Bluo Shadou < 1 4 > 8 a r a l y Broun Shadou P.ICH Prais'Esc.""'Cursor" or PIJI «u»¡ir: lHelp-^ 2Edlt T 3S«vicr 4Prticr SPrtopt tCo tMPUI '-l: * ?U»r« : -P«s«'L'. 1 of. 1.1 8C«d SDaulca I B O u l f DUplas TILE. . Figura 3-33. Pantalla de Contenido de la variable produets 50 En la Lección 3-3 aprenderás cómo editar las variables existentes. 'La Lección 33 empieza en la pantalla de Contenido de ficheros, así que usa la tecla Esc para volver a la pantalla de Contenido de ficheros (véase la Figura 3-34). - Pulsa la tecla Esc para volver a la pantalla de Contenido de fichero. — \ I h « fe 1 l e w l n ] v a f l i b l t i u.riíbl» Uldtft ie 13 le 30 fyp« M N H C » r v C v r r c n l l y In Kmk 1 1 1 2 l>njtl> 13 M M 11 38 T i l * COSriETlC: C«l« J1-» Co~~«nt 11' 8'9817:87 11' 8'S017:87 11' 8'9017:87 •. Il'-S'S»171 9 7 - > • : • 'Pr»*« ZKTER k.y Cor »«eh vtrltfcli l» k» «dllid. «r pr«t« «=A11 D»t>l«pl»y. IH.lp > 2 E Í U 3S«v«er 5 P r W c r S fcCo 7V»r» 8C»¿' " 9D.vlc« lOOuit IMPUI íltpliy FILE Figura 3-34. Pantalla de Contenido del fichero COSMETIC con la variable producís seleccionada SI EDICION DE VARIABLES EXISTENTES. En esta lección aprenderás cómo editar las variables creadas en las Lecciones 3-1 y 3-2 empleando el editor de datos. La lección 3-3 empieza en la pantalla de -.Contenido de ficheros. La pantalla de Contenido de ficheros fichero COSMETICS (véase la :Figura 3-35). la lista, de todas las variables del ofrece - Escribe la letra A (opción All-Todas). Th» folloulns u>rl»ble> ere currentl* ln the file CCSnEIlC: Variable sales uní ts onhand Uldth Typa Rank is 13 1S 39 K n M 1 1 1 '2 LenjlK Date 13 14 14 14 38 11' 11' 11' 11' Tl^e 8'38 8'38 8'98 8'S8 Co««ent 17: 67 1?: 87 17: 87 17: 87 Press EHTER key for aach varlabla to b» adltad, or prasa (UAll D i D U p I a y . IHelp . 2£dl¿ .< 3S«vser 4?rtser S tCo 7U.r» 9Cavlca lBOuIt IMPUT 01sp1ay FILE Figura 3-35. Pantalla de Contenido del fichero COSMKTIC Una vez que se escribe la letra A (All-Todas) en la pantalla de' Contenido de ficheros., el sistema presenta las variables sales, units, onhand, v produets en el editor de datos (véase la Figura 3-36). Observa que el sistema presenta el conteñido de las variables en el orden en que figuraban en la pantalla de Contenido de ficheros. Cursor at Rou: Colu-n: Rou ti lee 1 . 487 2 .233 3 .276 4 .274 s • 2SS í . 2S3 7 .248 8 .245 3 .248 19 .233 11 .223 12 .211 1 3 .208 14 .183 1 1 Cal» Editor f I la: COJnETIC n * K i n u * Rous: Mu-bar oC Cola: units onhand producís ía. 1B. 2. nadnots * ParTu-o • * Suoatnoss ParCuma . 13. s. 61. 6 7.. Sí. 41. 78. 63. 2 2. 11. 3S. 38. 22. 26. 38. s a. 47. Si. 23. 41. • 53. 6 3. 33. 4. 3Z. 14 4 ..*"" ' ,„ ' . . Rosas Parfum w-.». Sao roa* Colojno^ * .'í* tladly nuak Colosn«'^': • l l i w t r l n ) Splco Colosna.*: Dusly Caun Llpst lck l u l t r v Cunast L l p « l l e k v ' i " . •• Rad Rad Roso L. 1 pa l Ick^'-.--- Hlnt of Roso Poudar Baalcally S a l j a Poudar.,.,-.. P l a l n l y Paaek Poudar?"'. , " •*'' T Ocaan Slua Shadou * Baraly Broun Shadou Lensth 14 14 14 14 Typ'Ulh N'18 «'13 H'18 C'38 Pracs tha f& kay lo sauo updatad dala'or'tho rS kay Cor olh«r"optlonc. "* UUIp 2Edll 3S.uscr 4Prtlcr SOpl» 6Cs 7Uara • BC~d SPaulc* lBQult IKPUI Plipl.y flLE-.-J Figura 3-36. Las variables sales, units, onhand, y producís en el editor de dalos Ahora se quiere cambiar los valores de los datos en las celdas de la fila 14. Se puede editar las variables simplemente escribiendo de nuevo los valores de los datos (véase la Figura 3-3?)- Usa la tecla End para poner el cursor en la celda 14 de la variable sales. Escribe el número .154 encima del número .159. - Usa la tecla Tab para ir a la celda 14 de la variable units. Escribe el número 32 encima del número 47. - Usa la tecla Tab para ir a la celda 14 de la variable onhand. Pon un espacio y un numero 9 encima del número 32. - Usa 1-3 tecla Tab para ir a la celda 14 de la variable produets Escribe el nombre Siiverv Shadow encima del nombre Barely Brown Chó.dow. Usa la tecla Deiete (Borrar) para borrar las letras sobran tes n Cursor at Rou: Colunn: Rou 1 z uní l a salaa . 4 8 7 " . . " 1 18. .233 12.• Z76 .Z74-" \ .* 13. - •J IBs .zss vr'ri zz: 6 .253 r.w - 11. V 41. 7 .248 3 4 8 3 19 11 12 13 14 .245 ' ' .' .248 "—' .233 ; ' .223 .211' - ' " .288;" : .154* 3S. 36. 22. 26. 38. .32. sa. flaKl^uM Rouc: H y b e r of Cois: Data Editor Ella: COSnEIlC 4 1 product E .\ - _ • ; • 3. 61. 67. S6. ' S6. • 78. 63. 23. 41. 53. 63. 33. 4. 3. fladness Perfumo . Suaatnasa Perfuma Roses P t r í u * * Sea fo>" Cologne r.edly ru/sk Cologne Sl-»-orIng Splca Cologne Dwsty Caun Lipstick Su-tel Svltry Llflllck ft¿ F.d Roca Lipstick Hlrt of Fowíor c i l l c i l l y Eelje f B . i i r P l a l n l y Faach Poudar Occan Blue Shodou SIIvery Shodou Lan3th 14 14 I4 M lyp'Uth M'lfl H'13 H'16 C'38 Presa'tha'FG'fcay to sawa updatad data or tho TS key íor othar optlons. ¿H.Ip"> 2E4It SSavser 4Prtscr SOpta 6Co 7Uara 8C»d 30avlca lOOult JMPUI..' 01spIoy PILE Figura 3-37. Variables editadas en el editor de datos A continuación se quiere borrar una fila entera de valores de datos. Primero hay que seleccionar la fila a borrar. Luego se pulsa F5 (Opts) para abrir el menúventana de Opciones del editor. Para terminar, se selecciona la opción Delete Rows (Borrar filas) en el menú-ventana de Opciones del editor (véase la Figura 3-35 ). - Usa la tecla Home para poner el cursor al principio de la columna de la variable sales. - Usa la Flecha hacia abajo para poner el cursor en la celda 5 (valor de datos .2SS)- Pulsa. F5 (Opts). - Usa la Flecha hacia abajo para seleccionar la opción Delete Rows (Borrar filas). Cursor i t Rou: Co 1 u«n: Rou solos 1 .487.' .233 . 276 .274 .2SS .253 ' .248 .245 2 3 4 S & 7 9 8 .2<e 19 .233 .223 .211 11 12 13 .288 "1 . 154 Lcngth Typ'Uth I I K U U H ROUB: Munbor of Col»: 0«t» Editor rilo: COSnETIC 14 4 products 3 18. 12. 8. 13. 22. 11. 41. 35. 38. 22. 26. 33. 53. 32. .• • i flódn Suflt Roso too «•di ElnDuat Sult . R . H Rod Hl nl _ 11 (7. • St. se. • 78. • 13. 29. • 41. ' 59. &3. 33. 4. • ••1 FUI 0c«« rioílfy silos Add oddltlonol colunn ROMOUO solos ftdd rous Dolola*róuo Pt^^tfíiW TAi^ Add colli Doloto colli Prlnt to prlntor Prlnl to Tilo Sovo ulthout ox 11 Sort ln oscondlnf ordor Sort ln dcccondlnj order 14 «'18 14 14 14 «'13 K'I8 C'38 Hljhlljht dtslrod onlry »»d pros* M T E R to soloct. 2Cdlt 3S«uicr 4Prt<cr S tCo 7Uars' 8C«d SDoulo* lOOult Dlsploy FILE lM.lp IMPUI Figura 3-3.S. Menú-ventana de Opciones del editor con selección de la opción Dcletc Rous (Horrar filas) Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el menude Opciones del editor, el sistema pide que se indique el número de filas a •rrar (véase la Figura 3-39)- jntana Rou 1 2 .233 5 6 7 8 \- - 3 V. IB .-I.—:—r~¡! s.T : ' ti.— ' ' Suootnoss*Porfu«o~ • % * * • <l>: • 12." - ~ - • .—y--.. i 18 11 12 13 14 14 4 products solas 3 4 N«K|MUM Rous: Munber of Cois: Soto Editor Filo: COSnEIIC Cursor st Rou: Coluftn: .209 .154 -.. - • Oc«»n filwa Ch.dcu 58. 4. 32. ' 3. 14 M'13 ' •* - Slluory Shadou Lonjth lyp'Uth 14 «'18 14 «'10 lHtlp lhPUI 2í(¡n_, 3S»utcr 4Prt«cr S 14 C'38 tío TVors 8C«d 9Doulco IBOult Dlspliy FILE Figura 3-39. indicador del número de filas a borrar cc JJ I Hay que borrar una fila de las variables sales, units, onhand, y produets. - Pulsa la tecla Enter para aceptar el valor de 1 íila a borrar como opción por defecto. Una vez que se pulsa la tecla Enter para aceptar la opción por defecto con valor de 1, el sistema borra la íila 5 y hace avanzar un puesto las filas siguientes (véase la Figura 3-40). Observa que cuando se emplea la opción para Borrar filas, STATGRAPHICS empieza a borrarlas a partir de la fila en la que se encuentre el cursor. Curtor at Rou: Colu-n: Rou 1 2 3 S 6 7 8 9 18 11 1Z 13 calos .487"-—.' . 2 9 3 V - .276r-í . 274 S 1 units n onhand 12. I ? I 8 . . :> 13. - :-- „-J . rs3 .218- " 41. - 2 4 S '-. ' .248 • • ! 38. .239 : 22. . 2 2 3 " ' • : 26.• 3S. .211 .288 . 1S4 . Doto Editor rilo: COSHE11C 9. . 61. 67. S6. 78. 63. ; 38. S8. 29. 41. S9. 63. 33. 4. ; 32. 9. noxlnuM Rous: Ku-b.r or Cois: 13 4 produets * H a d n o s s ¡ Suaatnaia porfun» . r Rosas Parfu-a * ."f • Sea Foa** Colojna Slnnorlnj Splc* Colojn* Dosty Daun Llp'Stlck Sultry Sunsat Llpstlck Rad Rod Rosa Llpstlck Nlnt oF Roso Poudor" Baslcally Beljt Poudar Plalnly Poach Fouátr Ocean Slua Shadou: Sllvtry Shadou ' * * 14 Lanjth 13 13 13 13 Iyp'Uth K'IB H'l3 H'IB C'38 r? Pr«s» th«"FG lny'to i«v» updttid d»t« or thi FS lH«lp~-' Z E d l t V 3S«utcr 4Prt*er SOpts SCo • 7V«r» 1MPUT *•" V for'othtr optlon». 8C«d SOBUICB IBOult Dltplay FILE J ; Figura 3-40. Variables con una fila borrada en el editor de datos A continuación hay que añadir una fila entera de valores de datos. Primero hay que indicar dónde se quiere añadir la fila. (Cuando se u.sa la opción para Añadir filas, STATGRAPHICS empieza a añadirlas en la fila donde se encuentra fel cursor). Luego se pulsa F5 (Opts) para abrir el rnenu ventanas de Opciones del editor. Para terminar, se selecciona la opción Add Rows (Añadir filas) en el menú-ventana de Opciones del editor (véase la Figura 3-41). 56 - Usa la Flecha hacia abajo para poner el cursor en la celda 11 (valor de datos .211) en la variable sales. - Pulsa F5 (Opts). - Usa la Flecha hacia abajo para seleccionar la opción Add Rows (Añadir filas). Cursor at Rou: Coluxn: Jtou 3 4 5 t ¿276 10. --V- KIXJ js.-tg . >>t _ _ . . ,27i¿: .'i»--. •253 ¡ .248 rr "v - 41.-T.24Sf- . • " j 38.-. Lanjth lyp'Uth , lH.lp ; 1MPUI K*K1P«U« Rous: Nuxber of Col«: Oats táller file: G O Í M T i C uní le 3S-: 3 .233;?. - •22. 1S .223-' ' : 26. . ' 11 .211^.-' '38. 12 .298-" ' S8. 32. 13 . 154 .-.— 11 7 t 1 solee i 2 11 cnhend 13 4 producís nodlíy s s l t s Aid sddttlonsl calunn Rexove s s l t s d d *r ¿ 5 «725 Mr- P Pelele rows ÍJ.v-rfRí"*! Cuet 5SSSSS' 23 H»»*' 3j.5s-Sí-if rui 3..--i Oce. Cllu Add ce lis «elote calis rrlnt to prlntsr r r i n t to r t w leue ulthout exlt Sert ln afcendlnj order Sert ln deecendlnj order 13 «'18 13 13 13 «'13 «'18 C'3B H l j M l j M daalred entra and prets' lMltR*lo - salsctrr" T T~^Í~'"' .TV: 2tdlt 35«vaer IPrtacr S - 6Ca — 7Vars * 8C~d'-« SPaulo. lOOult Di mpí*y r¡LK Figura 3--11. Menú-vcnlana de Opciones de! cdilor con selección de la opción Add Uo«s (Añadir illas) - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar la selección hecha en el menúventana de Opciones del editor, el sistema pide que se especifique el número de filas a añadir (véase la Figura 3-42). Hay que añadir una fila a las variables sales, units, onhand, y producís, así que pulsa la tecla Enter para aceptar el valor de la opción por defecto. - Pulsa la tecla Enter otra ves para aceptar el valor de una fila a añadir como opción por defecto. n»xlNUM RQUI! Hunbor of Col*: Calo Cdllor r i l o : COSntllC 11 Cursor ot Rou: Colunn: 1 «nhand 13 4 producto Sllutry'Shodou ' Lanjtl» 13 i^p^Jtk ti'ie 13 C'3B 13 13 I4'13 «'te V • r-ixrz. Dltplay r.ILI^.7 .— J---T- l ü m ^ J : Figura 3-42. Indicador de número de filas a añadir Una vez que se pulsa la tecla Enter, el sistema añade una fila en blanco en la f 11 y mueve las siguientes un puesto hacia abajo (véase la Figura 3-43). (Cuando se usa la opción para Añadir filas, STATGRAPHICS empieza a añadir filas en la fila en la que se encuentre el cursor). Cursor «t Rou: Colunn: 11 unltt 1 z .233"Í:^V: 3 .276<v_> J 4 .274^:1 S -2S3.it'6 .249 - v • ' 7 .245 ,.. > .240 : : . í 3 .233, la .223,-.,1 . ii 12 • 211 .' 13 .288 ' • 14 .1S4' * - lonjth Typ'títl» 14 H'IB 14 K'l3 i. "-"Pract*th«'X6'k«y"to Hunbor of Cois: 4 product* 18.'. 12. y"-,.-'. i S. • 13.--*''"Í"! íi.-r-^ 41. • 35. 38. 22. • 2t. • 38. SB. 32. ntxirtuN flsws: 14 04t« Editor Tlio: COSnEUC 1 • • • • S.J: u rg: 67;.*; 56^! 1 63. > 23.:. * 41.. 53. • •* 6 3 . " v 33. , • 4.3. • tladnaa." r « r r » M S u i i t n i i l T.r -jm C.loino Il^orlnj'Spleo'Colojn.^TÍÍ^I Puaty p»un* LIpatlck-'^-T-.I-V^ly*: Eultry Cunto t Llpat lok-.-^.Vv.'...Rad Rad R o a o ' L l p a t l c k " ^ *; .. - ! Mlnt or'Ro«o'roudor: 1 rt ; 8 a l j a Poudofwii¿¿" .j - V 8Ta a l o a l l * •.AAO^.».^ •-•v.t.^.Mj-**-] .. h»r i o l n l y Paach .Cóndor;.,:,.., ; • * Ocoan S1 uo"£h• d o u ^ ' t ' ' • • , " Ellvary It>»dou'-";' .""-í" .. 14 14 «'18 C'38 t«vt upí»l«d"d»t»*or~tho-rS"fci<nfor-olh«r~: bpUonc~T"rr; I H « l ? - q 2Ed 11 • 3S.vter 4Prttcr S0pt*«4 6Co^— í 7UariT? 8Cxd""< SDaulco IBOuttt IKPÜ; " " Dliplay PILE" Figura 3-43. Variables con una fila en blanco añadida en el edilor de datos Ahora se puede poner datos en la Fila 11 para todas las variables. Se puede poner números enteros en las celdas en blanco de una variable numérica sin escribir el punto separador de decimales al íinal del valor (véase la Fig. 3-44). La próxima vez que se presenten las variables en el editor de datos, STATGRAPHICS añadirá lo-? separadores de decimales y alineará los valores de los datos. - Escribe el número .156 en la celda en blanco de la variable sales. - Usa la tecla Tab para poner el cursor en la variable units. Escribe el número 3? en la celda en blanco. - Usa la tecla Tab para poner el cursor en la variable onhand. Escribe el número 12 en la celda en blanco. - Usa la tecla Tab para poner el cursor en la variable produets. Escribe el nombre Gentle Grey Shadow en la celda en blanco. Cu i-Mar »t Rou: Colunn: leu solos unlta sí 26 S. 38.'-tí 11 4 Cata rdltor ni.: COSntlIC rtftMlmm Rou*: Kunbor of Cola: 14 4 product* ha"dno««y^*ríUniJ Sútatnaif? Roiaa'rirfyna^H^ y.»Tto¿Üfolmn«r, . ,.., . CtxnorlM^tpIcatColOfiw^ (uaty; Daunttlpat lokWií Su 11 rv' tuns < L1 pm 11 elt? Rod Rad'RosaHúatlck^ Htnt'of RosaTroudar!^ Saileally'BalsáTfoudaríl! Cantlo'Cra|/;Sh«doú"KJt5, 3 3 i r 1 a l ni y' r«»ch' T oudar «JtoWoSíí 11 iv.^sh.dou ^ r T T ^ r - r t onhand 14 14 14 rie K ' C ' C°^rr¿si"th«^E''kt^tH'l3 o"»saw«*updslsd'dala*or'lths3'BrS>»a'fórJ"othorTóptlonsrT'.^?. Í P Í l p ^ 2£4l.tij 3Say¿éc 4frt«cr S0?lsjr¿ 6Co.;-.u TyariÉJ 8C«.d?t3 9»«vJlo« IBOult; Olsplay Lf.t-tó? 1££ül.~2 Figura 3-M. Variables con datos en la nueva fila en el editor de datos La columna de produets es más ancha de lo necesario para los nombres de productos que hsy en ella. Vamos a usar el menú-ventana de Opciones del editor par? modificar i? ?rnplitud de la columna de producís. El primer paso es pulsar F5 (Opts) para abrir el menú-ventana de Opciones del editor, y luego seleccionar la opción Modify pira modificar produets (véase la Figura 3-45). - Pulsa F5 (Opts). - Usa la tecla Home, si es necesario, para seleccionar la opción Modify (Modificar) producís. Cursor at Rou: Coluxn: fiou salee units 11 4 Data tdltor rilo: COSnKIlC enhand product* 1 KÍ3»f 5T ir ?3¡S ITE8333 Z 3 4 5 G 7 8 Add sddltlonal colunn Rsnov* product* Add rou* Delete rou* Add calis Delets calis Prlnt te prlntsr Prlnt to fila Xave ulthout aMlt Jort ln ascsndlnj order Sort ln dcicsndlnj order •"Jrf<r*ir. :z48?f4wy3 4i;-»^.-!¡»TL "í« Í3Í :249 3 :239?: 18 11 riexlmi* Rows: 14 Hunbar of Cois: 4 • 2Z3 12 13 M S" «-Jffe^-*-*» 1 3 38. S8. L«n3th 14 14 14 14 Typ'UthH/18 H'13 K'18 C'38 p.'ÍTTW-,H l g M Ight'deslred* entry'snd'praae t N I £ H " t o " » » U o t T T r = l V f lHelptí 2 U I t >i 3Seveor 4Prtaor S — t C o > « - - ' 7Vars~l B O d ^ S Í 9Pev|0« lBOultí jflfuiiK " " v PI«»I«» riurrá ; Figura 3-45. Menú-ventana de Opciones del editor con selección de la opción Modify (Modificar) producís ) - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar la selección hecha en el menúventana de Opciones del editor, el sistema presenta la ventana Modify Current Column (Modificar la columna activada). Se usa la ventana para Modificar la columna activada al objeto de indicar la nueva amplitud (véase la Figura 3-46). - Usa la tecla Tab para ir al campo Width (Amplitud). - Escribe el numero 25 encima del número 30 en este campo. 60 «t Rou: Colum: Doto ííltor rilo: COSntlIC 11 4 products 1 Z 3 4 5 Sss'.Fom.CoJojnsI . £1 iu««r1t nj'.Spl ca* Ca i ojn«3 Ousta"®» tuitr^s rtodlfy curront COIUHH R.á'Rod tnt'of' S3. - ...H• Boslcol1 K»»i: prodúct*^ Csntlo CrSPo: c 33.'; FWInly ;-4.- .•.'••; Ocoon SI Vldtt: 2S 6 8 9 18 11 Sus»tB«E«',P«rrufi«' Roioi'PorfuosJ (1 7 1Z 13 14 ItDNlnuH Rouc: 14 Huibor oT Col si4 .211 -jujZS . 268 Longth Typ'Uth 14 K'18 S. 14 M'13 " Sllvsry 14 «'18 14 C'3fl ÍH«lp"S? Z l d l t á 3Sou«or 4Prtser S?R«»vÍ 4Cop7JV TUorsTÍ BC~¿-¿i SP.ylo» 180ult^ IMPUIjSi OlspU* Figura 3-46. Ventana para Modificar la columna activada con indicación de la nueva amplitud - Pulsa F6 (GO) C Una vez que se pulsa F6 (Go) para procesar la ventana para Modificar la columna activada, el sistema cambia la amplitud de la columna y modifica la anotación Typ/Wtít (Tipo/Amplitud) al final de la columna de products para reflejar el cambio de amplitud (véase la Figura 3-47). - Pulsa F6 (Go) Cursor «t Rou: It Caluxn: 4 Rou solos untts Dota Idltor filo: COSniIlC onhtnd n»xlmi« Rous: 14 «unb.r «r Cois: 4 products Lsnjth 14 14 14 14 Typ'L'th K'18 K'13 K'IB C'ZE •*• i l í crTc l.hirT'Gptl ór,¿í lH«lpí3 2£dlt*í 3S.utor HF.-tsor SPpU~-G lC£J£?á ?V.r«£» 8Cnd'1?-? SPoylco !B«Glv3 r IKUl} Dioploy ÍJLZlf'í? V ) Figura 3-17. Columna modificada de la variable products en el editor de datos 61 Una vez que se pulsa otra vez F6 (Go) para procesar las entradas en la ventana para Modificar la columna activada, el sistema presenta el menú-ventana de Almacenaje. Hay que almacenar los datos y salir del editor de datos. Selecciona la opción para Almacenar y Salir en el menú-ventana para Almacenar (véase la Figura - Usa la Flecha hacia abajo para seleccionar la opción Save and Ezit (Almacenar y Salir). 11 4 Cursor >t Dolí Sou salas Unjtll Typ'Uth CalimftS 14 ICU 14 r sU Oats n i t o r rii>i cosntuc •lOitnl produets 14 Pfll fllKlmw Roo»! 14 fluMbor of Co 4l si 14 C'iS V , Figura 3-48. Menú-ventana Save (Almacenar) con selección de la opción Save and Exit (Almacenar y Salir) - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar la selección hecha en el menúvsntana para Almacenar, el sistema almacena los cambios, sale del editor de datos, y pasa a la pantalla de Contenido de ficheros (véase la Figura .3-49). o¿ I * . falUulnj varlablaa tlartabla aalaa" uní ta ank^nd pradu c t s ara c u r r a n t l j In tba T i l a Uldlh tyj>« Rank Lar. 5 I b Cala COSílEUC: Tina Connanl / 9e:i3: 13 "K7^rmri<G3sn$rc:ii>iz fí U'l2'9e 13:8S M 18 « ll*12/3B 13:8S 14 2S C ii'i2'9B 13:es 14 2S F-.YPrata'EJirER'kay for' aack w»rUbla"t»tka*a4ltad^"or'rra««-fisftllTD«DlapI'ayr i 1>UI»"* ZSiltrj 3ía«scir «Prtaer W o t ¡ £ 2 m » r * 3 á B C i ^ ! ® 9D¿wloá IBoCltJ íwuirr. Ditpiay Figura 3-49. Pantalla de Contenido delfichero COSMETIC Una vez terminada esta lección, vuelve al Menú principal. Se vuelve al Menú principal saliendo del procedimiento de Operaciones con ficheros (véase la Fig.3-50) - Pulsa la tecla Esc hasta volver al Menú principal. i STAISHATHICS Statlatlcal CrapMea Syata» CAÍ» A. 0. C. D. BAKOCEnE«T_A«p SYS?tu UTILITIES Pata^hana jaM~a*ñ£ Syata»* £nvlron**cnt Rapart t i r i t a r and Craphlca Raplay Craphlca A t t r l b u l a a Tlng L. K. H. 0. PLQITlnS OMO 0EICR1PI1UE SIAI1SI1CS 1. Pío 11Inj Puneilonc P. Daasrlptlva Rathoda C. E a t l - a t l o n and T o a l l n j H. P t a t r l b u t l o n f u n c t l o n a I . Exploratory Oata Arvalyila SERIES PROCEDURES roracactfr>5 O u a l l t y Control S-oothlnj Tina S a r l a s Analyala ADVAHCED PROCEDURES P. C a l a j o r l e a l Data Analyala 0. n u l t l u a r l a t a Halhoda R. l*onparar»atrlo KiLK«dB S. S > - p l l n J I . EMparlnantal Daalgn OKJ REGRESSIOM AflALVSIS J. Anal^tla of Uarlanea K. K a j r a t i l o n A n a l y c l a ílATHErtAT 1 CAL AKD USER PROCEDURES U. na ¿banal l e a l functlona U. flacroa and Usar Functlona Cv55c5=ífL-aa"Teurá<irrTkay»-l o"T.l a M 1 jh l _ d a a I r a d ' a a et I e n ^ T hariTpra a«'EMIEHT^^f^KSS» lrval?"3 21dlt"3 3Sauicr 4 P r t * c r S v ! i ' ; ? < tCo « U a r l / í B C r ^ r í 9Pavl¿« Dlipliy iegú¡L<¡¡ V. Figura 3-50. El Menú principal 63 y RESUMEN En este capítulo trabajaste con variables haciendo uso del editor de datos en el procedimiento de Operaciones con ficheros. Concretamente, en este capítulo : - hiciste selecciones en menús para llegar al procedimiento de Operaciones con ficheros. - usaste la pantalla de entrada de datos para las Operaciones con ficheros y la opción C (Editar) para crear un fichero nuevo y entrar en el editor de datos. - usaste el editor de datos para crear variables y poner los valores de los datos. - usaste la opción D (Visualización) y la opción A (Todas) en la pantalla de Contenido de ficheros para ver los contenidos de las variables. - usaste F5 (Opts) (Opciones) para crear una nueva variable y poner valores de datos para dicha variable. - usaste el editor de datos para modificar los valores de los datos, borrar una fila, y añadir una fila a las cuatro variables. - usaste F5 (Opts) (Opciones) para modificar la amplitud de una variable. - usaste la opción Save and Exit (Almacenar y Salir) en el menú-ventana Save para almacenar los cambios y salir del editor de datos. MANEJO DE DATOS CON LA OPERACION DE ACTUALIZACION. En el Capítulo 3 aprendiste cómo usar el editor de datos para crear ficheros y variables. En este capítulo vas a aprender a usar la operación de Actualización del procedimiento de Operaciones de fichero, al objeto de -crear y editar (modificar) las variables. Los ejercicios de este capítulo emplean el fichero COSMETIC que creaste en el Capitulo 3. Este fichero contiene variables con estadísticas de ventas (millones de dólares), unidades vendidas (millares), e inventario disponible (millares), de 14 productos cosméticos de Worldwide Products. En este capítulo aprenderás a crear variables y a editarlas con la operación de Actualización del procedimiento de Operaciones de fichero. También aprenderás a emplear los operadores (símbolos y palabras especiales que permiten manejar y transformar datos) de STATGRAPHICS. USO DE DOS VARIABLES NUMERICAS PARA CALCULAR UNA TERCERA. En esta lección se usa la ventana de Asignación de la operación de Actualización para calcular una variable numérica nueva (príce) usando dos variables existentes (sales y units). También se hace uso de los siguientes operadores de STATGRAPHICS : ROUND, * (multiplicación), y / (división). La Lección 4-1 empieza en el Menú principal. El primer paso para crear una variable es emplear los menús para seleccionar el procedimiento de Operaciones de fichero. El procedimiento de Operaciones de fichero está en el menú secundario de Gestión de datos, así que empieza por seleccionar el menú secundario de Gestión de datos en el Menú principal (véase la Figura 4-1). - Si hace falta, usa la tecla Home para seleccionar el menú secundario de Gestión de datos. Figura 4-1. Menú principal con selección del menú secundario de Gestión de dntos 65 - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el Menú principal, el sistema presenta el menú secundario de Gestión de datos. Selecciona el procedimiento de Operaciones de fichero desde el menú secundario de Gestión de datos (véase la Figura 4-2). - Usa la Flecha hacia abajo para seleccionar el procedimiento de Operaciones de fichero. DATA nAKOCEnEKT 1. 2. 3. «. Dlipliy 9iti Dlractory rila'Op'a'ritloni lxport Data Filas Export Data rila» k.T- T -V Uá«~-oüra"<¿r-kaya-to~M jhl ljhl'daa lred*procad¿raT"t~Thañ~praaB~EKTEfl?.,"TV';74 IHalp 21411M SSavaoi* «Prlaar SfiíAVJ « • 'fcl TUara '» 90avlo« lSQult l JMPUT Dtaplay Figura 4-2. Menú secundario de Gestión de dalos con selección del procedimiento de Operaciones de fichero - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el menú secundario de Gestión de datos, el sistema presenta la pantalla de entrada de datos para Operaciones de fichero (véase la Figura 4-3). Se usa esta pantalla para indicar el fichero de datos y la operación con los que trabajar. 66 rila Optrat1onc STATCRAPHICS r i l a n»~e: CSS55TÍ35 Oparatlonc: 0. tras* A . Copy B. Créate C. Edlt C. Recode H. Rene«e I. tpllt 1. Jeln f. Prlnt Plise an Data Orive - C : V S T R J C \ D A T A \ AXOUA ««UN C0030I« OCCCTfl COStl P&fiOOr cosncnc ISDAIB MPDAIA lUOSTACt IROHORt L0CL1H 1 i le~n npOrri i 1 i s"*»KdTFs«s-| u . w lHalpi' Z M Í t S 3Savscr Ifrlser jwtiTSS "oíT'jS 7V»r«'J< BO. RUPATA •rm UltJ isá J Figura 4-3. Pantalla de entrada de datos para Operaciones de fichero Hay que decirles a STATGRAPHICS el nombre del fichero con el que trabajar (COSMETIC) e indicar la operación (Actualización) deseada (véase la figura 4-4). - Escribe el nombre del fichero COSMETIC en el campo STATGRAPHICS File Ñame. El cursor va automáticamente al campo Desired Operation (Operación deseada). - Si es necesario, escribe la letra ] (Updtate- Actualizar) en este campo. 67 r~ Tile sinicnnpHics Operat lona: rila n.-,: Oprrallonc cosntuc fl. Copy 8. Croata C. Edlt 0. E r n a ( . Jeln r. Trtnt C. Racada H. Banana 1. S p l l t J. Upd.t. Declred oporatlon: J Fllii on Data Drtva - C:<^TeiC\DaiO\ PHO'JO NOKLIK Cf-ataia CflSEl ocdoia s 6.100.1 COSrETIC TSCOIft r ^ - r - • _ Completa'lnpuC IHelp ZEdlt ' 3Savscr «Prtccr S. iriPUI Efiproin IU0SIOCE E LOCLlfi rwDaia M e I d a * a n d ' p r e c » * F f c T 1 tCo • ?U.rt 8C«d ' * SDawlea lBOultl DUplay FILE File 4-4. Pantalla de entrada de d3tos para Operaciones de fichero una vez completada - Pulsa F6 (GO). Una vez que se pulsa F6 (Go) para procesar las entradas en la pantalla de entrada de datos para Operaciones de fichero, el sistema presenta la pantalla de Actualización de variables, con el encabezamiento "Contents of file COSMETIC" (Contenido del fichero COSMETIC) (véase la Figura 4-5). Esta pantalla presenta una lista de las variables del fichero con el que se esté trabajando. Queremos crear una variable nueva. Mira la Línea de estado. La opción N (NewNueva.) en la pantalla de Actualización de variables nos permite crear una variable nueva en el fichero COSMETIC. Contenta of fila COSnflIC Uarlabla Uldth Typa Ranh Lanjth FOIRECTORY Pata Tina II' B'SB U:2B Co»»ant s«i a «rssrsri e tío es?ren i rsrvzzz'ii»/ s o 71 c z 3c unlta onhand producía 13 IB 2S K H C I 1 2 H H 14 2S 11' B'J» 1 7 H 2 11' 8'SB 17: S2 II' 8'SB 17:52 lHalpfJ 2 £ d l t y 3íavacr «Prtaer S'r*agJ M o ¿ * | 7Vl»c»2í 8C~dtl3 3D*vlo« lBQuItj IMPUI.Í1-! Figura 4-5. Pantalla de Actualización de variables - Escribe la letra N (Nueva) en este campo. Una vez que se escribe la letra N para añadir una variable nueva, el sistema presenta el campo Variable nueva. Hay que crear una variable nueva, price, para que contenga el precio medio de cada uno'de los 14 productos cosméticos cuyas estadísticas se encuentran en el fichero COSMETIC. Escribe price en el campo Variable nueva para decirle a STATGRAPHICS en nombre de la variable nueva (véase la Figura 4-6). - Escribe el nombre price en el campo. cont.nu «r ni. cosncuc Utrlibla Uldth Typa Ronk Lanjth Data PDIRECIORV Il-a I I ' B'9» lt:2« k> i a» .TSEES^I «nnarxrrrrj itEisssi i w • unlta onhand product! Cannant 13 K 18 H ZS C I 1 Z 14 14 14 25 11' B'SB |7:S2 I I ' B'9B 17:S2 11' 8'3B 17:SZ sz ^tfii^jg.^u^r.r;''-",»^ Entar n«»a of ñau varlabla: prle«.yj3f.Sl fHlshlI jht"'V»rIabT«:7fl"fti"al jñ"C»CoKÍíñrD«Or«pIa^ lHalp^j 2ídltm 3Savaci* 4Prt«or S2&&I TVaria I M t { SPavlca lBQultl jHPUtKU Dlaplay f Figura 4-6. Campo New Variable (Variable nueva) una vez completado - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar la Variable nueva, el sistema presenta la ventana de Asignación. Se usa la ventana de Asignación para indicar la fórmula (ecuación) que habrá de crear los valores de la variable price. Pero, ¿Cuál es la fórmula apropiada de la variable price ? Sabemos que la variable sales del fichero COSMETIC contiene ventas en millones de dólares. Por ejemplo, Madness Perfume tiene 0,407 millones de dólares de ventas- % 407.000. También sabernos que la variable units del fichero COSMETIC contiene el número de unidades vendidas en millares de unidades. Por ejemplo, Madness Perfume ha vendido 10 millares de unidades - 10.000 unidades. Para calcular el precio medio de Madness Perfume hay que multiplicar sales por 1000 (para convertir 0,407 a miles de dólares), y dividir el resultado por las unidades (en millares). Haciendo uso del operador * (multiplicación) y del operador / (división), la fórmula es : (0,<-t07 * 1000) / 10 = 407 /10 = 40.7 70 Es decir, el precio medio de Madness Perfume es $ 40,70. Podemos usar la misma fórmula para calcular el precio medio de todos los productos en el fichero COSMETIC. Todo lo que hay que hacer es poner en la fórmula los nombres de las variables apropiadas : (sales * 1000) / S También tenernos que redondear el precio medio de cada producto convirtiéndolo al número íntegro más cercano. Para redondear un valor al número entero máscercano se usa el operador ROUND. (Observa que al escribir el nombre de un operador hay que hacerlo en letras mayúsculas). La fórmula para calcular el precio medio de Madness Perfume es : (. 407 * 1000) i 10 Para redondear el precio medio al número íntegro más cercano, la fórmula es: ROUND ((.407 * 1000) / 10) = ROUND (407 / 10) = ROUND 40.7 = 41 Observa que hay que poner entre paréntesis la parte de la fórmula para calcular el precio medio al objeto de que el operador ROUND redondee el resultado del cá.lculo completo del promedio. Corno antes, se pueden poner los nombres de las variables en la fórmula para redondear los precios medios de todos ios productos. La fórmula para crear los valores de la variable price (véase la Figura 4-7) es : ROUND (sales * 1000) / uníts) Nota.: Si todos los nombres de las variables en el directorio de datos son diferentes, se puede poner solo el nombre de la variable. Pero hay dos variables llamadas sales y dos variables llamadas units en el directorio de datos- una en el fichero COSMETIC y otra en el fichero llamado TSDATA. Por ello hay que poner en la fórmula el nombre del fichero y el nombre de la variable de esta manera: fichero, variable 71 Por ejemplo, se usa COSMETICsales para referirse a la variable sales en el fichero COSMETIC. - En la ventana de Asignación, escribe la fórmula exactamente como se indica a continuación: ROUND ((COSMETIC .sales * 1000) / COSMETIC. units) Contenta Utrltila UldtK Typa Bank fOIKICTJ)JRV332S lanjth <r n i . cosnsnc Data lina Ceiwani 17:36 ln nllllons ef do 11.ra n l « JB H Í W M Í 17:31 unlte 13 H onhanf produ Entar^axcignñant!*RÓÜM T <<COSntTtC?íáúii y j&^ n 14 tntir nana oT ñau uirlable: prle» j y lHalpM USPUta 2E4ll2 3S»uaor AFrteoit stü¿3 7y»r«:5 BC~é:¿'. SDevIee IBOultí Olaplay r . M S S V Figura 4-7. Ventana de Asignación con 1a fórmula para la variable price - Putea la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo entrado en la ventana de .signacic'-;. el sistema presenta el campo Cornment (Comentario). Este campo se usa ara :-oner una descripción breve de la nueva variable (véase la Figura 4-6). £-:-.:ri'c-f el comentario precio medio en el campo. Uarlabla UldtK T y p a Rank FDIRECTORV satos " units onhand produets ta 13 te zs X H C 1 1 I Z Lanjth —" 1 4 H 14 14 ZS Data » ' 9'98 ,-'."r l l ' I Z ' 9 8 11'1Z'98 ll'lZ'98 11'12'3B Tina 16:28 I3:BS 1 13:85 13: B S 13:BS Connont ."íj"";i •-.. *• .' Snlar cOHMant? auiraja prlca lHalp I 2£dlt 1HPUI • ' 3Sa 6Co Alar» BC«d " SD.ulca IBOult : Dlsplay TILS •' Figura 4-8. El campo Comment (Comentario) una vez completado - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo escrito en el campo Comment, el sistema almacena los valores de datos en la nueva variable y almacena el comentario en el campo Cornrnent. El sistema añade la variable price al final de la lista de variables en la pantalla de Actualización de variables (véase la Fig. 4-9). Ahora puedes pasar a la Lección 4-2. En la Lección 4-2, vas a aprender cómo actualizar variables existentes. La Lección 4-2 empieza en la pantalla de Actualización de variables Contanta of M I . COSMETIC Varlabla nuBtcTOBv i.l.i wtltc oníi.nd product a prlca Uldtk Ty»« «ank 16 13 16 2S Lanjlh Dala 14 14 14 25 14 1 1 ' l Z ' S e 13:85 t l ' 1 2 ' 3 8 13 : 85 l l ' 1 2 ' 9 B 13:85 l l ' I 2 ' 9 e 13:85 1I'12'9B 15:48 a v a r a j o p r l c o - < W ! i « H C " 1 l 1 2 1 t lHalp r 2Edlt "3 3Sav«er 4Prtaor S lina Csnxant s'st ~u-2g g g g j ; M»2si-J 7 U a r a ^ 8C«d t » iupui j • r ¿a; 3Davloa Dupiay 180ulU nu? \ Figura 4-9. Pantalla de Actualización de variables con la variable pnce EDICION DE VARIABLES EXISTENTES. La operación de Actualización ofrece varias opciones para actualizar ficheros además de las aprendidas- Asignación y Nueva. Esta lección enseña cómo usar las opciones restantes, indicadas más abajo, en variables existentes. Las variables se pueden editar de una en una. - Display- Visualizar - Comment- Comentar - Rename- Cambiar de nombre - Copy- Copiar - Erase- Borrar. La Lección 4-2 emoieza en la Dan talla de Actualización de la variable. ¿ i. Querernos examinar el contenido de la variable price. Primero, selecciona la "íriabie price (véase la Figura 4-10). Luego usa la opción D (Display-Visualizar) P>:a piV:-r:*ar el contenido de la variable. - \'a la Flecha hacia abajo para seleccionar la variable price. / 7i s»r rti• cosnEtic Uarlabla FOIRECrOKV ca l el un! ta onhand producta Uldth lyra Ranh te 13 te 2S Lanjth M H H "14 Data Tin* Cannant II' 8'3B 16:28 ti' 8'38 17: SZ II' 8'98 17: SZ II' 8'98 17:SZ ZS 11' 8'38 I7:SZ r " ~"-'" ll''8'3a'18Ill' »v«rts«-prl rHIjhlljht'virlatla.-'fl-fltalsn C=Coau<int D=DlEp!«y"t:Er*c*'H:K>ü~R:)Uriá'K«''YrC<>pQ'| ! lllslp.v lídlt 3Sau»cr 4Prtaer S fcCo TVara BC»d SDaulca lBQult 1 1MPUI._-, Dltplay riLE^.tí Figura 4-10. Pantalla de Actualización de variables con la variable price seleccionada - Escribe la letra D (Display-Visualizar). Una vez que escribas la letra D para ver los valores de datos de la variable price el sistema presenta la pantalla de Contenido (véase la Figura 4-11). La pantalla de Contenido muestra el nombre de la variable, su longitud y los valores de los datos. Desde esta pantalla no se pueden editar los valores de los datos almacenados en la variable. Uartabl*: CCSílEI IC. pr I C» O.njlh ' H> < 1> 41 < 2> < 3> < 4» < S) ( 6 ) < 7) 24 3S Zt 23 6 7 <18> <1U < !2> 8 4 7 ( 8> l t 3) 18 < 1 j> 1 f l 4) S 1 He I p 2f¿lt ríj.-'irrocirr picplay r.lí-K-:f±j i 3S*v«cr 4Prtaor SPrtopt 6Co V ^ í 7Var«'a 8Cnd -,? SOovlc» í e Q u l t j Fipura 4-1!. í'antjüa de Conlenido de ia variable price Añora vamos a usar ía opción C (Comment-Comentar) para hacer un comentario sobre Ja variable sales. Usa la tecla Esc para volver a la pantalla de Actualización de variables. Luego, selecciona la variable sales en la pantalla de Actualización de variables (vease la Figura 4-12) y especifica la opción C (Comment- Comentario). - Pulsa la tecla Esc. - Usa la Flecha hacia arriba para seleccionar sales. r >r r u « c o s n t u c U.rl.il. Ulilh T*p« R»f>k TImi CDMvnt lanjth 11' B'9« lt:Z« FDIRECTORV T u ' í'9«*i71sz** s ¡ i. « acascr»«üiKSTI 14 «« T y ^ r11' B'98 17: 1 13 H sz ii' 8'90 17: 1 14 18 H onhtni sz 8'9B 17: 11' 14 ZS Z 2 S prD¿uctl c sz 8'SB 1 H K uní ti 11' prle» t e : 11 i v t r rHljkUjhrT;4rl¡lUÍ-ft»0««l5n"C«Co>««nt*DeDUpUi)"I=Er¿«»">(t«.ií7R«R«n»-«"V»Copa' lMelp"* 2EíltÍ3 3S«u'.cr 4Prt»or Sfijití JhPUT Ví 7 V « C « S B O J " » 3D»u!e» IBOult 1 Dlipl.y flLtr. : Figura 4-12. Pantalla de Actualización de variables con la variable sales seleccionada - Es-Tibe la letra C (Comentario). Una vez que escribas la tetra C para añadir un comentario a la variable sales variable, el sistema presenta el campo Comment. Escribe a descripción in rnillions oí' do llar? en la variable sales - véase la Fieura 4-1 V) w - • - Escribe el comentario en "millones de dolares" en el campo. a V 76 or r u > cosmetic Uortable UUth Type Xank Lonjlh rOIRCCTORV Dota un 11 o «nh*n¿ product* ,rlc. 11'1Z'3B U'lZ'SB ll'lZ'98 II'IZ'9* 13 le 25 H fl C « I 1 2 » H 14 14 25 14 Tlm CenMont 11' »'9» 1C.29 13: BS 13:85 13:»S 1 S M Í i w r . j l prlco Enter connont: Iñ'nllllon* o f ' i o l l i r i l j rHlsMlsht~vé'ri»kler'AxA,,!jn"CiC0MnéH"POl*M«¡ri¿Irá^^ lHcip -j Z t d l t Q 3Sevaer 4?rt«or K t ' v ^ 7\)*r« 2 IKPUI-3 SDovlca Dlepley IBOulÜ Nt-E^.;! Figura 4-13. El campo Comment (Comentario) una vez completado - pulsa la tecla Enter. Al pulsar la tecla Enter, el sistema muestra la pantalla de Actualización de variables. Observa la nueva descripción en el campo Comment de la variable sales (Véase la Figura 4-14). Ahora hay que usar la opción R (Rename-Cambiar de nombre) para cambiar el nombre de la variable price para que la describa mejor. Se selecciona la variable price en la panta.Ha de Actualización de variables (véase la Figura 4-14). Luego se usa la opción P. (P.ename) para cambiar el nombre de la variable. - Usa la Flecha hacia abajo para, seleccionar la variable price en esta Dantalla. nn í 1 Contení! of Tilo COSnSTIC Variable FDIRECTOHV talca untta onhand product» u u t h Type Rank 13 13 18 25 H H H C 1 1 1 2 Lanjth Dota Tino CftMMOnt 14 14 14 14 ZS 11' 9'9B 11'1Z'38 ll'IZ'98 Il'lZ'SB 1I'12'38 11:28 13:BS ln xllllont of d o l í a n 13:8S 13:85 13:65 fHlghl l9ht'uarIablof-fl=flaoljn"C»Co«-.ant'D"DI»pl»<í I»tra«e"HeHaOTIeR«n»>««~V»Cop;n JHolpjt 2t¿lt* ISavaer 4Prtaor S.'. U i ¡ TV.raJJ 9D»vlo» IBSultj IMPUT¿i Dlaploy LljJ^íá Figura 4-14. Pantalla de Actualización de variables con selección de la variable price - Escribe ia letra R (Rename- Cambiar el nombre). Una vez que se escribe la letra R para cambiar el nombre de la variable, el sistema presenta el campo New Ñame (Nombre nuevo). Usa este campo para escribir el nombre nuevo de la variable príce_ avgprice (véase la Figura 4-15). _ Escribe el nombrre avgprice en el campo New Ñame. Contanta af Ctla COSrtEIIC Uarlabla rDIRCCTORV salaa unlta • nh • r\d producta Entor ñau Uldth Tupa ftank !« 13 1< ZS H H H C 1 1 1 z Lan3th Cata Tina 14 14 14 14 ZS 11' ll'lZU® 11'IZ'S» ll'IZ'9» ll'lZ'9» If-ZB 13: ÍS ln Nllllana of dollara 13: (S 13: «S 13: »S CaiMant kvflprlot^ CHI JRTTj Kircí? r»n t • 15 n*t¡CfS!¡ñrrD Í D iiyiiT1»Iraír^^(eap tRíKW^VfCípgi lHalpj* ZMttjg 3I»v»0£ 4£rUaC Sftfófi «oj££¿ TVaoUá 8I&A9 SDayiea IBOultS jmmlbs piipu» nuisy Figura 4-15. El campo New Ñame (Nombre nuevo) una vez completado _ Pulsa la tecla Enter. A pulsar ia tecla Enter para procesar lo escrito en el campo New Ñame, el sistema muestra la pantalla de Actualización de variables. Observa el nombre nuevo de la variable price en la pantalla de Actualización de variables (véase la Figura 4-16). Mora vamos a emplear la opción Copy para copiar la variable oiiñand a una variable nueva onhand2. Primero, selecciona la variable onband en la pantalla de Actualización de variables (véase la Figura 4-16). Luego usa la opción Y (CopyCopijf) para copiar la variable - Usa la Flecha hacia arriba para seleccionar la variable onhand. Contante of fll» COSfltllC Uirtibli FDIRECIORV Uldth Iyp» Rank ta!.a uní ta 18 13 productf aujprlce ZS X N pnhañdTEESSSSriU j' N 1 1 Unjth Data 14 14 11/ 3^38 lt:Z8 11'1Z'3B 13: BS ln n l J l l o n i or dolí ara U ' I Z ' 3 8 13: BS 14 ZS 14 ll'lZ'38 13:85 Il'lZ-^8 15:48 averaja prlca Tina Coment I^nr M 5?5S3S3!aU 1'I Z^ss *l 3:8 1 rH 1 s M 1 s h C W í • ^ f l ' f l i ¡IsS-CiCilSSSríip Ia>l í5*lirriai*H¿Híü-Tl=SiñaS«-yiC¿ pijl l H o l p í l Z E d l t l á 3S*uxer 4 P r U c r S $ K 5 2 I W o a í S T V i r s A SCAi-fj 3D«vlca I B O u l t j JHPUuiJ Dlaplay EILIJSEÍ V ) Figura 4-16. Pantalla de Actualización de variable con selección de la variable onhand - Escribe la letra Y (Copy-Copiar). Una vez que se escribe la letra Y para copiar la variable onhand, el sistema muestra el campo New Variable (Variable nueva). Este campo se usa para escribir el nombre de la variable nueva- onhand2 (véase la Figura 4-17). - Escribe el nombre onhand2 en el campo New. nr rn< cosnmc Variable Uldth lypa R.nk FDIRECIORY salas Uní ts onhand 1 — produets svjprlca ia 13 2S n 1 fl 1 M . r —-1 C 2 N Lanjth Pete Tl«« Con^ent 11' 3'3» 16:28 14 14 H ' 1 2 ' 3 8 13:es ln n l l l l o n e of H ' 1 2 ' 3 8 13:85 i<v o x j w a r . iu n t » ir. 14 2S H ' 1 2 ' 3 8 13:8S dollara rraKrnfse^RTf Í^C^-TTC" Enter nanc of new verlabla! lHelp 2Edlt;j 3Seusor 41-rtecr, S"¡£SÜi tCoJgjS T V a r j U 9 M SDevlee lBOultj IMPUTAS Dlcplay . rax-ia Figura 4-17. El campo New Variable (Variable nueva) una vez completado - Pulsa la tecla Enter. Al pulsar la tecla Enter para procesar los escritos en el campo New Variable, el sistema presenta el campo Comment (Comentario) (véase la Figura 4-16). Contente or rile COSnEIIC U.rl.bl. Uldth Typ« R.nk ECIRECIORV talai units producís ausprlea Lanjlh Data lina Con • nt 18 13 N H I 1 11 14 II' S'S» 1S:2Í lt'12'98 I3:8S ln nllllona or d a l l a n I1'12'38 13: ÍS 2S C K 2 1 14 2S 11 1I'12'38 13:6S H ' 1 2 ' 3 8 IS:i» avaraja price Enter con-.nt: lH.lp'^í 2 E d l t d BSaueer IPrtacr S lüPJJ I M ' 7 V . r f ¿ 8Cnd:i!$ SDaJloo lOOulLÍ ' Dl.pl.* V Figura 4-18. El campo Comment (Comentario) para la variable onhand2 61 ) No vamos a poner ningún comentario, así que pulsa la tecla Enter sin escribir comentario alguno para dejar el campo Comment de la variable onhand2 en blanco (véase la Figura 4-19). Como no se necesita la variable onhand2 para cálculos futuros., vamos a borrarla. La opcion E ( Erase-Borrar ) se usa para borrar la variable onhand2. Primero, selecciona la variable onhand2 en la pantalla de Actualización de variables (véase la Figura 4-19) Luego, usa la opción E (Erase-Borrar) para borrar la variable. - Pulsa la tecla Enter sin escribir ningún comentario. - Usa la Flecha hacia abajo para seleccionar la variable onhand2 or r n . cosHETic Uarlabla Ulíth Typa Bank rOIRECIORV calva unlta onhand producía avgprlca ónhandZ — IB 13 IB 2S « K H M C H « 1 I 1 2 1 1 Laftjlh 14 14 14 14 2S 14 14 * Dito 11' 9'9B U'12'98 U'12'98 U'12'98 U'12'98 U'12'98 ""U'12'98 Tina Coement 16:28 13: BS in n|l1 lona oE 13:8S 13:8S 13: BS 1S: 48 ivcri3> prlca . . 16:18 f HIsMljhl'uarlablo: Asflotjn CaConnant &-Dlaplay Extraía XsHau R-Ranaca V^Copyl IHalp - 2Edlt 3Savacr 4Prtacr S 6Cc 7U»ra - BCnd 90aulea IBOult* mrur ciipiay riLi ' Figura 4-19. Pan(2lla de Actual¡7.ac¡ón de variable con selección de la variable onhand2 - Escribe la letra E (Erase- Borrar) Una vez que se escribe la letra E para especificar la opción de borrar, el sistema muestra la ventana de Borrar. En la ventana de Borrar, el sistema te pregunta si quieres o no borrar ia variable onhand2 (véase la Figura 4-20). En STATGRAPHICS esta opción es el método empleado para borrar una variable. / A or rii> cosmric Variable UlaLh lypo Ronk Len^th FDIRECIORV solee unltc onh* Dote Tino Cor*»ent 11' 8'98 16:28 II' 8'98 17:SZ ln nllllons oT doliere II' B'SB 17:52 -. i...«.'u.-i-r-t ••r ; 1 j^-". • " . j m t t * i ' • tf,".J « 2Ed11 >\ 3S*vser •IPrttor S' " v « 6Co .»r'H 7Var«T¿ BCMÍM ¿Deulóo lBOultj JMPUT .i Dlsploü riLi-síí r r m ¡He ip Figura 4-20. Ventana para borrar Escribe la letra Y (Yes - Sí). Una ves que escribas Y (Yes - Sí) para indicar que deseas borraj la variable onhand 2, el sistema quita la variable onhand 2 del fichero y de la lista de variables (véase ia Figura 4-21) r Contenta of file CQSP.ÍTIC Tino Copment Variable UldtK Typ* Rank Lenjtk Poto FDJSECIORV 11' 8'98 1&:Z8 sales 18 X 1 14 11' 8'98 17:52 ln nllllons ot do 11 ara uníts 13 H 1 14 U' B'S» 17:SZ enhand 1» M 1 14 II' 8'9« I7:SZ producto 211 S C Z 14 25 U' 8'98 17:SZ «¿iprIce , > C T T * 1 * * l ~ ^ r « 3 a rHlshlIsRt^arUíloS-ftaflisIsn-CoCoñMñt-piPIspUa'Iiíraso'HíHorRiRínáiís'VsCopy] lHelp-a 2IdltU 3S*vscp 4Prtaor &C0J1CT 7U.n£l 8C„d;"f 9Dsulc« lBQult} Jf.PUTi,^ Olsplty ÍILI;"7J Figura 4-21. Pantalla de Actualización de variables con la variable onhand2 borrada Ahora que ya has terminado esta, lección, puedes volver al Menú principal. Se vuelve al Menú principal saliendo del procedimiento de Operaciones de fichero (véase la Figura 4-22). - Pulsa la tecla Esc hasta volver al Menú principal. STATCRAPHICS S i i t l l U o l Crophlca SyataDATA nAMACEHEHT AHO SVSItK UTILITIES A. Dáta'.tlanijañant B. SyKtai £nvlroiw«nt C. Roport U r l t a r and Craphlca Aoploy D. Craphlci Attrlbutoa TLNE SERIES PROCEDURES l. Fariciitlnj n. Ouollty Control M. twootKlnf 0. TIMO Sorloa Anotyola PLOTTIMC AMD DESCR1PTIVE STAT1STICS K. Plottln5 functlonc F. Dascrlptlwi Rathoda C. Satlnatlon and Titttnj H. Dlatrlbutton Functlona ADUAMCED PROCEDURES P. Cotojortco] Dota Onolyala 0. nultluorlota Motboda R. HonporoMotrlo flothoda S. Conpllns AKOUA AMD RECRESSION AKALVSlí J . Analyxlc of Uirlanca K. Rajraaalon Analyala MAIHEJtATlCAl AMD USER PROCEDURES U. rt«than»tlcol Functlona U. Kacroa and U«ar Functlona 1. Ixparlnantal Daatjn I . Expleratory Data Analyalt lHalía 2Edltj3 3Sou,or «PrUor J_MPUX¿3 ««ÍS2Í TWar»^' K^.Ü 9Davioi lBQullí Dlaplay Figura 4-22. El Menú principal IMPORTACION DE DATOS. A menudo, los datos a analizar vienen de otras fuentes. Puede que la sección de contabilidad te dé un disco con información sobre cuentas por cobrar producido por algún programa, de gestión de base de datos. 0 que la sección de personal te dé un disco con datos sobre vacaciones de los empleados producido con un programa de hoja de cálculo. STATGRAPHICS te permite usar datos venidos de otras fuentes sin que haga falta volver a partir de cero ' * Por medio del procedimiento de Importación de ficheros de datos en STATGP.APHICS, puedes emplear ficheros preparados con los formatos siguientes : - KS'1 i I "formados con delimitadores en blanco o con delimitadores de caracteres) - Lotus i-2-.->. hasta ta versión 2.2 (se puede importar un fichero de la versión 3.0 si antes se transforma a la versión 2.2 en 1-2-.5S 64 v - Syrnphony, hasta versión 1.2 - clBASE, hasta, la versión IV - ATLAS * GRAPHICS - DIF (Formato para intercambio de datos). En este capítulo vas a aprender cómo importar un fichero llamado EMPDATADAT. Este fichero ASCII con delimitadores'en blanco, contiene información del personal de Worhvide Products en la que se incluye el número de identidad, el nombre, fecha de empleo, salario a la hora, y horas semanales trabajadas. Decimos que este tipo de fichero tiene delimitadores en blanco porque se usan espacios en blanco para separar las columnas. IMPORTACION DE UN FICHERO. En esta lección se usa el procedimiento de Importación de ficheros de datos para importar un fichero ASCII, con delimitadores en blanco, llamado EMPDATADAT. El fichero contiene información del personal de 7/orldwide Products en la que se incluye el número de identidad, el nombre, fecha de empleo, salario a la hora, y horas semanales trabajadas. Como ya tienes instalado STATGRAPHICS en el ordenador, el fichero EMPDATADAT que vino con STATGRAPHICS está ya almacenado y listo para su uso. La Lección 5-1 empieza en el Menú principal. El primer paso para importar el fichero EMPDATADAT es emplear los rnenús para seleccionar ei procedimiento de Importación de ficheros de datos. El procedimiento de Importación de ficheros de datos se encuentra en el menú secundario de Gestión de datos, así que empieza por seleccionar el menú secundario de Gestión de datos en el Menú principal (véase la Figura 5- 1) - Usa la tecla Home, si hace falta, para seleccionar el menú secundario de Gestión de datos 'o • jr j STATCRAPHICS Slallatleal Craphlea Syata.. DATA A. 0. C. 0. Í1AMACEHENT AMO SVSTEH UTILITIES Data~í1anága~Mont Syatart Ctivlrotwi«nt Raport Urltar and Craphlea Rifli^ Craphlea Attrlbutaa TIRE L. n. H. O. SERIES PROCEDURES Porocaatlnj Ouallty Control Swoothlnj rt*«e Sarita Analycta PLOTTINC AMO DESCRIPTJUC SIAIISIICS E. Plottlnj Functlon* r. Daccrlptlv* Hathoda C. E*tInatIon and laatlnj H. Dlitrlbutlon Functlona 1. Exploratory Dota Analyals ADUAKCED PROCEDURES P. Catajorlcal Data Analyils 9. fluitluarlata flethodl R. Konparanatrle flathodc S. Sanpllng T. Exparlnantal Doalgn ANOUA AHD RECRESSIOH AKALVSIS J. Analytlt oT Uarlanca K. R c j r t u U n Analyala NATHEflATICAL AHD USER PROCEDURES U. Rathanatlcal runotlona V. nacroa and Usar Functlona g y V I ' V U«'^r«¿f T fca'y«' , tó~Klihnaht~dailr«d'.aétlonr~ThaA'praá.'tHIER.V , r : t H : Ví lH«lpí9 2 E d l C 3 3Sauacr <Prt>°r S^áEÜSl L S o t ü d 7Var*'j BCnd'"} SDawics lBQultj jHPUI^j Dltplay Figura S-l. Menú principal con el menú secundario de Gestión de datos seleccionado - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el Menú principal, el sistema presenta el menú secundario de Gestión de datos. Selecciona el procedimiento de Importación de ficheros de datos en el menú secundario de Gestión de datos (véase la Figura 2). - Usa la Flecha hacia abajo para seleccionar el procedimiento de Importación de ficheros de datos. 6 \ f PA1A HAMAElrtEMI 1. 2. 3. «. Dlaplay Data Dlrcotary fila Oparatlena W o r t " Pala'PIlaa E.pcrt Data fllaa Alar» 1 » BCMÍ.J* SDavloa IBOultj Dlaplay ifúlp** Z í á l f a 3íavaor V r t a o F JKPUljá V ) Figura 5-2. El menú secundario de Gestión de datos con el procedimiento de Importación de ficheros de datos seleccionado - Pulsa la tecla Enter. Una vez que se pulsa la tecla Enter para procesar lo seleccionado en el menú secundario de Gestión de datos, el sistema presenta la pantalla de entrada de datos para importación de ficheros (véase la Figura 5-3) Se emplea esta, pantalla para darle al sistema detalles sobre el fichero EMPDATA DATA que se va a importar. Observa el centro de la Figura >3- Debajo de la línea que dice al principio "Files on Irnport Dnve" '.Ficheros a importar en el disco), el sistema presentatodoslos ficheros de datos oue no son ASF íoue no son de STATGRAPHICS) en la ruta del i "X directorio de importación (el directorio y subdirectorios que indican la ruta para llegar a la zona del disco donde se encuentran almacenados los ficheros). Los ficheros que aparecen en ia lista son ios ficheros que STATGRAPHICS considera disponibles para que los importes. 37 I«port Misa Variable nanea ln flrat rou: Yaq 1 nput rila nana: SIAICRAPHICS Tila nana: Startlnj coluxn: Í 3 Startlnj rou: J 2 ¡ Indlnj eslunn (8 Tor all colunnt>: Indlnj rou <• for all rou«>: |_g input r u . typ.= wcirsasnsfsíssa Input nuxorle nlaalnj valúa coda: rtald uldtha CASCI1 only): ~ " ' ' flJee en Inpert OrIvm CflSEl.DflI lHalpi JHEUíá 3TR CASE2.DAI I U « 3 3Seuaoi* Zídlt J S - C:viMICOfllA\ EWOflld.Oflr rtaor Siyi-t-á «o.:vít W a r a - t BC*<i SDeuloa IBQultl Dlaplay JUtOSUB Figura 5-3. Pantalla de entrada de datos para Importación de ficheros En la Figura 5-4, se muestra el contenido del fichero EMPDATADAT que se quiere importar. Observa que cada columna del fichero EMPDATADAT está separada por uno o más espacios en blanco. Decimos que este tipo de fichero tiene delimitadores en blanco porque hay espacios en blanco entre las columnas. La primera fila del fichero tiene los encabezamientos de cada columna; por ejemplo, ID, Ñame, y Hire_Date (identificación, nombre y fecha de empleo). Algunos de los encabezamientos de las columnas tienen barras inclinadas (Wage/hr y Hrs/Week- Salario/hora y Horas/semana). Aunque se puede usar en los ficheros ASCII, la barra inclinada es un carácter ilegal para su uso en el nombre de una variable de STATGRAPHICS. Por ello, cuando STATGRAPHICS importa el fichero EMPDATA.DAT, el sistema cambia los caracteres ilegales a la raya de subrayar. 10 8888 8881 8882 8883 8ee<« S08S 8806 8837 8888 8889 88ie eait 8812 8813 8814 881S 8816 8817 8818 8813 Mlr«.B«t« 82'23 /, 88 83'38'88 87'81'88 83'3í'88 Uhltaen 81'81'Sl Ul«. BS'31'81 l»'3l'8l Llndqultt S4'8I'87 B.fc.r |2'BI'82 Dumrr 8l'38/83 Uhim nootjo».»'"^ eB'lS'83 U» ihlnjlon 82'23'84 B.lt.l 87'B1'84 P»tt«r*on 12'3t'84 Hanlon 83'81'BS 6l'83'8i Thortan KIR« SnltK .'iru Splnk» Pallan n.r.h.ll 82'81'87 «t'38'87 eB'12'88 íl.,,shr S.S8 i.ZS 4.7S 4.SS 3.3S 3.3% 4.88 7.18 t.7S S.S8 S.t.» 18.28 e.3a 4 S3 3.SS 3.7S 3.3S s. es 9.SS 4.7S HrtSVfk 38 . 8 48..8 28.. 8 2S.. 8 37.• S 4S..8 38. • 27. S 28. 8 28. 8 24. s 25. S se. e 48. 4S. * s 33. s 38. 8 33. 8 33. » s Figura 5-4. El contenido del fichero EMPDATA.DAT Ahora estás preparado para decirle a STATGRAPHICS los detalles del fichero EMPDATADAT que se desea importar. En la pantalla de entrada de datos para Importación de ficheros, primero tienes que especificar el tipo del fichero EMPDATA.DAT. Como se dijo antes, EMPDATADAT es un fichero con delimitadores en blanco (véase la Figura S-5). - Pulsa, la tecla Tab, si hace falta, para poner el cursor en el campo Input File Type (Tipo del fichero de entrada). - usa la barra espadadora para conmutar este campo a Blank Delmiited (deiimitador en blanco). 69 Iwpgrt rt'»« «n ta f.r • » eolunn»)» «i» W *Ul<« " / t u r.«>. St.rtln, « ' r í a 1 3 St.rtína <•*"• )WJT ________ 7 onrtación deficheros « S Luego tienes que con e s p e c ^ a c i ó n d e j ^ ^ e entrada b l a n C 0 S el nombre del fichero a fichero quiere ^J****' a m p o . . - L"" 'a secunda parte del campo. - Escribe uA i en r 90 FMPADATAJDAT. (La el > fltra<ia campo d e datos Ixport n i . « Input Tila typa: í llñlTballSlt.ií'Sa Uarlabla n a x a In flrat rou: Vas Input Tila nana: DU>DATftT.t>AT STfllCRAPHICI rila nana: Starttn5 eol«~n: Startlnj rou: l^J Endlnj celunn tB Ctr all :o!unnc>: B ?!{ Irválnj rou <8 for all rouí): 8 j Input nuxarlc n t n l n j vtiur cedajt'3Z7B6 riali uldthx < M C I I onlj): CASEl-S"! CASE2.MT EAFDATA. PAI { . ' ^ y r « w t w «-V-nYCoAp I a ta' t npüt T riá 1 da~anj ~>raaa~ I H a l p ^ Z t í t t M 3Sa'uaor «Prlaor » tCa W t 7U«r« Jurui-C' piapi»v inroRi Figura 5-6. Pantalla de entrada de datos para Importación de ficheros, con EMPDATA.DAT indicado como nombre Je! fichero de entrada Como viste en la Figura 5-4, la primera fila del fichero EMPDATADAT tiene encabezamientos de columna. Como opción por defecto, STATGRAPHICS usa los valores en la primera fila del fichero importado como nombres de las variables. (Además, como opción por defecto, STATGRAPHICS usa los valores en el resto de las filas como datos). Vamos a usar los nombres de las columnas en la primera fila del fichero EMPDATADAT corno nombres de las variables, así que deja el campo Variable Ñames in First Row (Nombres de las variables en la primera fila) en Tes (Sí) (véase la Figura j-7). 91 Inport Filia Input Til» typa: í lañlTOoI I S l l a d " " ^ Uarlabla nanaa ln flrat r » U : yes Input fila nana: OlPDflTA'.DAT SIATCPAPH1CS M í e M M : J S £ £ S 3 Startlnj column: X33 Startlnj rou: JJg £rwilnj colunn <8 Tar all coIu*ina>l BJ3 Indlnj rou C® for all roua>l B^t Input nunerlc nlsslnj valué codo: f 3Z7I8 • F1«U uidth. CASCII «niy>: Filos on lnport Orlvs - C:\STAIC\DBIA\ CASSl.OOT CASEZ.DAT lHelp''F'zl<!ltíS InPDATA.DAI 3SaJsor l i n t e r S W IhPUI Í 3 •Y o • ¿ i Alara ^ BC-d 90avlce lBQultl Oltplay IWORI./} Figura 5-7. Pantalla de entrada de datos para Importación de ficlicros con indicación afirmativa de Variable Ñames ¡n First Row (Nombres de variables en la primera fila) Ahora se necesita nombre para el fichero en el que se van a almacenar los datos importados. Vamos a usar como nombre de STATGRAPHICS el mismo nombre que tenía el fichero ASCI I original— EMPDATA. En el campo STATGRAPHICS File Ñame (Nombre del fichero STATGRAPHICS) escribe EMPDATA (véase la Figura 5-6). STATGRAPHICS añade automáticamente la extensión ASF al nombre del fichero que pongas en este campo. (ASF en realidad quiere decir APL Shared File - Fichero compartido de APL, pero puedes pensar que quiere decir A STATGRAPHICS File un fichero de STATGRAPHICS). Observa que tanto el campo del fichero de entrada como el campo del fichero STATGRAPHICS (de salida) indican EMPDATA. Sin embargo, el fichero de entrada tiene ia extensión DAT y el fichero de STATGRAPHICS tiene la extensión ASF. - Pulsa la tecla Tab para poner el cursor en el campo STATGRAPHICS File Ñame (Nombre del fichero STATGRAPHICS). " - Escribe el nombre dei fichero EMPDATA en este campo. 92 Irport riloa Input filo typa: Bli¿S*B«tl»it«f333 Uarlabla naxoa tn flr.t rou: Vo¿ Input ftl. !••>•: tWOAtfl'.Dftl SIRICAAPHICS fila nana: JU1PDAIAJ Startlnj coIuh»: ítartlnj rou: fJS Zndlnf coluxn Cí for >11 coIu«m>: tndlnj r « u <( for all rou«>: BJQ B2 Input minarle M i t i n s ualua codo: rXÍTÍS ' • O a n . i d uldth. <ASCII .NIY>: EBSI^^SZAAS^JYJSRE^'TV: fllaa on Ixport Privo - C:NSIAICV»AIA\ CASE1.DAT CASEZ.Mr EKPPAIA. W U ^orP I a t a~* 1 npul~f 1 a Ida' and~praaa*~ X H Ó l p S 2Edltfj( 3Sau«or IPrlaor S *¿í¿ái3 W o i U á Alara SC^d ^rj 30aulc« 180ultl JhPUIJSI " Dlaplay ;nPORI j : I l : y Figura 5-8. Pantalla de entrada de datos para Importación de ficheros con EMPDATA.DAT especificado como fichero de STATGRAPHICS. Antes cíe importar el fichero EMPDATA.DAT, cerciórate de que las entradas en el resto de los campos sean las que aparecen en la Figura 5-9. Pasa de un campo a otro usando la tecla Tab. Para mover el cursor dentro de un campo, usa las flechas. La barra espaciadora se usa para conmutar las opciones en los campos Input File Type (Tipo del fichero de entrada) y Variable Ñames in First Row (Nombres de las variables en la primera fila). De ser necesario, se pueden usar las teclas normales para editar lo entrado en los campos. Ahora estás listo para importar el fichero EMPDATADAT. I-part Fllaa riu Input typa: »I ank 'Bal Inl taí"23 Uarlafcla naxaa In flrat ra»: Y»a Input fila nana: MFDfiTA*. DAT SJAICSAfHICS fila nana: inTDAIA'} Startlnj colunn: S u r t i o s rau: I","* Endlnj calunn <e for all colunnc>: Indlrvj rou (8 for all rout>: B Input nu-arle nlaalnj valúa coda: P327CB >(-Y» F I . M uldtha CASCII anly>: C V i S J C E f c i » ^ - : ' J M . ' o í i i l i « J i ' ' 3 : . ' Fila» an U p o r t Priva - C:\STAie\PATAs CASE1.PAI CASE2.PAI U1PDAIA. DAT l H e l p 1 ! V U I t t l 3Sav«cr 4Prtter S f l ^ T J tCo IWUT 7Uara"3 SDtulca IBOultJ Dlaplay J W O R I .J Figura 5-9. Pantalla de entrada de datos para Importación de ficheros una vez completada - Pulsa F6 (Go). Una 762 que se pulsa F6 (Go), el sistema empieza a importar el fichero EMPDATADAT. Conforme va procesando el fichero, se muestra la pantalla de Información sobre ia importación, que contiene detalles sobre el fichero importado, EMPDATADAT, y sobre el fichero STATGRAPHICS que se está creando, EMPDATAASF (véanse las cuatro líneas de arriba en la Figura 5-10). Ojírndo se termina la importación, el sistema índica el nombre, tipo, intervalo y longitud de cada un? de las variables creadas (véase el resto de las líneas de la Fisura 5-10). El intervalo de una variable indica ia forma de los datos: 0 es un solo numero o caracter. 1 es una lista de números o de caracteres, y 2 es una tabla de filas ? columnas con números o caracteres. (STATGRAPHICS importa cada columna del fichero EMPDATADAT como variable numérica o corno variable de caracteres. Como EMPDATADAT es u.n fichero con delimitadores en blanco, STATGRAPHICS hace un? variable numérica de cada columna de números, y una variable de ciracerei de cada columna de números, y caracteres que no sean numéricos). El sistema indica también la fecha y la hora en que se crearon las variables. 94 r l**p«rt «lanli Delimitad Pila 1 «.partios fila: C:vSI«IC\P«IfKWP<tIA. Pfll fila 29 rowi and S catuana. Inportlnj 28 rou* arvd S cetunns. Ka«*a Klra_P»t* Uaj«_l>r Hrs '^aak lili K K 1J 13 Iractory ta-' ll^B'SÍ ll'ZB'M ll'28'3B 11'28'3« 11'28'98 lt'2B'9e i'A.W?) 14:43 C.-MIftrCsOftlftstnpPBIft.BSI 14:43 14: O 14: 43 H:43 14:43 r*i» 9 C 9 D » v l o « lBQultJ J Figura 5-10. Pantalla de Información de importación La Figura 5-11 muestra las variables en el nuevo fichero EMPDATAASF. (Ya sabes cómo ver tocias las variables de un fichero, así que no hace falta que lo hagas ahora. Lo puedes ver en la Figura 5-11). Mira la anotación Typ/Wth (Tipo/amplitud) cerca del final de la pantalla. Como ves, el sistema importó las columnas del nombre y de la fecha de empleo como variables de caracteres y el resto como variables numéricas. Observa que, como se dijo antes, el sistema cambió los nombres de columna de Wage/hr y Hrs/week a los nombres de variables Wage-hr y Hrs-Week (Salario-hora y Horas-semana). 95 Cursor ot Rou: Co lunn: Rou 1 2 3 4 5 6 7 S 9 ie ii 12 13 14 1 1 Doto Editor Pilo: tnPDATA ID Hlro_Dol» seas; 12^2 3^891! IFFIVISL 19 S U.j.hr t.zs^í-, aeeiteg*. BBBZ.'&i&sWifc] noHlnUH Rouc: Munbor or Cois: 87'tl'8e.n ÍB.obn^?-/ zs Uhlt»9f>"Í 8BB4. !A¿V>J':} Ul..-;^:'1.'] •5^31'Bl \ 3.35 L i n d e l ti' evíi/BZ 2 aeacr'l.-t-c'á l.kor IZ'Bl'BZ r\ 4.88 ílVVÍrS sea?::-^/;.-.] Du»rr s Bf38'83 8988,?. -V.v -"- uKit» • -"• ¡ 8883.'-'¡'íi." j fiontjonary • B'lS'83-f e s t B ^ ' í ^ v ' l UiaMnjton 8Z'ZV84 S.SB "í'-'t-v j s s i i . ^ ^ K Í a «altóla K S7'81'81 t i s . w i Fattaraon 1Z'31'84 * lí.Z8ftv-Viríl| 5 «s.a f.';-" 3e. e - 'i Z7.s; 28.a : 28.8 va 48.8 • •;. r. b 38 i - <'V>>4 Lonjth 13 19 19 13 19 T^P'Utli K'l3 C18 C 8 N'13 «'13 Sr-TíPr«o»"*tli«"FC"Wif"t« »«va*i/p¿ata¿'dal»"or" tha" FS' Wy~íor~ot.hor optlona.? ' i'Molp'Ji ZEdlf'i 3Souscr 4Prticr W)pt* ' W o ' 7Uar* ;» BCnd' » 9Daulca lBQult) JKPUI^ " DItplay FILI r..] Figura S-II. Las variables en el fichero EMPDATA.ASF Ahora que ya has terminado la lección, puedes volver al Menú principal. Desde la pantalla de Información sobre la importación se vuelve al Menú principal saliendo del procedimiento de Importación de ficheros de datos (véase la Figura 5-12). - Pulsa la tecla Esc hasta volver al Menú principal. jsifilGftAPHICS StatUtlcal C r o p M c o SyEtsnjj DATA A. E. C. 0. OOMrtCEnEMr AMO SYSItB U T I U I U S r»t« 'rtanaginanl Cftvlrofwínt flrport Urltor »rul C r a p M c c Raplay C r a p M c a Attrlbvtca llnE L. n. K. 0. SERIES PROCEPUREI fcracwtlny Ooallty Control J*>oothlnj Tl-r Serle* Analvsla PLOrllhC AMD EESCRIPTIVE SIAT1SIICS E. rutttr.3 Functlona f. CafC-lptluo Híjthodt C. Ettlnatlon and Tattlnj H. D l t t r l b u Ü c n Puncllona 1. Ixplorator^ Doto Aníllelo A.OUArsCE!» PHOCEOURES f. CftloJiTlcal Dala £n«lycla O. n u l l I v i r U t j H»thoda R. Honpara««trlc riothods S. S.-pIlnj T. CnporlHantal D a a g n AHO'JA SHO RESRESSiOK OKALYSIS J. S m l y i l i of U«rl«nc« K. Anolyilí nnrKEnariCAL Ans UJER PHOCESURSS Ll. PathOMa*. 1 c* 1 r^ncl.cnt V. ^tcrei and. Uier Tunctlonc — - Mj, "¿-ur a or'k a y* 'to— K^íilljht'baalraá'icclío^r"Xhar."t>rp»v* EN7EK. 7• r ' \ 8C«¿ . .: SDoulcc IDOultj IK'.lp j iEdlt.; 3S«w»er 4Prtaer !>r~." i fc£o . » V » r a C* 11 o I * y ihpu : F i g u r a 5- a 2. C ¡ M e n ú prin-vi;;:;f OTRAS P R A C T I C A S Para practicar mas la importación de ficheros, haz lo que se sugiere a continuación. Vuelve al procedimiento de Importación de ficheros de datos. Importa, el fichero EMPDATA.DAT corno fichero con formato ASCII. Indica lo siguiente: en el campo Input File Type {Tipo del fichero de entrada), ASCII; en el campo Input File Ñame (nombre del'fichero de entrada), EMPDATADAT; y en el campo STATGRAPHICS File Mame (nombre del fichero STATGRAPHICS), TEST. Cuando se importa un fichero ASCII formado, hay que definir la amplitud de cada campo. Examina la Figura para, determinar la amplitud de cada columna, contando desde ei primer carácter de una columna ai primer carácter de la columna adyacente. Debería resultar que la amplitud de la columna primera es 5; 11, la de la segunda ; 10, la de la tercera; 6, la de la cuarta; y 9, la de la quinta. Escribe los números 5 11 10 6 9 en el campo Field Widths (Amplitud de los campos) en la pantalla de entrada de datos para Importación de ficheros. Pulsa F6 (GO) para importar el fichero. Emplea el editor de datos para examinar las variables importadas. ú v