ANÁLISIS CUANTITATIVO DE LA INFORMACIÓN Una parte considerable de la información económica relacionada con el mundo de la empresa o de su entorno económico es "intrínsecamente numérica" y precisa un tratamiento cuantitativo. Tal es el caso de toda la información expresada en unidades monetarias ( la práctica totalidad de la información contable empresarial, las principales macromagnitudes, mucha de la información financiera, algunas de las informaciones sobre el mercado, el sector, la competencia, etc....) todas las informaciones de tipo técnico que se relacionen con la actividad económica analizada y que vengan dadas en las unidades propias de las magnitudes físicas estudiadas toda la información interna y/o externa, agregada o no que viene expresada en términos de ratios, índices,proporciones y por tanto carece de unidades. (cotizaciones, índices bursátiles, tasas de desempleo, actividad, ocupación,cuotas de mercado,proporciones de defectos,ratios financieros, etc.) Pero además, de una u otra forma, el hecho de que las característica estudiadas no sean , en principio, numéricas, ni impide ni minusvalora la importancia de que acaben siendo cuantificables, por medio del conteo de casos.Ello conlleva que el análisis cuantitativo o estadístico de la información no se limite exclusivamente a la información intrínsecamente numérica, sino que se extienda, también a la información "categórica" o cualitativa. As pues el tratamiento estadístico de la información puede y debe aplicarse a información sobre características cuantitativas ( variables) y a la información sobre características cualitativas (atributos). La finalidad del análisis estadístico de la información suele orientarse hacia la extracción del máximo "jugo informativo" al conjunto de datos disponibles, en tres direcciones distintas pero en ocasiones curiosamente solapables. La determinación de los rasgos esenciales de todo el conjunto de datos, eliminando lo superfluo y resaltando las características fundamentales.Todo ello con la pretensión de obtener un reducido pero significativo conjunto de indicadores globales de todo el conjunto de datos.De ello suelen ocuparse las distintas técnicas descriptivas de reducción y representación de datos. La determinación de relaciones funcionales ( exactas) o estadísticas (tendenciales) entre distintas características. De ello se ocupa la Regresión y la Correlación, pero también técnicas más complejas de análisis multivariante. La determinación, aproximada en términos de certidumbre parcial, de ciertas características fundamentales sobre colectivos inabarcables por su extensión o inaccesibles por su propia naturaleza. A ello se orientaría el análisis inferencial 1 J.Lejarza & I.Lejarza El diagrama de flujo que se expone , ilustra claramente estos objetivos, si bien no debemos olvidar que : El análisis de Series Temporales no tiene por qué limitarse al estudio de única variable o atributo. El análisis inferencial puede aplicarse a todos y cada uno de los casos Diagrama de flujo de la estadística 2 J.Lejarza & I.Lejarza ISOMORFISMO DE REPRESENTACIÓN DE LA ESTADÍSTICA Aunque no deja de ser una simplificación, podemos convenir en que el análisis estadístico puede diferenciarse en análisis descriptivo ( realizado sobre la totalidad del colectivo) e inferencial, realizado sobre una muestra de tal colectivo, con la intención de obtener conclusiones que sean razonablemente verosímiles para la totalidad de la población. La posibilidad de conectar ambos tipo de análisis se basa en el modelo matemático de la estadística que no es otro que el cálculo de probabilidades. En el siguiente gráfico podemos ver ilustrada esta modelización. 3 J.Lejarza & I.Lejarza Considerando el número de variables ( o atributos) analizados el análisis descriptivo puede diferenciarse en unidimensional y multidimensional. Dentro del análisis unidimensional merece una mención especifica en las aplicaciones económicas de la estadística el estudio de los números índices y el análisis de series temporales Dentro del análisis multidimensional el estudio de la dependencia estadística, la correlación y la regresión son igualmente resaltables. Y finalmente todo ello puede considerarse en un ámbito inferencial :resolviendo el "salto" del análisis muestral a la inferencia poblacional a través de dos conjuntos de metodologías conocidas como la Estimación y el Contraste de Hipótesis. En definitiva cualquier técnica de análisis estadístico participa de cuatro rasgos , uno de cada una de las siguientes cuatro dicotomías según los tipos de variable-dato-situación: ATRIBUTO VARIABLE TEMPORAL SINCRÓNICO UNIDIMENSIONAL DESCRIPTIVO MULTIDIMENSIONAL INFERENCIAL 4 J.Lejarza & I.Lejarza INFORMACIÓN -FUENTES-DATOS-VARIABLES La información , de todo tipo ,es absolutamente necesaria para el desarrollo de la empresa en todos los órdenes ; la información es imprescindible no solo como fuente de conocimiento sino como base para la toma de decisiones adecuadas.Por tanto ,centrándonos en la empresa ,la información ha de constituir la base fundamental para el conocimiento de la situación y éste , a su vez , supondrá los cimientos de las decisiones adecuadas que fomentarán el crecimiento de la organización. Evidentemente( estamos en Empresariales) tratamos de información relativa a la empresa , y por tanto , relacionada con ella, pero no debemos de olvidar que lo dicho para ésta puede transportarse a cualquier ámbito de la actividad humana1. La información es en ocasiones inexistente , en otras excesiva , en otras inadecuada , y en otras confusa e irrelevante ; de ahí que sea necesario plantearse una metodología adecuada para conseguir información ,fiable, necesaria, reducida , útil y consecuente con nuestros propósitos . En cierto modo la metodología y las técnicas que nos ayudan a conseguir lo dicho anteriormente , no son otras que las relacionadas con la “Estadística” . Podríamos englobar las operaciones para conseguir que la información posea las cualidades antes descritas con el apelativo de “tratamiento de la información” que incluiría desde la recogida de ésta en las fuentes adecuadas hasta su entrega a los organismos decisores, una vez se le han eliminado las “impurezas” y se le ha sacado todo su “jugo informativo”. Por ello y centrándonos en la empresa plantearíamos que : Hemos de “tratar la información” de la manera más adecuada a nuestro objetivo de conocimiento de la situación . La información se “tratará” con metodología y técnicas estadísticas y provendrá de dos fuentes principalmente: Fuentes primarias .Información “ya” existente en la empresa y presumiblemente informatizada. En este capítulo entrarían datos relacionados con: Número de errores en los procesos productivos. Número de bajas por enfermedad. Reclamaciones recibidas. Tiempos de fabricación . Reclamaciones satisfechas. Balances. Inventario. Etc.............................................................. El análisis estadístico de estos datos proporcionará a la empresa el conocimiento de su situación en temas relacionados prioritariamente con su funcionamiento interno tradicional , lo que no deja de ser importante. Fuentes secundarias. La información se recoge fuera de la empresa o fuera de los procesos habituales de recogida de información. En este caso, la organización , no posee información que le es importante para el conocimiento de su “realidad” .Para 1 recuérdese la conocida frase “la información es poder” 5 J.Lejarza & I.Lejarza conseguirla acude a las llamadas fuentes secundarias : personas o instituciones que posean información relevante para ella , o realizando las oportunas encuestas. La información proveniente de fuentes secundarias suele hacer referencia a temas no tan relacionados intrínsecamente con la organización , pero sí absolutamente necesarios para evaluar su situación. Ahondando en lo expuesto ,y centrándonos en cuestiones más estadísticas , y con ánimo de ir perfilando conceptos que luego serán de aplicación cuando tratemos los métodos estadísticos con más profundidad ; podemos clasificar los “datos”2 de la siguiente manera3: FUENTES PRIMARIAS FUENTES SECUNDARIAS INFORMACIÓN DIACRÓNICA SINCRÓNICA (SERIES TEMPORALES) ESCALA NOMINAL INFORMACIÓN (CROSS-SECTION ) ESCALA NOMINAL ORDINAL POR INTERVALO ESCALA CUANTITATIVA POR RAZÓN VALORES : ESCALAS DE MEDIDAS La información ,proveniente tanto de fuentes primarias como secundarias, puede hacer referencia a un momento concreto y puntual de la vida de la empresa por lo que estaríamos ante información “diacrónica” ,y por otro lado , puede provenir de “mediciones” que se han realizado a lo largo de un tiempo , es por tanto información diacrónica , temporal. Tanto una como otra, podrá presentarse de varias formas , lo que incidirá en los procesos y técnicas estadísticas adecuadas a su manipulación, exploración , reducción y transformación para que constituyan instrumentos óptimos para el diagnóstico y la decisión. Las formas o escalas descritas en el gráfico de la página anterior supondrían lo siguiente: Debe tomarse la palabra “dato” en su acepción de “concreción , numérica o no, de la información” Mtnez. de Lejarza ,Juan; “Una propuesta de metodología para el análisis espacial de datos económicos en áreas metropolitanas” D. Economía Aplicada Univ. Valencia . Inedit. 2 3 6 J.Lejarza & I.Lejarza Escala nominal: La información sobre un carácter viene dada en escala nominal cuando ésta se puede clasificar en categorías no numéricas4 , mutuamente excluyentes, no ordenables. Sería información (datos)5 de este tipo de escala :las razones para adquirir un producto,las expectativas que produce un producto,el estado civil , sexo, “nombrar” los defectos de un producto; en definitiva, todas aquellas en las que se “nombre” (nominal) cualidades , mutuamente excluyentes e “inordenables”. Escala ordinal . La información tiene el carácter de la anterior , por tanto nominal , pero con la característica no restrictiva de que se puede establecer algún tipo de orden ; existiendo , por tanto, algún origen de referencia para esta ordenación. Serían de este tipo o escala , las observaciones referentes a : tipo de satisfacción ( mala , regular...) , consumo ( bajo , medio , ...) , ingresos ( bajos ....) ,etc.; en definitiva toda información “nominal” susceptible de ser ordenable. Escala cuantitativa. La información no se concreta en “nombres” sino en “cantidades”; los datos son , por tanto, cantidades , mediciones, en definitiva “cifras”.6 Escala cuantitativa por intervalos. La información se concreta en cantidades en las que se ha establecido de antemano un tipo de unidad de medida que permite cuantificar “distancias” o diferencias entre observaciones . Serían de este tipo ,la información referente a : presupuestos , gastos , salarios, etc. Escala cuantitativa por razón . La información se concreta en cantidades en las que se ha establecido un tipo de unidad que las hace comparables y, además, se dota a ésta de un origen (normalmente cero absoluto) que las hace “razonables”7 . Sería información de tipo escala de razón aquella que nos hablase de : edad de individuos , piezas en stock, estaturas , ..... La información concretada en datos numéricos o “cadenas” nominales tomará, en la mayoría de los casos, diversos valores o “formas” para cada característica estudiada , en definitiva; “variaran” para cada caso , observación o individuo del que se tenga información o datos. Si los valores y las formas “varían” estaremos ante “variables” que nos informan de las “variaciones” que afectan a cada característica estudiada de la empresa . En el caso de información cuantitativa estaremos , como ya hemos dicho , ante variables , y en el caso de información nominal ante “atributos” ;teniendo ambos tipos un tratamiento estadístico distinto. Por su importancia para el conocimiento de la situación de los temas referidos a control de calidad, hemos de mencionar un tipo de información o datos , o mejor, una manera de plasmar la información “distinta” y “conjugada” a las antes mencionadas ; nos referimos a las llamadas “variables de conteo”. El carácter no numérico de esta información establece que en el lenguaje de ciertos programas informáticos se les denomine a estos datos ,“cadenas no numéricas” .Así ocurre, por ejemplo, con el programa SPSS/PC 5 Quizá debiéramos utilizar la palabra “datos” , pues es información “concretada” . 6 Recuérdese que “cifra” proviene del árabe “sifr” ;cero , la “cantidad” por excelencia 7 “Razonables” en el sentido de “establecer razones para estar por encima o debajo ” 4 7 J.Lejarza & I.Lejarza Estaríamos ante “variables de conteo” cuando la frecuencia (“conteo” del número de veces que se repite) con la que se da una expresión nominal de una característica la convertimos en información cuantitativa de la característica ; pasando la expresión nominal a ser el individuo o caso al que se le ha medido o cuantificado (frecuencia) . De una manera simple con un ejemplo: Situación 1. Información sobre valoración de un producto / escala nominal ordinal individuos/casos valoración individuo 1 individuo 2 individuo 3 individuo 4 individuo 5 individuo 6 individuo 7 individuo 8 individuo 9 individuo 10 excelente mejorable excelente excelente excelente pésimo mejorable excelente mejorable excelente transformación variable de conteo / escala cuantitativa de razón individuo/casos = valoración pésimo mejorable excelente se mide nº de veces se expresa valoración 1 3 6 Cuando se posee la información , sea del tipo que sea, se deberá analizar para “sacarle” el máximo posible de rendimiento encaminado a conocer la situación de la calidad de los productos , procesos y estructuras de la empresa. Las técnicas de análisis serán , evidentemente, de carácter prioritariamente estadístico y básicas ; de ser necesario, por la relevancia de las posibles consecuencias, se usarían técnicas más “avanzadas”. El primer paso del análisis es el conocido como E.D.A (Exploratory Data Analysis)8 .Este análisis consiste en el tratamiento “simple” de la información, permitiéndonos vislumbrar las posibles “estructuras” que están embebidas en los datos observados. Mediante el E.D.A. , establecemos los “caminos” por los que debemos de E.D.A. (Exploratory Data Analysis); término acuñado en : Tukey . J.W.;”Exploratory Data Analysis”. Edit Addison-Wesley. 1977. 8 8 J.Lejarza & I.Lejarza discurrir para concluir una mejor visión de la realidad. El análisis exploratorio se realiza con técnicas estadísticas básicas9 , que una vez evaluadas nos permiten “decidir” donde debemos de profundizar con técnicas más sofisticadas. Resumido esquemáticamente ,lo enunciado quedaría de la siguiente manera: INFORMACIÓN AJENA A LA EMPRESA INFORMACIÓN PROPIA DE LA EMPRESA INFORMACIÓN/DATOS/VARIABLES ANÁLISIS EXPLORATORIO DE DATOS(EDA). POSIBLES ESTRUCTURAS/CONOCIMIENTO DE LA REALIDAD DE LA EMPRESA INVESTIGACIÓN DETALLADA DE LAS SITUACIONES AVENTURADAS POR EL E.D.A. CONOCIMIENTO DE LA REALIDAD DE LA EMPRESA SITUACIÓN ACTUAL DE REFERENCIA DECISIONES El análisis de la información traerá como resultado el conocimiento de la realidad de la empresa al respecto de lo que nos interesa .Ese conocimiento servirá para dotar a la dirección de referencias útiles para comparaciones posteriores, además de ayudar a la toma de decisiones a la hora de emprender la mejora continua en las áreas más precarias descubiertas. Nos referimos con básicas a técnicas de reducción y representación gráfica : medias , varianzas , histogramas , etc. 9 9 J.Lejarza & I.Lejarza