Paquetes estadísticos

Anuncio
PAQUETES ESTADISTICOS
Conceptualmente, un paquete estadístico es un conjunto de programas informáticos específicamente diseñados
para el análisis estadístico de datos con el objetivo de resolver problemas de estadística descriptiva, inferencial
o ambos
Es un conjunto de programas y subprogramas conectados de manera que funcionan de manera conjunta; es
decir, para pasar de uno a otro no se necesita salir del programa y volver a él. Un paquete estadístico permite
aplicar a un mismo fichero de datos un conjunto ilimitado de procedimientos estadísticos de manera
sincronizada, sin salir del programa. De esta forma, la utilidad del conjunto integrado es mayor que la suma de
las partes. En cierto modo, un paquete estadístico es similar a un paquete ofimático (por ejemplo, Office 97 de
Microsoft).
Hay paquetes que fueron escritos originalmente para ordenadores tipo mainframe : SPSS , BMDP , SAS ,
Minitab , Genstat y GLIM. Los tres primeros se volvieron muy populares en ese entorno. Actualmente pueden
usarse en PC todos ellos. Otros paquetes se han desarrollado específicamente para PC, sin haber pasado por la
etapa de los mainframes.
Algunas de las variables que es necesario tener en cuenta para comparar adecuadamente unos paquetes
estadísticos de otros son, esencialmente, las seis que se mencionan a continuación:
1.− Coste: Este es uno de los puntos mas importantes que hay que tocar al momento de elegir un Paquete
Estadístico, desafortunadamente, el coste de sus licencias está fuera del alcance de la mayor parte de los
usuarios y la obtención de copias subrepticias no es posible para muchos ni fácil en absoluto para ninguno.
2.− Nivel de sofisticación del usuario: Idealmente, éste debería ser un entendido en estadística y tener ciertos
conocimientos de programación. En la medida que carezca de los segundos, tendrá que renunciar a realizar
por su cuenta cierto tipo de análisis que vayan más allá de los más comunes; y en tanto que carezca de los
primeros, será más dependiente de aquellos paquetes con un interfaz más informativo.
3.− Tamaño del conjunto de datos: En la mayor parte de los problemas −al menos, en lo que respecta a su
número, no a su dificultad ni importancia− esta variable no supone ninguna restricción significativa. De
hecho, la mayotia de los paquetes pueden manejar sin mayores problemas conjuntos de datos no
excesivamente grandes. Sólo cuando se rebasa cierto umbral es preciso considerar paquetes específicamente
diseñados para hacer frente a este tipo de condicionantes.
Los distribuidores de muchos paquetes estadísticos comerciales suelen hacer hincapié en la probada capacidad
de sus productos para manipular grandes conjuntos de datos. Desafortunadamente para ellos, el rango de
problemas en que estas virtudes son críticas se estrecha aceleradamente: por una parte, las ampliaciones de
memoria son cada vez más económicas, elevando hasta niveles muy cómodos el umbral a partir del cual
serían necesarios productos más sofisticados; por la otra, para los problemas en que los conjuntos de datos son
verdaderamente grandes −bases de datos de corporaciones, información censal, etc.− pueden emplearse
herramientas específicas como, por ejemplo, programas escritos en C que interactúen con el gestor de la base
de datos.
4.− Grado de intensidad computacional: El incremento en la potencia computacional de los ordenadores
permite hoy en día aplicar ciertas técnicas estadísticas impensables hace unos años y ampliar su campo de
aplicación a ámbitos inasequibles para las tradicionales. Las técnicas de remuestreo o de validación cruzada,
ciertos tests exactos y gran parte de las técnicas bayesianas exigen una enorme capacidad de cálculo.
1
No todos los paquetes estadísticos están igualmente adaptados para este tipo de problemas. Con muchos de
ellos −por ejemplo, Minitab, Stata y gran parte de los paquetes gratuitos− resulta simplemente imposible
porque fueron diseñados únicamente para implementar técnicas tradicionales y carecen de un verdadero
lenguaje de programación asociado que resulte eficiente.
5.− Ergonomía: Curiosamente, el aspecto que tal vez más encarezca determinados paquetes estadísticos es el
ergonómico: la posibilidad de contar con ayudas interactivas o tutoriales, de representar gráficamente datos
con un golpe de ratón, de exportar automáticamente los resultados a formato .html o .pdf, etc. Bajo cierto
punto de vista, el coste de las licencias es, de hecho, el coste de la impericia o la pereza. A la primera, en
mercadotecnia, se la suele denominar productivity; a la segunda, learning curve. Es más productivo y exige
menor esfuerzo mental un paquete estadístico en que para imprimir no haya sino que pulsar el icono de la
impresora, en que para visualizar unos datos baste con visitar el menú Gráficos o el Importar para leer datos
de un fichero con el formato de cierta hoja de cálculo. Este tipo de habilidades son realmente reduntantes si se
cuenta con un mínimo de habilidad y no se pretende escatimar un adarme de esfuerzo: utilizando ficheros de
texto como intermediarios, se pueden intercambiar datos con cualquier hoja de cálculo o con otros programas
que permiten manipular datos o gráficos, gran parte de los cuales son de distribución gratuita.
6.− Facilidad de programación: Si bien contar con lenguajes de programación complejos no es lo deseable, si
lo es disponer de la capacidad de generar programas sencillos tipo "batch files" que permitan realizar tareas de
transformación, cálculo de datos, realización de pruebas estadísticas, generación de nuevos archivos y
documentos conteniendo resultados sin necesidad de estar digitando cada vez los comandos correspondientes,
con el consiguiente ahorro de tiempo y esfuerzo.
VENTAJAS Y DESVENTAJAS DE LOS PAQUETES ESTADISTICOS.
Debido a las diferencias existentes entre los paquetes estadisticos, mencionaremos individualmente las
ventajas y desventajas de algunos de ellos, desarrollando mayormente los Paquetes mas conocidos como son
SAS y SPSS y de muchos otros solo se mencionara su existencia.
− SAS, Statistical Analysis System (SAS Institute Inc., Cary , NC) http://www.sas.com
* Comprende amplias posibilidades de procedimientos estadísticos (métodos multivariados, regresión
múltiple con posibilidades diagnósticas , análisis de supervivencia con riesgos proporcionales y regresión
logística) y permite cálculos exactos para tablas r x c y contiene potentes posibilidades gráficas.
* Todos los procedimientos pueden emplearse de una sola ejecución.
* Los resultados pueden guardarse como archivos y usarse como entradas para futuras ejecuciones.
* Es particularmente útil en la gestión de datos y en la redacción de informes.
* Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual
antes de seleccionar la opción deseada.
* SAS ofrece la mayor flexibilidad para personalizar el manejo y análisis de datos, sin embargo su principal
inconveniente es que no resulta fácil aprender a usarlo.
− SPSS, Statistical Package for the Social Sciencies (SPSS Inc. , Chicago)
* Dispone de un amplio conjunto de métodos estadísticos (multivariados, series temporales, regresión
logística y análisis de supervivencia).Todos los procedimientos pueden emplearse de una sola ejecución.
2
* Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual
antes de seleccionar la opción deseada. SPSS es el más fácil de aprender para los investigadores principiantes
y tiene un manual que explica la filosofía y los mecanismos de las técnicas estadísticas.
* Puede creerse que SPSS es un producto caro y ligado a compras costosas. Esto no es totalmente cierto. Si
bien no es un producto barato, sí es rentable. De hecho, el éxito de SPSS se debe a:
• Vinculación de los objetivos a las necesidades de la empresa.
• Perfecto Acoplamiento a un Plan de Investigación bien formulado.
• Servicio de Calidad para los usuarios.
• Eficaz Evaluación de los Resultados hallados.
• Facilidad del Manejo y de la Programación.
ALGUNAS DIFERENCIAS ENTRES LOS DOS GRANDES (SAS y SPSS)
• Precio
El precio de SPSS es mucho menor que el del programa SAS, en torno a la mitad del precio.
• Rentabilidad
Recomendable para PYMES (hasta 500 trabajadores), SPSS es la mejor solución. Para grandes
empresas (más de 500 empleados) o aquellas que puedan permitirse un fuerte desembolso sin
necesidad de retorno a corto plazo, SAS es más rentable que SPSS, ya que permite ejecutar mayor
número de procedimientos estadísticos y operativos.
• Facilidad
El manejo de SPSS es mucho más sencillo que el de SAS. El interfaz estilo hoja de cálculo de SPSS y
su posibilidad de abrir ventanas muy comprensivas le convierten en un feo adversario para SAS. No
obstante, SAS, una vez conocido el manejo de su lenguaje de programación, es más divertido que
SPSS.
• Formación
La dependencia absoluta del lenguaje de programación por parte de SAS le hace muy vulnerable ante
necesidades repentinas, ya que obliga a la Empresa a costear caros programas de formación, con el fin
de permitir que su personal le saque el máximo provecho. SPSS, sin embargo, al ser mucho más fácil,
no encadena al usuario a largos procesos formativos, sino que, en un tiempo mucho más corto que
SAS, puede realizar complejos procedimientos de análisis sin esfuerzo.
• Robustez
La dependencia absoluta de Windows por parte de SPSS le hace muy vulnerable ante "caídas" del
sistema, normalmente provocadas por acciones ilícitas del usuario. El programa SAS, por su parte, al
tener su propio sistema operativo, toma la iniciativa del sistema, una vez arrancado, no permitiendo
que una acción no autorizada por parte del usuario paralice el trabajo del operario
− BMDP http://www.spssscience.com/Bmdp/
Es el más antiguo de los paquetes. El primer manual para BMD Biomedical Computers Programs se publicó
en 1961.En 1975 pasó a denominarse BMDP. Cubre un amplio abanico de métodos estadísticos pero su
capacidad para manejar datos es limitada.
Desventajas: sus programas se ejecutan por separado: solo puede accederse a uno de ellos en cada ejecución.
Los resultados de cada programa se pueden guardar en un archivo de BMDP y utilizarse como entrada en
otros programas.
− Epi Info (Center for Diseases Control/WHO, Dean et al). http://www.cdc.gov/epiinfo
3
Posee un excelente manejo de cuestionarios y entrada de datos. Posee escasos pero muy potentes comandos
para el análisis estadístico y funciona prácticamente en cualquier computadora y sus utilitarios más
importantes requieren escasos recursos informáticos. Es ideal para epidemiología de campo.
No posee métodos multivariados ni estadísticas de supervivencia. No tiene costo. Las versiones actuales
"corren" en DOS. Se está implementando una versión para Windows.
− Minitab Statistical Software (State College , Pa) http://www.minitab.com
Permite uso interactivo y es popular entre estudiantes y usuarios no especializados aunque no contempla
tantos métodos estadísticos como SPSS, SAS o BMDP, incluye regresión múltiple. No es adecuado para
conjuntos de datos pequeños
− Stata Statistical Package (Stata Corporation ,Computing Resource Center, College Station , Texas)
http://www.stata.com
Tiene muy amplias capacidades estadísticas aplicables a áreas biológicas, del comportamiento y económicas.
− Stat View Software (Abacus Concepts INC, Berkeley) http://www.statview.com
Fácil de aprender y operar y dispone de tests básicos y capacidades gráficas, pero no es capaz de manejar
grandes conjuntos de datos ni dispone de estadísticas de análisis de sobre−vida ni regresión logística.
− StatXact 3 (V3 Cytel Software Corporation , Cambridge , Massachussetts) http://www.cytel.com
Por primera vez pone a disposición en forma práctica cálculos exactos para datos discretos, como por ejemplo
el test exacto para una tabla r x c, test de tendencia exacta para tabla r x 2 y el test exacto para la combinación
de tablas 2 x 2 cuando falla el test de Mantel−Haenszel.
También permite el cálculo para niveles de significación semi−p , uso recomendado por Armitage para datos
discretos.
− Genstat, General Statistic Program
Se le considera uno de los paquetes más difíciles de aprender. Es al mismo tiempo un lenguaje y un paquete
de modo que el tipo de operaciones algebraicas usadas habitualmente en estadística pueden programarse
facilmente lo que permite la ejecución de métodos nuevos. Por ello es popular entre los estadísticos que se
encuentran desarrollando nuevos métodos o variantes de métodos existentes. Tiene buenos recursos para
analizar experimentos diseñados.
− GLIM, Generalized Linear Interactive Modelling http://www.nag.com/stats/GDGE.html
Fue escrito para ajustar modelos lineales en forma interactiva lo que permite al investigador avanzar mediante
la prueba y ajuste de diferentes modelos, con lo que puede agregar o descartar variables y apreciar el efecto de
estos cambios antes de decidir el siguiente paso. Es más útil en tamaños pequeños a medianos de datos
− Prophet (National Center for Research Resources , National Institutes of Health. BBN Systems and
Technologies , 1997) http://www−prophet.bbn.com
Es un paquete aún en etapa de prueba. Es bastante semejante en sus disponibilidades a SPSS, pero pensamos
que es superior en la presentación de los resultados. Tiene un excelente y didáctico manual en línea por medio
de Internet.
4
− Arcus Quickset Biomedical (Research Solutions, Cambridge, England)
http://www.researchsolutions.com/arcus_quickstat/index.html
− Cricket Graph III (Islandia , NY) http://www.cjs.cadmus.com/da/instructions/cricket_mac.html
− CSS Statistical Software (Statsoft Inc)
− EGRET . Epidemiologycal Graphics and Testing Package (Statistic and Research Corporation ,
Washington,1988) http://www.cytel.com/products/egret
− Epicure Peanuts (Hirosoft International Corporation , Seattle, Washington,1993)
http://www.hirosoft.com/index.html
− GRAPHROC.Maximatti Oy , Xerttulink , Finland http://www.saunalahti.fi/~maxim
− Graphpad Instat software http://www.graphpad.com
− HLM V4.0 (Scientific Software International , Chicago , Illinois) http://www.ssicentral.com/hlm/hlm.htm
− JMP Software V3.01, V3.15, V3.2 (SAS Institute,Cary,NC) http://www.jmpdiscovery.com/
− LISREL V8. Scientific Software International , Chicago , 1993
http://www.ssicentral/com/lisrel/mainlix/htm
− Lotus (Lotus Development Corporation) http://www.lotus.com
− Microsoft Excel http://www.microsoft.com/office/excel/default.htm
− MLn. Multilevel Statistical Models , London
− MLWIN (Multilevel Modeling for Windows).Institute of Education , London , 1998 http://ioc.ac.uk/mlwin
− NUD*IST V4.0 . Qualitative Solution and Research , Victoria , Australia http://www.qsr.com.au
− Report V6.0.08 (IDV , Munich , Germany)
− Review Manager. RevMan.The Cochran Collaboration , Oxford) Versiones 3.1, 4.0
http://hiru.mcmaster.ca/cochrane/cochrane/revman.htm
− ROC Analyzer V09B (Centrosoft , Birmingham , Alabama)
− Sigmastat V2.0 (Jandel Scientific) http://www.spssscience.com/sigmastat
− Simstat V3.5 http://www.kovcomp.co.uk
− S−Plus Statistical Package (Stat Sci , Seattle and Europe)
− Statigraphics (Manigistics)
− Statistica (Statsoft, Tulsa Ok)
− Statprobe (Ann Arbor, Mich) http://www.statprobetechnologies.com
5
− Stat Soft (Tulsa, Okl) http://www.statsoftinc.com
− SUDAAN. Analysis with Complex Samples , Lavange LM http://www.rti.org./patents/sudaan/sudaan.html
− SYSTAT Software (Wilkinson, 1990, SYSTAT Inc) http://www.spssscience.com/systat
− Testimate V5.2ª (IDV, Munich, Germany)
− True Epistat (Epistat Services) http://www.true_epistat.com
− Clinfo Systems (Southern California School of Medicine)
− Egret (Statistics and Epidemiology Research Corporation)
− GBSTAT http://www.gbstat.com/index1.htm
− LogXact http://www.cytel.com/new.pages/LX.2.html
− NCSS V6.0 (J.L. Hintze , Kaysville , Utah) http://www.ncss.com
− SIP − Sistema Informático Perinatal http://www.clap.hc.edu.uy
− SPIDA (Gebski et al, 1992)
− Statistix (NH Analytical Software) http://www.statistix.com
INTRODUCCION
Un Paquete Estadístico es un conjunto de programas y subprogramas conectados de manera que funcionan de
manera conjunta; es decir, para pasar de uno a otro no se necesita salir del programa y volver a él. Un paquete
estadístico permite aplicar a un mismo fichero de datos un conjunto ilimitado de procedimientos estadísticos
de manera sincronizada, sin salir del programa. De esta forma, la utilidad del conjunto integrado es mayor que
la suma de las partes. En cierto modo, un paquete estadístico es similar a un paquete ofimática Este, entre
otros temas como las ventajan y desventajas de cada uno de los paquetes estadísticos por nosotros conocidos,
serán tocados y ampliados en este trabajo.
CONCLUSION
A la vista de lo investigado, podemos decir que los Paquetes Estadísticos son muy útiles al momento de hacer
cálculos estadísticos pero, los usuarios que sólo se aproximan circunstancialmente a problemas de tipo
estadístico y que sólo buscan soluciones poco sofisticadas y puntuales deben reexaminar las rutinas
estadísticas de cualquier hoja de cálculo, incluyendo, tal vez, algunos de los macros de libre distribución que
pueden encontrar en Internet, usar algún programa gratuito con un interfaz simple como los que pueden
encontrarse e Internet o tal vez, buscar en Internet alguna de las cada vez más numerosas páginas en las que es
posible realizar interactivamente y en línea determinadas manipulaciones estadísticas.
Por otra parte, a aquellos usuarios que tengan que realizar análisis estadísticos más complejos y de una forma
más regular podrían tomar como primera opción R, programa gratuito que pueden descargarse en internet.
Usado en combinación con otro tipo de programas que extienden su capacidad gráfica −hojas de cálculo,
procesadores de texto, programas específicos para la representación de datos, JavaScript, etc.− puede realizar
con un coste nulo análisis sumamente sofisticados que, incluyen, tal vez, el 99% de los que precisan el 95% de
los usuarios. Sólo un número pequeño de ellos echaría en falta alguna de las herramientas adicionales que
6
incluye su versión comercial, S−Plus, o tal vez alguna de las de SAS o SPSS u otros.
BIBLIOGRAFIA
− http://www.estadistico.com/arts.html?20001113
− http:// www.sas.com
− http://www.spssscience.com/Bmdp/
− http://www.cdc.gov/epiinfo
− http://www.mednet.org.uy/suis/infosuis/temas/infosuis8−a.htm
− http://www.suis.org.uy/infosuis/temas/temas_08−1.shtml
7
Descargar