¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? José Manuel Moreno Carretero Licenciado en Informática por la Universidad de Granada Experto en accesibilidad y usabilidad Web por La Universidad de Alcalá de Henares Webmaster del Grupo Cooperativo Cajamar Cajamar Caja Rural ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? OBTENCIÓN DE DATOS A PARTIR DEL FORMATO “RIS” A partir del archivo RIS, obtendremos el archivo Excel para poder tratar los datos. En nuestro ejemplo “resultados datos cirugia periodontal regenerativa” tenemos las siguientes tablas en el mismo archivo: CORE: Registro completo. Esta tabla contiene los registros completos. Los campos de esta primera tabla son: Id_article, Authors, Title, Year, Source title, etc. AU: Para cada articulo identificado en la tabla anterior con “Id_article”, nos da el autor que ha intervenido en la elaboración “Authors”. Como veis un “Id_article” aparecerá tantas veces como autores han intervenido en el. DE-ID: No se ha utilizado JCR: No se ha utilizado CAT: No se ha utilizado CONCEPTOS BÁSICAS PARA EL TRABAJO Filas de la tabla: Son las líneas horizontales. Cada una de ellas es un registro excepto la primera que es la cabecera de la tabla. Columnas: Líneas verticales de la tabla Celda: Cada casilla que se produce con el cruce de una columna y una fila. Cabecera: Fila Superior de la tabla Campos: Cada una de las celdas de la cabecera. Hoja: Cada una de las pestañas inferiores. Cada una contiene una tabla diferente. Necesitaremos nuevas pestañas o abrir otro archivo para usarla temporalmente en la obtención de datos finales. Lo veremos con algún ejemplo. Ordenación: Cualquier tabla podremos ordenarla fijando una de las columnas de ordenación. Por ejemplo la tabla CORE podremos ordenarla por el campo “year” y de esta forma tener agrupados todos los artículos de cada año. -1- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Subtotales: Podremos realizar operaciones de subtotales sobre la tabla. Siguiendo con el ejemplo anterior podremos “contar” los registros para cada cambio que nos encontremos en “year”, de esta forma tendríamos el número de publicaciones por año. Seleccionar celdas visibles: Habrá un momento en el que podremos ocultar ciertos registros. De esta forma solo seleccionaremos las visibles, desechando el resto. Lo veremos con ejemplos. Filtro: Podremos filtrar una tabla seleccionando un campo determinado de dicha tabla. Por ejemplo publicaciones del año 1986. Visualización de la tabla: La tabla no tiene porque tener que visualizarse completa, como en nuestro caso. Podemos desplazarnos por la tabla mediante las barras de desplazamiento (Inferior y derecha). El ancho de las columnas podemos variarlo a voluntad, poniendo el ratón en la zona superior derecha de cada una de las columnas y moviéndolo mientras lo mantenemos pulsado. Si hacemos doble clic en la columna se adaptará al ancho mínimo para poder mostrar todo el contenido de dicha columna. Todo lo relativo a cambio de columnas (ancho, etc) es trasladable a cualquiera de las tablas siguientes. EJEMPLO BÁSICO Supongamos la siguiente tabla (“Ejemplo Básico.xls”): Nombre Apellido Nota Antonio Lopez 5 Juan Murcia 5 Mercedes Castillo 6 Miguel Ventura 3 Irene Moreno 9 Javier Pérez 9 Mario Ariza 10 Begoña Sánchez 2 Francisco Gutiérrez 9 Torcuato Membrives 0 Emilio Cuadra 1 -2- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? El nombre Apellido y Nota es la cabecera de la tabla. Indican los campos de cada uno de los registros. El resto son los datos Un registro, por ejemplo: Antonio López con un 5 de nota. Realicemos una ordenación por nota de mayor a menor Nombre Apellido Nota Mario Ariza Irene Moreno 9 Javier Pérez 9 Francisco Gutiérrez 9 Mercedes Castillo 6 Antonio Lopez 5 Juan Murcia 5 Miguel Ventura 3 Begoña Sanchez 2 Emilio Cuadra 1 Torcuato Menbrives 0 -3- 10 ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Realicemos subtotales: Para cada cambio en nota Usar la función cuenta y agregar el subtotal a nota Nombre Mario Apellido Nota Ariza 10 Cuenta 10 1 Irene Moreno 9 Javier Pérez 9 Francisco Gutiérrez 9 Cuenta 9 3 Castillo 6 Cuenta 6 1 Antonio Lopez 5 Juan Murcia 5 Cuenta 5 2 Ventura 3 Cuenta 3 1 Sanchez 2 Cuenta 2 1 Cuadra 1 Cuenta 1 1 Menbrives 0 Cuenta 0 1 Mercedes Miguel Begoña Emilio Torcuato Cuenta general 11 Si “plegamos” al 2 Nombre Apellido Nota Cuenta 10 1 Cuenta 9 3 Cuenta 6 1 Cuenta 5 2 Cuenta 3 1 Cuenta 2 1 Cuenta 1 1 Cuenta 0 1 Cuenta general -4- 11 ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? La ordenación y los subtotales la vamos a realizar durante el ejemplo de forma mucho más compleja y anidada. Es decir de resultados, volveremos a realizar ordenaciones y nuevos subtotales y así sucesivamente. En el ejemplo podrían pedirnos cuantas notas han sido sacadas por un solo alumno. ANÁLISIS Números de publicaciones: Este dato lo obtenemos viendo el total de registros que tiene la tabla CORE. Hacer notar que la cabecera no cuenta. Vamos al final de la tabla vemos el número de registros, le restamos uno (la cabecera) y obtenemos el dato. Números de publicaciones= 1795-1(cabecera) = 1794 publicaciones. Número de publicaciones por año: Ordenaremos la tabla por “year”, Datos – ordenar. Ordenar por “Year” Ascendente. En 2007 pincharemos en el icono Ordenar. -5- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Y pediremos que nos de los subtotales. Deberá de darnos la cuenta para cada cambio que encuentre en “Year”. Datos – Subtotales. Para cada cambio en “Year” usar la función “cuenta” y agregar subtotal a “Year”. En 2007, icono subtotales En este punto tenemos en la zona superior izquierda tres números. Si pinchamos en: 1.- Obtenemos el total de la cuenta 1794 2.- Obtenemos la cuenta para cada año: Cuenta 1980 = 32, Cuenta 1981 = 30, etc 3.- Obtenemos la tabla completa pero con registros intermedios que nos dan el total para cada cambio en el año. -6- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Pulsando la opción 2 podremos seleccionar cuantos artículos ha habido por año. - Haremos una selección de celdas visibles. - Copiaremos la selección y nos la llevaremos a un nuevo archivo Excel que denominaremos área de trabajo. La idea es no machacar datos en la tabla original. Vemos que nos aparece un nuevo archivo con tres hojas (pestañas) en las que podremos incluir los datos temporales para retocar, obtener finales e incluso hacer nuevas operaciones. El número de pestañas podremos ir aumentándolas pinchando con el ratón, botón derecho. En 2007 pinchando a la derecha de la pestaña -7- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Cambiaremos la cabecera con los nombres correctos (Año y nº de publicaciones) y eliminaremos de todos los registros la palabra “Cuenta “ (con espacio final). Para no tener que hacer uno a uno podremos darle un reemplazar “Cuenta “ por “” Edición – Reemplazar. Buscar “Cuenta “ y remplazar por “” (dejar vacío. Las comillas no se ponen). Pulsamos reemplazar todos y tenemos la tabla lista. Control B en 2007 -8- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Esta tabla podrá seleccionarse y tras copiarla, pegarla en el procesador de texto. Seleccionamos con el ratón. Edición – copiar. Nos vamos a Word, nos colocamos en el punto elegido y damos a Edición – Pegar. -9- ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Para realizar una gráfica con estos datos, el año lo deberá de tomar como texto y no como un número para evitar que lo tome como dato. Un número se transforma en texto colocándole una ‘ (comilla simple) por delante. Podríamos haberlo hecho de una vez al remplazar “Cuenta “ por “’” (comilla simple). Una vez bien formada la tabla (texto y datos), la seleccionaremos (incluida la cabecera que corregimos Año y nº de publicaciones). Insertar – Gráfico En 2007 elegimos directamente el tipo de gráfico Tras elegir el tipo de gráficos, por ejemplo Líneas, Vamos pulsando a siguiente. Debemos de ir rellenando los datos que se nos piden. Es aconsejable hacer una prueba “jugando” con todas las opciones para ver los resultados. Se pueden ir viendo sobre la marcha. - 10 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? No os preocupéis porque podremos eliminar la gráfica sin problemas si no sale de nuestro agrado. Al final pediremos que nos la inserte como objeto en la misma pestaña en la que estamos. La otra opción es para crearla en una pestaña aparte. Pulsamos finalizar. - 11 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Una vez realizada la tabla, podremos marcar sobre la línea y pulsando el botón derecho del ratón, agregar una línea de tendencia. Interesante ver las posibles opciones de la línea de tendencia. En cualquier momento podremos pincharla con el ratón y eliminarla. Edición – Borrar – Línea de tendencia. En 2007 Botón derecho - eliminar Título del gráfico 120 100 80 Nº de Publicaciones 60 Lineal (Nº de Publicaciones) 40 20 19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00 20 02 20 04 20 06 20 08 20 10 0 Podremos ponernos sobre la gráfica y con el botón derecho del ratón copiarla para llevarla al procesador de texto (pegándola) tal como hicimos con la tabla. El método de copiar tablas y gráficos a Word es exactamente igual en todos los casos, por lo que únicamente explicaremos la obtención de datos. Como tenemos que seguir trabajando con la tabla “madre” y la tenemos con los subtotales, debemos de proceder a limpiar los subtotales para cálculos siguientes: Datos – subtotales. Quitar todos. En 2007 igual pero pulsando el icono Datos - 12 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Además de lo anterior se pidió hacer la comparación para ver la evolución con la palabra “dentistry”, para ver si la evolución en publicaciones se correspondía con el tema tratado. Esta búsqueda se hizo manualmente año a año en el Sopus. Con los datos se hizo una tabla con una nueva columna y se realizó una gráfica con estas dos columnas. Para esto se eligió un gráfico tipo personalizado de Líneas y columnas 2 - 13 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Como la escala utilizada difiere y no se ven a penas nuestros datos por que son insignificantes con respecto a la búsqueda de “Dentitry”, marcamos en “eje”, “Eje de valores y” De esta forma conseguimos que se nos creen dos ejes “Y” una para nuestros datos y otro para “Dentistry” 120 60000 100 50000 80 40000 60 30000 40 20000 20 10000 Dentistry 2010 2008 2006 2004 2002 2000 1998 1996 1994 1992 1990 1988 1986 1984 1982 0 1980 0 Nº de Publicaciones De esta forma podemos ver la tendencia de ambas búsquedas. Distribución de publicaciones por tipo de documento: - Ordenamos la tabla por “Document Type”. - Sacamos los subtotales, pidiendo la función cuenta para cada cambio en tipo de documento. - Plegamos a 2 - Nos llevamos los datos a otra pestaña del archivo de trabajo, para no tocar el original. Seleccionando solo visibles. - 14 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? En esta tabla de trabajo: Nº publicaciones Tipo Documento Cuenta Article Cuenta Article in Press Cuenta Conference Paper Cuenta Editorial Cuenta Letter Cuenta Note Cuenta Review 1509 10 36 2 5 3 229 - Realizaremos una nueva ordenación por Número de publicaciones. Esta vez descendente. Nº publicaciones Tipo Documento Cuenta Article Cuenta Review Cuenta Conference Paper Cuenta Article in Press Cuenta Letter Cuenta Note Cuenta Editorial 1509 229 36 10 5 3 2 A modo de ejemplo Viendo que algunos datos son insignificantes los vamos a agrupa en una zona común “Varios”. Copiamos a la derecha los datos a representar, por ejemplo hasta “Review”. Añadimos un registro “Varios” y como dato ponemos una función. Nos posicionamos en el dato (vacío) y pinchamos en funciones. Buscamos dentro de matemáticas la función “Suma”. Aceptamos y marcamos en la zona izquierda los datos a agrupar. Volvemos a aceptar. - 15 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? Tipo Documento Nº publicaciones Article Review 1509 229 Varios 56 Con esto vamos a crear un gráfico de tarta. El sistema el mismo que el anterior pero cambiando el tipo de gráfico a “circular”. Elegimos el que más nos guste y seguimos el mismo proceso de “nº de publicaciones por año”. Nº publicaciones Article Review Varios Índice Lotka: Nicolás envió un PPT powerpoint (Lotka) en el que explica paso a paso como hacer la gráfica. Con la información que tenéis hasta ahora debéis de poder hacerlo. A partir de la diapositiva 6 viene el ejemplo para Excel. Para este cálculo debemos de utilizar la tabla AU. - Ordenaremos por autores y calcularemos cuantas publicaciones tiene cada autor utilizando los subtotales. - 16 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? - Obtener la cuenta en cada cambio en autor. De esta forma obtenemos el número de artículos en los que ha participado cada autor. Tendremos autores y número de publicaciones. Debemos de seguir tratando estos resultados llevándonos la tabla a la zona de trabajo. Ordenamos (descendente) por Nº de publicaciones. Tenemos agrupados todos los que han escrito n publicaciones. - Volvemos a utilizar los subtotales. - Contar para cada cambio en nº de publicaciones. De esta forma obtenemos cuantos autores han escrito 35 artículos, 29, etc - Seleccionaremos esta tabla y no llevaremos a otra pestaña (botón derecho sobre la pestaña e insertar). - Pegamos y obtenemos la tabla para trabajar en el Índice de Lotka. Índice de coautoría: Se contaron el número de autores diferentes utilizando el dato obtenido para utilizar en Lotka (publicaciones por cada autor tenía tantos registros como autores había) y se dividió por el total de documentos, obteniendo dicho índice. Distribución de los documentos y autores: En este dato tenemos que obtener cuantos artículos hay con un autor, cuantos con dos, etc. Para ello: En la tabla AU ordenamos por “Id article” y así sabemos cuantos autores han escrito cada artículo. Nos llevamos esta tabla aun área de trabajo. En esta tabla tenemos que el artículo 1 está escrito por 6 autores, el 2 por 7, etc Ordenamos por número de autores y volvemos a contar los cambios con lo que obtenemos que 270 artículos han sido escritos por un autor, 277 por 2, etc. Esta tabla la volvemos a seleccionara para llevárnosla a una nueva área de trabajo y tras retocarla obtenemos la tabla de distribución de los documentos y los autores. Tasa de autoría única: Utilizamos el nº de documentos con un solo autor, del apartado anterior, dividido por el total de publicaciones. Revistas más productivas: Para esto vamos a utilizar la tabla CORE. Ordenamos por “Source Tittle”. De esta forma obtenemos cuantos documentos se han publicado en cada revista. Nos llevamos la tabla al área de trabajo. Ordenamos por el número de - 17 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? publicaciones y obtenemos la tabla definitiva. Al ser muy amplia y tenerla ordenada, escogemos lo más representativo. Idioma de publicación: Ordenamos por “Language of Original Document” y contamos. Nos llevamos los visibles al area de trabajo y ordenamos de nuevo. Si queremos obtener porcentajes, en la columna del lado hacemos las cuentas anteponiendo un igual. Número de documentos de cada idioma entre el total de documentos. Cambiamos el formato a porcentaje de toda la columna. Marcamos la columna Botón derecho Formato de celdas Pestaña número Porcentaje dos decimales. - 18 - ¿Cómo utilizar Excel para facilitar el tratamiento de datos para bibliometría? DIRECCION DE DESCARGA Podéis descargar todos los archivos para realizar prácticas de: http://www.dentasoft.es/curso-excel-bibliometria/ Dirección de correo para consulta de dudas: [email protected] - 19 -