IBM Unica NetInsight Versión 8 Release 6 30 de abril de 2012 Guía de ajuste Nota Antes de utilizar este producto y la información a la que da soporte, lea la información contenida en el apartado “Avisos” en la página 59. Esta edición se aplica a la versión 8, release 6, modificación 0 de IBM Unica NetInsight y todos los releases y modificaciones posteriores hasta que se indique otra cosa en nuevas ediciones. © Copyright IBM Corporation 1996, 2011. Contenido Capítulo 1. Cómo ponerse en contacto con el soporte técnico de IBM Unica . . 1 Capítulo 2. Selección y configuración de hardware . . . . . . . . . . . . . . 3 Requisitos mínimos de hardware . . . . . . Determinar un nivel de rendimiento aceptable . . 3 . 3 Capítulo 3. Optimización de la base de datos SQL Server . . . . . . . . . . 5 Contadores de los que se debe realizar el seguimiento . . . . . . . . . . . . . Valores de contador deseados. . . . . . . . Contadores de objetos de procesador . . . . Contadores de objetos del sistema . . . . . Contadores de gestor de almacenamientos intermedios de SQL Server . . . . . . . Contadores de objetos de mecanismos de cierre. Contadores de objetos de bloqueos . . . . . Contadores de objetos de gestor . . . . . . Contadores de objetos (lógicos o físicos) de disco Contadores de objetos de memoria . . . . . . . . . 5 6 6 6 . . . . 6 6 7 7 7 . 8 Capítulo 4. Optimización de la base de datos DB2 . . . . . . . . . . . . . . 9 Resumen de las recomendaciones de configuración . 9 Recomendaciones detalladas de configuración . . . 11 Instalar los archivos del sistema de base de datos en una ubicación adecuada . . . . . . . . 11 Seleccionar el juego de caracteres de base de datos adecuado . . . . . . . . . . . . 12 Configurar los registros de transacciones . . . 12 Seleccionar el tamaño de página adecuado . . . 12 Aumentar el tamaño de la agrupación de almacenamiento intermedio . . . . . . . . 13 Habilitar el paralelismo intrapartición . . . . 13 Configurar las áreas de trabajo en memoria. . . 14 Aumentar el número de servidores de E/S de DB2 . . . . . . . . . . . . . . . . 15 Configurar espacios de tabla. . . . . . . . 16 Capítulo 5. Optimización de la base de datos Oracle . . . . . . . . . . . . 19 Resumen de las recomendaciones de configuración Recomendaciones detalladas de configuración . . . Instalar los archivos del sistema de base de datos en una ubicación adecuada . . . . . . . . Seleccionar el juego de caracteres de base de datos adecuado . . . . . . . . . . . . Seleccionar el valor de DB_BLOCK_SIZE adecuado . . . . . . . . . . . . . . Configurar los registros de rehacer . . . . . Aumentar el tamaño de memoria caché de almacenamiento intermedio . . . . . . . . © Copyright IBM Corp. 1996, 2011 19 21 21 21 22 22 22 Configurar las áreas de trabajo en memoria. . . 23 Configurar espacios de tabla. . . . . . . . 24 Configurar particionamiento de tablas e índices 27 Capítulo 6. Valores de configuración del rendimiento . . . . . . . . . . . 29 Elemento <database> . Elemento <ntdbbases>. <maxqueuedlines> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 . 31 . 32 Capítulo 7. Ajuste avanzado NetInsight 35 Elegir los métodos y los objetivos del ajuste . . . Utilizar un entorno de prueba para el ajuste . . . Problemas de rendimiento ocasionales y continuados . . . . . . . . . . . . . . Aislar problemas de rendimiento durante las actualizaciones . . . . . . . . . . . . . Determinar el tiempo de importación de datos . Determinar el tiempo de indexación y mantenimiento de tablas . . . . . . . . . Determinar el tiempo de actualización de perfiles de visitante . . . . . . . . . . . . . Determinar el tiempo de generación de informes Problemas de rendimiento durante la importación Esperas de red . . . . . . . . . . . . Resolución de títulos de página. . . . . . . Problemas con la memoria caché y los ID de la memoria . . . . . . . . . . . . . . . Verificar si la conciliación de ID está ocasionando un problema de rendimiento . . . . . . . Ejemplo: verificación de la conciliación de ID como problema de rendimiento. . . . . . . Determinar el ID que está ocasionando el problema de rendimiento . . . . . . . . . Ejemplo: verificación del origen del problema de conciliación de ID . . . . . . . . . . . Ajuste cuando la información en el valor de ID es obligatoria para la generación de informes . . Reducir el intervalo de punto de comprobación Ajustar cuando el campo de ID contiene información obligatoria para la generación de informe. . . . . . . . . . . . . . . Volver a configurar NetInsight cuando el campo de ID contiene información no necesaria para la generación de informes . . . . . . . . . Cuellos de botella del subsistema de disco de la base de datos durante las confirmaciones . . . Cuellos de botella de recursos del sistema de NetInsight . . . . . . . . . . . . . . Problemas de rendimiento durante la indexación y el mantenimiento de las tablas . . . . . . Problemas de rendimiento durante la creación de perfiles de visitante. . . . . . . . . . . Perfiles de visitante con filtros basados en directorio, página o grupo de contenido . . . . 35 35 35 36 36 36 36 37 37 37 38 39 40 40 41 41 42 42 43 44 44 45 47 47 48 iii Problemas de rendimiento durante la generación de informes . . . . . . . . . . . . . Aislar problemas de rendimiento con informes dinámicos (ampliación de detalles) . . . . . . Inhabilitar el almacenamiento en memoria caché Personalizar el análisis de tablas de NetInsight en los despliegues de Oracle . . . . . . . . . . Inhabilitar el análisis de tablas de informe para un perfil . . . . . . . . . . . . . . Inhabilitar el análisis de tablas de esquema para un perfil . . . . . . . . . . . . . . iv IBM Unica NetInsight: Guía de ajuste 49 Especificar un código SQL de análisis de tablas personalizado . . . . . . . . . . . . 55 53 54 Capítulo 8. Ubicaciones de archivos y directorios . . . . . . . . . . . . . 57 54 55 55 Avisos . . . . . . . . . . . . . . . 59 Marcas registradas . . . . . . . . . . . . 61 Capítulo 1. Cómo ponerse en contacto con el soporte técnico de IBM Unica Si encuentra un problema que no puede resolver consultando la documentación, el contacto de soporte designado de la empresa puede registrar una llamada con el soporte técnico de IBM® Unica . Utilice la información de esta sección para asegurarse de que su problema se soluciona de manera eficaz y satisfactoriamente. Si usted no es un contacto de soporte designado en su empresa, póngase en contacto con el administrador de IBM Unica para obtener más información. Información a recopilar Antes de ponerse en contacto con el soporte técnico de IBM Unica , recopile la información siguiente: Breve descripción de la naturaleza de su problema. Mensajes de error detallados que verá cuando se produzca el problema. Pasos detallados para reproducir el problema. Archivos de registro, archivos de sesión, archivos de configuración y archivos de datos relacionados. v Información sobre el producto y el entorno del sistema, que puede obtener tal como se describe en "Información del sistema". v v v v Información del sistema Cuando llame al soporte técnico de IBM Unica , es posible que se le solicite proporcionar información sobre el entorno. Si su problema no evita que inicie sesión, mucha de esta información estará disponible en la página Acerca de, que proporciona información sobre si ha instalado aplicaciones de IBM Unica . Puede acceder a la página Acerca de seleccionando Ayuda > Acerca de. Si no se puede acceder a la página Acerca de, puede obtener el número de versión de cualquier aplicación IBM Unica mediante la visualización del archivo version.txt ubicado en el directorio de instalación para cada aplicación. Si el archivo version.txt no está disponible, utilice el mandato NetTracker admin -buildinfo para obtener la información de la versión. Información de contacto para el soporte técnico de IBM Unica Para obtener formas de contactar con el soporte técnico de IBM Unica , consulte el sitio web de Soporte técnico del producto IBM Unica : (http://www.unica.com/ about/product-technical-support.htm). © Copyright IBM Corp. 1996, 2011 1 2 IBM Unica NetInsight: Guía de ajuste Capítulo 2. Selección y configuración de hardware En esta sección se incluye una descripción sobre cómo determinar los requisitos de hardware mínimos para la configuración y una descripción de los requisitos de hardware. Requisitos mínimos de hardware El hardware mínimo necesario para dar soporte a la base de datos y proporcionar un rendimiento de NetInsight aceptable variará en función de cómo se utilice NetInsight y del volumen de datos de registro que almacene. Por ejemplo, los usuarios que procesen los archivos de registro una vez a la semana y revisen los informes sólo los lunes puede que tengan requisitos menos estrictos que los que procesen los archivos de registro de cada día y los revisen al día siguiente. Determinar un nivel de rendimiento aceptable Para determinar los requisitos de hardware mínimos de despliegue de NetInsight, primero tiene que identificar el nivel de rendimiento que considere aceptable. El rendimiento que puede alcanzar una configuración de hardware específica variará en función de lo siguiente: la frecuencia con que actualice los perfiles de NetInsight, el número de perfiles que utilice y el tiempo máximo que necesite para que se lleve a cabo la actualización de un perfil. Por ejemplo, suponga que el modelo empresarial que utiliza exige que sólo actualice los perfiles de NetInsight una vez a la semana cada fin de semana para su visualización el lunes siguiente. En tal caso, puede definir un rendimiento aceptable que sea "lo suficientemente rápido para procesar los archivos de registro de una semana en un plazo de 48 horas". Si actualiza los perfiles de NetInsight cada noche para su visualización el día siguiente, el rendimiento aceptable podría ser "lo suficientemente rápido para procesar los registros de un día en menos de 7 horas". Puesto que NetInsight procesa un solo lote grande de datos de registro con mayor eficacia que varios lotes más pequeños, serán necesarios menos recursos de hardware para alcanzar el primer objetivo. Si utiliza un perfil individual de NetInsight para el sitio web, necesitará hardware que pueda leer, procesar y generar informes a partir de los datos de los archivos de registros en el periodo de tiempo que exija la empresa. Si el sitio web se divide en áreas distintas y desea un perfil de NetInsight para cada una, necesitará hardware que pueda leer, procesar y generar informes para cada área, de nuevo en el periodo de tiempo de destino. Aunque esos perfiles más pequeños pueden tardar menos en actualizarse, es probable que el tiempo acumulado para procesarlos supere el tiempo para procesar un perfil individual más grande. © Copyright IBM Corp. 1996, 2011 3 4 IBM Unica NetInsight: Guía de ajuste Capítulo 3. Optimización de la base de datos SQL Server SQL Server se entrega con unas cuantas opciones de ajuste de la configuración nativas. No obstante, puede ajustar la base de datos SQL Server para obtener el rendimiento óptimo supervisando periódicamente los contadores de rendimiento claves de Windows. La supervisión de los contadores de rendimiento de Windows también ayuda a panificar posibles actualizaciones del sistema a media que el conjunto de datos aumente. Debe supervisar el rendimiento durante las actualizaciones y la generación de informes. Para obtener más información detallada sobre la supervisión del rendimiento de SQL Server, consulte la documentación de SQL Server. Para obtener información adicional de ajuste de base de datos, consulte la información de consulta técnica de ajuste de rendimiento disponible en Microsoft Press. Contadores de los que se debe realizar el seguimiento Utilice el Monitor de rendimiento de Windows para supervisar el rendimiento de la base de datos SQL Server de NetInsight. Se debe realizar el seguimiento de los contadores siguientes: Objeto de rendimiento Contador Procesador % de tiempo de procesador Sistema Longitud de la cola del procesador SQL Server: gestor de almacenamientos intermedios Frecuencia de aciertos de caché del búfer SQL Server: bloqueos personales Promedio de tiempo de espera de bloqueos temporales Lecturas de página/s Esperas de bloqueos temporales/s SQL Server: bloqueos Tiempo promedio de espera SQL Server: gestor de memoria Concesiones de memoria pendientes Disco lógico (para configuraciones no RAID) Longitud promedio de la cola de disco Promedio de segundos de disco/lectura Promedio de segundos de disco/escritura Disco físico (para configuraciones RAID)* Longitud promedio de la cola de disco Promedio de segundos de disco/lectura Promedio de segundos de disco/escritura Memoria Páginas/s * Si utiliza un sistema operativo que no sea Windows Server 2003 para supervisar los contadores de discos físicos, primero debe habilitar el servicio DiskPerf. Hágalo ejecutando diskperf –y desde una línea de mandatos o habilitando el servicio en el Panel de control. Es posible que tenga que reiniciar el servidor de la base de datos después de habilitar el servicio. Es posible que tenga que hacer más cambios de © Copyright IBM Corp. 1996, 2011 5 configuración en el sistema para minimizar la sobrecarga adicional a causa de la ejecución de DiskPerf. Una vez realizada la supervisión, inhabilite DiskPerf. Valores de contador deseados A continuación se proporciona una lista de cada contador que se debe supervisar, agrupados por objeto. La descripción de cada contador incluye los valores y las modificaciones deseados que puede realizar en el sistema para que resulte más fácil alcanzar los valores deseados. Contadores de objetos de procesador % de tiempo de procesador % de tiempo de procesador realiza el seguimiento del porcentaje de tiempo durante el que el procesador ejecuta una hebra no desocupada. Microsoft recomienda que la utilización media de CPU no supere el 90 por ciento. Si lo hace, considere la posibilidad de añadir procesadores adicionales o de actualizar los procesadores existentes. Contadores de objetos del sistema Longitud de la cola del procesador Longitud de la cola del procesador realiza el seguimiento del número de hebras en la cola del procesador. Si la longitud de cola es superior a 5 por cada procesador, es posible que experimente un cuello de botella de CPU. Puede resolver el cuello de botella añadiendo más procesadores, añadiendo procesadores más rápidos o reduciendo la carga en el sistema. La adición de índices también puede ayudar. Contadores de gestor de almacenamientos intermedios de SQL Server Frecuencia de aciertos de caché del búfer Frecuencia de aciertos de caché del búfer realiza el seguimiento del porcentaje de páginas solicitadas por SQL Server que ya estaban en memoria. Si este valor está por debajo del 60%, considere la posibilidad de asignar más memoria a SQL Server, añadiendo memoria física al sistema o reasignando la memoria existente. Lecturas de página/s Lecturas de página/s realiza el seguimiento del número de solicitudes de E/S de páginas de datos físicos por segundo. Este parámetro debe mantener un valor bajo. Si es alto de forma continuada, aumente la memoria física del sistema o la cantidad de memoria asignada a SQL Server. Contadores de objetos de mecanismos de cierre Promedio de tiempo de espera de bloqueos temporales Promedio de tiempo de espera de bloqueos temporales realiza el seguimiento de la duración media (en milisegundos) de una espera por parte de una hebra de SQL Server en un bloqueo temporal. Si este valor y el valor de Esperas de bloqueos temporales/s son altos, ello sugiere que el sistema tiene un porcentaje de aciertos de memoria caché bajo que está forzando al sistema a realizar más E/S físicas. Para impedir este posible cuello de botella de E/S, aumente la cantidad de 6 IBM Unica NetInsight: Guía de ajuste memoria física en el sistema. Si no es posible, considere la posibilidad de aumentar el ancho de banda de E/S del sistema. Esperas de bloqueos temporales/s Esperas de bloqueos temporales/s realiza el seguimiento del número de veces por segundo que una hebra tiene que esperar en un bloqueo temporal. Si este valor y el valor del contador Promedio de tiempo de espera de bloqueos temporales son altos, ello sugiere que el sistema tiene un porcentaje de aciertos de memoria caché bajo que está forzando al sistema a realizar más E/S físicas. Para impedir este posible cuello de botella de E/S, aumente la cantidad de memoria física en el sistema. Si no es posible, considere la posibilidad de aumentar el ancho de banda de E/S del sistema. Contadores de objetos de bloqueos Tiempo promedio de espera Tiempo promedio de espera realiza el seguimiento del promedio de tiempo (en milisegundos) durante el que una hebra está a la espera de un bloqueo. Aunque puede que no sea posible eliminar el tiempo de espera de bloqueo, este valor debe ser lo más bajo posible. Asegúrese de que no haya transacciones no relacionadas con NetInsight que accedan a o bloqueen la base de datos de NetInsight durante una actualización. Considere la posibilidad de dedicar el servidor a la base de datos de NetInsight. Contadores de objetos de gestor Concesiones de memoria pendientes Concesiones de memoria pendientes realiza el seguimiento de la cantidad de usuarios o procesos que están a la espera de que se conceda memoria. Si este valor es alto, aumente la memoria asignada a SQL Server o añada más memoria física al sistema. Contadores de objetos (lógicos o físicos) de disco Longitud promedio de la cola de disco Longitud promedio de la cola de disco notifica el promedio de lecturas y escrituras en cola para un disco. Si el sistema utiliza una configuración de disco RAID con varios discos, este total hace referencia a todas las unidades contenidas en el volumen. Este valor debe mantenerse en 2 o menos para cada disco. Si el valor es superior a 2, el sistema está limitado por E/S. Para eliminar el cuello de botella, intente añadir discos físicos o aumentar la velocidad de los discos (quizá cambiando la configuración RAID). Promedio de segundos de disco/lectura Promedio de segundos de disco/lectura realiza el seguimiento del promedio de segundos que se tarda en realizar una lectura de datos del disco. Un valor entre 11 y 15 milisegundos es aceptable. Si el valor es superior a 15, el sistema está limitado por E/S. Para eliminar el cuello de botella, intente añadir discos físicos o cambiar la configuración RAID. Capítulo 3. Optimización de la base de datos SQL Server 7 Promedio de segundos de disco/escritura Promedio de segundos de disco/escritura realiza el seguimiento del promedio de segundos que se tarda en realizar una escritura de datos en el disco. Este valor debe ser inferior a 12 milisegundos. Si el almacenamiento en memoria caché de escritura está habilitado en el disco, es probable que este valor sea inferior o igual a 4 milisegundos por escritura. Si este valor es alto, aumente el número de discos del sistema o utilice unidades de disco duro más rápidas. Contadores de objetos de memoria Páginas/s Páginas/s realiza el seguimiento de la velocidad a la que se leen o se escriben las páginas en el disco para resolver errores de paginación intensiva. Si este valor es superior a 0 de forma continuada, el sistema está paginando de forma intensiva (haciendo intercambios con el disco duro). Para impedir la paginación intensiva, añada más memoria al sistema o elimine otras aplicaciones que resten memoria a SQL Server. Si ha establecido manualmente la memoria máxima del sistema, es posible que también tenga que reducir el valor de memoria máxima del servidor, reducir el valor de memoria mínima del servidor o cambiar el tamaño fijo de memoria. 8 IBM Unica NetInsight: Guía de ajuste Capítulo 4. Optimización de la base de datos DB2 En este apartado se describen los pasos para instalar y configurar la base de datos para un rendimiento óptimo de NetInsight. Los pasos se indican en el orden general en el que se pueden implementar. Las instalaciones de base de datos existentes se pueden volver a configurar para mejorar el rendimiento; tenga en cuenta, sin embargo, que las instalaciones mal configuradas pueden contener cuellos de botella que la reconfiguración no puede superar. Resumen de las recomendaciones de configuración En este apartado se resume la configuración de base de datos recomendada para un rendimiento óptimo de NetInsight. En los apartados siguientes se describen otras consideraciones de configuración y de fondo. Valor Recomendación Ubicación de instalación del sistema de archivo de base de datos Instale los archivos del sistema de base de datos en la misma unidad física que el sistema operativo, siempre que haya suficiente RAM disponible para impedir cualquier paginación del sistema. Juego de caracteres de la base de datos Los juegos de caracteres ISO8859-1 (para sistemas UNIX), IBM-1252 (para sistemas Windows) y UTF-8 se pueden utilizar con total seguridad como juego de caracteres de la base de datos. Consulte la guía de instalación de NetInsight para obtener más información. Si piensa utilizar otro juego de caracteres, póngase en contacto con el soporte técnico de IBM. Registros de transacciones Cree, como mínimo, 4 registros de transacciones de al menos 500 MB cada uno. Tamaño de página Utilice o cree un espacio de tabla con un tamaño de página de 8 KB, como mínimo. Tamaño de agrupación de almacenamiento intermedio Aumente el tamaño de agrupación de almacenamiento intermedio de la instancia de base de datos para utilizar el máximo de RAM posible. Deje suficiente RAM disponible para que otras aplicaciones del sistema (por ejemplo, NetInsight) puedan ejecutarse sin paginación. Asigne tanta memoria como sea posible a la agrupación de almacenamiento intermedio asociada con el espacio de tabla donde se almacenen las tablas y los índices de NetInsight. © Copyright IBM Corp. 1996, 2011 9 10 Valor Recomendación INTRA_PARALLEL Habilite el paralelismo intrapartición siempre que haya varios procesadores disponibles para utilizarlos con la instancia de NetInsightDB2. Si la instancia de NetInsight es un nodo miembro de una instancia particionada, asegúrese de que haya varios procesadores disponibles para que los utilice cada partición de base de datos antes de habilitar el paralelismo intrapartición. MAX_QUERYDEGREE Establezca este parámetro en un múltiple del número de procesadores disponibles en el sistema DB2. En el caso de servidores de NetInsight dedicados con mucha memoria y subsistemas de discos de alta velocidad, es posible que se necesite un valor de hasta cuatro veces el número de procesadores disponibles para sacar todo el partido del hardware disponible. DFT_DEGREE Establezca este parámetro en un múltiple del número de procesadores disponibles en el sistema DB2. En el caso de servidores de NetInsight dedicados con mucha memoria y subsistemas de discos de alta velocidad, es posible que se necesite un valor de hasta cuatro veces el número de procesadores disponibles para sacar todo el partido del hardware disponible. Espacio de tabla TEMP Coloque los archivos de datos contenidos en el espacio de datos TEMP en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Coloque los archivos de datos en el espacio de tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas. SHEAPTHRES Establezca este valor en 200 MB, como mínimo. Es posible que se deba incrementar este número en el caso de conjuntos de datos más grandes. Si la base de datos está configurada para paralelismo intrapartición, asegúrese de que el sistema tenga suficiente RAM para proporcionar esta cantidad de memoria, junto con la memoria necesaria para agrupaciones de almacenamiento intermedio y ordenaciones privadas sin que el sistema realice ninguna paginación. IBM Unica NetInsight: Guía de ajuste Valor Recomendación SORTHEAP Si el paralelismo intrapartición está inhabilitado, establezca el valor de SORTHEAP en 100 MB, como mínimo. (Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este valor en el caso de conjuntos de datos más grandes. Si el paralelismo intrapartición está habilitado, establezca el valor de SORTHEAP en el valor de SHEAPTHRES dividido por el grado máximo de paralelismo de la instancia. En todos los casos, asegúrese de que el sistema tenga suficiente RAM para proporcionar la cantidad especificada de memoria, además de la necesaria para agrupaciones de almacenamiento intermedio sin que el sistema realice ninguna paginación. NUM_IOSERVERS Establezca este parámetro en un valor igual al número de discos físicos en los que se almacenen datos. Espacio de tabla TEMP Utilice un espacio de tabla TEMP con System Managed Space (SMS). Coloque todos los contenedores definidos para el espacio de tabla TEMP en un disco dedicado. Asegúrese de que, como grupo, los contenedores del espacio de tabla TEMP proporcionen, como mínimo, 2 GB de espacio temporal disponible. Para obtener el mejor rendimiento, coloque los contenedores que contienen el espacio de tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas. Espacio de tabla DATA Utilice un espacio de tabla DATA con Database Managed Storage (DMS). Coloque los contenedores que contengan el espacio de tabla DATA en los discos que contengan sólo esos contenedores. Asegúrese de que, como grupo, los contenedores definidos para el espacio de tabla DATA proporcionen suficiente espacio para almacenar la cantidad de datos que espera procesar. Para obtener el mejor rendimiento, coloque los archivos de datos en el espacio de tabla DATA en una unidad lógica compuesta por dos o más discos en bandas. Recomendaciones detalladas de configuración Instalar los archivos del sistema de base de datos en una ubicación adecuada Siempre que sea posible, instale los archivos del sistema de base de datos (ejecutables, herramientas, etc.) en un disco independiente del sistema operativo y Capítulo 4. Optimización de la base de datos DB2 11 los archivos de datos. Si es necesario, los archivos del sistema de base de datos se pueden instalar con total seguridad en el mismo disco el sistema operativo siempre que: 1. El área de intercambio del sistema esté en el mismo disco físico que el sistema operativo y el sistema tenga suficiente memoria para garantizar que no tenga lugar ninguna paginación o que ésta se produzca en contadas ocasiones; o bien 2. El área de intercambio del sistema esté en un disco físico independiente Recomendación: instale los archivos del sistema de base de datos en la misma unidad física que el sistema operativo, siempre que haya suficiente RAM disponible para impedir cualquier paginación del sistema. Seleccionar el juego de caracteres de base de datos adecuado Los juegos de caracteres de base de datos y cliente que se utilizan al crear la base de datos DB2 pueden tener un impacto considerable en NetInsight. v Los juegos de caracteres ISO8859-1 (para los sistemas UNIX), IBM-1252 (para los sistemas Windows) y UTF-8 se pueden utilizar con total seguridad. Consulte la guía de instalación de NetInsight para obtener más información. v Si está considerando la posibilidad de utilizar un juego de caracteres que no sea -1 o IBM-1252, póngase en contacto con el servicio de soporte técnico de IBM. Configurar los registros de transacciones Para obtener el rendimiento óptimo del proceso de importación de datos de NetInsight, configure los registros de transacciones de DB2 para proporcionar la productividad máxima con un número mínimo de conmutadores entre archivos de registro (los conmutadores aparecen cuando se llena un archivo de registro). Normalmente esto se consigue manteniendo un mínimo de cuatro registros de transacciones de 500 MB cada uno. Para reducir los tiempos de acceso al disco, mantenga los registros de transacciones en un disco que proporcione acceso rápido y fiable. En el caso de conjunto de datos más pequeños, por lo general se acepta el disco que contiene el sistema de DB2; en el caso de conjuntos de datos que se espera que superen 3 GB de almacenamiento de base de datos al mes, o para obtener el rendimiento de base de datos óptimo, coloque los registros de transacciones en una unidad lógica dedicada que conste de dos o más discos en bandas. Recomendación: cree, como mínimo, 4 registros de transacciones de al menos 500 MB cada uno. Seleccionar el tamaño de página adecuado El tamaño de página del espacio de tabla de los datos de NetInsight tiene un impacto importante en el uso de la memoria y en el rendimiento de E/S. El espacio de tabla de usuario predeterminado de DB2 tiene una tamaño de página de 4 KB. Un tamaño de página mayor permite que DB2 lea y escriba más filas de datos en una sola operación de E/S. Esto puede mejorar el rendimiento para NetInsight, lo cual exige a menudo que DB2 lea y escriba muchas filas de sus tablas de datos. También permite que DB2 cree archivos de datos más grandes, lo que significa que se pueden almacenar más datos en un solo espacio de tabla (el tamaño máximo de un archivo de datos es una función del tamaño de página). Un tamaño de página de al menos 8 KB (o, preferiblemente, 16 o 32 KB), proporciona un rendimiento y una escalabilidad de base de datos mejorados. 12 IBM Unica NetInsight: Guía de ajuste Los privilegios del usuario de NetInsight para la creación de tablas determinan dónde se crean las tablas de NetInsight. En general, es preferible limitar dichos privilegios a un solo espacio de tabla. Si va a crear una base de datos nueva para utilizarla con NetInsight, sustituya el espacio de tabla de usuario predeterminado por uno que tenga un tamaño de página superior al predeterminado. Además asegúrese de que el usuario de NetInsight tenga privilegios para crear tablas sólo en ese espacio de tabla. Recomendación: utilice o cree un espacio de tabla con un tamaño de página de al menos 8 KB. Aumentar el tamaño de la agrupación de almacenamiento intermedio El tamaño de la agrupación de almacenamiento intermedio determina la cantidad de memoria que DB2 puede utilizar para almacenar en la memoria caché las tablas y las consultas, almacenar las modificaciones de datos no confirmados, etc. El tamaño de la agrupación de almacenamiento intermedio por lo general no permite que DB2 utilice toda la RAM disponible en el sistema. Por lo tanto, se debe verificar y quizá incrementar para garantizar que se establezca en un tamaño correcto. El tamaño de una agrupación de almacenamiento intermedio se especifica en términos de páginas del tamaño determinado. Para determinar el tamaño adecuado de una agrupación de almacenamiento intermedio, determine la cantidad de RAM (en bytes) que desea que DB2 utilice para esa agrupación y, a continuación, divida ese valor entre el tamaño de página de dicha agrupación. Por ejemplo, si desea que DB2 asigne 100 MB de memoria a una agrupación de almacenamiento intermedio de 8 KB, especifique un tamaño de 12800 páginas. Recomendación: aumente el tamaño de agrupación de almacenamiento intermedio de la instancia de base de datos para utilizar el máximo de RAM posible. Deje suficiente RAM disponible para que otras aplicaciones del sistema (por ejemplo, NetInsight) puedan ejecutarse sin paginación. Asigne tanta memoria como sea posible a la agrupación de almacenamiento intermedio asociada con el espacio de tabla donde se almacenen las tablas y los índices de NetInsight. Habilitar el paralelismo intrapartición La ejecución de consultas en paralelo permite que DB2 saque el máximo partido del hardware disponible del sistema y puede mejorar el rendimiento de NetInsight hasta un 400 por ciento. De manera predeterminada, DB2 no está configurado para ejecutar consultas en paralelo (debido a la posibilidad que la instancia de base de datos esté particionada, en cuyo caso el paralelismo se alcanza de forma automática). En el caso de instancia no particionada, para permitir que DB2 ejecute consultas paralelas, debe habilitar el paralelismo intrapartición. El comportamiento de la ejecución en paralelo se controla mediante los parámetros INTRA_PARALLEL, MAX_QUERYDEGREE y DFT_DEGREE especificados en la configuración de gestor de bases de datos DB2. INTRA_PARALLEL El parámetro INTRA_PARALLEL habilita o inhabilita el paralelismo intrapartición. Para habilitar el paralelismo intrapartición para una instancia de base de datos, establezca el parámetro INTRA_PARALELL en YES. Capítulo 4. Optimización de la base de datos DB2 13 Recomendación: habilite el paralelismo intrapartición siempre que haya varios procesadores disponibles para utilizarlos con la instancia de NetInsightDB2. Si la instancia de NetInsight es un nodo miembro de una instancia particionada, asegúrese de que haya varios procesadores disponibles para que los utilice cada partición de base de datos antes de habilitar el paralelismo intrapartición. MAX_QUERYDEGREE El parámetro MAX_QUERYDEGREE controla el grado máximo de paralelismo que se puede utilizar para cualquier consola en una base de datos de una instancia determinada. Su valor predeterminado, ANY, indica a DB2 que determine automáticamente el grado máximo de paralelismo que se debe utilizar para todas las consultas. Con este valor predeterminado, el grado máximo de paralelismo seleccionado por DB2 no superará el número de procesadores en el sistema DB2; para algunos servidores de base de datos, si se especifica un grado máximo de paralelismo superior al número de procesadores disponibles, es posible que se tenga que dejar que DB2 saque todo el partido de los recursos del sistema. Nota: Nota: el valor de MAX_QUERYDEGREE no tiene ningún efecto, si INTRA_PARALLEL tiene el valor NO. Recomendación: establezca el parámetro MAX_QUERYDEGREE en un múltiple del número de procesadores disponibles en el sistema DB2. En el caso de servidores de NetInsight dedicados con mucha memoria y subsistemas de discos de alta velocidad, es posible que se necesite un valor de hasta cuatro veces el número de procesadores disponibles para sacar todo el partido del hardware disponible. DFT_DEGREE El parámetro DFT_DEGREE controla el grado predeterminado de paralelismo que se debe utilizar para todas las consultas ejecutadas en la base de datos determinada. Su valor predeterminado, ANY, indica a DB2 que determine automáticamente el grado máximo de paralelismo que se debe utilizar para todas las consultas. Con este valor predeterminado, el grado máximo de paralelismo seleccionado por DB2 no superará el número de procesadores en el sistema DB2; para algunos servidores de base de datos, si se especifica un grado máximo de paralelismo superior al número de procesadores disponibles, es posible que se tenga que dejar que DB2 saque todo el partido de los recursos del sistema. Nota: Nota: el valor de este parámetro no tiene efecto si el valor de INTRA_PARALLEL es NO. Recomendación: establezca DFT_DEGREE en un múltiple del número de procesadores disponibles en el sistema DB2. En el caso de servidores de NetInsight dedicados con mucha memoria y subsistemas de discos de alta velocidad, es posible que se necesite un valor de hasta cuatro veces el número de procesadores disponibles para sacar todo el partido del hardware disponible. Configurar las áreas de trabajo en memoria Debido a la naturaleza agregada de los informes de NetInsight, la base de datos lleva a cabo numerosas ordenaciones y uniones durante el proceso de generación de informes de NetInsight. Un dimensionamiento adecuado de las áreas de trabajo que utiliza la base de datos para llevar a cabo dichas ordenaciones y uniones tiene un impacto significativo en el rendimiento de NetInsight. 14 IBM Unica NetInsight: Guía de ajuste El dimensionamiento de las áreas de trabajo se controla mediante los parámetros SHEAPTHRES y SORTHEAP especificados en la configuración de gestor de bases de datos DB2. SHEAPTHRES El parámetro SHEAPTHRES especifica la memoria máxima que DB2 puede utilizar en una instancia para las operaciones de ordenación realizadas en serie (ordenaciones privadas). También especifica la memoria utilizada al llevar a cabo ordenaciones en paralelo (ordenaciones compartidas). Un valor de 200 MB para SHEAPTHRES o más general reduce el tiempo de generación de informes de NetInsight como mínimo un 400 por ciento. En el caso de bases de datos más grandes configuradas para utilizar el paralelismo intrapartición, puede que se necesario un valor de 500 MB o superior para SHEAPTHRES. Recomendación: establezca el valor de SHEAPTHRES en 200 MB, como mínimo. (Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este número en el caso de conjuntos de datos más grandes. Si la base de datos está configurada para paralelismo intrapartición, asegúrese de que el sistema tenga suficiente RAM para proporcionar esta cantidad de memoria, junto con la memoria necesaria para agrupaciones de almacenamiento intermedio y ordenaciones privadas sin que el sistema realice ninguna paginación. SORTHEAP El parámetro SORTHEAP especifica la memoria que DB2 utiliza para las operaciones de ordenación efectuadas en serie. También especifica la memoria utilizada por cada subagente paralelo al llevar a cabo ordenaciones en paralelo. En el caso de bases de datos no configuradas para paralelismo intrapartición, un valor de 100 MB o más general para SORTHEAP reduce el tiempo de generación de informes de NetInsight como mínimo un 400 por ciento. En el caso de bases de datos que utilicen el paralelismo intrapartición, es necesario un valor de SORTHEAP más bajo para dar cabida a los subagentes paralelos que se utilizan para efectuar consultas en paralelo. Cada subagente paralelo utiliza la cantidad de memoria especificada para SORTHEAP. Para determinar el valor de SORTHEAP máximo aceptable cuando el paralelismo intrapartición está habilitado, divida el valor de SHEAPTHRES entre el grado máximo de paralelismo para la instancia. Recomendación: si el paralelismo intrapartición está inhabilitado, establezca el valor de SORTHEAP en 100 MB, como mínimo. (Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este valor en el caso de conjuntos de datos más grandes. Si el paralelismo intrapartición está habilitado, establezca el valor de SORTHEAP en el valor de SHEAPTHRES dividido por el grado máximo de paralelismo de la instancia. En todos los casos, asegúrese de que el sistema tenga suficiente RAM para proporcionar la cantidad especificada de memoria, además de la necesaria para agrupaciones de almacenamiento intermedio sin que el sistema realice ninguna paginación. Aumentar el número de servidores de E/S de DB2 Cuando DB2 recupera datos del disco, añade una solicitud de E/S de disco a la cola de E/S de disco. La solicitud de E/S se elimina, a continuación, de la cola y la procesan los servidores de E/S de DB2. El número de servidores de E/S que DB2 utiliza se controla mediante el valor NUM_IOSERVERS. En el caso de algunos Capítulo 4. Optimización de la base de datos DB2 15 sistemas, el número predeterminado de servidores de E/S no puede sacar todo el partido del ancho de banda de E/S que proporciona el subsistema de disco subyacente; para obtener el rendimiento óptimo, puede que sea necesario aumentar el número de servidores de E/S. Recomendación: establezca un valor para NUM_IOSERVERS que sea igual al número de discos físicos en los que se almacenan los datos. Configurar espacios de tabla Una base de datos Oracle exige, como mínimo, cuatro espacios de tabla para funcionar correctamente. Estos espacios de tabla son: 1. El espacio de tabla SYSTEM 2. Un espacio de tabla UNDO 3. Un espacio de tabla TEMP utilizado para operaciones como operaciones (no necesariamente del tipo TEMPORARY) 4. Un espacio de tablas DATA para contener los datos importados y generados por NetInsight Nota: Los nombres de espacio de tabla que se utilizan en esta información identifican sus finalidades respectivas. Puede que no coincidan o que no tengan que coincidir con los nombres que se utilizan realmente en la base de datos. Los espacios de tabla SYSTEM, UNDO y TEMP se crean automáticamente con al base de datos. Lo más probable es que el espacio de tabla DATA se tenga que crear manualmente. La configuración de estos espacios de tabla tiene un impacto significativo en el rendimiento. Para obtener el rendimiento óptimo, deben configurarse de la manera siguiente: Gestión de espacio de extensiones y segmentos Los espacios de tabla gestionados localmente proporcionan una gestión del espacio y un rendimiento mejor que los espacios de tabla gestionados por diccionario y se deben utilizar siempre que sea posible. Los espacios de tabla cuyo espacio de segmentos se gestione automáticamente mediante Oracle proporcionan un mejor rendimiento que los que se gestionan manualmente con listas libres. La práctica recomendada es utilizar la gestión de espacio de segmentos automática siempre que sea posible. Configuración del espacio de tabla SYSTEM Los archivos de datos contenidos en el espacio de tabla SYSTEM se crean durante la instalación y suelen residir en el disco que contiene el sistema de base de datos Oracle. No es necesario reubicar estos archivos de datos. Configuración del espacio de tabla UNDO Ubicación Los archivos de datos contenidos en el espacio de tabla UNDO se crean por lo general durante la instalación, pero se pueden modificar después de la instalación. Los archivos de datos que contienen este espacio de tabla deben ubicarse en un disco físico independiente de los archivos de datos en los espacios de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco físico que el espacio de tabla TEMP. Si es necesario, elimine los archivos de datos 16 IBM Unica NetInsight: Guía de ajuste contenidos en este espacio de tabla que están en discos no reservados para los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la ubicación adecuada. Tamaño Los archivos de datos que contienen el espacio de tabla UNDO deben ser lo suficientemente grandes para dar cabida a los datos insertados por NetInsight durante cada parte del proceso de importación de datos, así como las modificaciones efectuadas durante el proceso de generación de informes. De media, 2 GB de espacio para deshacer son suficientes; no obstante, es posible que los usuarios con archivos de registro necesiten cantidades más grandes de espacio para deshacer. Al permitir un número moderado de extensiones en cada archivo de datos contenido en el espacio de tabla UNDO, este espacio de tabla podrá aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Recomendación: coloque los archivos de datos contenidos en el espacio de datos UNDO en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla UNDO proporcionen, como mínimo, 2 GB de espacio para deshacer. Habilite la opción de extensión automática para los archivos de datos en el espacio de tabla UNDO. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla UNDO en una unidad lógica compuesta por dos o más discos en bandas. Configuración del espacio de tabla TEMP Ubicación Los archivos de datos contenidos en el espacio de tabla TEMP se crean por lo general durante la instalación, pero se pueden modificar también después de la instalación. Los archivos de datos que contienen este espacio de tabla deben ubicarse en un disco físico independiente de los archivos de datos en los espacios de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco físico que el espacio de tabla UNDO. Si es necesario, elimine los archivos de datos contenidos en este espacio de tabla que están en discos no reservados para los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la ubicación adecuada. Tamaño Los archivos de datos que contienen el espacio de datos TEMP deben ser lo suficientemente grandes para dar cabida a ordenaciones grandes realizadas por la base de datos durante la creación de índices o la generación de informes. De media, 2 GB de espacio temporal para deshacer son suficientes; no obstante, es posible que los usuarios con bases de datos más grandes necesiten cantidades más grandes de espacio temporal. Al permitir un número moderado de extensiones en cada archivo de datos contenido en el espacio de tabla TEMP, este espacio de tabla podrá aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Capítulo 4. Optimización de la base de datos DB2 17 Recomendación: coloque los archivos de datos contenidos en el espacio de datos TEMP en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas. Configuración del espacio de tabla DATA Ubicación Los datos de NetInsight se almacenan en el espacio de tabla DATA. Este espacio de tabla tendrá que crearse manualmente, por lo general, después de que se instale la base de datos y de que se cree la instancia de base de datos. Los archivos de datos que contienen este espacio de tabla deben crearse en un disco físico independiente de los archivos de dato de los espacios de tabla SYSTEM, TEMP y UNDO. Si es necesario, reubique los archivos de datos contenidos en este espacio de tabla que estén en discos no reservados para los espacios de tabla DATA en la ubicación adecuada. Tamaño Los archivos de datos que contengan el espacio de tabla de datos deben ser lo suficientemente grandes para dar cabida a los datos insertados en la base de datos y generados por ésta durante el proceso de actualización de NetInsight. Al permitir un número ilimitado de extensiones en cada archivo de datos contenido en el espacio de tabla DATA, este espacio de tabla puede aumentar según sea necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Recomendación: coloque los archivos de datos contenidos en el espacio de tabla DATA en un disco que contenga sólo esos archivos de datos. Asegúrese de que, como grupo, los archivos de datos del espacio de tabla DATA proporcionen el espacio suficiente para almacenar los datos que se espera procesar. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla DATA en una unidad lógica compuesta por dos o más discos en bandas. 18 IBM Unica NetInsight: Guía de ajuste Capítulo 5. Optimización de la base de datos Oracle En este apartado se describen los pasos para instalar y configurar la base de datos para un rendimiento óptimo de NetInsight. Los pasos se indican en el orden general en el que se pueden implementar. Las instalaciones de base de datos existentes se pueden volver a configurar para mejorar el rendimiento; tenga en cuenta, sin embargo, que las instalaciones mal configuradas pueden contener cuellos de botella que la reconfiguración no puede superar. Resumen de las recomendaciones de configuración En este apartado se resume la configuración de base de datos recomendada para un rendimiento óptimo de NetInsight. En los apartados siguientes se describen otras consideraciones de configuración y de fondo. Valor Recomendación Ubicación de instalación del sistema de archivo de base de datos Instale los archivos del sistema de base de datos en la misma unidad física que el sistema operativo, siempre que haya suficiente RAM disponible para impedir cualquier paginación del sistema. Juego de caracteres de la base de datos Utilice WE8ISO8859P1 o UTF-8 como juego de caracteres tanto de la base de datos como del cliente. Antes de utilizar UTF-8, consulte la guía de instalación de NetInsight para obtener información importante. DB_BLOCK-SIZE Utilice o cree una base de datos con un valor de DB_BLOCK_SIZE de, como mínimo, 8192 o, preferiblemente, 16386. Registros para rehacer Cree, como mínimo, cuatro grupos de registros para rehacer de al menos 100 MB cada uno. Tamaño de la memoria caché de almacenamiento intermedio Aumente el tamaño de la memoria caché de almacenamiento intermedio de la instancia de base de datos para utilizar el máximo de RAM posible. Deje suficiente RAM disponible para que otras aplicaciones del sistema (por ejemplo, NetInsight) puedan ejecutarse sin paginación. © Copyright IBM Corp. 1996, 2011 19 20 Valor Recomendación Áreas de trabajo en memoria Utilice el dimensionamiento de área de trabajo automático. En el caso de conjuntos de datos que exijan menos de 5 GB de almacenamiento de base de datos, con 100 MB de memoria disponible hay suficiente. En el caso de conjuntos de datos que superen los 5 GB, el valor mínimo necesario para un rendimiento aceptable es de 300 MB o más. La cantidad de memoria disponible para las áreas de trabajo se puede aumentar con total seguridad, siempre que haya memoria del sistema disponible. Si la máquina tiene suficiente memoria, considere la posibilidad de dedicar al menos 1 GB, o preferiblemente 2 GB, a PGA_AGGREGATE_TARGET. Espacio de tabla UNDO Coloque los archivos de datos contenidos en el espacio de datos UNDO en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla UNDO proporcionen, como mínimo, 2 GB de espacio para deshacer. Habilite la opción de extensión automática para los archivos de datos en el espacio de tabla UNDO. Coloque los archivos de datos en el espacio de tabla UNDO en una unidad lógica compuesta por dos o más discos en bandas. Espacio de tabla TEMP Coloque los archivos de datos contenidos en el espacio de datos TEMP en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Coloque los archivos de datos en el espacio de tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas. IBM Unica NetInsight: Guía de ajuste Valor Recomendación Espacio de tabla DATA Coloque los archivos de datos contenidos en el espacio de tabla DATA en un disco que contenga sólo esos archivos de datos. Asegúrese de que, como grupo, los archivos de datos del espacio de tabla DATA proporcionen el espacio suficiente para almacenar los datos que se espera procesar. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Para obtener el mejor rendimiento, coloque los archivos de datos en el espacio de tabla DATA en una unidad lógica compuesta por dos o más discos en bandas. Particionamiento de tabla y de índice La utilización de tablas e índices particionados puede mejorar significativamente la velocidad, la escalabilidad y la capacidad de mantenimiento. Para obtener más información, póngase en contacto con el departamento de ventas de IBM. Recomendaciones detalladas de configuración Instalar los archivos del sistema de base de datos en una ubicación adecuada Siempre que sea posible, instale los archivos del sistema de base de datos (ejecutables, herramientas, etc.) en un disco independiente del sistema operativo y los archivos de datos. Si es necesario, los archivos del sistema de base de datos se pueden instalar con total seguridad en el mismo disco el sistema operativo siempre que: 1. El área de intercambio del sistema esté en el mismo disco físico que el sistema operativo y el sistema tenga suficiente memoria para garantizar que no tenga lugar ninguna paginación o que ésta se produzca en contadas ocasiones; o bien 2. El área de intercambio del sistema esté en un disco físico independiente Recomendación: instale los archivos del sistema de base de datos en la misma unidad física que el sistema operativo, siempre que haya suficiente RAM disponible para impedir cualquier paginación del sistema. Seleccionar el juego de caracteres de base de datos adecuado Los juegos de caracteres de base de datos y cliente que se utilizan al crear la base de datos Oracle pueden tener un impacto considerable en NetInsight. v Puede utilizar los juegos de caracteres WE8ISO8859P1 y UTF-8 con total seguridad para la base de datos y el cliente. Antes de utilizar UTF-8, consulte la guía de instalación de NetInsight para obtener información importante. v No se debe utilizar jamás el juego de caracteres US7ASCII. v Si está considerando la posibilidad de utilizar un juego de caracteres que no sea WE8ISO8859P1 o UTF-8, póngase en contacto con el servicio de soporte técnico de IBM. Capítulo 5. Optimización de la base de datos Oracle 21 Seleccionar el valor de DB_BLOCK_SIZE adecuado El valor de DB_BLOCK_SIZE implica varios aspectos importantes: desde el uso de memoria hasta el rendimiento de E/S. Este valor se establece cuando se crea la base de datos y no se puede modificar más adelante. El valor predeterminado es específico del sistema operativo, pero, por lo general, es muy pequeño (2048 o 4096, por ejemplo). Un valor de DB_BLOCK_SIZE más grande permite que Oracle lea y escriba más filas de datos en una sola operación de E/S. Ello puede mejorar el rendimiento de NetInsight, que a menudo exige que Oracle lea y escriba grandes cantidades de filas de sus tablas de datos. También permite que Oracle cree archivos de datos más grandes, lo que significa que se pueden almacenar más datos en una sola base de datos (el tamaño máximo de un archivo de datos es específico del sistema operativo). Si desea procesar y almacenar una cantidad de datos muy elevada, puede que necesite un valor de DB_BLOCK_SIZE grande. Al crear una base de datos nueva para utilizarla con NetInsight, para proporciona un rendimiento y una escalabilidad de base de datos adecuados, especifique un valor de DB_BLOCK_SIZE de, como mínimo, 8192, aunque es muy recomendable utilizar 16384. Si se intenta utilizar NetInsight con una base de datos existente que tenga un tamaño de bloque pequeño, es posible que el rendimiento disminuya. En esa situación, cree una base de datos nueva con un valor de DB_BLOCK_SIZE más grande o cree un espacio de tabla nuevo con un tamaño de bloque más grande. Nota: Oracle permite crear espacios de tabla y memorias caché de almacenamiento intermedio con tamaños de bloque distintos del tamaño de bloque predeterminado de la instancia. Aunque un espacio de tabla y una memoria caché de almacenamiento intermedio con un tamaño de bloque grande permitirán que NetInsight funcione con mayor eficacia en bases de datos con un tamaño de bloque predeterminado pequeño, ello supone, por lo general, que NetInSight disponga de menos memoria. Por lo tanto, no se recomienda. Recomendación: utilice o cree una base de datos con el valor para DB_BLOCK_SIZE de al menos 8192 o, preferiblemente, 16384. Configurar los registros de rehacer Para obtener el rendimiento óptimo del proceso de importación de datos de NetInsight, configure los registros de rehacer de Oracle para proporcionar la productividad máxima con un número mínimo de conmutadores entre archivos de registro (los conmutadores aparecen cuando se llena un archivo de registro). Normalmente esto se consigue manteniendo un mínimo de cuatro grupos de registros de rehacer, cada uno con archivos de registro de 100 MB como mínimo. Para obtener conjuntos de datos más grandes, puede que se necesiten registros de rehacer de 1 GB o más. Para reducir los tiempos de acceso al disco, mantenga los registros de rehacer en un disco que proporcione acceso rápido y fiable (para conjuntos de datos más pequeños, normalmente basta con el disco que contiene el sistema Oracle). Recomendación: cree, como mínimo, cuatro grupos de registros de rehacer de al menos 100 MB cada uno. Aumentar el tamaño de memoria caché de almacenamiento intermedio El tamaño de la memoria caché de almacenamiento intermedio de Oracle determina la cantidad de memoria que Oracle puede utilizar para almacenar en memoria caché tablas y consultas, almacenar modificaciones de datos no 22 IBM Unica NetInsight: Guía de ajuste modificados, etc. El tamaño de memoria caché de almacenamiento intermedio no permite, por lo general, que Oracle utilice toda la RAM disponible en el sistema. Por lo tanto, se debe verificar y quizá incrementar para garantizar que se establezca en un tamaño correcto. El tamaño de la memoria caché de almacenamiento intermedio para bloques estándar se determina mediante el valor DB_CACHE_SIZE para cada instancia de base de datos. El valor DB_CACHE_SIZE se mide en kilobytes, megabytes o gigabytes; por ejemplo DB_CACHE_SIZE=10M especifica una memoria caché de almacenamiento intermedio de 10 megabytes. Establezca este valor en la cantidad de RAM que desee que Oracle utilice para la memoria caché de almacenamiento intermedio estándar. Recomendación: aumente el tamaño de la memoria caché de almacenamiento intermedio de la instancia de base de datos para utilizar el máximo de RAM posible. Deje suficiente RAM disponible para que otras aplicaciones del sistema (por ejemplo, NetInsight) puedan ejecutarse sin paginación. Configurar las áreas de trabajo en memoria Debido a la naturaleza agregada de los informes de NetInsight, la base de datos lleva a cabo numerosas ordenaciones y uniones durante el proceso de generación de informes de NetInsight. Un dimensionamiento adecuado de las áreas de trabajo que utiliza la base de datos para llevar a cabo dichas ordenaciones y uniones tiene un impacto significativo en el rendimiento de NetInsight. El dimensionamiento de las áreas de trabajo se controla mediante los parámetros SHEAPTHRES y SORTHEAP especificados en la configuración de gestor de bases de datos DB2. SHEAPTHRES El parámetro SHEAPTHRES especifica la memoria máxima que DB2 puede utilizar en una instancia para las operaciones de ordenación realizadas en serie (ordenaciones privadas). También especifica la memoria utilizada al llevar a cabo ordenaciones en paralelo (ordenaciones compartidas). Un valor de 200 MB para SHEAPTHRES o más general reduce el tiempo de generación de informes de NetInsight como mínimo un 400 por ciento. En el caso de bases de datos más grandes configuradas para utilizar el paralelismo intrapartición, puede que se necesario un valor de 500 MB o superior para SHEAPTHRES. Recomendación: establezca el valor de SHEAPTHRES en 200 MB, como mínimo. (Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este número en el caso de conjuntos de datos más grandes. Si la base de datos está configurada para paralelismo intrapartición, asegúrese de que el sistema tenga suficiente RAM para proporcionar esta cantidad de memoria, junto con la memoria necesaria para agrupaciones de almacenamiento intermedio y ordenaciones privadas sin que el sistema realice ninguna paginación. SORTHEAP El parámetro SORTHEAP especifica la memoria que DB2 utiliza para las operaciones de ordenación efectuadas en serie. También especifica la memoria utilizada por cada subagente paralelo al llevar a cabo ordenaciones en paralelo. En el caso de bases de datos no configuradas para paralelismo intrapartición, un valor Capítulo 5. Optimización de la base de datos Oracle 23 de 100 MB o más general para SORTHEAP reduce el tiempo de generación de informes de NetInsight como mínimo un 400 por ciento. En el caso de bases de datos que utilicen el paralelismo intrapartición, es necesario un valor de SORTHEAP más bajo para dar cabida a los subagentes paralelos que se utilizan para efectuar consultas en paralelo. Cada subagente paralelo utiliza la cantidad de memoria especificada para SORTHEAP. Para determinar el valor de SORTHEAP máximo aceptable cuando el paralelismo intrapartición está habilitado, divida el valor de SHEAPTHRES entre el grado máximo de paralelismo para la instancia. Recomendación: si el paralelismo intrapartición está inhabilitado, establezca el valor de SORTHEAP en 100 MB, como mínimo. (Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este valor en el caso de conjuntos de datos más grandes. Si el paralelismo intrapartición está habilitado, establezca el valor de SORTHEAP en el valor de SHEAPTHRES dividido por el grado máximo de paralelismo de la instancia. En todos los casos, asegúrese de que el sistema tenga suficiente RAM para proporcionar la cantidad especificada de memoria, además de la necesaria para agrupaciones de almacenamiento intermedio sin que el sistema realice ninguna paginación. Configurar espacios de tabla Una base de datos Oracle exige, como mínimo, cuatro espacios de tabla para funcionar correctamente. Estos espacios de tabla son: 1. El espacio de tabla SYSTEM 2. Un espacio de tabla UNDO 3. Un espacio de tabla TEMP utilizado para operaciones como operaciones (no necesariamente del tipo TEMPORARY) 4. Un espacio de tablas DATA para contener los datos importados y generados por NetInsight Nota: Los nombres de espacio de tabla que se utilizan en esta información identifican sus finalidades respectivas. Puede que no coincidan o que no tengan que coincidir con los nombres que se utilizan realmente en la base de datos. Los espacios de tabla SYSTEM, UNDO y TEMP se crean automáticamente con al base de datos. Lo más probable es que el espacio de tabla DATA se tenga que crear manualmente. La configuración de estos espacios de tabla tiene un impacto significativo en el rendimiento. Para obtener el rendimiento óptimo, deben configurarse de la manera siguiente: Gestión de espacio de extensiones y segmentos Los espacios de tabla gestionados localmente proporcionan una gestión del espacio y un rendimiento mejor que los espacios de tabla gestionados por diccionario y se deben utilizar siempre que sea posible. Los espacios de tabla cuyo espacio de segmentos se gestione automáticamente mediante Oracle proporcionan un mejor rendimiento que los que se gestionan manualmente con listas libres. La práctica recomendada es utilizar la gestión de espacio de segmentos automática siempre que sea posible. 24 IBM Unica NetInsight: Guía de ajuste Configuración del espacio de tabla SYSTEM Los archivos de datos contenidos en el espacio de tabla SYSTEM se crean durante la instalación y suelen residir en el disco que contiene el sistema de base de datos Oracle. No es necesario reubicar estos archivos de datos. Configuración del espacio de tabla UNDO Ubicación Los archivos de datos contenidos en el espacio de tabla UNDO se crean por lo general durante la instalación, pero se pueden modificar después de la instalación. Los archivos de datos que contienen este espacio de tabla deben ubicarse en un disco físico independiente de los archivos de datos en los espacios de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco físico que el espacio de tabla TEMP. Si es necesario, elimine los archivos de datos contenidos en este espacio de tabla que están en discos no reservados para los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la ubicación adecuada. Tamaño Los archivos de datos que contienen el espacio de tabla UNDO deben ser lo suficientemente grandes para dar cabida a los datos insertados por NetInsight durante cada parte del proceso de importación de datos, así como las modificaciones efectuadas durante el proceso de generación de informes. De media, 2 GB de espacio para deshacer son suficientes; no obstante, es posible que los usuarios con archivos de registro necesiten cantidades más grandes de espacio para deshacer. Al permitir un número moderado de extensiones en cada archivo de datos contenido en el espacio de tabla UNDO, este espacio de tabla podrá aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Recomendación: coloque los archivos de datos contenidos en el espacio de datos UNDO en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla UNDO proporcionen, como mínimo, 2 GB de espacio para deshacer. Habilite la opción de extensión automática para los archivos de datos en el espacio de tabla UNDO. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla UNDO en una unidad lógica compuesta por dos o más discos en bandas. Configuración del espacio de tabla TEMP Ubicación Los archivos de datos contenidos en el espacio de tabla TEMP se crean por lo general durante la instalación, pero se pueden modificar también después de la instalación. Los archivos de datos que contienen este espacio de tabla deben ubicarse en un disco físico independiente de los archivos de datos en los espacios de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco físico que el espacio de tabla UNDO. Si es necesario, elimine los archivos de Capítulo 5. Optimización de la base de datos Oracle 25 datos contenidos en este espacio de tabla que están en discos no reservados para los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la ubicación adecuada. Tamaño Los archivos de datos que contienen el espacio de datos TEMP deben ser lo suficientemente grandes para dar cabida a ordenaciones grandes realizadas por la base de datos durante la creación de índices o la generación de informes. De media, 2 GB de espacio temporal para deshacer son suficientes; no obstante, es posible que los usuarios con bases de datos más grandes necesiten cantidades más grandes de espacio temporal. Al permitir un número moderado de extensiones en cada archivo de datos contenido en el espacio de tabla TEMP, este espacio de tabla podrá aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Recomendación: coloque los archivos de datos contenidos en el espacio de datos TEMP en un disco que contenga sólo los archivos de datos o en un disco que contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP. Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas. Configuración del espacio de tabla DATA Ubicación Los datos de NetInsight se almacenan en el espacio de tabla DATA. Este espacio de tabla tendrá que crearse manualmente, por lo general, después de que se instale la base de datos y de que se cree la instancia de base de datos. Los archivos de datos que contienen este espacio de tabla deben crearse en un disco físico independiente de los archivos de dato de los espacios de tabla SYSTEM, TEMP y UNDO. Si es necesario, reubique los archivos de datos contenidos en este espacio de tabla que estén en discos no reservados para los espacios de tabla DATA en la ubicación adecuada. Tamaño Los archivos de datos que contengan el espacio de tabla de datos deben ser lo suficientemente grandes para dar cabida a los datos insertados en la base de datos y generados por ésta durante el proceso de actualización de NetInsight. Al permitir un número ilimitado de extensiones en cada archivo de datos contenido en el espacio de tabla DATA, este espacio de tabla puede aumentar según sea necesario. Esto impide errores durante la ejecución de NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos si se alcanza su tamaño máximo. Recomendación: coloque los archivos de datos contenidos en el espacio de tabla DATA en un disco que contenga sólo esos archivos de datos. Asegúrese de que, como grupo, los archivos de datos del espacio de tabla DATA proporcionen el 26 IBM Unica NetInsight: Guía de ajuste espacio suficiente para almacenar los datos que se espera procesar. Habilite la opción de extensión automática tanto para el espacio de tabla DATA como para sus archivos de datos. Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de tabla DATA en una unidad lógica compuesta por dos o más discos en bandas. Configurar particionamiento de tablas e índices NetInsight permite utilizar tablas e índices particionados en una base de datos Oracle. La utilización de tablas e índices particionados puede mejorar significativamente la velocidad, la escalabilidad y la capacidad de mantenimiento. El equipo de servicios profesionales de IBM puede configurar el particionamiento de la base de datos. Para obtener más información, póngase en contacto con el departamento de ventas de IBM. Capítulo 5. Optimización de la base de datos Oracle 27 28 IBM Unica NetInsight: Guía de ajuste Capítulo 6. Valores de configuración del rendimiento En este apartado se describen los elementos del archivo NetTracker.cfg que se utilizan para ajustar el rendimiento de NetInsight. El archivo NetTracker.cfg se encuentra en el directorio del programa NetInsight. Elemento <database> El elemento database contiene valores que afectan al modo como se importan los datos de registro en NetInsight. Los elementos hijo que tienen más impacto en el proceso de importación son <checkpointmegs> y <maxcache>. También puede añadir opcionalmente varias secciones si el concepto tiene que desglosarse. <checkpointmegs> El elemento <checkpointmegs> controla la cantidad de datos en bruto no comprimidos que se procesan en cada punto de comprobación de importación. En cada punto de comprobación, todos los datos estructurados en sesiones hasta ese punto concreto se almacenan en la base de datos. Ello incluye la conciliación de ID, donde los valores de cadena de varias columnas se concilian con sus tablas de ID respectivas para determinar si existen o si se debe crear un ID nuevo. Cada punto de comprobación genera sobrecarga, que se puede gestionar mediante <checkpointmegs>. Por ejemplo, de manera predeterminada <checkpointmegs> se establece en 125 MB. Si estuviera procesando 1250 MB del total de datos de registro en bruto sin comprimir, se necesitarían 10 puntos de comprobación, los cuales todos generan sobrecarga de memoria, para completar la fase de importación. Si se detectara un problema durante la importación, NetInsight podría reanudar el proceso de importación en cualquiera de los 10 puntos de comprobación. A la inversa, si cambiara <checkpointmegs> a 500 MB, sólo necesitaría tres puntos de comprobación frente a los diez y un 70% menos de sobrecarga de memoria. Sin embargo, habría menos puntos de comprobación a partir de los cuales se podría reanudar si se detectara un problema. El proceso de la aplicación retiene en memoria los datos que se procesan antes de almacenarse en un punto de comprobación. Si va a utilizar la aplicación NetInsight de 32 bits, esto limitará el tamaño hasta el que puede aumentar el valor de <checkpointmegs>. En una aplicación de 64 bits, sólo tiene la restricción de la cantidad de memoria del sistema. No existe ninguna correlación entre la cantidad de datos en bruto almacenados en la base de datos y la cantidad almacenada en memoria para cada punto de comprobación. Esto se debe a que la cantidad de datos almacenados depende de las visitas abiertas entre puntos de comprobación, la cardinalidad de visitantes y los ID y las cadenas correspondientes que se van a almacenar. El valor óptimo en el que establecer <checkpointmegs> depende de los datos del archivo de registro. Como sugerencia, establezca <checkpointmegs> en 1000 MB para las aplicaciones NetInsight de 32 bits y 6000 MB para las aplicaciones de 64 bits. Si no está seguro del valor óptimo para el entorno, consulte a los servicios profesionales de IBM. © Copyright IBM Corp. 1996, 2011 29 <maxcache> Utilice los atributos del elemento <maxcache> para optimizar el rendimiento de los procesos de importación. Esos atributos dependen de los datos de los archivos de registro; afectan a análisis de los datos y a la eficacia de los algoritmos según los datos que se vayan a procesar. Configure estos atributos para dar cabida al perfil más grande. Para determinar cómo establecer estos atributos, examine el archivo cache.log de cada uno de los perfiles que se haya ejecutado. Esos archivos se encuentran en cada uno de los directorios <directorio_programa_NetInsight>/data/ <nombre_perfil>. Como práctica recomendada, examine en el archivo cache.log si se han ejecutado los datos representativos de una carga por encima de la media. El elemento <maxcache> incluye los atributos siguientes: visits: este atributo controla la cantidad de memoria asignada para gestionar las memorias caché de visitas abiertas. Este valor se utiliza en todos los perfiles. Si las visitas abiertas superan el número que se indica en este atributo, el desbordamiento se escribirá en el disco. Para optimizar el rendimiento, este número siempre tiene que ser superior al número total de visitas abiertas de una ejecución de importación. No obstante, si este valor es demasiado elemento, es posible que la asignación de memoria y la conciliación no sean eficaces. Compruebe el archivo cache.log para ver el número total de visitas abiertas en una ejecución de importación. Por ejemplo: Visits: Number of Reads : 2657915 Number of Hits : 2657915 (100%) Number of Writes: 2631909 Max Open : 9972 Current Open : 4550 Lo ideal es que el valor del atributo visits sea superior al número Max Open de cualquier perfil concreto. views: no se utiliza actualmente, pero se debe mantener en el valor 0. errors: no se utiliza actualmente, pero se debe mantener en el valor 0. ids: este atributo controla la cantidad de memoria interna asignada para cada una de las memorias caché de ID que se utilizan durante el análisis de los archivos de registro. A medida que se analizan los archivos de registro, los ID y sus cadenas se almacenan en grupos de memoria internos. Si hay demasiados elementos y no hay suficientes grupos, el análisis y la conciliación se ralentizarán porque será más difícil encontrar elementos en los grupos. Examine el archivo cache.log para determinar si el valor del atributo ids debe aumentarse. El ejemplo siguiente muestra la información incluida para cada una de las estructuras de ID: PageBrkdwnID: Number of Reads : 610802 Number of Hits : 419371 (69%) Number of Writes: 63170 Max Buckets : 15013 Buckets Used : 9552 Max Items/Bucket: 6 Avg Items/Bucket: 1.58 Max Cached : 33774 30 IBM Unica NetInsight: Guía de ajuste Number Values Number Number of Saves : 4 Stored : 61068 (15267 per save) of ID Selects: 0 of ID Selects Found: 0 Avg Items/Bucket indica el promedio de elementos que se van a almacenar. Lo ideal es que este número sea inferior a 1,50. Si tiene estructuras de ID donde Avg Items/Bucket es más de 2,00 o 3,00, considere la posibilidad de aumentar el valor del atributo ids. Nota importante: este valor asigna grupos para cada estructura de ID, por lo que al aumentar este número se incrementará el uso de la memoria para todas las estructuras de ID. maxmb: este atributo representa la cantidad máxima de memoria (en MB) que se puede almacenar antes de establecer puntos de comprobación en los datos. Como práctica recomendada, no permita que el sistema llegue a este umbral. Aumente este número para asegurarse de que no fuerce un punto de comprobación de esta manera. Como regla general, establezca este valor en el valor del elemento <checkpointmegs>. Elemento <ntdbbases> El elemento <ntdbbases> contiene los valores para los archivos SQLite que se utilizan durante el proceso de importación. Recomendamos que tanto rowcache.dat como ovcache.dat se modifiquen y se coloquen en memoria para todas las instalaciones de 64 bits. A continuación se indica un ejemplo de lo que se debe añadir al archivo NetTracker.cfg: <ntdbbases> <ntdbbase key="rowcache.dat" page="8192" cache="8192" synchmode="0" temp_store="2" retrys="150" readuncommitted="true" journalmode="OFF" path=":memory:"/> <ntdbbase key="ovcache.dat" page="8192" cache="8192" synchmode="0" temp_store="2" retrys="150" readuncommitted="true" journalmode="OFF" path=":memory:"/> </ntdbbases> Cada base de datos tiene los atributos siguientes. Para obtener más información detallada en cuanto a estos atributos, visite http://www.sqlite.org/pragma.html. key: nombre del archivo SQLite. page: tamaño de la página de la base de datos. El tamaño de la página debe ser de un potencia de dos más que o igual a 512 y menos que o igual a 32768. cache: es el número máximo de páginas de disco de base de datos de SQLite que SQLite mantendrá en memoria de forma simultánea para el archivo concreto. syncmode: esta atributo indica la modalidad que SQLite utilizará para sincronizarse con el sistema operativo cuando escriba datos. Los tres valores son FULL (2), NORMAL (1) y OFF (0). Recomendamos trabajar en modalidad OFF ya que el rendimiento supera con creces el coste que supone trabajar en las otras dos modalidades. Además, puesto que los archivos SQLite sólo se utilizan durante el proceso de punto de comprobación/importación, podemos recuperar por completo los datos si los archivos se corrompen. Capítulo 6. Valores de configuración del rendimiento 31 temp_store: este atributo determina donde realiza el archivo SQLite sus operaciones temporales. Los valores son DEFAULT (0), FILE (1) y MEMORY (2). De manera predeterminada, temp_store se establece en 0, pero, según la cantidad de memoria que haya asignado al sistema, es posible que desee establecerlo en 2. Si se establece en 0 (el valor predeterminado), la ubicación de las operaciones temporales quedará determinada por el valor SQLITE_TEMP_STORE. Para obtener más información, consulte la documentación de SQLite. retrys: número de reintentos si el archivo SQLite está bloqueado. readuncommitted: el nivel de aislamiento predeterminado para SQLite es SERIALIZABLE. Cualquier proceso o hebra puede realizar un aislamiento de READ UNCOMMITTED, pero se seguirá utilizando SERIALIZABLE salvo entre conexiones que compartan una página común y una memoria caché de esquemas. Recomendamos establecer este atributo en true. journalmode: el atributo journalmode establece la modalidad de ajuste del archivo SQLite. Puesto que estos archivos tienen una vida útil breve y puesto que la aplicación ya tiene la prestación de retrotracción incorporada en el proceso, no es necesaria la retrotracción. Por este motivo, este valor siempre debe establecerse en OFF. path: vía de acceso del archivo SQLite. Este atributo permite mover estos archivos a otros controladores o discos o, incluso, colocarlos en memoria. Para obtener un rendimiento óptimo, es muy recomendable colocar estos archivos en memoria. El valor para el almacenamiento en memoria es “:memory:”. <maxqueuedlines> El elemento <maxqueuedlines> tiene dos atributos que ayudan a controlar las colas de proceso de los archivos de registro. Estos valores corresponden a cada servidor de archivos de registro configurado para un perfil determinado. El incremento o la reducción de dichos valores afectará a las hebras del servidor de archivos. Estos atributos son importantes para gestionar la cantidad total de memoria utilizada para un proceso de importación determinado. Cuantos más servidores de archivos de registro estén configurados para un perfil, más afectarán estos valores a la cantidad total de memoria utilizada. parser: el atributo parser representa el número total de líneas de archivo de registro que cada hebra de analizador (de cada servidor de archivos de registro definido) pondrá en su cola antes de difundirlas a la cola clasificadora. El valor predeterminado es 2000. sorter: el atributo sorter representa el número total de líneas de registro que se colocan en la cola clasificadora y que posteriormente el proceso de importación de NetInsight procesa. El valor predeterminado es 10000. Los valores óptimos para estos atributos dependen de la potencia de proceso de E/S y CPU del servidor de aplicaciones de NetInsight en el sistema. La cola analizadora lee las líneas de registro del archivo de registro y las coloca en memoria. La cola clasificador toma las líneas de registro de la cola analizadora, las ordena y las almacena en memoria. El proceso de importación de NetInsight busca la siguiente línea de registro válida que se deba procesar entre todas las colas clasificadoras de todos los servidores de archivos de registro definidos en el perfil. Una vez que se elimina una línea de registro de la cola clasificadora, la cola 32 IBM Unica NetInsight: Guía de ajuste clasificadora obtiene la línea siguiente de la cola analizadora. Estas os colas hacen referencia directa a un archivo de registro determinado para cada servidor de archivos de registro. Los valores predeterminados de estos atributos son en cierto modo arbitrarios. En función del número de servidores de archivos de registro del entorno, es posible que tenga que cambiar estos valores para gestionar el uso de memoria del proceso de importación. Lo ideal es que la cola analizadora procese tan rápido como la cola clasificadora para que ninguna de ellas deba esperar a que la otra avance. En la práctica, es difícil lograrlo cuando se tienen registros de varios tamaños y varios servidores de archivos de registro. Se recomienda probar estos valores para encontrar la configuración óptima para el entorno. Capítulo 6. Valores de configuración del rendimiento 33 34 IBM Unica NetInsight: Guía de ajuste Capítulo 7. Ajuste avanzado NetInsight El objetivo de este capítulo es ayudarle a resolver problemas de rendimiento en la instalación de NetInsight. Antes de seguir las pautas que se señalan en este capítulo, consulte el capítulo sobre ajuste específico de la base de datos que utilice. Si va a utilizar una base de datos Oracle con una configuración de hardware sólida, quizá deba considerar la posibilidad de utilizar las funciones de particionamiento de Oracle. Póngase en contacto con un representante de ventas de IBM para obtener información sobre el particionamiento en una base de datos Oracle para NetInsight. Elegir los métodos y los objetivos del ajuste Antes de ajustar el sistema, debe evaluar, en primer lugar, el rendimiento actual y establecer los objetivos de mejora del rendimiento. En concreto, para facilitar el ajusta primero debe: 1. Determinar si se están produciendo problemas de rendimiento durante las actualización o cuando los usuarios amplían los detalles de los informes. 2. Determine cuánto se tarda en realizar las actualizaciones y las ampliaciones de los detalles. 3. Decida el tiempo aceptable para su empresa. Por ejemplo, ¿cuánto tiempo puede tardar una actualización para dejar aún el tiempo suficiente para ejecutar copias de seguridad antes de que los usuarios tengan que acceder a los informes de NetInsight? ¿Cuánto tiempo están dispuestos a esperar los usuarios cuando amplíen los detalles de un informe personalizado? Tras responder estas preguntas, podrá centrar mejor sus esfuerzos de ajuste. Se recomienda supervisar las actualizaciones durante varios días y consultar a los usuarios finales de NetInsight antes de realizar cualquier ajuste. Utilizar un entorno de prueba para el ajuste El ajuste va mucho más rápido si se puede recrear un problema a un escala más pequeña en un entorno de prueba. Los entornos de prueba habituales utilizan la configuración de perfiles actual, un conjunto de registros de servidor web más pequeño y un servidor de bases de datos que pueda ser menos potente del que se utiliza en producción. Tenga en cuenta que los cambios en NetInsight pueden adaptarse a tales situaciones, pero que puede que los cambios en los valores del servidor de bases de datos no lo hagan. Problemas de rendimiento ocasionales y continuados Este documento se centra en la mejora de los problemas continuados de rendimiento. Los problemas ocasionales están relacionados generalmente a uno de los factores siguientes: v La adición o modificación de perfiles de visitante o informes personalizados v La modificación de determinadas opciones de NetInsight v Un proceso externo que compita con NetInsight o la base de datos por los recursos (por ejemplo, una copia de seguridad completa mensual de un servidor) © Copyright IBM Corp. 1996, 2011 35 Asegúrese de que los usuarios con acceso para cambiar opciones o añadir informes personalizados comprendan las implicaciones de rendimiento de los cambios que realizan. Restrinja el acceso, según sea necesario, a las opciones y a los informes personalizados a los usuarios en los que confíe para efectuar dichos cambios. Aislar problemas de rendimiento durante las actualizaciones Si tiene problemas de rendimiento relacionados con los tiempos de actualización, el primer paso es determinar qué parte del proceso de NetInsight es lenta. El proceso de actualización de NetInsight se puede dividir en cuatro fases independientes: v v v v Importación de datos nuevos Indexación y mantenimiento de tablas Creación de perfiles de visitante Generación de informes Para determinar cuál de los siguientes es el origen más probable de los problemas de rendimiento, tiene que saber el tiempo que dedica NetInsight a cada uno. Determinar el tiempo de importación de datos 1. Inicie una actualización desde una línea de mandatos. Tome nota de la hora a la que se inicia. 2. Una vez que haya finalizado la actualización, compruebe la fecha de la última modificación del archivo cache.log. 3. Compruebe la indicación de fecha y hora en el archivo cache.log para determinar cuando ha finalizado la importación de datos. Compárela con la hora a la que se ha iniciado la actualización para determinar cuánto ha tardado la importación. 4. Si la importación tarda demasiado, consulte el apartado “Problemas de rendimiento durante la importación” en la página 37. Determinar el tiempo de indexación y mantenimiento de tablas 1. Ejecute un rastreo de base de datos de una actualización siguiendo las instrucciones de la documentación de la base de datos. 2. Examine el archivo de rastreo para determinar cuánto tiempo añaden los mandatos de análisis de tablas a la actualización. 3. 3. Examine si en el archivo de rastreo hay mandatos que se utilicen para crear índices. Identifique los que puedan añadir un tiempo considerable a la actualización. (NetInsight puede descartar y volver a crear ciertos índices durante una actualización para evitar la sobrecarga del mantenimiento de índices durante las inserciones de datos nuevos en una tabla. La restauración de índices en las tablas de NetInsight al concluir la importación puede exigir mucho tiempo con determinados conjuntos de datos). 4. Si determina que la indexación y el mantenimiento de tablas añaden una cantidad de tiempo considerable a la actualización, consulte el apartado “Problemas de rendimiento durante la indexación y el mantenimiento de las tablas” en la página 47. Determinar el tiempo de actualización de perfiles de visitante Las actualizaciones en la tabla de perfiles que forman parte de la creación de perfiles de visitante pueden consumir grandes cantidades de tiempo en función del 36 IBM Unica NetInsight: Guía de ajuste número de perfiles de visitantes configurados y de la cantidad de datos de registro nuevos importados durante una actualización. Para determinar el tiempo de actualización de perfiles de visitante: 1. Ejecute un rastreo de base de datos de una actualización siguiendo las instrucciones de la documentación de la base de datos. 2. Compruebe si en el archivo de rastreo hay inserciones en la tabla de perfiles. 3. Identifique las consultas que tarden cantidades considerables de tiempo en ejecutarse. 4. Al examinar el archivo de rastreo se muestran los problemas con esas consultas, consulte el apartado “Problemas de rendimiento durante la creación de perfiles de visitante” en la página 47. Determinar el tiempo de generación de informes El archivo rpttimes.log se genera durante la generación de informes. Contiene información sobre el tiempo que tardan en generarse cada resumen y los componentes en que se basa. Para determinar el tiempo de generación de informes: 1. Compruebe la hora de la última modificación del archivo rpttimes.log. 2. Compare la hora de la última modificación del archivo rpttimes.log con la hora registrada al principio del archivo. Esto indica aproximadamente cuánto ha tardado el último informe generado. 3. Si la generación de informes tarda demasiado, consulte el apartado “Problemas de rendimiento durante la generación de informes” en la página 49. Problemas de rendimiento durante la importación Los problemas de rendimiento durante la importación se clasifican en general en estas categorías: v “Esperas de red” v “Problemas con la memoria caché y los ID de la memoria” en la página 39 v “Cuellos de botella del subsistema de disco de la base de datos durante las confirmaciones” en la página 44 v “Cuellos de botella de recursos del sistema de NetInsight” en la página 45 Esperas de red Dos opciones de NetInsight que tienen el potencial de incorporar importantes retrasos durante la importación: v “Resolución de nombres de host” v “Resolución de títulos de página” en la página 38 Resolución de nombres de host Cuando la opción de NetInsight Resolver nombres de hosts está habilitada, NetInsight realiza una búsqueda DNS inversa de direcciones IP en los registros para determinar sus nombres de host asociados. Aunque NetInsight almacena en la memoria caché la información de direcciones IP resueltas, la espera puede ser considerable, incluso con un servidor DNS bien configurado. Puede reducir el retraso realizando una de las acciones siguientes: v “Inhabilitar la opción Resolver nombres de hosts” en la página 38 Capítulo 7. Ajuste avanzado NetInsight 37 v “Resolver nombres de host a través del servidor web” Inhabilitar la opción Resolver nombres de hosts: Si no se necesitan nombres de host en los informes, puede inhabilitar la resolución de nombres de host. 1. Abra un perfil cuya importación sea lenta. 2. Pulse la pestaña Opciones. Se abrirá la página General. 3. Desmarque la casilla de verificación Resolver nombres de hosts. Resolver nombres de host a través del servidor web: Si se necesitan nombres de host para los informes, pero su resolución mediante NetInsight notifica un retraso inaceptable, puede resolverlos, en cambio, mediante el servidor web. El servidor web escribirá los nombres de host resueltos directamente en los archivos de registro. Tras haber cambiado los valores del servidor web y haber procesado el último archivo de registro que contenga nombres de host sin resolver, puede desactivar la resolución de nombres de host en el perfil de NetInsight. Nota: Al hacer que el servidor web resuelva los nombres de host, se genera cierta sobrecarga en el servidor web, ya que se resolverá un nombre de host para cada entrada en el archivo de registro. Configurar Apache para resolver nombres de host: 1. Abra el archivo httpd.conf del servidor en un editor de texto. 2. Busque la línea HostnameLookups Off. 3. 3. Cambie el valor de la línea de Off a On. Configurar iPlanet para resolver nombres de host: 1. Abra el archivo magnus.conf del servidor en un editor de texto. 2. Busque la línea DNS off. 3. Cambie el valor de la línea de off a on. Configurar IIS para resolver nombres de host: Instale el instalar plug-in de servidor web de NetInsight. Así se resolverán los nombres de host automáticamente antes de escribirlos en el registro. (Este plug-in está disponible para descargarlo en http://customercentral.unica.com). Resolución de títulos de página Cuando la opción Resolver títulos de página de NetInsight está habilitada, NetInsight intenta resolver los títulos de página de cada página exclusiva que se enumere en el archivo de registro. Lo hace solicitando cada página y analizando el código HTML para buscar el título de la página. Los sitios que generan muchas páginas dinámicas pueden sufrir importaciones lentas si esta opción está habilitada. Puede mejorar el rendimiento configurando adecuadamente la opción Resolver títulos de página y ejecutando las actualizaciones en un momento en el que el servidor web no tenga una carga muy alta. De manera predeterminada, NetInsight limita las páginas que solicita para evitar tensión en el servidor web y los retrasos durante la información: 38 IBM Unica NetInsight: Guía de ajuste v Si NetInsight ha resuelto el título de una página en los últimos catorce días, no intenta volver a resolver el título de la página. v NetInsight no resuelve los títulos de las páginas que se enumeran en su opción Títulos de página sin resolver. Esta opción incluye de forma predeterminada las páginas cuya vía de acceso contiene /cgi-bin/ o /scripts/ y los archivos que acaban en exe y cgi. v NetInsight no incluye la cadena de consulta en las solicitudes de página. Por lo general, no es recomendable que NetInsight resuelva títulos para solicitudes de página que contengan identificadores exclusivos incluidos en el URL. Puede impedir que NetInsight resuelva esas páginas creando un filtro que defina las páginas sujetas a la resolución de títulos. Determinar si la opción Resolver títulos de página está habilitada 1. Abra un perfil cuya importación sea lenta. 2. Pulse la pestaña Opciones. Se abrirá la página General. 3. Compruebe si la casilla de verificación Resolver títulos de página está seleccionada. Limitar las páginas cuyos títulos resuelve NetInsight Puede limitar las páginas cuyos títulos intenta resolver NetInsight creando uno o más filtros para las opciones Títulos de página sin resolver o Títulos de página resueltos en el perfil. 1. Visualice el perfil en el que desee crear un filtro de título de página. 2. Pulse la pestaña Opciones. 3. En el panel izquierdo, en Títulos de página, pulse Títulos de página sin resolver (para crear un filtro para las páginas que NetInsight no debe resolver) o Títulos de página resueltos (para crear un filtro sólo para las páginas que NetInsight debe resolver). 4. Pulse Añadir. 5. Especifique un filtro que coincida con las páginas a las que desee dirigirse. (Para obtener información detallada sobre los filtros, consulte la guía del usuario de NetInsight). 6. Pulse Añadir. Nota: Para aplicar un filtro nuevo a datos importados anteriormente, debe suprimir los datos del perfil y volver a importar los archivos de registro. Si ya no tiene todos los archivos de registro importados anteriormente en el perfil, puede que se pierdan datos. Problemas con la memoria caché y los ID de la memoria Durante la importación, NetInsight almacena en la memoria caché los valores de los archivos de registro en memoria hasta que ha analizado una cantidad predefinida de datos de punto de comprobación (de manera predeterminada, 125 MB). Cuando se alcanza este intervalo de punto de comprobación (o cuando se alcanza el final de un archivo de registro o de un clúster de archivos de registro), NetInsight concilia los datos almacenados en memoria caché con el contenido de las tablas de ID de la base de datos. Pueden producirse problemas de rendimiento si NetInsight tiene que conciliar un número demasiado elevado de valores para un tipo concreto de datos con sus tablas de ID. Estos problemas pueden ser: Capítulo 7. Ajuste avanzado NetInsight 39 v Las cachés de la memoria pueden desbordarse en el disco, lo que generaría esperas en el subsistema de disco. v Los recursos necesarios para conciliar grandes cantidades de datos nuevos con la tabla que contiene los ID existentes pueden convertirse en un cuello de botella de rendimiento serio. Nota: NetInsight también almacena en la memoria caché la información de memoria de la base de datos para garantizar un acceso más rápido a los valores que se utilizan con frecuencia. Nota: Hay una lista exhaustiva de las tablas de ID de la guía de esquemas de base de datos de NetInsightDatabase en http://customercentral.unica.com. Verificar si la conciliación de ID está ocasionando un problema de rendimiento 1. Abra el archivo cache.log en un editor de texto. 2. Localice la sección etiquetada Checkpoints Executed. 3. 3. Examine el valor de Reconcile IDs. (Los tiempos de los registros se expresan en segundos). Ejemplo: verificación de la conciliación de ID como problema de rendimiento En este ejemplo del archivo cache.log, los valores de conciliación destinados para las tablas de ID son claramente los responsables del tiempo que se consume durante la importación. Checkpoints Executed: 1 40 Stage Average Time Reconcile IDs 75461.23 Misc 0.00 Totals 0.00 Traffic 0.00 IDs 0.00 Parameters 0.00 Titles 0.00 Views 0.00 SpiderViews 0.00 Ads 0.00 Errors 0.00 Links 0.00 Initial Referrers 0.00 Closed Visits 0.00 Clickstreams 0.00 Campaigns 0.00 Closed SpiderVisits 0.00 IBM Unica NetInsight: Guía de ajuste Stage Average Time Spider Clickstreams 0.00 Spider Campaigns 0.00 Open Visits 0.00 Open Clickstreams 0.00 Open Visit Parameters 0.00 Open SpiderVisits 0.00 Open Spider Clickstreams 0.00 Open Spider Visit Parameters 0.00 End Transaction 0.00 Deletes 0.00 Determinar el ID que está ocasionando el problema de rendimiento Una vez que haya determinado que la conciliación de ID está ocasionando un problema de rendimiento, tiene que determinar el ID responsable. 1. Abra el archivo cache.log en un editor de texto. 2. Busque la sección ID Reconciliation Times. 3. Compruebe el tiempo que se indica para cada ID para determinar los ID que están ocasionando problemas. 4. Consulte la guía de esquemas de base de datos de NetInsight para obtener información detallada sobre qué se almacena en esa tabla de ID. 5. Examine los archivos de registro para determinar por qué se están creando tantos ID exclusivos. 6. Consulte a los usuarios finales de NetInsight para determinar si se utiliza toda, parte o ninguna de la información disponible en el campo del ID en cuestión en los informes de NetInsight. Ejemplo: verificación del origen del problema de conciliación de ID En este ejemplo del archivo cache.log, PageBrkDwn es el origen de los problemas de conciliación de ID. ID Reconciliation Times: ID Average Time CookieID 0.59 HostID 2.47 PageBrkdwnID 75449.03 PageID 0.26 RefBrkdwnID 0.27 BrowserBrkdnID 0.03 BrowserID 0.00 DepartmentID 0.00 Capítulo 7. Ajuste avanzado NetInsight 41 ID Average Time DirectoryID 0.09 DomainID 0.00 KeywordsID 0.00 PlatformID 0.00 RefID 0.00 UserID 0.33 ServerID 0.00 CampaignID 0.00 VisitorID 0.34 ContentID 0.00 ProfileID 0.00 ScreenResID 0.00 ChannelID 0.00 SegmentID 0.00 ChannelTypeID 0.00 Al consultar el esquema de base de datos se muestra que la tabla PageBrkdwnID almacena la parte del URL que sigue a “?” (la cadena de consulta). Un examen posterior del archivo de registro muestra que parte de la solicitud HTTP contiene una cadena de identificación exclusiva que utiliza un servidor de aplicaciones para almacenar la información de sesión para que los visitantes naveguen por el sitio. Puesto que este valor es exclusivo de cada vista que NetInsight procesa, se genera un nuevo ID de desglose de página, que se almacena en la memoria caché y, finalmente, se confirma en la base de datos para cada vista. En este caso, la sobrecarga necesaria para conciliar la tabla de ID existentes con los nuevos valores del archivo de registro y la confirmación del gran número de valores exclusivo en la tabla PageBrkdwnID son la causa de los problemas de rendimiento. Ajuste cuando la información en el valor de ID es obligatoria para la generación de informes Si la información del valor de ID que genera el cuello de botella de rendimiento es necesaria para la generación de informes, puede mejorar el rendimiento reduciendo el intervalo de punto de comprobación. Esto hace que NetInsight realice confirmaciones más pequeñas de datos, lo que genera escrituras más frecuentes pero más pequeñas en la base de datos. Las bases de datos con recursos disponibles limitados o las diseñadas para confirmaciones pequeñas frecuentes pueden beneficiarse de este cambio. Nota: La modificación del intervalo de punto de comprobación afecta a cada perfil de la instalación de NetInsight. El efecto de esta modificación en los perfiles que ya funcionen adecuadamente debería ser mínimo. Si detecta problemas, póngase en contacto con el servicio de soporte técnico de IBM. Reducir el intervalo de punto de comprobación 1. Abra NetTracker.cfg en un editor de texto. 2. Localice la línea: <checkpointmegs>125</checkpointmegs> 42 IBM Unica NetInsight: Guía de ajuste 3. Modifique el valor, según desee. Es posible que tenga que probar varios valores antes de encontrar el que mejor se adapte al sistema. 4. Guarde los cambios. Ajustar cuando el campo de ID contiene información obligatoria para la generación de informe Si la tabla de ID en cuestión contiene datos necesarios para la generación de informes, pero la información que genera el elevado número de valores de ID no es necesaria, puede resolver el problema utilizando la opción Búsqueda y reescritura de URL de NetInsight para reescribir el valor durante la importación. Por ejemplo, supongamos que los URL PageBreakdown tiene un aspecto como el siguiente: ?item=676&referrer=GGLE&UniqueID=1xertyuxclsaljdss Supongamos, además, que utiliza los valores del elemento y el referenciador en la generación de informes, pero no necesita el UniqueID. Puede utilizar la búsqueda y sustitución para eliminar el ID exclusivo antes que la información que se va a asociar con un ID de desglose de página. Configurar una regla de búsqueda y sustitución 1. Visualice el perfil en el que desee sustituir o suprimir parte del URL. 2. Pulse la pestaña Opciones. 3. En el panel de la izquierda, pulse, bajo Contenido dinámico, Búsqueda y reescritura de URL. 4. Pulse Añadir. 5. En el recuadro Descripción, especifique un nombre para la regla de búsqueda y sustitución. 6. En el cuadro Regla de búsqueda, especifique una expresión regular para buscar coincidencias con el texto que desee buscar. En este ejemplo, podría utilizar: (UniqueID=.*&?) Para obtener más información sobre cómo escribir reglas de búsqueda, consulte la ayuda en línea de NetInsight o la guía del usuario de NetInsight. 7. Para eliminar por completo el texto de la coincidencia, deje el recuadro Valor de reemplazo en blanco. 8. Si sólo hay un ID exclusivo por cada URL, en el recuadro Tipo de regla, elija Cadena de consulta. Ello indica que desea aplicar la regla a la parte del URL correspondiente a la cadena de consulta. 9. Pulse Guardar opciones. 10. Pulse Continuar. 11. Seleccione la regla de búsqueda y sustitución y pulse URL. 12. Pulse Añadir. 13. Cree un filtro para definir las páginas en las que se debe ejecutar la nueva regla de búsqueda y sustitución. Si desea que la regla se ejecute en todas las vistas que importe, utilice el filtro: that contains / 14. Pulse Añadir. Una vez creada, la regla de búsqueda y sustitución se ejecutará cada vez que se lleve a cabo una actualización. No obstante, no afectará los datos que ya estén en la base de datos. En tal caso, tendrá que borrar el perfil y volver a Capítulo 7. Ajuste avanzado NetInsight 43 importar todos los datos. Puede que si los conjuntos de datos son más grandes esto no sea posible. Si trabaja con un conjunto de datos grande, póngase en contacto con el servicio de soporte técnico de IBM para obtener ayuda sobre cómo implementar ese cambio en la base de datos. Volver a configurar NetInsight cuando el campo de ID contiene información no necesaria para la generación de informes Si no necesita el campo que almacena valores exclusivos para los informes, puede inhabilitar su importación, con lo que se evitan las consultas de conciliación que están ocasionando los problemas de rendimiento. Impedir que se importe un campo Abra el archivo de configuración de perfiles en un editor de texto. 1. Localice el elemento <ignoredfields>. Si <ignoredfields*gt; no existe, añádalo bajo el elemento <weboptions>. 2. Modifique <ignoredfields> para incluir el campo que desee inhabilitar. Para obtener una lista de campos que se pueden añadir a <ignoredfields>, consulte la tabla siguiente. El fragmento de código modificado debe tener un aspecto similar al siguiente: <ignoredfields> <ignoredfield>PageBreakdown</ignoredfield> </ignoredfields> 3. Guarde y cierre el archivo. Campos ignorables en los perfiles de servidor web Hay diez campos que se pueden ignorar en los perfiles de servidor web. Campo Valor cuando está inhabilitado Browser Unknown BrowserBreakdown Unknown Cookie None Domain Unresolved Keywords KeywordsID 0 PageBreakdown PageBrkdwnID 0 Platform Unknown Referrer None ReferrerBreakdown None User UserID 0 Cuellos de botella del subsistema de disco de la base de datos durante las confirmaciones Si el archivo cache.log muestra que todos los aspectos de la sincronización por puntos de comprobación tardan mucho tiempo, normalmente ello se debe a la E/S de disco en la base de datos. A continuación se muestra la sección del archivo cache.log que lo suele mostrar: Checkpoints Executed: 45 44 IBM Unica NetInsight: Guía de ajuste Stage Average Time Reconcile IDs 20.71 Misc 0.02 Totals 0.02 Traffic 0.01 IDs 4.91 Parameters 0.77 Titles 0.07 Views 7.36 SpiderViews 0.53 Ads 0.00 Errors 0.14 Links 0.00 Initial Referrers 0.16 Closed Visits 33.05 Clickstreams 2.11 Campaigns 0.00 Closed SpiderVisits 0.49 SpiderClickstreams 0.04 SpiderCampaigns 0.00 Open Visits 0.42 Si la mayoría de estos tiempos son de más de unos cuantos segundos, es posible que tenga que examinar el subsistema de disco del servidor de la base de datos para asegurarse de que esté lo suficientemente ajustado para escritura. El Monitor de rendimiento de Windows, iostat o las herramientas que se entreguen con la base de datos pueden ayudarle a diagnosticar el origen del cuello de botella. Al configurar una base de datos para utilizarla con NetInsight, se recomienda utilizar una configuración RAID (RAID 0 o 0+1) en bandas tanto para NetInsight como para los volúmenes de datos de la base de datos. No se recomienda utilizar RAID 5, porque esta configuración puede proporcionar un rendimiento bajo cuando se llevan a cabo un gran número de operaciones de escritura. Si el análisis muestra problemas con la E/S de disco y no utiliza una configuración RAID (RAID 0 o 0+1) en bandas tanto para NetInsight como para los volúmenes de datos de la base de datos, considere la posibilidad de exportar los datos de NetInsight, volver a configurar la matriz de discos y, a continuación, volver a importar los datos en la base de datos. Antes de hacerlo, sin embargo, consulte a su proveedor de matrices RAID cuáles son las mejores medidas de E/S de disco para la matriz RAID que utilice y las opciones de ajuste para manejar mejor la alta demanda de ancho de banda del disco. Cuellos de botella de recursos del sistema de NetInsight Entre las confirmaciones de datos durante la importación, NetInsight almacena en memoria caché los datos analizados de los archivos de registro en memoria. Si esas memorias caché se desbordan, NetInsight escribo los datos en archivos temporales del disco. Además, durante la importación, NetInsight inicia una hebra por cada Capítulo 7. Ajuste avanzado NetInsight 45 servidor en clúster configurado en el perfil con el fin de analizar el archivo de registro de cada servidor. Si todos los registros que vaya a importar se encuentran en el mismo disco en una configuración en clúster, esas hebras pueden competir por el ancho de banda del disco. Cuando intente identificar un cuello de botella de rendimiento, supervise el uso de la memoria, la E/S de disco y el uso de CPU en el sistema NetInsight. Problemas con la memoria de intercambio del sistema operativo Si el sistema NetInsight intercambia memoria en el disco de forma sistemática, la solución consiste en limitar lo que se ejecute en el servidor o en añadir memoria. Aunque es posible limitar la memoria que utiliza NetInsight, en la mayoría de los casos el impacto en el rendimiento será tan grave como los problemas derivados del intercambio de memoria en el disco. Problemas con la E/S de disco en el disco de NetInsight Si experimenta problemas de E/S de disco en el disco donde está instalado el programa NetInsight, mueva NetInsight a un disco más rápido. Si no es posible, es posible que resulte útil reducir el intervalo de punto de comprobación. Consulte el apartado “Reducir el intervalo de punto de comprobación” en la página 42. Problemas en la unidad de archivos de registro Al importar y procesar archivos de registro, si experimenta problemas de E/S en la unidad donde se almacenan los registros durante la importación, considere la posibilidad de distribuir los registros en varios discos físicos. Puede resultar útil reubicar los archivos de registro a un disco físico distinto del que contiene el directorio del programa NetInsight. La contención de disco entre las hebras que leen archivos de registro y las que utilizan los archivos temporales de NetInsight puede convertirse en un cuello de botella importante. Problemas con los cuellos de botella de CPU Si el análisis del uso de la CPU muestra que hay un cuello de botella de procesador, por lo general, la práctica recomendada es añadir más CPU al sistema NetInsight o mover NetInsight a un sistema con CPU más rápidas. Si no es posible, es posible que pueda ajustar las hebras de NetInsight hasta cierto punto. Nota: Los cambios en la generación de hebras afectan a todos los perfiles de la instalación de NetInsight. Ajustar la generación de hebras 1. Abra NetTracker.cfg en un editor de texto. 2. Localice la línea: <maxqueuedlines parser="2000" sorter="10000"/> 3. 3. Reduzca el valor de la hebra analizadora. Se reducirá el trabajo que cada hebra tiene que hacer para mantener su cola llena. En función de la disponibilidad de otros recursos del sistema, este cambio puede mejorar el rendimiento. Si reduce este valor a cero, la generación de hebras se desactivará por completo. 4. Guarde y cierre el archivo. 46 IBM Unica NetInsight: Guía de ajuste Problemas de rendimiento durante la indexación y el mantenimiento de las tablas De manera predeterminada, NetInsight vuelve a crear los índices sobre las tablas de parámetros durante cada actualización. Cuando se utiliza con Oracle y DB2, NetInsight también actualice las estadísticas de análisis sobre las tablas y los índices cada quince actualizaciones. En los casos en los que no sea necesario actualizar las estadísticas de análisis con tanta frecuencia, la inhabilitación del mantenimiento automática puede reducir el tiempo de importación. Nota: Si inhabilita la reindexación automática o la actualización de las estadísticas de análisis, el DBA debe asegurarse de que las estadísticas sobre las tablas y los índices se actualicen con regularidad y de que los índices se mantengan de la forma adecuada. Inhabilitar la reconstrucción de índices 1. Abra el archivo de configuración de perfiles en un editor de texto. 2. Añada lo siguiente al archivo bajo el elemento <weboptions>: <noimportreindex/> 3. Guarde y cierre el archivo. Problemas de rendimiento durante la creación de perfiles de visitante Los problemas de rendimiento que surgen con los perfiles de visitante suelen ser temporales y afectan sólo a la primera actualización después de que se haya añadido o modificado un perfil de visitante. Los problemas de rendimiento persistentes con los perfiles de visitante sólo tienen lugar en los casos en los que se configuran centenares de perfiles de visitante. En la mayoría de los casos en los que surgen problemas de rendimiento persistentes puede mejorar el rendimiento añadiendo un índice a la base de datos. Durante la primera actualización después de que se añada o modifique un perfil de visitante, NetInsight analiza todo el conjunto de datos para determinar si las visitas se adaptan al perfil nuevo o modificado. Ello puede hacer que la actualización tarde más de lo habitual. Las actualizaciones posteriores sólo examinan los datos recién importados para determinar si se debe realizar o no una entrada para cada perfil de visitante aplicable. Si la creación de perfiles de visitantes es lenta de forma continuada, examine los filtros de los perfiles de visitante. Prácticamente en todos los casos donde se producen problemas de rendimiento, los perfiles de visitante no tienen filtros o los filtros implicados se basan en el directorio, la página o el grupo de contenido. Perfiles de visitante sin filtros Los perfiles de visitante sin filtros suelen ser el resultado de la supresión accidental de un filtro durante la modificación a otra opción de NetInsight. Por ejemplo, si un usuario crea un perfil de visitante según un parámetro definido en la opción de NetInsight y ese parámetro se suprime posteriormente, el perfil de visitante permanecerá sin filtros. Cuando un perfil de visitante no tiene filtros, NetInsight añade una fila a la tabla de perfiles de la base de datos para cada visita en los archivos de registro. Puede resolver este problema suprimiendo los perfiles de visitante que no tengan filtros. Capítulo 7. Ajuste avanzado NetInsight 47 Verificar si cada perfil de visitante tiene un filtro 1. 2. 3. 4. Visualice el perfil que contiene el perfil de visitante. Pulse la pestaña Opciones. En el panel izquierdo, pulse Perfiles de visitante en Visitantes. Seleccione un perfil de visitante y pulse Visitantes para ver los filtros que están asociados con este perfil. Suprimir un perfil de visitante 1. 2. 3. 4. Visualice el perfil que contiene el perfil de visitante. Pulse la pestaña Opciones. En el panel izquierdo, pulse, en Visitantes, Perfiles de visitante. 4. Seleccione el perfil de visitante que desee suprimir y pulse Borrar. Nota: La actualización inicial después de suprimir un perfil de visitante sin perfiles puede tardar más tiempo porque se volverá a crear el perfil de los visitantes según los nuevos valores de perfiles de visitante. Las actualizaciones posteriores se ejecutarán mucho más rápido. Perfiles de visitante con filtros basados en directorio, página o grupo de contenido NetInsight almacena información sobre directorios, páginas y grupos de contenido en la tabla de vistas. Para buscar las visitas que coinciden con los perfiles de visitante que tienen filtros basados en dichos valores, NetInsight efectúa una unió entre la tabla de vistas y la tabla de visitas. Aunque esta unión sólo devuelve unas cuantas filas, la consulta puede consumir mucho tiempo. Puede reducir el coste de la unión y mejorar considerablemente el rendimiento creado un índice de cobertura para los datos a los que se hace referencia en la tabla de vistas. En general, tendrá que añadir un índice sobre una combinación del VisitID y el ID de los que se deriva el filtro. Consulte el apartado “Crear un índice de cobertura”. Crear un índice de cobertura En algunos casos, puede mejorar considerablemente el rendimiento de las consultas lentas creando un índice de "cobertura". Por ejemplo, en el caso de un perfil de visitante basado en página, puede añadir un índice sobre VisitID y PageID con una sintaxis similar a la siguiente: CREATE INDEX ViewVisitIDX ON <nombre_perfil_abreviado>_Views (VisitID, PageID); Después de crear el índice, evalúe con atención el rendimiento de NetInsight durante las siguientes actualizaciones para determinar si la creación de perfiles de visitante es más rápida. Si el rendimiento ha mejorado, añada el índice al esquema de NetInsight. Nota: El mantenimiento de los índices es costoso. Añada índices adicionales con precaución al esquema de base de datos, porque puede llegar a un punto en que la disminución de devoluciones de cada índice añadido añadirá más tiempo al proceso de importación de NetInsight, aunque debería ahorrar tiempo durante el proceso de creación de perfiles. CREATE INDEX ViewVisitIDX ON <nombre_perfil_abreviado>_Views (PageID, VisitID); 48 IBM Unica NetInsight: Guía de ajuste Añadir un índice al esquema de NetInsight Una vez que haya probado y determinado que un índice nuevo ha mejorado el rendimiento, debe añadirlo al archivo de definición de esquema de base de datos de NetInsight para que NetInsight reconozca el índice. Para añadir un índice al esquema: 1. Abra el archivo .xml correspondiente del directorio de datos de NetInsight. 2. Localice la definición de tabla adecuada. 3. Añada el tipo de elemento siguiente: <index name="ViewVisitIdx" unique="true"> <definition>(VisitID, PageID)</definition> </index> Nota: Encontrará información detallada sobre los archivos de esquema de NetInsight en la guía de archivos de definición de esquema de NetInsight disponible en http://customercentral.unica.com. Problemas de rendimiento durante la generación de informes Los problemas con la generación de informes se pueden dividir en general en cuatro tipos independientes: v Generación lenta de agregados v Generación lenta de informes estándar en un perfil v Generación lenta de informes personalizados Para determinar cuál es el caso durante una actualización, examine el archivo rpttimes.log. El registro se desglosa por periodo de tiempo, lo que permite determinar el tiempo que se tarda en generar agregados y generar resúmenes, conjuntos de resultados e informes personalizados para cada periodo de tiempo. Ejemplo: rpttimes.log A continuación se muestra un ejemplo del contenido habitual de un archivo rpttimes.log: ***************************************************************************** Beginning aggregate calculations at Wed May 04 02:45:14 2005 Date(s) being aggregated: 2453494 ***************************************************************************** Aggregate #1 (Visit) completed in 3 minutes, 0 seconds Aggregate #2 (User Agent) completed in 31 seconds Aggregate #3 (Visit Duration) completed in 20 seconds ***************************************************************************** Beginning summary calculations for May 2005 at Wed May 04 03:29:02 2005 ***************************************************************************** Summary #1 (Day of the Week Summary) completed in 35 seconds Summary #3 (Browser Summary) completed in 4 seconds Summary #9 (Date Summary) completed in 32 seconds ***************************************************************************** Beginning resultset calculations for May 2005 at Wed May 04 03:38:00 2005 ***************************************************************************** Resultset for summary #1 (Day of the Week Summary) completed in 0 seconds Resultset for summary #3 (Browser Summary) completed in 0 seconds Resultset for summary #9 (Date Summary) completed in 0 seconds ***************************************************************************** Beginning custom report calculations for May 2005 at Wed May 04 03:40:40 2005 ***************************************************************************** Resultset for custom summary #3 (Page Summary) completed in 0 seconds Resultset for custom summary #2 (Parameter Summary for P_Param0) completed in Capítulo 7. Ajuste avanzado NetInsight 49 6 minutes, 24 seconds Resultset for custom summary #1 (Parameter Summary for P_Param1) completed in 2 minutes, 15 seconds ***************************************************************************** Beginning summary calculations for All Months at Wed May 04 04:11:55 2005 ***************************************************************************** Summary #1 (Day of the Week Summary) completed in 1 minute, 5 seconds Summary #3 (Browser Summary) completed in 6 seconds Summary #11 (Directory Summary) completed in 1 second ***************************************************************************** Beginning resultset calculations for All Months at Wed May 04 05:27:06 2005 ***************************************************************************** Resultset for summary #1 (Day of the Week Summary) completed in 0 seconds Resultset for summary #3 (Browser Summary) completed in 0 seconds Resultset for summary #9 (Date Summary) completed in 1 second ***************************************************************************** Beginning custom report calculations for All Months at Wed May 04 05:52:40 2005 ***************************************************************************** Resultset for custom summary #3 (Page Summary) completed in 1 second Resultset for custom summary #2 (Parameter Summary for P_Param0) completed in 46 minutes, 43 seconds Resultset for custom summary #1 (Parameter Summary for P_Param1) completed in 6 minutes, 47 seconds Problemas de rendimiento durante la generación de agregados Las tablas de agregación almacenan los totales calculados a partir de los datos almacenados en otras tablas. Por ejemplo, la tabla Views contiene cada vista de página de los archivos de registro, la tabla Agg_View contiene el número total de vistas y visitas para cada página del sitio, agrupadas por una fecha específica. Las tablas de agregación permiten que NetInsight genere informes dinámicos según la fecha de manera más rápida. Las fechas de los agregados se listan al principio de la sección de agregado como fechas julianas. Nota: Para obtener más información sobre las fechas julianas, incluidos los procedimientos almacenados de ejemplo para convertirlas a un formato más convencional para el tipo de base de datos, consulte la guía de esquemas de base de datos de NetInsight en http://customercentral.unica.com. En Internet también puede encontrar una amplia variedad de convertidores de fechas julianas. Si la adición de información a las tablas de agregación tarda mucho tiempo, examine las fechas que se vayan a agregar. Por lo general, la generación de agregados sólo tiene lugar para las fechas contenidas en los registros que haya importado como parte del mismo proceso de actualización. Si se enumeran más de varias fechas en el archivo rpttimes.log, puede deberse a que se haya ejecutado un mandato –recalc de línea de mandatos. (El mandato –recalc hace que NetInsight vuelva a calcular los informes de todos los datos de la base de datos de NetInsight). El rendimiento durante estos tipos de operaciones no es el habitual. Supervise el perfil para obtener un registro generado por el proceso de actualización de NetInsight. Si, tras unos cuantos días, NetInsight aún realiza el agregado de fechas sobre las que no está importando datos de registro actualmente, póngase en contacto con el servicio de soporte técnico de UCompany/> para obtener ayuda. Si todos los agregados tardan mucho tiempo cada día, ello indica, por lo general, que existe un problema de E/S de disco en la base de datos. Realizar tareas de supervisión adicionales de la base de datos con las herramientas del sistema operativo y de la base de datos puede ayudar a aislar el problema. Cada agregado contiene datos que se utilizan para crear uno o más resúmenes. Si un agregado concreto tarda demasiado tiempo en generarse, puede: 50 IBM Unica NetInsight: Guía de ajuste v Inhabilitarla (si no es relevante para el perfil en cuestión). Los agregados se inhabilitan inhabilitando sus resúmenes asociados en las opciones de perfil de NetInsight. Por ejemplo, si los datos contenidos en Resumen de rendimiento del servidor y Resumen de entregas de páginas no son relevantes en un perfil concreto porque el perfil se utiliza principalmente para ventas y marketing, puede inhabilitar Resumen de entregas de páginas y Resumen de rendimiento del servidor. Esto, por su parte, inhabilitará el agregado de rendimiento. v Reduzca el número de ID asociados con el agregado. Si necesita ayuda para determinar los resúmenes que están asociados con un agregado concreto, póngase en contacto con el servicio de soporte técnico de IBM. A menudo la inhabilitación de un agregado no es una opción porque sus datos son necesario para uno o más resúmenes que se desean incluir en el perfil. En tal caso, analice el número de filas añadidas al agregado diariamente. (Cuente las filas de la tabla de agregación antes y después de una actualización para obtener el número de filas añadidas). Si el número de filas adicionales es alto (en comparación con los demás agregados del perfil), por lo general, se genera un número alto de valores exclusivos para uno de los campos del agregado. Por ejemplo, la tabla Agg_View contiene información sobre PageID. Si este agregado es un problema persistente, normalmente se debe a que está generando un número elevado de valores exclusivos para las páginas o cadenas de consulta de los archivos de registro. Para obtener información sobre cómo ajustar los problemas relacionados con un número elevado de ID, consulte el apartado “Problemas con la memoria caché y los ID de la memoria” en la página 39. Inhabilitar un resumen: 1. Visualice el perfil en NetInsight. 2. Pulse la pestaña Opciones. 3. En el panel izquierdo, en Principal, pulse Resúmenes. 4. En la lista Resúmenes seleccionados, seleccione el resumen que desee inhabilitar y pulse Eliminar informe. 5. Cuando haya acabado de inhabilitar los resúmenes, pulse Guardar opciones y, a continuación, pulse Continuar. Problemas de rendimiento para resúmenes y conjuntos de resultados estándar Si todos los resúmenes y conjuntos de resultados tardan demasiado en generarse diariamente, esto indica, por lo general, que existe un problema de E/S de disco en la base de datos. Realizar tareas de supervisión adicionales de la base de datos con las herramientas del sistema operativo y de la base de datos puede ayudar a aislar el problema. Si un resumen concreto tarda demasiado tiempo en generarse, puede: v Inhabilitarla (si no es relevante para el perfil en cuestión). En la mayoría de los casos, sin embargo, el resumen será necesario. v Reduzca el número de ID asociados con el resumen. Los tiempos prolongados de generación de resúmenes suelen deberse a la generación de un gran número de valores exclusivos para uno de los ID en el que se basa el resumen. Por ejemplo, si el resumen de páginas está provocando problemas de rendimiento, la causa suele ser que se está generando un gran número de ID de página. Para obtener información sobre cómo ajustar los problemas relacionados con un gran número de ID, consulte el apartado “Problemas con la memoria caché y los ID de la memoria” en la página 39. Capítulo 7. Ajuste avanzado NetInsight 51 Problemas de rendimiento con los informes personalizados El primer paso para resolver los problemas de rendimiento con los informes personalizados es asegurarse de que los usuarios necesiten cada uno de los informes personalizados cuya actualización automática se ha establecido. Si hay informes que no se van a utilizar, considere la posibilidad de suprimirlos o de impedir que se actualicen automáticamente. Inhabilitar la actualización automática de un informe personalizado: 1. Abra el perfil que contenga el informe personalizado. 2. Pulse la pestaña Personalizado. 3. Seleccione el informe personalizado que no desee que NetInsight actualice automáticamente. 4. Pulse Editar informe. 5. Pulse Guardar. 6. Desmarque la casilla de verificación Actualizar automáticamente el informe. 7. Asegúrese de desmarcar también la casilla de verificación Guardar como nuevo informe. 8. Pulse Continuar. Ajustar NetInsight para informes personalizados lentos: El archivo rpttimes.log indica cuánto tarda cada informe personalizado en generarse. Si un informe tarda demasiado, es posible que tenga que reducir el tiempo de generación de informes ajustando NetInsight para el informe siguiendo estos pasos: 1. “Determinar las consultas que tardan demasiado en ejecutarse”. 2. “Ajustar la base de datos para consultas lentas” en la página 53. 3. “Visualice el plan de ejecución de la consulta” en la página 53. 4. “Volver a ejecutar el informe personalizado” en la página 53. 5. “Añadir índices nuevos al esquema de base de datos de NetInsight” en la página 53. Determinar las consultas que tardan demasiado en ejecutarse: Obtenga un rastreo de la actividad de la base de datos cuando se ejecuta un informe personalizado concreto. Cada una de las bases de datos a las que NetInsight da soporte tiene la capacidad de proporcionar información de rastreo sobre el rendimiento de las consultas. Para obtener más información, consulte la documentación de la base de datos. Si está seguro de que otros usuarios no intentarán acceder a la interfaz de NetInsight durante el rastreo, puede ejecutar el informe desde la interfaz de NetInsight. Si no puede garantizarlo, restrinja el acceso a la interfaz desactivando el servidor web y utilice el mandato –drill para ejecutar el informe personalizado manualmente. Para obtener ayuda sobre cómo utilizar el mandato –drill, póngase en contacto con el servicio de soporte técnico de IBM. El archivo de rastreo mostrará las consultas o conjuntos de consultas que tardan más en ejecutarse. Nota: Si no puede recrear el problema de rendimiento cuando es el único usuario de la base de datos, ello sugiere que la base de datos no se está adaptando para gestionar varios usuarios que generen informes personalizados. Es posible que 52 IBM Unica NetInsight: Guía de ajuste sean necesarias otras evaluaciones del rendimiento y ajustes durante el uso normal de NetInsight. La mejor manera de hacerlo es utilizar las herramientas que proporcionan los proveedores de la base de datos y el sistema operativo para evaluar el uso de recursos. Debe prestar especial atención a la E/S de disco y al uso de la memoria cuando varios usuarios accedan a NetInsight. Ajustar la base de datos para consultas lentas: Ejecute las consultas que tarden más tiempo en ejecutarse con un programa de utilidad diseñado para mostrar el plan de ejecución y el coste de la consulta. Si en el plan de ejecución de la consulta hay exploraciones de tabla, considere los distintos índices que puede añadir para evitarlas. Si la consulta lenta aplica a un filtro basado en visita a un informe basado en vista, o a la inversa, una manera de optimizar la consulta es utilizar un índice de cobertura. (La aplicación de un filtro basado en visita a un informe basado en vista, o a la inversa, puede aportar mucha tensión a la base de datos, ya que NetInsight debe realizar una unión entre las tablas de vistas y de visitas). El índice de cobertura debe contener las columnas aplicables que NetInsight consultará en una tabla determinada. Por ejemplo, si uno de los informes personalizados contiene un filtro de página que se aplica al resumen de visitantes, un índice sobre la tabla de vistas que contenga PageID y VisitID podría permitir que la base de datos sirviera la solicitud sin acceder a la tabla de vistas directamente. Consulte el apartado “Crear un índice de cobertura” en la página 48. Visualice el plan de ejecución de la consulta: Ejecute la consulta con un programa de utilidad de base de datos adecuado a fin de determinar si la base de datos está utilizando correctamente el índice que ha añadido. Volver a ejecutar el informe personalizado: Vuelva a ejecutar el informe personalizado para ver si el tiempo de generación de informes ha mejorado. Antes de volver a ejecutar el informe, depure la tabla RecentResults ejecutando este mandato: nettracker <nombre_perfil> -purgeresults Al depurar la tabla RecentResults se obliga a NetInsight a recalcular la información mediante el nuevo índice en lugar de los resultados almacenados en memoria caché. (Si se utilizan los resultados almacenados en memoria caché, la consulta no se volverá a ejecutar). Añadir índices nuevos al esquema de base de datos de NetInsight: Si el índice resuelve el problema de rendimiento, añada el índice nuevo al esquema de NetInsight. Consulte el apartado “Añadir un índice al esquema de NetInsight” en la página 49. Aislar problemas de rendimiento con informes dinámicos (ampliación de detalles) El análisis de los problemas de rendimiento en la generación de informes dinámicos es complicado porque NetInsight almacena en memoria caché los resultados de los informes que genera. Un efecto de este almacenamiento en memoria caché es que si ejecuta un informe concreto dos veces, las consultas Capítulo 7. Ajuste avanzado NetInsight 53 utilizadas la segunda vez son distintas de las consultas utilizadas la primera vez. El segundo informe se generará mucha más rápidamente que el primero. Puede inhabilitar el almacenamiento en memoria caché durante el ajuste. Una vez desactivado el almacenamiento en memoria caché, analice con atención las ampliaciones de detalles que los usuarios finales han informado que eran problemáticas. Intente identificar qué tienen en común esos informes. Por ejemplo, ¿comparten uniones concreta en su código SQL? En la mayor parte de los casos en los que surgen problemas que se pueden rastrear hasta los informes dinámicos, el código SQL generado incluye una unión entre las tablas de vistas y visitas del perfil. Suelen ser las tablas más grandes. Las uniones se dan cuando un filtro basado en datos almacenados en la tabla de vistas (por ejemplo, una página, un directorio o un grupo de contenido) se aplica a un resumen basado en la tabla de visitas (por ejemplo, un resumen de visitantes reincidente, un resumen de visitante, un resumen de anfitriones o un resumen de usuarios). También se dan en los paneles de control que contienen resúmenes basados en la tabla de visitas. Una vez que haya identificado el informe dinámico concreto que causa el problema consulte el apartado “Problemas de rendimiento con los informes personalizados” en la página 52. Inhabilitar el almacenamiento en memoria caché 1. Abra NetTracker.cfg en un editor de texto. 2. Cambie la línea <resultsetretention>900</resultsetretention> por <resultsetretention>0</resultsetretention>. 3. Guarde el cambio en el archivo. Nota: La desactivación del almacenamiento en memoria caché puede tener un impacto importante en el tiempo que tarda en generar informes dinámicos. Inhabilite el almacenamiento en memoria caché cuando realice procedimientos de resolución de problemas y preferiblemente durante horas de poca actividad. Vuelva a habilitarlo lo antes posible. Personalizar el análisis de tablas de NetInsight en los despliegues de Oracle Para los despliegues de Oracle, NetInsight incluye un proceso de análisis de tablas incorporado que utiliza para ajustar las consultas durante la importación y/o la generación de informes. El análisis estadístico de las tablas de NetInsight examina métricas, como los recuentos de filas, la cardinalidad, etc. Según esas métricas, las consultas de NetInsight se ajustan automáticamente para obtener un rendimiento óptimo. Se ejecutan procesos independientes para las tablas de informes y las tablas de esquema. El análisis de tablas para las tablas de informes se ejecuta durante cada fase de generación de informes. El análisis de tablas para las tablas de esquema se ejecuta una vez cada quince importaciones. Si tiene problemas de rendimiento que detecta o sospecha que están relacionados con errores o ineficacias del código SQL de análisis de tablas de NetInsight, puede inhabilitar el análisis de tablas como parte del proceso de resolución de problemas. También puede crear una variable de entorno de NetInsight en la que especifique SQL propio que se ejecute para el análisis de tablas. Estas medidas sólo se pueden 54 IBM Unica NetInsight: Guía de ajuste tomar siguiendo las indicaciones del servicio de soporte técnico de IBM o el administrador de la base de datos Oracle de NetInsight de la empresa. El análisis de tablas de NetInsight se inhabilita perfil a perfil. El código SQL personalizado especificado para ejecutarse en lugar del código SQL de análisis de tablas predeterminado de NetInsight se aplica a todos los perfiles que se ejecuten en la instalación. Inhabilitar el análisis de tablas de informe para un perfil 1. Abra el archivo de configuración del perfil para el que desee inhabilitar el análisis de tablas. 2. Añada esta etiqueta xml: <noreporttableanalysis/> 3. Guarde el archivo. NetInsight ya no efectuará el análisis de tablas en las tablas de informe del perfil. Inhabilitar el análisis de tablas de esquema para un perfil 1. Abra el archivo de configuración del perfil para el que desee inhabilitar el análisis de tablas. 2. Añada esta etiqueta xml: <notableanalysis/> 3. Guarde el archivo. NetInsight ya no efectuará el análisis de tablas en las tablas de esquema del perfil. Especificar un código SQL de análisis de tablas personalizado 1. En Opciones administrativas de NetInsight, seleccione Opciones > Principal > Variables de entorno. 2. Pulse Añadir para añadir una variable nueva. 3. Para anular el valor predeterminado de NetInsight: v SQL de análisis de tablas de informes: cree una variable con el nombre NI_STATS_OVERRIDE. v SQL de análisis de tablas de informes y esquema, cree una variable con el nombre NI_STATS_OVERRIDE_ALL. 4. Para obtener el valor, especifique el procedimiento de PL/SQL que desee utilizar. En el ejemplo siguiente, el 50% de las filas de las tablas del esquema plat80qa3 se incluyen para su análisis y las estadísticas resultantes se almacenan en la tabla aasavestats: begin DBMS_STATS.GATHER_TABLE_STATS(’plat80qa3’, ’%tablename%’, estimate_percent=>50,stattab => ’aasavestats’);end; Nota: Si se han definido ambos, NI_STATS_OVERRIDE_ALL anulará a NI_STATS_OVERRIDE. Capítulo 7. Ajuste avanzado NetInsight 55 56 IBM Unica NetInsight: Guía de ajuste Capítulo 8. Ubicaciones de archivos y directorios cache.log El archivo cache.log se genera durante el proceso de importación. Permite realizar el seguimiento de la memoria de NetInsight y proporciona información sobre el tiempo que consumen las inserciones de base de datos en cada punto de comprobación de NetInsight. El archivo cache.log se encuentra en el directorio de perfiles. Directorio del programa de NetInsight En los sistemas Windows, el directorio del programa NetInsight predeterminado se encuentra en C:\Archivos de programa\NetInsight. En los sistemas UNIX, el directorio de perfiles predeterminado se encuentra en /usr/local/NetInsight. NetTracker.cfg El archivo NetTracker.cfg se encuentra en el directorio del programa NetInsight. Archivo de configuración de perfil El archivo de configuración de perfil se denomina nombre_perfil_abreviado.cfg. Se encuentra en el directorio de perfiles predeterminado. Directorio de perfiles En los sistemas Windows, el directorio de perfiles predeterminado se encuentra en C:\Archivos de programa\NetInsight\Data\nombre_perfil_abreviado. En los sistemas UNIX, el perfil de directorios predeterminado se encuentra en /usr/local/NetInsight/data/nombre_perfil_abreviado. rpttimes.log El archivo rpttimes.log se genera durante la generación de informes. Contiene información sobre el tiempo que tardan en generarse cada resumen y los componentes en que se basa. El archivo rpttimes.log se encuentra en el directorio de perfiles. © Copyright IBM Corp. 1996, 2011 57 58 IBM Unica NetInsight: Guía de ajuste Avisos Esta información se ha desarrollado para productos y servicios ofrecidos en EE.UU. Es posible que IBM no ofrezca los productos, servicios o funciones que se tratan en este documento en otros países. Consulte con el representante de IBM de su localidad si desea información sobre los productos y servicios disponibles actualmente en su zona. Las referencias a programas, productos o servicios de IBM no pretenden establecer ni implicar que sólo puedan utilizarse dichos productos, programas o servicios de IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio funcionalmente equivalente que no infrinja ninguno de los derechos de propiedad intelectual de IBM. Sin embargo, es responsabilidad del cliente evaluar y verificar el funcionamiento de cualquier producto, programa o servicio que no sea de IBM. IBM puede tener patentes o solicitudes de patentes pendientes que cubran el tema principal descrito en este documento. El suministro de este documento no le otorga ninguna licencia sobre estas patentes. Puede enviar consultas sobre licencias, por escrito, a: IBM Director of Licensing IBM Corporation North Castle Drive Armonk, NY 10504-1785 EE.UU. Para consultas sobre licencias relacionadas con información de doble byte (DBCS), póngase en contacto con el departamento de propiedad intelectual de IBM de su país o envíe sus consultas, por escrito, a: Intellectual Property Licensing Legal and Intellectual Property Law IBM Japan Ltd. 1623-14, Shimotsuruma, Yamato-shi Kanagawa 242-8502 Japan El párrafo siguiente no se aplica al Reino Unido ni a ningún otro país donde estas disposiciones sean incompatibles: INTERNATIONAL BUSINESS MACHINES CORPORATION PROPORCIONA ESTA PUBLICACIÓN "TAL CUAL" SIN GARANTÍAS DE NINGÚN TIPO, NI EXPLÍCITAS NI IMPLÍCITAS, INCLUYENDO PERO NO LIMITÁNDOSE A ELLAS, LAS GARANTÍAS IMPLÍCITAS DE NO VULNERACIÓN, COMERCIALIZACIÓN O IDONEIDAD PARA UN FIN CONCRETO. Algunos países no permiten la renuncia a garantías explícitas o implícitas en determinadas transacciones, por lo que puede que esta declaración no sea aplicable en su caso. Esta información puede contener inexactitudes técnicas o errores tipográficos. Periódicamente se efectúan cambios en la información incluida en este documento; estos cambios se incorporarán en nuevas ediciones de la publicación. IBM puede realizar en cualquier momento mejoras o cambios en los productos o programas descritos en esta publicación sin previo aviso. © Copyright IBM Corp. 1996, 2011 59 Todas las referencias hechas en este documento a sitios web que no son de IBM se proporcionan únicamente para su información y no representan en modo alguno una recomendación de dichos sitios web. El material de esos sitios web no forma parte del material para este producto IBM, por lo que el uso de esos sitios web es a cuenta y riesgo del usuario. IBM puede utilizar o distribuir cualquier información que se le proporcione en la forma que considere adecuada, sin incurrir por ello en ninguna obligación para con el remitente. Los titulares de licencias de este programa que deseen obtener información sobre el mismo con el fin de permitir: (i) el intercambio de información entre programas creados independientemente y otros programas (incluido éste) y (ii) el uso mutuo de información que se haya intercambiado, deben ponerse en contacto con: IBM Corporation 170 Tracer Lane Waltham, MA 02451 EE.UU. Dicha información puede estar disponible, sujeta a los términos y condiciones correspondientes, incluyendo, en algunos casos, el pago de una tarifa. El programa bajo licencia que se describe en este documento y todo el material bajo licencia disponible los proporciona IBM bajo los términos de las Condiciones Generales de IBM, Acuerdo Internacional de Programas Bajo Licencia de IBM o cualquier acuerdo equivalente entre las partes. Los datos de rendimiento contenidos en el presente documento se han determinado en un entorno controlado. Por lo tanto, los resultados obtenidos en otros entornos operativos pueden variar de modo significativo. Tal vez se hayan realizado mediciones en sistemas que estén en fase de desarrollo y no existe ninguna garantía de que esas mediciones vayan a ser iguales en los sistemas disponibles en el mercado. Además, algunas mediciones podrían haberse estimado mediante extrapolación. Puede que los resultados reales varíen. Los usuarios de este documento debería verificar los datos aplicables para sus entornos específicos. La información relacionada con productos que no son de IBM se ha obtenido de los proveedores de dichos productos, de sus anuncios publicados o de otras fuentes de disponibilidad pública. IBM no ha comprobado estos productos y no puede confirmar la precisión de su rendimiento, compatibilidad ni contemplar ninguna otra reclamación relacionada con los productos que no son de IBM. Las preguntas relacionadas con las funciones de los productos que no son de IBM deberán dirigirse a los proveedores de estos productos. Todas las sentencias relacionadas con la futura dirección de IBM o intento están sujetas al cambio o retirada sin previo aviso y sólo representan objetivos y metas. Los precios indicados son precios sugeridos de IBM al por menor, están actualizados y están sujetos a cambios sin previo aviso. Los precios de los concesionarios pueden variar. Esta información contiene ejemplos de datos e informes utilizados en operaciones empresariales diarias. Para ilustrarlas de la forma más completa posible, los ejemplos incluyen nombres de personas, empresas, marcas y productos. Todos 60 IBM Unica NetInsight: Guía de ajuste estos nombres son ficticios y cualquier similitud a los nombres y direcciones que haya utilizado una empresa real es pura coincidencia. LICENCIA DE COPYRIGHT: Esta información contiene programas de aplicaciones de ejemplo en código fuente, que ilustran técnicas de programación en las distintas plataformas operativas. Puede copiar, modificar y distribuir estos programas de ejemplo en cualquier formato sin necesidad de efectuar ningún pago a IBM, con el fin de desarrollar, utilizar, comercializar o distribuir programas de aplicación que se ajusten a la interfaz de programación de aplicaciones para la plataforma operativa para la cual se han escrito los programas de aplicación. Los ejemplos no se han probado minuciosamente bajo todas las condiciones. Por lo tanto, IBM no puede garantizar ni implicar la fiabilidad, servicio o funcionamiento de estos programas. Los programas de ejemplo se ofrecen "TAL CUAL", sin garantía de ningún tipo. IBM no es responsable de ningún daño resultante de la utilización de los programas de ejemplo por parte del usuario. Si consulta esta documentación en soporte software, puede que no aparezcan las fotografías e ilustraciones en color. Marcas registradas IBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales registradas de International Business Machines Corp., registrada en muchas jurisdicciones en todo el mundo. Otros nombres de servicios y productos podrían ser marcas registradas de IBM u otras compañías. Hay disponible una lista actual de marcas registradas de IBM en la Web en “Información de marca registrada y copyright en ” www.ibm.com/legal/copytrade.shtml. Avisos 61 62 IBM Unica NetInsight: Guía de ajuste Impreso en España