IBM Unica NetInsight: Guía de ajuste

Anuncio
IBM Unica NetInsight
Versión 8 Release 6
30 de abril de 2012
Guía de ajuste
Nota
Antes de utilizar este producto y la información a la que da soporte, lea la información contenida en el apartado “Avisos”
en la página 59.
Esta edición se aplica a la versión 8, release 6, modificación 0 de IBM Unica NetInsight y todos los releases y
modificaciones posteriores hasta que se indique otra cosa en nuevas ediciones.
© Copyright IBM Corporation 1996, 2011.
Contenido
Capítulo 1. Cómo ponerse en contacto
con el soporte técnico de IBM Unica . . 1
Capítulo 2. Selección y configuración de
hardware . . . . . . . . . . . . . . 3
Requisitos mínimos de hardware . . . . . .
Determinar un nivel de rendimiento aceptable .
. 3
. 3
Capítulo 3. Optimización de la base de
datos SQL Server . . . . . . . . . . 5
Contadores de los que se debe realizar el
seguimiento . . . . . . . . . . . . .
Valores de contador deseados. . . . . . . .
Contadores de objetos de procesador . . . .
Contadores de objetos del sistema . . . . .
Contadores de gestor de almacenamientos
intermedios de SQL Server . . . . . . .
Contadores de objetos de mecanismos de cierre.
Contadores de objetos de bloqueos . . . . .
Contadores de objetos de gestor . . . . . .
Contadores de objetos (lógicos o físicos) de disco
Contadores de objetos de memoria . . . . .
.
.
.
.
5
6
6
6
.
.
.
.
6
6
7
7
7
. 8
Capítulo 4. Optimización de la base de
datos DB2 . . . . . . . . . . . . . . 9
Resumen de las recomendaciones de configuración . 9
Recomendaciones detalladas de configuración . . . 11
Instalar los archivos del sistema de base de datos
en una ubicación adecuada . . . . . . . . 11
Seleccionar el juego de caracteres de base de
datos adecuado . . . . . . . . . . . . 12
Configurar los registros de transacciones . . . 12
Seleccionar el tamaño de página adecuado . . . 12
Aumentar el tamaño de la agrupación de
almacenamiento intermedio . . . . . . . . 13
Habilitar el paralelismo intrapartición . . . . 13
Configurar las áreas de trabajo en memoria. . . 14
Aumentar el número de servidores de E/S de
DB2 . . . . . . . . . . . . . . . . 15
Configurar espacios de tabla. . . . . . . . 16
Capítulo 5. Optimización de la base de
datos Oracle . . . . . . . . . . . . 19
Resumen de las recomendaciones de configuración
Recomendaciones detalladas de configuración . . .
Instalar los archivos del sistema de base de datos
en una ubicación adecuada . . . . . . . .
Seleccionar el juego de caracteres de base de
datos adecuado . . . . . . . . . . . .
Seleccionar el valor de DB_BLOCK_SIZE
adecuado . . . . . . . . . . . . . .
Configurar los registros de rehacer . . . . .
Aumentar el tamaño de memoria caché de
almacenamiento intermedio . . . . . . . .
© Copyright IBM Corp. 1996, 2011
19
21
21
21
22
22
22
Configurar las áreas de trabajo en memoria. . . 23
Configurar espacios de tabla. . . . . . . . 24
Configurar particionamiento de tablas e índices
27
Capítulo 6. Valores de configuración
del rendimiento . . . . . . . . . . . 29
Elemento <database> .
Elemento <ntdbbases>.
<maxqueuedlines> . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 29
. 31
. 32
Capítulo 7. Ajuste avanzado NetInsight
35
Elegir los métodos y los objetivos del ajuste . . .
Utilizar un entorno de prueba para el ajuste . . .
Problemas de rendimiento ocasionales y
continuados . . . . . . . . . . . . . .
Aislar problemas de rendimiento durante las
actualizaciones . . . . . . . . . . . . .
Determinar el tiempo de importación de datos .
Determinar el tiempo de indexación y
mantenimiento de tablas . . . . . . . . .
Determinar el tiempo de actualización de perfiles
de visitante . . . . . . . . . . . . .
Determinar el tiempo de generación de informes
Problemas de rendimiento durante la importación
Esperas de red . . . . . . . . . . . .
Resolución de títulos de página. . . . . . .
Problemas con la memoria caché y los ID de la
memoria . . . . . . . . . . . . . . .
Verificar si la conciliación de ID está ocasionando
un problema de rendimiento . . . . . . .
Ejemplo: verificación de la conciliación de ID
como problema de rendimiento. . . . . . .
Determinar el ID que está ocasionando el
problema de rendimiento . . . . . . . . .
Ejemplo: verificación del origen del problema de
conciliación de ID . . . . . . . . . . .
Ajuste cuando la información en el valor de ID
es obligatoria para la generación de informes . .
Reducir el intervalo de punto de comprobación
Ajustar cuando el campo de ID contiene
información obligatoria para la generación de
informe. . . . . . . . . . . . . . .
Volver a configurar NetInsight cuando el campo
de ID contiene información no necesaria para la
generación de informes . . . . . . . . .
Cuellos de botella del subsistema de disco de la
base de datos durante las confirmaciones . . .
Cuellos de botella de recursos del sistema de
NetInsight . . . . . . . . . . . . . .
Problemas de rendimiento durante la indexación
y el mantenimiento de las tablas . . . . . .
Problemas de rendimiento durante la creación de
perfiles de visitante. . . . . . . . . . .
Perfiles de visitante con filtros basados en
directorio, página o grupo de contenido . . . .
35
35
35
36
36
36
36
37
37
37
38
39
40
40
41
41
42
42
43
44
44
45
47
47
48
iii
Problemas de rendimiento durante la generación
de informes . . . . . . . . . . . . .
Aislar problemas de rendimiento con informes
dinámicos (ampliación de detalles) . . . . . .
Inhabilitar el almacenamiento en memoria caché
Personalizar el análisis de tablas de NetInsight en
los despliegues de Oracle . . . . . . . . . .
Inhabilitar el análisis de tablas de informe para
un perfil . . . . . . . . . . . . . .
Inhabilitar el análisis de tablas de esquema para
un perfil . . . . . . . . . . . . . .
iv
IBM Unica NetInsight: Guía de ajuste
49
Especificar un código SQL de análisis de tablas
personalizado . . . . . . . . . . . . 55
53
54
Capítulo 8. Ubicaciones de archivos y
directorios . . . . . . . . . . . . . 57
54
55
55
Avisos . . . . . . . . . . . . . . . 59
Marcas registradas .
.
.
.
.
.
.
.
.
.
.
. 61
Capítulo 1. Cómo ponerse en contacto con el soporte técnico
de IBM Unica
Si encuentra un problema que no puede resolver consultando la documentación, el
contacto de soporte designado de la empresa puede registrar una llamada con el
soporte técnico de IBM® Unica . Utilice la información de esta sección para
asegurarse de que su problema se soluciona de manera eficaz y satisfactoriamente.
Si usted no es un contacto de soporte designado en su empresa, póngase en
contacto con el administrador de IBM Unica para obtener más información.
Información a recopilar
Antes de ponerse en contacto con el soporte técnico de IBM Unica , recopile la
información siguiente:
Breve descripción de la naturaleza de su problema.
Mensajes de error detallados que verá cuando se produzca el problema.
Pasos detallados para reproducir el problema.
Archivos de registro, archivos de sesión, archivos de configuración y archivos de
datos relacionados.
v Información sobre el producto y el entorno del sistema, que puede obtener tal
como se describe en "Información del sistema".
v
v
v
v
Información del sistema
Cuando llame al soporte técnico de IBM Unica , es posible que se le solicite
proporcionar información sobre el entorno.
Si su problema no evita que inicie sesión, mucha de esta información estará
disponible en la página Acerca de, que proporciona información sobre si ha
instalado aplicaciones de IBM Unica .
Puede acceder a la página Acerca de seleccionando Ayuda > Acerca de. Si no se
puede acceder a la página Acerca de, puede obtener el número de versión de
cualquier aplicación IBM Unica mediante la visualización del archivo version.txt
ubicado en el directorio de instalación para cada aplicación. Si el archivo
version.txt no está disponible, utilice el mandato NetTracker admin -buildinfo
para obtener la información de la versión.
Información de contacto para el soporte técnico de IBM Unica
Para obtener formas de contactar con el soporte técnico de IBM Unica , consulte el
sitio web de Soporte técnico del producto IBM Unica : (http://www.unica.com/
about/product-technical-support.htm).
© Copyright IBM Corp. 1996, 2011
1
2
IBM Unica NetInsight: Guía de ajuste
Capítulo 2. Selección y configuración de hardware
En esta sección se incluye una descripción sobre cómo determinar los requisitos de
hardware mínimos para la configuración y una descripción de los requisitos de
hardware.
Requisitos mínimos de hardware
El hardware mínimo necesario para dar soporte a la base de datos y proporcionar
un rendimiento de NetInsight aceptable variará en función de cómo se utilice
NetInsight y del volumen de datos de registro que almacene. Por ejemplo, los
usuarios que procesen los archivos de registro una vez a la semana y revisen los
informes sólo los lunes puede que tengan requisitos menos estrictos que los que
procesen los archivos de registro de cada día y los revisen al día siguiente.
Determinar un nivel de rendimiento aceptable
Para determinar los requisitos de hardware mínimos de despliegue de NetInsight,
primero tiene que identificar el nivel de rendimiento que considere aceptable. El
rendimiento que puede alcanzar una configuración de hardware específica variará
en función de lo siguiente: la frecuencia con que actualice los perfiles de
NetInsight, el número de perfiles que utilice y el tiempo máximo que necesite para
que se lleve a cabo la actualización de un perfil.
Por ejemplo, suponga que el modelo empresarial que utiliza exige que sólo
actualice los perfiles de NetInsight una vez a la semana cada fin de semana para
su visualización el lunes siguiente. En tal caso, puede definir un rendimiento
aceptable que sea "lo suficientemente rápido para procesar los archivos de registro
de una semana en un plazo de 48 horas". Si actualiza los perfiles de NetInsight
cada noche para su visualización el día siguiente, el rendimiento aceptable podría
ser "lo suficientemente rápido para procesar los registros de un día en menos de 7
horas". Puesto que NetInsight procesa un solo lote grande de datos de registro con
mayor eficacia que varios lotes más pequeños, serán necesarios menos recursos de
hardware para alcanzar el primer objetivo.
Si utiliza un perfil individual de NetInsight para el sitio web, necesitará hardware
que pueda leer, procesar y generar informes a partir de los datos de los archivos
de registros en el periodo de tiempo que exija la empresa. Si el sitio web se divide
en áreas distintas y desea un perfil de NetInsight para cada una, necesitará
hardware que pueda leer, procesar y generar informes para cada área, de nuevo en
el periodo de tiempo de destino. Aunque esos perfiles más pequeños pueden
tardar menos en actualizarse, es probable que el tiempo acumulado para
procesarlos supere el tiempo para procesar un perfil individual más grande.
© Copyright IBM Corp. 1996, 2011
3
4
IBM Unica NetInsight: Guía de ajuste
Capítulo 3. Optimización de la base de datos SQL Server
SQL Server se entrega con unas cuantas opciones de ajuste de la configuración
nativas. No obstante, puede ajustar la base de datos SQL Server para obtener el
rendimiento óptimo supervisando periódicamente los contadores de rendimiento
claves de Windows. La supervisión de los contadores de rendimiento de Windows
también ayuda a panificar posibles actualizaciones del sistema a media que el
conjunto de datos aumente. Debe supervisar el rendimiento durante las
actualizaciones y la generación de informes.
Para obtener más información detallada sobre la supervisión del rendimiento de
SQL Server, consulte la documentación de SQL Server. Para obtener información
adicional de ajuste de base de datos, consulte la información de consulta técnica de
ajuste de rendimiento disponible en Microsoft Press.
Contadores de los que se debe realizar el seguimiento
Utilice el Monitor de rendimiento de Windows para supervisar el rendimiento de
la base de datos SQL Server de NetInsight. Se debe realizar el seguimiento de los
contadores siguientes:
Objeto de rendimiento
Contador
Procesador
% de tiempo de procesador
Sistema
Longitud de la cola del procesador
SQL Server: gestor de almacenamientos
intermedios
Frecuencia de aciertos de caché del búfer
SQL Server: bloqueos personales
Promedio de tiempo de espera de bloqueos
temporales
Lecturas de página/s
Esperas de bloqueos temporales/s
SQL Server: bloqueos
Tiempo promedio de espera
SQL Server: gestor de memoria
Concesiones de memoria pendientes
Disco lógico (para configuraciones no RAID) Longitud promedio de la cola de disco
Promedio de segundos de disco/lectura
Promedio de segundos de disco/escritura
Disco físico (para configuraciones RAID)*
Longitud promedio de la cola de disco
Promedio de segundos de disco/lectura
Promedio de segundos de disco/escritura
Memoria
Páginas/s
* Si utiliza un sistema operativo que no sea Windows Server 2003 para supervisar
los contadores de discos físicos, primero debe habilitar el servicio DiskPerf. Hágalo
ejecutando diskperf –y desde una línea de mandatos o habilitando el servicio en el
Panel de control. Es posible que tenga que reiniciar el servidor de la base de datos
después de habilitar el servicio. Es posible que tenga que hacer más cambios de
© Copyright IBM Corp. 1996, 2011
5
configuración en el sistema para minimizar la sobrecarga adicional a causa de la
ejecución de DiskPerf. Una vez realizada la supervisión, inhabilite DiskPerf.
Valores de contador deseados
A continuación se proporciona una lista de cada contador que se debe supervisar,
agrupados por objeto. La descripción de cada contador incluye los valores y las
modificaciones deseados que puede realizar en el sistema para que resulte más
fácil alcanzar los valores deseados.
Contadores de objetos de procesador
% de tiempo de procesador
% de tiempo de procesador realiza el seguimiento del porcentaje de tiempo
durante el que el procesador ejecuta una hebra no desocupada. Microsoft
recomienda que la utilización media de CPU no supere el 90 por ciento. Si lo hace,
considere la posibilidad de añadir procesadores adicionales o de actualizar los
procesadores existentes.
Contadores de objetos del sistema
Longitud de la cola del procesador
Longitud de la cola del procesador realiza el seguimiento del número de hebras en
la cola del procesador. Si la longitud de cola es superior a 5 por cada procesador,
es posible que experimente un cuello de botella de CPU. Puede resolver el cuello
de botella añadiendo más procesadores, añadiendo procesadores más rápidos o
reduciendo la carga en el sistema. La adición de índices también puede ayudar.
Contadores de gestor de almacenamientos intermedios de
SQL Server
Frecuencia de aciertos de caché del búfer
Frecuencia de aciertos de caché del búfer realiza el seguimiento del porcentaje de
páginas solicitadas por SQL Server que ya estaban en memoria. Si este valor está
por debajo del 60%, considere la posibilidad de asignar más memoria a SQL
Server, añadiendo memoria física al sistema o reasignando la memoria existente.
Lecturas de página/s
Lecturas de página/s realiza el seguimiento del número de solicitudes de E/S de
páginas de datos físicos por segundo. Este parámetro debe mantener un valor bajo.
Si es alto de forma continuada, aumente la memoria física del sistema o la
cantidad de memoria asignada a SQL Server.
Contadores de objetos de mecanismos de cierre
Promedio de tiempo de espera de bloqueos temporales
Promedio de tiempo de espera de bloqueos temporales realiza el seguimiento de la
duración media (en milisegundos) de una espera por parte de una hebra de SQL
Server en un bloqueo temporal. Si este valor y el valor de Esperas de bloqueos
temporales/s son altos, ello sugiere que el sistema tiene un porcentaje de aciertos
de memoria caché bajo que está forzando al sistema a realizar más E/S físicas.
Para impedir este posible cuello de botella de E/S, aumente la cantidad de
6
IBM Unica NetInsight: Guía de ajuste
memoria física en el sistema. Si no es posible, considere la posibilidad de aumentar
el ancho de banda de E/S del sistema.
Esperas de bloqueos temporales/s
Esperas de bloqueos temporales/s realiza el seguimiento del número de veces por
segundo que una hebra tiene que esperar en un bloqueo temporal. Si este valor y
el valor del contador Promedio de tiempo de espera de bloqueos temporales son
altos, ello sugiere que el sistema tiene un porcentaje de aciertos de memoria caché
bajo que está forzando al sistema a realizar más E/S físicas. Para impedir este
posible cuello de botella de E/S, aumente la cantidad de memoria física en el
sistema. Si no es posible, considere la posibilidad de aumentar el ancho de banda
de E/S del sistema.
Contadores de objetos de bloqueos
Tiempo promedio de espera
Tiempo promedio de espera realiza el seguimiento del promedio de tiempo (en
milisegundos) durante el que una hebra está a la espera de un bloqueo. Aunque
puede que no sea posible eliminar el tiempo de espera de bloqueo, este valor debe
ser lo más bajo posible. Asegúrese de que no haya transacciones no relacionadas
con NetInsight que accedan a o bloqueen la base de datos de NetInsight durante
una actualización. Considere la posibilidad de dedicar el servidor a la base de
datos de NetInsight.
Contadores de objetos de gestor
Concesiones de memoria pendientes
Concesiones de memoria pendientes realiza el seguimiento de la cantidad de
usuarios o procesos que están a la espera de que se conceda memoria. Si este valor
es alto, aumente la memoria asignada a SQL Server o añada más memoria física al
sistema.
Contadores de objetos (lógicos o físicos) de disco
Longitud promedio de la cola de disco
Longitud promedio de la cola de disco notifica el promedio de lecturas y escrituras
en cola para un disco. Si el sistema utiliza una configuración de disco RAID con
varios discos, este total hace referencia a todas las unidades contenidas en el
volumen. Este valor debe mantenerse en 2 o menos para cada disco. Si el valor es
superior a 2, el sistema está limitado por E/S. Para eliminar el cuello de botella,
intente añadir discos físicos o aumentar la velocidad de los discos (quizá
cambiando la configuración RAID).
Promedio de segundos de disco/lectura
Promedio de segundos de disco/lectura realiza el seguimiento del promedio de
segundos que se tarda en realizar una lectura de datos del disco. Un valor entre 11
y 15 milisegundos es aceptable. Si el valor es superior a 15, el sistema está limitado
por E/S. Para eliminar el cuello de botella, intente añadir discos físicos o cambiar
la configuración RAID.
Capítulo 3. Optimización de la base de datos SQL Server
7
Promedio de segundos de disco/escritura
Promedio de segundos de disco/escritura realiza el seguimiento del promedio de
segundos que se tarda en realizar una escritura de datos en el disco. Este valor
debe ser inferior a 12 milisegundos. Si el almacenamiento en memoria caché de
escritura está habilitado en el disco, es probable que este valor sea inferior o igual
a 4 milisegundos por escritura. Si este valor es alto, aumente el número de discos
del sistema o utilice unidades de disco duro más rápidas.
Contadores de objetos de memoria
Páginas/s
Páginas/s realiza el seguimiento de la velocidad a la que se leen o se escriben las
páginas en el disco para resolver errores de paginación intensiva. Si este valor es
superior a 0 de forma continuada, el sistema está paginando de forma intensiva
(haciendo intercambios con el disco duro). Para impedir la paginación intensiva,
añada más memoria al sistema o elimine otras aplicaciones que resten memoria a
SQL Server. Si ha establecido manualmente la memoria máxima del sistema, es
posible que también tenga que reducir el valor de memoria máxima del servidor,
reducir el valor de memoria mínima del servidor o cambiar el tamaño fijo de
memoria.
8
IBM Unica NetInsight: Guía de ajuste
Capítulo 4. Optimización de la base de datos DB2
En este apartado se describen los pasos para instalar y configurar la base de datos
para un rendimiento óptimo de NetInsight. Los pasos se indican en el orden
general en el que se pueden implementar. Las instalaciones de base de datos
existentes se pueden volver a configurar para mejorar el rendimiento; tenga en
cuenta, sin embargo, que las instalaciones mal configuradas pueden contener
cuellos de botella que la reconfiguración no puede superar.
Resumen de las recomendaciones de configuración
En este apartado se resume la configuración de base de datos recomendada para
un rendimiento óptimo de NetInsight. En los apartados siguientes se describen
otras consideraciones de configuración y de fondo.
Valor
Recomendación
Ubicación de instalación del sistema de
archivo de base de datos
Instale los archivos del sistema de base de
datos en la misma unidad física que el
sistema operativo, siempre que haya
suficiente RAM disponible para impedir
cualquier paginación del sistema.
Juego de caracteres de la base de datos
Los juegos de caracteres ISO8859-1 (para
sistemas UNIX), IBM-1252 (para sistemas
Windows) y UTF-8 se pueden utilizar con
total seguridad como juego de caracteres de
la base de datos. Consulte la guía de
instalación de NetInsight para obtener más
información. Si piensa utilizar otro juego de
caracteres, póngase en contacto con el
soporte técnico de IBM.
Registros de transacciones
Cree, como mínimo, 4 registros de
transacciones de al menos 500 MB cada uno.
Tamaño de página
Utilice o cree un espacio de tabla con un
tamaño de página de 8 KB, como mínimo.
Tamaño de agrupación de almacenamiento
intermedio
Aumente el tamaño de agrupación de
almacenamiento intermedio de la instancia
de base de datos para utilizar el máximo de
RAM posible. Deje suficiente RAM
disponible para que otras aplicaciones del
sistema (por ejemplo, NetInsight) puedan
ejecutarse sin paginación. Asigne tanta
memoria como sea posible a la agrupación
de almacenamiento intermedio asociada con
el espacio de tabla donde se almacenen las
tablas y los índices de NetInsight.
© Copyright IBM Corp. 1996, 2011
9
10
Valor
Recomendación
INTRA_PARALLEL
Habilite el paralelismo intrapartición
siempre que haya varios procesadores
disponibles para utilizarlos con la instancia
de NetInsightDB2. Si la instancia de
NetInsight es un nodo miembro de una
instancia particionada, asegúrese de que
haya varios procesadores disponibles para
que los utilice cada partición de base de
datos antes de habilitar el paralelismo
intrapartición.
MAX_QUERYDEGREE
Establezca este parámetro en un múltiple del
número de procesadores disponibles en el
sistema DB2. En el caso de servidores de
NetInsight dedicados con mucha memoria y
subsistemas de discos de alta velocidad, es
posible que se necesite un valor de hasta
cuatro veces el número de procesadores
disponibles para sacar todo el partido del
hardware disponible.
DFT_DEGREE
Establezca este parámetro en un múltiple del
número de procesadores disponibles en el
sistema DB2. En el caso de servidores de
NetInsight dedicados con mucha memoria y
subsistemas de discos de alta velocidad, es
posible que se necesite un valor de hasta
cuatro veces el número de procesadores
disponibles para sacar todo el partido del
hardware disponible.
Espacio de tabla TEMP
Coloque los archivos de datos contenidos en
el espacio de datos TEMP en un disco que
contenga sólo los archivos de datos o en un
disco que contenga sólo los archivos de
datos para los espacios de tabla UNDO y
TEMP. Asegúrese de que, como grupo, todos
los archivos de datos del espacio de tabla
TEMP proporcionen, como mínimo, 2 GB de
espacio temporal. Habilite la opción de
extensión automática tanto para el espacio
de tabla DATA como para sus archivos de
datos. Coloque los archivos de datos en el
espacio de tabla TEMP en una unidad lógica
compuesta por dos o más discos en bandas.
SHEAPTHRES
Establezca este valor en 200 MB, como
mínimo. Es posible que se deba incrementar
este número en el caso de conjuntos de
datos más grandes. Si la base de datos está
configurada para paralelismo intrapartición,
asegúrese de que el sistema tenga suficiente
RAM para proporcionar esta cantidad de
memoria, junto con la memoria necesaria
para agrupaciones de almacenamiento
intermedio y ordenaciones privadas sin que
el sistema realice ninguna paginación.
IBM Unica NetInsight: Guía de ajuste
Valor
Recomendación
SORTHEAP
Si el paralelismo intrapartición está
inhabilitado, establezca el valor de
SORTHEAP en 100 MB, como mínimo. (Este
parámetro se especifica en páginas de 4 KB;
1 MB = 256 páginas). Es posible que se deba
incrementar este valor en el caso de
conjuntos de datos más grandes. Si el
paralelismo intrapartición está habilitado,
establezca el valor de SORTHEAP en el
valor de SHEAPTHRES dividido por el
grado máximo de paralelismo de la
instancia. En todos los casos, asegúrese de
que el sistema tenga suficiente RAM para
proporcionar la cantidad especificada de
memoria, además de la necesaria para
agrupaciones de almacenamiento intermedio
sin que el sistema realice ninguna
paginación.
NUM_IOSERVERS
Establezca este parámetro en un valor igual
al número de discos físicos en los que se
almacenen datos.
Espacio de tabla TEMP
Utilice un espacio de tabla TEMP con
System Managed Space (SMS). Coloque
todos los contenedores definidos para el
espacio de tabla TEMP en un disco
dedicado. Asegúrese de que, como grupo,
los contenedores del espacio de tabla TEMP
proporcionen, como mínimo, 2 GB de
espacio temporal disponible.
Para obtener el mejor rendimiento, coloque
los contenedores que contienen el espacio de
tabla TEMP en una unidad lógica compuesta
por dos o más discos en bandas.
Espacio de tabla DATA
Utilice un espacio de tabla DATA con
Database Managed Storage (DMS). Coloque
los contenedores que contengan el espacio
de tabla DATA en los discos que contengan
sólo esos contenedores. Asegúrese de que,
como grupo, los contenedores definidos para
el espacio de tabla DATA proporcionen
suficiente espacio para almacenar la
cantidad de datos que espera procesar.
Para obtener el mejor rendimiento, coloque
los archivos de datos en el espacio de tabla
DATA en una unidad lógica compuesta por
dos o más discos en bandas.
Recomendaciones detalladas de configuración
Instalar los archivos del sistema de base de datos en una
ubicación adecuada
Siempre que sea posible, instale los archivos del sistema de base de datos
(ejecutables, herramientas, etc.) en un disco independiente del sistema operativo y
Capítulo 4. Optimización de la base de datos DB2
11
los archivos de datos. Si es necesario, los archivos del sistema de base de datos se
pueden instalar con total seguridad en el mismo disco el sistema operativo siempre
que:
1. El área de intercambio del sistema esté en el mismo disco físico que el sistema
operativo y el sistema tenga suficiente memoria para garantizar que no tenga
lugar ninguna paginación o que ésta se produzca en contadas ocasiones; o bien
2. El área de intercambio del sistema esté en un disco físico independiente
Recomendación: instale los archivos del sistema de base de datos en la misma
unidad física que el sistema operativo, siempre que haya suficiente RAM
disponible para impedir cualquier paginación del sistema.
Seleccionar el juego de caracteres de base de datos
adecuado
Los juegos de caracteres de base de datos y cliente que se utilizan al crear la base
de datos DB2 pueden tener un impacto considerable en NetInsight.
v Los juegos de caracteres ISO8859-1 (para los sistemas UNIX), IBM-1252 (para los
sistemas Windows) y UTF-8 se pueden utilizar con total seguridad. Consulte la
guía de instalación de NetInsight para obtener más información.
v Si está considerando la posibilidad de utilizar un juego de caracteres que no sea
-1 o IBM-1252, póngase en contacto con el servicio de soporte técnico de IBM.
Configurar los registros de transacciones
Para obtener el rendimiento óptimo del proceso de importación de datos de
NetInsight, configure los registros de transacciones de DB2 para proporcionar la
productividad máxima con un número mínimo de conmutadores entre archivos de
registro (los conmutadores aparecen cuando se llena un archivo de registro).
Normalmente esto se consigue manteniendo un mínimo de cuatro registros de
transacciones de 500 MB cada uno.
Para reducir los tiempos de acceso al disco, mantenga los registros de transacciones
en un disco que proporcione acceso rápido y fiable. En el caso de conjunto de
datos más pequeños, por lo general se acepta el disco que contiene el sistema de
DB2; en el caso de conjuntos de datos que se espera que superen 3 GB de
almacenamiento de base de datos al mes, o para obtener el rendimiento de base de
datos óptimo, coloque los registros de transacciones en una unidad lógica dedicada
que conste de dos o más discos en bandas.
Recomendación: cree, como mínimo, 4 registros de transacciones de al menos 500
MB cada uno.
Seleccionar el tamaño de página adecuado
El tamaño de página del espacio de tabla de los datos de NetInsight tiene un
impacto importante en el uso de la memoria y en el rendimiento de E/S. El
espacio de tabla de usuario predeterminado de DB2 tiene una tamaño de página
de 4 KB. Un tamaño de página mayor permite que DB2 lea y escriba más filas de
datos en una sola operación de E/S. Esto puede mejorar el rendimiento para
NetInsight, lo cual exige a menudo que DB2 lea y escriba muchas filas de sus
tablas de datos. También permite que DB2 cree archivos de datos más grandes, lo
que significa que se pueden almacenar más datos en un solo espacio de tabla (el
tamaño máximo de un archivo de datos es una función del tamaño de página). Un
tamaño de página de al menos 8 KB (o, preferiblemente, 16 o 32 KB), proporciona
un rendimiento y una escalabilidad de base de datos mejorados.
12
IBM Unica NetInsight: Guía de ajuste
Los privilegios del usuario de NetInsight para la creación de tablas determinan
dónde se crean las tablas de NetInsight. En general, es preferible limitar dichos
privilegios a un solo espacio de tabla.
Si va a crear una base de datos nueva para utilizarla con NetInsight, sustituya el
espacio de tabla de usuario predeterminado por uno que tenga un tamaño de
página superior al predeterminado. Además asegúrese de que el usuario de
NetInsight tenga privilegios para crear tablas sólo en ese espacio de tabla.
Recomendación: utilice o cree un espacio de tabla con un tamaño de página de al
menos 8 KB.
Aumentar el tamaño de la agrupación de almacenamiento
intermedio
El tamaño de la agrupación de almacenamiento intermedio determina la cantidad
de memoria que DB2 puede utilizar para almacenar en la memoria caché las tablas
y las consultas, almacenar las modificaciones de datos no confirmados, etc. El
tamaño de la agrupación de almacenamiento intermedio por lo general no permite
que DB2 utilice toda la RAM disponible en el sistema. Por lo tanto, se debe
verificar y quizá incrementar para garantizar que se establezca en un tamaño
correcto.
El tamaño de una agrupación de almacenamiento intermedio se especifica en
términos de páginas del tamaño determinado. Para determinar el tamaño
adecuado de una agrupación de almacenamiento intermedio, determine la cantidad
de RAM (en bytes) que desea que DB2 utilice para esa agrupación y, a
continuación, divida ese valor entre el tamaño de página de dicha agrupación. Por
ejemplo, si desea que DB2 asigne 100 MB de memoria a una agrupación de
almacenamiento intermedio de 8 KB, especifique un tamaño de 12800 páginas.
Recomendación: aumente el tamaño de agrupación de almacenamiento intermedio
de la instancia de base de datos para utilizar el máximo de RAM posible. Deje
suficiente RAM disponible para que otras aplicaciones del sistema (por ejemplo,
NetInsight) puedan ejecutarse sin paginación. Asigne tanta memoria como sea
posible a la agrupación de almacenamiento intermedio asociada con el espacio de
tabla donde se almacenen las tablas y los índices de NetInsight.
Habilitar el paralelismo intrapartición
La ejecución de consultas en paralelo permite que DB2 saque el máximo partido
del hardware disponible del sistema y puede mejorar el rendimiento de NetInsight
hasta un 400 por ciento. De manera predeterminada, DB2 no está configurado para
ejecutar consultas en paralelo (debido a la posibilidad que la instancia de base de
datos esté particionada, en cuyo caso el paralelismo se alcanza de forma
automática). En el caso de instancia no particionada, para permitir que DB2 ejecute
consultas paralelas, debe habilitar el paralelismo intrapartición.
El comportamiento de la ejecución en paralelo se controla mediante los parámetros
INTRA_PARALLEL, MAX_QUERYDEGREE y DFT_DEGREE especificados en la
configuración de gestor de bases de datos DB2.
INTRA_PARALLEL
El parámetro INTRA_PARALLEL habilita o inhabilita el paralelismo intrapartición.
Para habilitar el paralelismo intrapartición para una instancia de base de datos,
establezca el parámetro INTRA_PARALELL en YES.
Capítulo 4. Optimización de la base de datos DB2
13
Recomendación: habilite el paralelismo intrapartición siempre que haya varios
procesadores disponibles para utilizarlos con la instancia de NetInsightDB2. Si la
instancia de NetInsight es un nodo miembro de una instancia particionada,
asegúrese de que haya varios procesadores disponibles para que los utilice cada
partición de base de datos antes de habilitar el paralelismo intrapartición.
MAX_QUERYDEGREE
El parámetro MAX_QUERYDEGREE controla el grado máximo de paralelismo que
se puede utilizar para cualquier consola en una base de datos de una instancia
determinada. Su valor predeterminado, ANY, indica a DB2 que determine
automáticamente el grado máximo de paralelismo que se debe utilizar para todas
las consultas. Con este valor predeterminado, el grado máximo de paralelismo
seleccionado por DB2 no superará el número de procesadores en el sistema DB2;
para algunos servidores de base de datos, si se especifica un grado máximo de
paralelismo superior al número de procesadores disponibles, es posible que se
tenga que dejar que DB2 saque todo el partido de los recursos del sistema.
Nota: Nota: el valor de MAX_QUERYDEGREE no tiene ningún efecto, si
INTRA_PARALLEL tiene el valor NO.
Recomendación: establezca el parámetro MAX_QUERYDEGREE en un múltiple del
número de procesadores disponibles en el sistema DB2. En el caso de servidores de
NetInsight dedicados con mucha memoria y subsistemas de discos de alta
velocidad, es posible que se necesite un valor de hasta cuatro veces el número de
procesadores disponibles para sacar todo el partido del hardware disponible.
DFT_DEGREE
El parámetro DFT_DEGREE controla el grado predeterminado de paralelismo que
se debe utilizar para todas las consultas ejecutadas en la base de datos
determinada. Su valor predeterminado, ANY, indica a DB2 que determine
automáticamente el grado máximo de paralelismo que se debe utilizar para todas
las consultas. Con este valor predeterminado, el grado máximo de paralelismo
seleccionado por DB2 no superará el número de procesadores en el sistema DB2;
para algunos servidores de base de datos, si se especifica un grado máximo de
paralelismo superior al número de procesadores disponibles, es posible que se
tenga que dejar que DB2 saque todo el partido de los recursos del sistema.
Nota: Nota: el valor de este parámetro no tiene efecto si el valor de
INTRA_PARALLEL es NO.
Recomendación: establezca DFT_DEGREE en un múltiple del número de
procesadores disponibles en el sistema DB2. En el caso de servidores de NetInsight
dedicados con mucha memoria y subsistemas de discos de alta velocidad, es
posible que se necesite un valor de hasta cuatro veces el número de procesadores
disponibles para sacar todo el partido del hardware disponible.
Configurar las áreas de trabajo en memoria
Debido a la naturaleza agregada de los informes de NetInsight, la base de datos
lleva a cabo numerosas ordenaciones y uniones durante el proceso de generación
de informes de NetInsight. Un dimensionamiento adecuado de las áreas de trabajo
que utiliza la base de datos para llevar a cabo dichas ordenaciones y uniones tiene
un impacto significativo en el rendimiento de NetInsight.
14
IBM Unica NetInsight: Guía de ajuste
El dimensionamiento de las áreas de trabajo se controla mediante los parámetros
SHEAPTHRES y SORTHEAP especificados en la configuración de gestor de bases
de datos DB2.
SHEAPTHRES
El parámetro SHEAPTHRES especifica la memoria máxima que DB2 puede utilizar
en una instancia para las operaciones de ordenación realizadas en serie
(ordenaciones privadas). También especifica la memoria utilizada al llevar a cabo
ordenaciones en paralelo (ordenaciones compartidas). Un valor de 200 MB para
SHEAPTHRES o más general reduce el tiempo de generación de informes de
NetInsight como mínimo un 400 por ciento. En el caso de bases de datos más
grandes configuradas para utilizar el paralelismo intrapartición, puede que se
necesario un valor de 500 MB o superior para SHEAPTHRES.
Recomendación: establezca el valor de SHEAPTHRES en 200 MB, como mínimo.
(Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible
que se deba incrementar este número en el caso de conjuntos de datos más
grandes. Si la base de datos está configurada para paralelismo intrapartición,
asegúrese de que el sistema tenga suficiente RAM para proporcionar esta cantidad
de memoria, junto con la memoria necesaria para agrupaciones de almacenamiento
intermedio y ordenaciones privadas sin que el sistema realice ninguna paginación.
SORTHEAP
El parámetro SORTHEAP especifica la memoria que DB2 utiliza para las
operaciones de ordenación efectuadas en serie. También especifica la memoria
utilizada por cada subagente paralelo al llevar a cabo ordenaciones en paralelo. En
el caso de bases de datos no configuradas para paralelismo intrapartición, un valor
de 100 MB o más general para SORTHEAP reduce el tiempo de generación de
informes de NetInsight como mínimo un 400 por ciento.
En el caso de bases de datos que utilicen el paralelismo intrapartición, es necesario
un valor de SORTHEAP más bajo para dar cabida a los subagentes paralelos que se
utilizan para efectuar consultas en paralelo. Cada subagente paralelo utiliza la
cantidad de memoria especificada para SORTHEAP. Para determinar el valor de
SORTHEAP máximo aceptable cuando el paralelismo intrapartición está habilitado,
divida el valor de SHEAPTHRES entre el grado máximo de paralelismo para la
instancia.
Recomendación: si el paralelismo intrapartición está inhabilitado, establezca el valor
de SORTHEAP en 100 MB, como mínimo. (Este parámetro se especifica en páginas
de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este valor en el
caso de conjuntos de datos más grandes. Si el paralelismo intrapartición está
habilitado, establezca el valor de SORTHEAP en el valor de SHEAPTHRES dividido
por el grado máximo de paralelismo de la instancia. En todos los casos, asegúrese
de que el sistema tenga suficiente RAM para proporcionar la cantidad especificada
de memoria, además de la necesaria para agrupaciones de almacenamiento
intermedio sin que el sistema realice ninguna paginación.
Aumentar el número de servidores de E/S de DB2
Cuando DB2 recupera datos del disco, añade una solicitud de E/S de disco a la
cola de E/S de disco. La solicitud de E/S se elimina, a continuación, de la cola y la
procesan los servidores de E/S de DB2. El número de servidores de E/S que DB2
utiliza se controla mediante el valor NUM_IOSERVERS. En el caso de algunos
Capítulo 4. Optimización de la base de datos DB2
15
sistemas, el número predeterminado de servidores de E/S no puede sacar todo el
partido del ancho de banda de E/S que proporciona el subsistema de disco
subyacente; para obtener el rendimiento óptimo, puede que sea necesario aumentar
el número de servidores de E/S.
Recomendación: establezca un valor para NUM_IOSERVERS que sea igual al
número de discos físicos en los que se almacenan los datos.
Configurar espacios de tabla
Una base de datos Oracle exige, como mínimo, cuatro espacios de tabla para
funcionar correctamente. Estos espacios de tabla son:
1. El espacio de tabla SYSTEM
2. Un espacio de tabla UNDO
3. Un espacio de tabla TEMP utilizado para operaciones como operaciones (no
necesariamente del tipo TEMPORARY)
4. Un espacio de tablas DATA para contener los datos importados y generados
por NetInsight
Nota: Los nombres de espacio de tabla que se utilizan en esta información
identifican sus finalidades respectivas. Puede que no coincidan o que no tengan
que coincidir con los nombres que se utilizan realmente en la base de datos.
Los espacios de tabla SYSTEM, UNDO y TEMP se crean automáticamente con al
base de datos. Lo más probable es que el espacio de tabla DATA se tenga que crear
manualmente. La configuración de estos espacios de tabla tiene un impacto
significativo en el rendimiento. Para obtener el rendimiento óptimo, deben
configurarse de la manera siguiente:
Gestión de espacio de extensiones y segmentos
Los espacios de tabla gestionados localmente proporcionan una gestión del espacio
y un rendimiento mejor que los espacios de tabla gestionados por diccionario y se
deben utilizar siempre que sea posible. Los espacios de tabla cuyo espacio de
segmentos se gestione automáticamente mediante Oracle proporcionan un mejor
rendimiento que los que se gestionan manualmente con listas libres. La práctica
recomendada es utilizar la gestión de espacio de segmentos automática siempre
que sea posible.
Configuración del espacio de tabla SYSTEM
Los archivos de datos contenidos en el espacio de tabla SYSTEM se crean durante
la instalación y suelen residir en el disco que contiene el sistema de base de datos
Oracle. No es necesario reubicar estos archivos de datos.
Configuración del espacio de tabla UNDO
Ubicación
Los archivos de datos contenidos en el espacio de tabla UNDO se crean por lo
general durante la instalación, pero se pueden modificar después de la instalación.
Los archivos de datos que contienen este espacio de tabla deben ubicarse en un
disco físico independiente de los archivos de datos en los espacios de tabla
SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco
físico que el espacio de tabla TEMP. Si es necesario, elimine los archivos de datos
16
IBM Unica NetInsight: Guía de ajuste
contenidos en este espacio de tabla que están en discos no reservados para los
espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la
ubicación adecuada.
Tamaño
Los archivos de datos que contienen el espacio de tabla UNDO deben ser lo
suficientemente grandes para dar cabida a los datos insertados por NetInsight
durante cada parte del proceso de importación de datos, así como las
modificaciones efectuadas durante el proceso de generación de informes. De
media, 2 GB de espacio para deshacer son suficientes; no obstante, es posible que
los usuarios con archivos de registro necesiten cantidades más grandes de espacio
para deshacer. Al permitir un número moderado de extensiones en cada archivo de
datos contenido en el espacio de tabla UNDO, este espacio de tabla podrá
aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y
elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos
si se alcanza su tamaño máximo.
Recomendación: coloque los archivos de datos contenidos en el espacio de datos
UNDO en un disco que contenga sólo los archivos de datos o en un disco que
contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP.
Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla
UNDO proporcionen, como mínimo, 2 GB de espacio para deshacer. Habilite la
opción de extensión automática para los archivos de datos en el espacio de tabla
UNDO.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla UNDO en una unidad lógica compuesta por dos o más discos en bandas.
Configuración del espacio de tabla TEMP
Ubicación
Los archivos de datos contenidos en el espacio de tabla TEMP se crean por lo
general durante la instalación, pero se pueden modificar también después de la
instalación. Los archivos de datos que contienen este espacio de tabla deben
ubicarse en un disco físico independiente de los archivos de datos en los espacios
de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo
disco físico que el espacio de tabla UNDO. Si es necesario, elimine los archivos de
datos contenidos en este espacio de tabla que están en discos no reservados para
los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la
ubicación adecuada.
Tamaño
Los archivos de datos que contienen el espacio de datos TEMP deben ser lo
suficientemente grandes para dar cabida a ordenaciones grandes realizadas por la
base de datos durante la creación de índices o la generación de informes. De
media, 2 GB de espacio temporal para deshacer son suficientes; no obstante, es
posible que los usuarios con bases de datos más grandes necesiten cantidades más
grandes de espacio temporal. Al permitir un número moderado de extensiones en
cada archivo de datos contenido en el espacio de tabla TEMP, este espacio de tabla
podrá aumentar si es necesario. Esto impide errores durante la ejecución de
NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los
archivos de datos si se alcanza su tamaño máximo.
Capítulo 4. Optimización de la base de datos DB2
17
Recomendación: coloque los archivos de datos contenidos en el espacio de datos
TEMP en un disco que contenga sólo los archivos de datos o en un disco que
contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP.
Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla
TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción
de extensión automática tanto para el espacio de tabla DATA como para sus
archivos de datos.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas.
Configuración del espacio de tabla DATA
Ubicación
Los datos de NetInsight se almacenan en el espacio de tabla DATA. Este espacio de
tabla tendrá que crearse manualmente, por lo general, después de que se instale la
base de datos y de que se cree la instancia de base de datos. Los archivos de datos
que contienen este espacio de tabla deben crearse en un disco físico independiente
de los archivos de dato de los espacios de tabla SYSTEM, TEMP y UNDO. Si es
necesario, reubique los archivos de datos contenidos en este espacio de tabla que
estén en discos no reservados para los espacios de tabla DATA en la ubicación
adecuada.
Tamaño
Los archivos de datos que contengan el espacio de tabla de datos deben ser lo
suficientemente grandes para dar cabida a los datos insertados en la base de datos
y generados por ésta durante el proceso de actualización de NetInsight.
Al permitir un número ilimitado de extensiones en cada archivo de datos
contenido en el espacio de tabla DATA, este espacio de tabla puede aumentar
según sea necesario. Esto impide errores durante la ejecución de NetInsight y
elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos
si se alcanza su tamaño máximo.
Recomendación: coloque los archivos de datos contenidos en el espacio de tabla
DATA en un disco que contenga sólo esos archivos de datos. Asegúrese de que,
como grupo, los archivos de datos del espacio de tabla DATA proporcionen el
espacio suficiente para almacenar los datos que se espera procesar. Habilite la
opción de extensión automática tanto para el espacio de tabla DATA como para sus
archivos de datos.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla DATA en una unidad lógica compuesta por dos o más discos en bandas.
18
IBM Unica NetInsight: Guía de ajuste
Capítulo 5. Optimización de la base de datos Oracle
En este apartado se describen los pasos para instalar y configurar la base de datos
para un rendimiento óptimo de NetInsight. Los pasos se indican en el orden
general en el que se pueden implementar. Las instalaciones de base de datos
existentes se pueden volver a configurar para mejorar el rendimiento; tenga en
cuenta, sin embargo, que las instalaciones mal configuradas pueden contener
cuellos de botella que la reconfiguración no puede superar.
Resumen de las recomendaciones de configuración
En este apartado se resume la configuración de base de datos recomendada para
un rendimiento óptimo de NetInsight. En los apartados siguientes se describen
otras consideraciones de configuración y de fondo.
Valor
Recomendación
Ubicación de instalación del sistema de
archivo de base de datos
Instale los archivos del sistema de base de
datos en la misma unidad física que el
sistema operativo, siempre que haya
suficiente RAM disponible para impedir
cualquier paginación del sistema.
Juego de caracteres de la base de datos
Utilice WE8ISO8859P1 o UTF-8 como juego
de caracteres tanto de la base de datos como
del cliente. Antes de utilizar UTF-8, consulte
la guía de instalación de NetInsight para
obtener información importante.
DB_BLOCK-SIZE
Utilice o cree una base de datos con un
valor de DB_BLOCK_SIZE de, como
mínimo, 8192 o, preferiblemente, 16386.
Registros para rehacer
Cree, como mínimo, cuatro grupos de
registros para rehacer de al menos 100 MB
cada uno.
Tamaño de la memoria caché de
almacenamiento intermedio
Aumente el tamaño de la memoria caché de
almacenamiento intermedio de la instancia
de base de datos para utilizar el máximo de
RAM posible. Deje suficiente RAM
disponible para que otras aplicaciones del
sistema (por ejemplo, NetInsight) puedan
ejecutarse sin paginación.
© Copyright IBM Corp. 1996, 2011
19
20
Valor
Recomendación
Áreas de trabajo en memoria
Utilice el dimensionamiento de área de
trabajo automático. En el caso de conjuntos
de datos que exijan menos de 5 GB de
almacenamiento de base de datos, con 100
MB de memoria disponible hay suficiente.
En el caso de conjuntos de datos que
superen los 5 GB, el valor mínimo necesario
para un rendimiento aceptable es de 300 MB
o más. La cantidad de memoria disponible
para las áreas de trabajo se puede aumentar
con total seguridad, siempre que haya
memoria del sistema disponible. Si la
máquina tiene suficiente memoria, considere
la posibilidad de dedicar al menos 1 GB, o
preferiblemente 2 GB, a
PGA_AGGREGATE_TARGET.
Espacio de tabla UNDO
Coloque los archivos de datos contenidos en
el espacio de datos UNDO en un disco que
contenga sólo los archivos de datos o en un
disco que contenga sólo los archivos de
datos para los espacios de tabla UNDO y
TEMP. Asegúrese de que, como grupo, todos
los archivos de datos del espacio de tabla
UNDO proporcionen, como mínimo, 2 GB
de espacio para deshacer. Habilite la opción
de extensión automática para los archivos de
datos en el espacio de tabla UNDO. Coloque
los archivos de datos en el espacio de tabla
UNDO en una unidad lógica compuesta por
dos o más discos en bandas.
Espacio de tabla TEMP
Coloque los archivos de datos contenidos en
el espacio de datos TEMP en un disco que
contenga sólo los archivos de datos o en un
disco que contenga sólo los archivos de
datos para los espacios de tabla UNDO y
TEMP. Asegúrese de que, como grupo, todos
los archivos de datos del espacio de tabla
TEMP proporcionen, como mínimo, 2 GB de
espacio temporal. Habilite la opción de
extensión automática tanto para el espacio
de tabla DATA como para sus archivos de
datos. Coloque los archivos de datos en el
espacio de tabla TEMP en una unidad lógica
compuesta por dos o más discos en bandas.
IBM Unica NetInsight: Guía de ajuste
Valor
Recomendación
Espacio de tabla DATA
Coloque los archivos de datos contenidos en
el espacio de tabla DATA en un disco que
contenga sólo esos archivos de datos.
Asegúrese de que, como grupo, los archivos
de datos del espacio de tabla DATA
proporcionen el espacio suficiente para
almacenar los datos que se espera procesar.
Habilite la opción de extensión automática
tanto para el espacio de tabla DATA como
para sus archivos de datos. Para obtener el
mejor rendimiento, coloque los archivos de
datos en el espacio de tabla DATA en una
unidad lógica compuesta por dos o más
discos en bandas.
Particionamiento de tabla y de índice
La utilización de tablas e índices
particionados puede mejorar
significativamente la velocidad, la
escalabilidad y la capacidad de
mantenimiento. Para obtener más
información, póngase en contacto con el
departamento de ventas de IBM.
Recomendaciones detalladas de configuración
Instalar los archivos del sistema de base de datos en una
ubicación adecuada
Siempre que sea posible, instale los archivos del sistema de base de datos
(ejecutables, herramientas, etc.) en un disco independiente del sistema operativo y
los archivos de datos. Si es necesario, los archivos del sistema de base de datos se
pueden instalar con total seguridad en el mismo disco el sistema operativo siempre
que:
1. El área de intercambio del sistema esté en el mismo disco físico que el sistema
operativo y el sistema tenga suficiente memoria para garantizar que no tenga
lugar ninguna paginación o que ésta se produzca en contadas ocasiones; o bien
2. El área de intercambio del sistema esté en un disco físico independiente
Recomendación: instale los archivos del sistema de base de datos en la misma
unidad física que el sistema operativo, siempre que haya suficiente RAM
disponible para impedir cualquier paginación del sistema.
Seleccionar el juego de caracteres de base de datos
adecuado
Los juegos de caracteres de base de datos y cliente que se utilizan al crear la base
de datos Oracle pueden tener un impacto considerable en NetInsight.
v Puede utilizar los juegos de caracteres WE8ISO8859P1 y UTF-8 con total
seguridad para la base de datos y el cliente. Antes de utilizar UTF-8, consulte la
guía de instalación de NetInsight para obtener información importante.
v No se debe utilizar jamás el juego de caracteres US7ASCII.
v Si está considerando la posibilidad de utilizar un juego de caracteres que no sea
WE8ISO8859P1 o UTF-8, póngase en contacto con el servicio de soporte técnico
de IBM.
Capítulo 5. Optimización de la base de datos Oracle
21
Seleccionar el valor de DB_BLOCK_SIZE adecuado
El valor de DB_BLOCK_SIZE implica varios aspectos importantes: desde el uso de
memoria hasta el rendimiento de E/S. Este valor se establece cuando se crea la
base de datos y no se puede modificar más adelante. El valor predeterminado es
específico del sistema operativo, pero, por lo general, es muy pequeño (2048 o
4096, por ejemplo). Un valor de DB_BLOCK_SIZE más grande permite que Oracle
lea y escriba más filas de datos en una sola operación de E/S. Ello puede mejorar
el rendimiento de NetInsight, que a menudo exige que Oracle lea y escriba grandes
cantidades de filas de sus tablas de datos. También permite que Oracle cree
archivos de datos más grandes, lo que significa que se pueden almacenar más
datos en una sola base de datos (el tamaño máximo de un archivo de datos es
específico del sistema operativo). Si desea procesar y almacenar una cantidad de
datos muy elevada, puede que necesite un valor de DB_BLOCK_SIZE grande.
Al crear una base de datos nueva para utilizarla con NetInsight, para proporciona
un rendimiento y una escalabilidad de base de datos adecuados, especifique un
valor de DB_BLOCK_SIZE de, como mínimo, 8192, aunque es muy recomendable
utilizar 16384. Si se intenta utilizar NetInsight con una base de datos existente que
tenga un tamaño de bloque pequeño, es posible que el rendimiento disminuya. En
esa situación, cree una base de datos nueva con un valor de DB_BLOCK_SIZE más
grande o cree un espacio de tabla nuevo con un tamaño de bloque más grande.
Nota: Oracle permite crear espacios de tabla y memorias caché de almacenamiento
intermedio con tamaños de bloque distintos del tamaño de bloque predeterminado
de la instancia. Aunque un espacio de tabla y una memoria caché de
almacenamiento intermedio con un tamaño de bloque grande permitirán que
NetInsight funcione con mayor eficacia en bases de datos con un tamaño de
bloque predeterminado pequeño, ello supone, por lo general, que NetInSight
disponga de menos memoria. Por lo tanto, no se recomienda.
Recomendación: utilice o cree una base de datos con el valor para
DB_BLOCK_SIZE de al menos 8192 o, preferiblemente, 16384.
Configurar los registros de rehacer
Para obtener el rendimiento óptimo del proceso de importación de datos de
NetInsight, configure los registros de rehacer de Oracle para proporcionar la
productividad máxima con un número mínimo de conmutadores entre archivos de
registro (los conmutadores aparecen cuando se llena un archivo de registro).
Normalmente esto se consigue manteniendo un mínimo de cuatro grupos de
registros de rehacer, cada uno con archivos de registro de 100 MB como mínimo.
Para obtener conjuntos de datos más grandes, puede que se necesiten registros de
rehacer de 1 GB o más. Para reducir los tiempos de acceso al disco, mantenga los
registros de rehacer en un disco que proporcione acceso rápido y fiable (para
conjuntos de datos más pequeños, normalmente basta con el disco que contiene el
sistema Oracle).
Recomendación: cree, como mínimo, cuatro grupos de registros de rehacer de al
menos 100 MB cada uno.
Aumentar el tamaño de memoria caché de almacenamiento
intermedio
El tamaño de la memoria caché de almacenamiento intermedio de Oracle
determina la cantidad de memoria que Oracle puede utilizar para almacenar en
memoria caché tablas y consultas, almacenar modificaciones de datos no
22
IBM Unica NetInsight: Guía de ajuste
modificados, etc. El tamaño de memoria caché de almacenamiento intermedio no
permite, por lo general, que Oracle utilice toda la RAM disponible en el sistema.
Por lo tanto, se debe verificar y quizá incrementar para garantizar que se
establezca en un tamaño correcto.
El tamaño de la memoria caché de almacenamiento intermedio para bloques
estándar se determina mediante el valor DB_CACHE_SIZE para cada instancia de
base de datos. El valor DB_CACHE_SIZE se mide en kilobytes, megabytes o
gigabytes; por ejemplo DB_CACHE_SIZE=10M especifica una memoria caché de
almacenamiento intermedio de 10 megabytes. Establezca este valor en la cantidad
de RAM que desee que Oracle utilice para la memoria caché de almacenamiento
intermedio estándar.
Recomendación: aumente el tamaño de la memoria caché de almacenamiento
intermedio de la instancia de base de datos para utilizar el máximo de RAM
posible. Deje suficiente RAM disponible para que otras aplicaciones del sistema
(por ejemplo, NetInsight) puedan ejecutarse sin paginación.
Configurar las áreas de trabajo en memoria
Debido a la naturaleza agregada de los informes de NetInsight, la base de datos
lleva a cabo numerosas ordenaciones y uniones durante el proceso de generación
de informes de NetInsight. Un dimensionamiento adecuado de las áreas de trabajo
que utiliza la base de datos para llevar a cabo dichas ordenaciones y uniones tiene
un impacto significativo en el rendimiento de NetInsight.
El dimensionamiento de las áreas de trabajo se controla mediante los parámetros
SHEAPTHRES y SORTHEAP especificados en la configuración de gestor de bases
de datos DB2.
SHEAPTHRES
El parámetro SHEAPTHRES especifica la memoria máxima que DB2 puede utilizar
en una instancia para las operaciones de ordenación realizadas en serie
(ordenaciones privadas). También especifica la memoria utilizada al llevar a cabo
ordenaciones en paralelo (ordenaciones compartidas). Un valor de 200 MB para
SHEAPTHRES o más general reduce el tiempo de generación de informes de
NetInsight como mínimo un 400 por ciento. En el caso de bases de datos más
grandes configuradas para utilizar el paralelismo intrapartición, puede que se
necesario un valor de 500 MB o superior para SHEAPTHRES.
Recomendación: establezca el valor de SHEAPTHRES en 200 MB, como mínimo.
(Este parámetro se especifica en páginas de 4 KB; 1 MB = 256 páginas). Es posible
que se deba incrementar este número en el caso de conjuntos de datos más
grandes. Si la base de datos está configurada para paralelismo intrapartición,
asegúrese de que el sistema tenga suficiente RAM para proporcionar esta cantidad
de memoria, junto con la memoria necesaria para agrupaciones de almacenamiento
intermedio y ordenaciones privadas sin que el sistema realice ninguna paginación.
SORTHEAP
El parámetro SORTHEAP especifica la memoria que DB2 utiliza para las
operaciones de ordenación efectuadas en serie. También especifica la memoria
utilizada por cada subagente paralelo al llevar a cabo ordenaciones en paralelo. En
el caso de bases de datos no configuradas para paralelismo intrapartición, un valor
Capítulo 5. Optimización de la base de datos Oracle
23
de 100 MB o más general para SORTHEAP reduce el tiempo de generación de
informes de NetInsight como mínimo un 400 por ciento.
En el caso de bases de datos que utilicen el paralelismo intrapartición, es necesario
un valor de SORTHEAP más bajo para dar cabida a los subagentes paralelos que se
utilizan para efectuar consultas en paralelo. Cada subagente paralelo utiliza la
cantidad de memoria especificada para SORTHEAP. Para determinar el valor de
SORTHEAP máximo aceptable cuando el paralelismo intrapartición está habilitado,
divida el valor de SHEAPTHRES entre el grado máximo de paralelismo para la
instancia.
Recomendación: si el paralelismo intrapartición está inhabilitado, establezca el valor
de SORTHEAP en 100 MB, como mínimo. (Este parámetro se especifica en páginas
de 4 KB; 1 MB = 256 páginas). Es posible que se deba incrementar este valor en el
caso de conjuntos de datos más grandes. Si el paralelismo intrapartición está
habilitado, establezca el valor de SORTHEAP en el valor de SHEAPTHRES dividido
por el grado máximo de paralelismo de la instancia. En todos los casos, asegúrese
de que el sistema tenga suficiente RAM para proporcionar la cantidad especificada
de memoria, además de la necesaria para agrupaciones de almacenamiento
intermedio sin que el sistema realice ninguna paginación.
Configurar espacios de tabla
Una base de datos Oracle exige, como mínimo, cuatro espacios de tabla para
funcionar correctamente. Estos espacios de tabla son:
1. El espacio de tabla SYSTEM
2. Un espacio de tabla UNDO
3. Un espacio de tabla TEMP utilizado para operaciones como operaciones (no
necesariamente del tipo TEMPORARY)
4. Un espacio de tablas DATA para contener los datos importados y generados
por NetInsight
Nota: Los nombres de espacio de tabla que se utilizan en esta información
identifican sus finalidades respectivas. Puede que no coincidan o que no tengan
que coincidir con los nombres que se utilizan realmente en la base de datos.
Los espacios de tabla SYSTEM, UNDO y TEMP se crean automáticamente con al
base de datos. Lo más probable es que el espacio de tabla DATA se tenga que crear
manualmente. La configuración de estos espacios de tabla tiene un impacto
significativo en el rendimiento. Para obtener el rendimiento óptimo, deben
configurarse de la manera siguiente:
Gestión de espacio de extensiones y segmentos
Los espacios de tabla gestionados localmente proporcionan una gestión del espacio
y un rendimiento mejor que los espacios de tabla gestionados por diccionario y se
deben utilizar siempre que sea posible. Los espacios de tabla cuyo espacio de
segmentos se gestione automáticamente mediante Oracle proporcionan un mejor
rendimiento que los que se gestionan manualmente con listas libres. La práctica
recomendada es utilizar la gestión de espacio de segmentos automática siempre
que sea posible.
24
IBM Unica NetInsight: Guía de ajuste
Configuración del espacio de tabla SYSTEM
Los archivos de datos contenidos en el espacio de tabla SYSTEM se crean durante
la instalación y suelen residir en el disco que contiene el sistema de base de datos
Oracle. No es necesario reubicar estos archivos de datos.
Configuración del espacio de tabla UNDO
Ubicación
Los archivos de datos contenidos en el espacio de tabla UNDO se crean por lo
general durante la instalación, pero se pueden modificar después de la instalación.
Los archivos de datos que contienen este espacio de tabla deben ubicarse en un
disco físico independiente de los archivos de datos en los espacios de tabla
SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo disco
físico que el espacio de tabla TEMP. Si es necesario, elimine los archivos de datos
contenidos en este espacio de tabla que están en discos no reservados para los
espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la
ubicación adecuada.
Tamaño
Los archivos de datos que contienen el espacio de tabla UNDO deben ser lo
suficientemente grandes para dar cabida a los datos insertados por NetInsight
durante cada parte del proceso de importación de datos, así como las
modificaciones efectuadas durante el proceso de generación de informes. De
media, 2 GB de espacio para deshacer son suficientes; no obstante, es posible que
los usuarios con archivos de registro necesiten cantidades más grandes de espacio
para deshacer. Al permitir un número moderado de extensiones en cada archivo de
datos contenido en el espacio de tabla UNDO, este espacio de tabla podrá
aumentar si es necesario. Esto impide errores durante la ejecución de NetInsight y
elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos
si se alcanza su tamaño máximo.
Recomendación: coloque los archivos de datos contenidos en el espacio de datos
UNDO en un disco que contenga sólo los archivos de datos o en un disco que
contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP.
Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla
UNDO proporcionen, como mínimo, 2 GB de espacio para deshacer. Habilite la
opción de extensión automática para los archivos de datos en el espacio de tabla
UNDO.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla UNDO en una unidad lógica compuesta por dos o más discos en bandas.
Configuración del espacio de tabla TEMP
Ubicación
Los archivos de datos contenidos en el espacio de tabla TEMP se crean por lo
general durante la instalación, pero se pueden modificar también después de la
instalación. Los archivos de datos que contienen este espacio de tabla deben
ubicarse en un disco físico independiente de los archivos de datos en los espacios
de tabla SYSTEM y DATA, pero se pueden ubicar con total seguridad en el mismo
disco físico que el espacio de tabla UNDO. Si es necesario, elimine los archivos de
Capítulo 5. Optimización de la base de datos Oracle
25
datos contenidos en este espacio de tabla que están en discos no reservados para
los espacios de tabla UNDO y/o TEMP y cree archivos de datos nuevos en la
ubicación adecuada.
Tamaño
Los archivos de datos que contienen el espacio de datos TEMP deben ser lo
suficientemente grandes para dar cabida a ordenaciones grandes realizadas por la
base de datos durante la creación de índices o la generación de informes. De
media, 2 GB de espacio temporal para deshacer son suficientes; no obstante, es
posible que los usuarios con bases de datos más grandes necesiten cantidades más
grandes de espacio temporal. Al permitir un número moderado de extensiones en
cada archivo de datos contenido en el espacio de tabla TEMP, este espacio de tabla
podrá aumentar si es necesario. Esto impide errores durante la ejecución de
NetInsight y elimina la necesidad de aumentar manualmente el tamaño de los
archivos de datos si se alcanza su tamaño máximo.
Recomendación: coloque los archivos de datos contenidos en el espacio de datos
TEMP en un disco que contenga sólo los archivos de datos o en un disco que
contenga sólo los archivos de datos para los espacios de tabla UNDO y TEMP.
Asegúrese de que, como grupo, todos los archivos de datos del espacio de tabla
TEMP proporcionen, como mínimo, 2 GB de espacio temporal. Habilite la opción
de extensión automática tanto para el espacio de tabla DATA como para sus
archivos de datos.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla TEMP en una unidad lógica compuesta por dos o más discos en bandas.
Configuración del espacio de tabla DATA
Ubicación
Los datos de NetInsight se almacenan en el espacio de tabla DATA. Este espacio de
tabla tendrá que crearse manualmente, por lo general, después de que se instale la
base de datos y de que se cree la instancia de base de datos. Los archivos de datos
que contienen este espacio de tabla deben crearse en un disco físico independiente
de los archivos de dato de los espacios de tabla SYSTEM, TEMP y UNDO. Si es
necesario, reubique los archivos de datos contenidos en este espacio de tabla que
estén en discos no reservados para los espacios de tabla DATA en la ubicación
adecuada.
Tamaño
Los archivos de datos que contengan el espacio de tabla de datos deben ser lo
suficientemente grandes para dar cabida a los datos insertados en la base de datos
y generados por ésta durante el proceso de actualización de NetInsight.
Al permitir un número ilimitado de extensiones en cada archivo de datos
contenido en el espacio de tabla DATA, este espacio de tabla puede aumentar
según sea necesario. Esto impide errores durante la ejecución de NetInsight y
elimina la necesidad de aumentar manualmente el tamaño de los archivos de datos
si se alcanza su tamaño máximo.
Recomendación: coloque los archivos de datos contenidos en el espacio de tabla
DATA en un disco que contenga sólo esos archivos de datos. Asegúrese de que,
como grupo, los archivos de datos del espacio de tabla DATA proporcionen el
26
IBM Unica NetInsight: Guía de ajuste
espacio suficiente para almacenar los datos que se espera procesar. Habilite la
opción de extensión automática tanto para el espacio de tabla DATA como para sus
archivos de datos.
Para obtener el mejor rendimiento: coloque los archivos de datos en el espacio de
tabla DATA en una unidad lógica compuesta por dos o más discos en bandas.
Configurar particionamiento de tablas e índices
NetInsight permite utilizar tablas e índices particionados en una base de datos
Oracle. La utilización de tablas e índices particionados puede mejorar
significativamente la velocidad, la escalabilidad y la capacidad de mantenimiento.
El equipo de servicios profesionales de IBM puede configurar el particionamiento
de la base de datos. Para obtener más información, póngase en contacto con el
departamento de ventas de IBM.
Capítulo 5. Optimización de la base de datos Oracle
27
28
IBM Unica NetInsight: Guía de ajuste
Capítulo 6. Valores de configuración del rendimiento
En este apartado se describen los elementos del archivo NetTracker.cfg que se
utilizan para ajustar el rendimiento de NetInsight. El archivo NetTracker.cfg se
encuentra en el directorio del programa NetInsight.
Elemento <database>
El elemento database contiene valores que afectan al modo como se importan los
datos de registro en NetInsight. Los elementos hijo que tienen más impacto en el
proceso de importación son <checkpointmegs> y <maxcache>.
También puede añadir opcionalmente varias secciones si el concepto tiene que
desglosarse.
<checkpointmegs>
El elemento <checkpointmegs> controla la cantidad de datos en bruto no
comprimidos que se procesan en cada punto de comprobación de importación. En
cada punto de comprobación, todos los datos estructurados en sesiones hasta ese
punto concreto se almacenan en la base de datos. Ello incluye la conciliación de ID,
donde los valores de cadena de varias columnas se concilian con sus tablas de ID
respectivas para determinar si existen o si se debe crear un ID nuevo.
Cada punto de comprobación genera sobrecarga, que se puede gestionar mediante
<checkpointmegs>. Por ejemplo, de manera predeterminada <checkpointmegs> se
establece en 125 MB. Si estuviera procesando 1250 MB del total de datos de
registro en bruto sin comprimir, se necesitarían 10 puntos de comprobación, los
cuales todos generan sobrecarga de memoria, para completar la fase de
importación. Si se detectara un problema durante la importación, NetInsight podría
reanudar el proceso de importación en cualquiera de los 10 puntos de
comprobación.
A la inversa, si cambiara <checkpointmegs> a 500 MB, sólo necesitaría tres puntos
de comprobación frente a los diez y un 70% menos de sobrecarga de memoria. Sin
embargo, habría menos puntos de comprobación a partir de los cuales se podría
reanudar si se detectara un problema.
El proceso de la aplicación retiene en memoria los datos que se procesan antes de
almacenarse en un punto de comprobación. Si va a utilizar la aplicación NetInsight
de 32 bits, esto limitará el tamaño hasta el que puede aumentar el valor de
<checkpointmegs>. En una aplicación de 64 bits, sólo tiene la restricción de la
cantidad de memoria del sistema.
No existe ninguna correlación entre la cantidad de datos en bruto almacenados en
la base de datos y la cantidad almacenada en memoria para cada punto de
comprobación. Esto se debe a que la cantidad de datos almacenados depende de
las visitas abiertas entre puntos de comprobación, la cardinalidad de visitantes y
los ID y las cadenas correspondientes que se van a almacenar. El valor óptimo en
el que establecer <checkpointmegs> depende de los datos del archivo de registro.
Como sugerencia, establezca <checkpointmegs> en 1000 MB para las aplicaciones
NetInsight de 32 bits y 6000 MB para las aplicaciones de 64 bits. Si no está seguro
del valor óptimo para el entorno, consulte a los servicios profesionales de IBM.
© Copyright IBM Corp. 1996, 2011
29
<maxcache>
Utilice los atributos del elemento <maxcache> para optimizar el rendimiento de los
procesos de importación. Esos atributos dependen de los datos de los archivos de
registro; afectan a análisis de los datos y a la eficacia de los algoritmos según los
datos que se vayan a procesar. Configure estos atributos para dar cabida al perfil
más grande.
Para determinar cómo establecer estos atributos, examine el archivo cache.log de
cada uno de los perfiles que se haya ejecutado. Esos archivos se encuentran en
cada uno de los directorios <directorio_programa_NetInsight>/data/
<nombre_perfil>. Como práctica recomendada, examine en el archivo cache.log si
se han ejecutado los datos representativos de una carga por encima de la media.
El elemento <maxcache> incluye los atributos siguientes:
visits: este atributo controla la cantidad de memoria asignada para gestionar las
memorias caché de visitas abiertas. Este valor se utiliza en todos los perfiles. Si las
visitas abiertas superan el número que se indica en este atributo, el
desbordamiento se escribirá en el disco. Para optimizar el rendimiento, este
número siempre tiene que ser superior al número total de visitas abiertas de una
ejecución de importación. No obstante, si este valor es demasiado elemento, es
posible que la asignación de memoria y la conciliación no sean eficaces.
Compruebe el archivo cache.log para ver el número total de visitas abiertas en una
ejecución de importación. Por ejemplo:
Visits:
Number of Reads : 2657915
Number of Hits : 2657915 (100%)
Number of Writes: 2631909
Max Open
: 9972
Current Open : 4550
Lo ideal es que el valor del atributo visits sea superior al número Max Open de
cualquier perfil concreto.
views: no se utiliza actualmente, pero se debe mantener en el valor 0.
errors: no se utiliza actualmente, pero se debe mantener en el valor 0.
ids: este atributo controla la cantidad de memoria interna asignada para cada una
de las memorias caché de ID que se utilizan durante el análisis de los archivos de
registro. A medida que se analizan los archivos de registro, los ID y sus cadenas se
almacenan en grupos de memoria internos. Si hay demasiados elementos y no hay
suficientes grupos, el análisis y la conciliación se ralentizarán porque será más
difícil encontrar elementos en los grupos.
Examine el archivo cache.log para determinar si el valor del atributo ids debe
aumentarse. El ejemplo siguiente muestra la información incluida para cada una de
las estructuras de ID:
PageBrkdwnID:
Number of Reads : 610802
Number of Hits : 419371 (69%)
Number of Writes: 63170
Max Buckets
: 15013
Buckets Used : 9552
Max Items/Bucket: 6
Avg Items/Bucket: 1.58
Max Cached
: 33774
30
IBM Unica NetInsight: Guía de ajuste
Number
Values
Number
Number
of Saves : 4
Stored : 61068 (15267 per save)
of ID Selects: 0
of ID Selects Found: 0
Avg Items/Bucket indica el promedio de elementos que se van a almacenar. Lo
ideal es que este número sea inferior a 1,50. Si tiene estructuras de ID donde Avg
Items/Bucket es más de 2,00 o 3,00, considere la posibilidad de aumentar el valor
del atributo ids.
Nota importante: este valor asigna grupos para cada estructura de ID, por lo que al
aumentar este número se incrementará el uso de la memoria para todas las
estructuras de ID.
maxmb: este atributo representa la cantidad máxima de memoria (en MB) que se
puede almacenar antes de establecer puntos de comprobación en los datos. Como
práctica recomendada, no permita que el sistema llegue a este umbral. Aumente
este número para asegurarse de que no fuerce un punto de comprobación de esta
manera. Como regla general, establezca este valor en el valor del elemento
<checkpointmegs>.
Elemento <ntdbbases>
El elemento <ntdbbases> contiene los valores para los archivos SQLite que se
utilizan durante el proceso de importación. Recomendamos que tanto rowcache.dat
como ovcache.dat se modifiquen y se coloquen en memoria para todas las
instalaciones de 64 bits. A continuación se indica un ejemplo de lo que se debe
añadir al archivo NetTracker.cfg:
<ntdbbases>
<ntdbbase key="rowcache.dat" page="8192" cache="8192" synchmode="0"
temp_store="2" retrys="150" readuncommitted="true" journalmode="OFF"
path=":memory:"/>
<ntdbbase key="ovcache.dat" page="8192" cache="8192" synchmode="0"
temp_store="2" retrys="150" readuncommitted="true" journalmode="OFF"
path=":memory:"/>
</ntdbbases>
Cada base de datos tiene los atributos siguientes. Para obtener más información
detallada en cuanto a estos atributos, visite http://www.sqlite.org/pragma.html.
key: nombre del archivo SQLite.
page: tamaño de la página de la base de datos. El tamaño de la página debe ser de
un potencia de dos más que o igual a 512 y menos que o igual a 32768.
cache: es el número máximo de páginas de disco de base de datos de SQLite que
SQLite mantendrá en memoria de forma simultánea para el archivo concreto.
syncmode: esta atributo indica la modalidad que SQLite utilizará para
sincronizarse con el sistema operativo cuando escriba datos. Los tres valores son
FULL (2), NORMAL (1) y OFF (0). Recomendamos trabajar en modalidad OFF ya
que el rendimiento supera con creces el coste que supone trabajar en las otras dos
modalidades. Además, puesto que los archivos SQLite sólo se utilizan durante el
proceso de punto de comprobación/importación, podemos recuperar por completo
los datos si los archivos se corrompen.
Capítulo 6. Valores de configuración del rendimiento
31
temp_store: este atributo determina donde realiza el archivo SQLite sus
operaciones temporales. Los valores son DEFAULT (0), FILE (1) y MEMORY (2).
De manera predeterminada, temp_store se establece en 0, pero, según la cantidad
de memoria que haya asignado al sistema, es posible que desee establecerlo en 2.
Si se establece en 0 (el valor predeterminado), la ubicación de las operaciones
temporales quedará determinada por el valor SQLITE_TEMP_STORE. Para obtener
más información, consulte la documentación de SQLite.
retrys: número de reintentos si el archivo SQLite está bloqueado.
readuncommitted: el nivel de aislamiento predeterminado para SQLite es
SERIALIZABLE. Cualquier proceso o hebra puede realizar un aislamiento de
READ UNCOMMITTED, pero se seguirá utilizando SERIALIZABLE salvo entre
conexiones que compartan una página común y una memoria caché de esquemas.
Recomendamos establecer este atributo en true.
journalmode: el atributo journalmode establece la modalidad de ajuste del archivo
SQLite. Puesto que estos archivos tienen una vida útil breve y puesto que la
aplicación ya tiene la prestación de retrotracción incorporada en el proceso, no es
necesaria la retrotracción. Por este motivo, este valor siempre debe establecerse en
OFF.
path: vía de acceso del archivo SQLite. Este atributo permite mover estos archivos
a otros controladores o discos o, incluso, colocarlos en memoria. Para obtener un
rendimiento óptimo, es muy recomendable colocar estos archivos en memoria. El
valor para el almacenamiento en memoria es “:memory:”.
<maxqueuedlines>
El elemento <maxqueuedlines> tiene dos atributos que ayudan a controlar las
colas de proceso de los archivos de registro. Estos valores corresponden a cada
servidor de archivos de registro configurado para un perfil determinado. El
incremento o la reducción de dichos valores afectará a las hebras del servidor de
archivos. Estos atributos son importantes para gestionar la cantidad total de
memoria utilizada para un proceso de importación determinado. Cuantos más
servidores de archivos de registro estén configurados para un perfil, más afectarán
estos valores a la cantidad total de memoria utilizada.
parser: el atributo parser representa el número total de líneas de archivo de
registro que cada hebra de analizador (de cada servidor de archivos de registro
definido) pondrá en su cola antes de difundirlas a la cola clasificadora. El valor
predeterminado es 2000.
sorter: el atributo sorter representa el número total de líneas de registro que se
colocan en la cola clasificadora y que posteriormente el proceso de importación de
NetInsight procesa. El valor predeterminado es 10000.
Los valores óptimos para estos atributos dependen de la potencia de proceso de
E/S y CPU del servidor de aplicaciones de NetInsight en el sistema. La cola
analizadora lee las líneas de registro del archivo de registro y las coloca en
memoria. La cola clasificador toma las líneas de registro de la cola analizadora, las
ordena y las almacena en memoria. El proceso de importación de NetInsight busca
la siguiente línea de registro válida que se deba procesar entre todas las colas
clasificadoras de todos los servidores de archivos de registro definidos en el perfil.
Una vez que se elimina una línea de registro de la cola clasificadora, la cola
32
IBM Unica NetInsight: Guía de ajuste
clasificadora obtiene la línea siguiente de la cola analizadora. Estas os colas hacen
referencia directa a un archivo de registro determinado para cada servidor de
archivos de registro.
Los valores predeterminados de estos atributos son en cierto modo arbitrarios. En
función del número de servidores de archivos de registro del entorno, es posible
que tenga que cambiar estos valores para gestionar el uso de memoria del proceso
de importación. Lo ideal es que la cola analizadora procese tan rápido como la cola
clasificadora para que ninguna de ellas deba esperar a que la otra avance. En la
práctica, es difícil lograrlo cuando se tienen registros de varios tamaños y varios
servidores de archivos de registro. Se recomienda probar estos valores para
encontrar la configuración óptima para el entorno.
Capítulo 6. Valores de configuración del rendimiento
33
34
IBM Unica NetInsight: Guía de ajuste
Capítulo 7. Ajuste avanzado NetInsight
El objetivo de este capítulo es ayudarle a resolver problemas de rendimiento en la
instalación de NetInsight. Antes de seguir las pautas que se señalan en este
capítulo, consulte el capítulo sobre ajuste específico de la base de datos que utilice.
Si va a utilizar una base de datos Oracle con una configuración de hardware
sólida, quizá deba considerar la posibilidad de utilizar las funciones de
particionamiento de Oracle. Póngase en contacto con un representante de ventas de
IBM para obtener información sobre el particionamiento en una base de datos
Oracle para NetInsight.
Elegir los métodos y los objetivos del ajuste
Antes de ajustar el sistema, debe evaluar, en primer lugar, el rendimiento actual y
establecer los objetivos de mejora del rendimiento. En concreto, para facilitar el
ajusta primero debe:
1. Determinar si se están produciendo problemas de rendimiento durante las
actualización o cuando los usuarios amplían los detalles de los informes.
2. Determine cuánto se tarda en realizar las actualizaciones y las ampliaciones de
los detalles.
3. Decida el tiempo aceptable para su empresa. Por ejemplo, ¿cuánto tiempo
puede tardar una actualización para dejar aún el tiempo suficiente para ejecutar
copias de seguridad antes de que los usuarios tengan que acceder a los
informes de NetInsight? ¿Cuánto tiempo están dispuestos a esperar los
usuarios cuando amplíen los detalles de un informe personalizado?
Tras responder estas preguntas, podrá centrar mejor sus esfuerzos de ajuste. Se
recomienda supervisar las actualizaciones durante varios días y consultar a los
usuarios finales de NetInsight antes de realizar cualquier ajuste.
Utilizar un entorno de prueba para el ajuste
El ajuste va mucho más rápido si se puede recrear un problema a un escala más
pequeña en un entorno de prueba. Los entornos de prueba habituales utilizan la
configuración de perfiles actual, un conjunto de registros de servidor web más
pequeño y un servidor de bases de datos que pueda ser menos potente del que se
utiliza en producción. Tenga en cuenta que los cambios en NetInsight pueden
adaptarse a tales situaciones, pero que puede que los cambios en los valores del
servidor de bases de datos no lo hagan.
Problemas de rendimiento ocasionales y continuados
Este documento se centra en la mejora de los problemas continuados de
rendimiento. Los problemas ocasionales están relacionados generalmente a uno de
los factores siguientes:
v La adición o modificación de perfiles de visitante o informes personalizados
v La modificación de determinadas opciones de NetInsight
v Un proceso externo que compita con NetInsight o la base de datos por los
recursos (por ejemplo, una copia de seguridad completa mensual de un
servidor)
© Copyright IBM Corp. 1996, 2011
35
Asegúrese de que los usuarios con acceso para cambiar opciones o añadir informes
personalizados comprendan las implicaciones de rendimiento de los cambios que
realizan. Restrinja el acceso, según sea necesario, a las opciones y a los informes
personalizados a los usuarios en los que confíe para efectuar dichos cambios.
Aislar problemas de rendimiento durante las actualizaciones
Si tiene problemas de rendimiento relacionados con los tiempos de actualización, el
primer paso es determinar qué parte del proceso de NetInsight es lenta. El proceso
de actualización de NetInsight se puede dividir en cuatro fases independientes:
v
v
v
v
Importación de datos nuevos
Indexación y mantenimiento de tablas
Creación de perfiles de visitante
Generación de informes
Para determinar cuál de los siguientes es el origen más probable de los problemas
de rendimiento, tiene que saber el tiempo que dedica NetInsight a cada uno.
Determinar el tiempo de importación de datos
1. Inicie una actualización desde una línea de mandatos. Tome nota de la hora a
la que se inicia.
2. Una vez que haya finalizado la actualización, compruebe la fecha de la última
modificación del archivo cache.log.
3. Compruebe la indicación de fecha y hora en el archivo cache.log para
determinar cuando ha finalizado la importación de datos. Compárela con la
hora a la que se ha iniciado la actualización para determinar cuánto ha tardado
la importación.
4. Si la importación tarda demasiado, consulte el apartado “Problemas de
rendimiento durante la importación” en la página 37.
Determinar el tiempo de indexación y mantenimiento de tablas
1. Ejecute un rastreo de base de datos de una actualización siguiendo las
instrucciones de la documentación de la base de datos.
2. Examine el archivo de rastreo para determinar cuánto tiempo añaden los
mandatos de análisis de tablas a la actualización.
3. 3. Examine si en el archivo de rastreo hay mandatos que se utilicen para crear
índices. Identifique los que puedan añadir un tiempo considerable a la
actualización. (NetInsight puede descartar y volver a crear ciertos índices
durante una actualización para evitar la sobrecarga del mantenimiento de
índices durante las inserciones de datos nuevos en una tabla. La restauración
de índices en las tablas de NetInsight al concluir la importación puede exigir
mucho tiempo con determinados conjuntos de datos).
4. Si determina que la indexación y el mantenimiento de tablas añaden una
cantidad de tiempo considerable a la actualización, consulte el apartado
“Problemas de rendimiento durante la indexación y el mantenimiento de las
tablas” en la página 47.
Determinar el tiempo de actualización de perfiles de visitante
Las actualizaciones en la tabla de perfiles que forman parte de la creación de
perfiles de visitante pueden consumir grandes cantidades de tiempo en función del
36
IBM Unica NetInsight: Guía de ajuste
número de perfiles de visitantes configurados y de la cantidad de datos de registro
nuevos importados durante una actualización.
Para determinar el tiempo de actualización de perfiles de visitante:
1. Ejecute un rastreo de base de datos de una actualización siguiendo las
instrucciones de la documentación de la base de datos.
2. Compruebe si en el archivo de rastreo hay inserciones en la tabla de perfiles.
3. Identifique las consultas que tarden cantidades considerables de tiempo en
ejecutarse.
4. Al examinar el archivo de rastreo se muestran los problemas con esas consultas,
consulte el apartado “Problemas de rendimiento durante la creación de perfiles
de visitante” en la página 47.
Determinar el tiempo de generación de informes
El archivo rpttimes.log se genera durante la generación de informes. Contiene
información sobre el tiempo que tardan en generarse cada resumen y los
componentes en que se basa.
Para determinar el tiempo de generación de informes:
1. Compruebe la hora de la última modificación del archivo rpttimes.log.
2. Compare la hora de la última modificación del archivo rpttimes.log con la hora
registrada al principio del archivo. Esto indica aproximadamente cuánto ha
tardado el último informe generado.
3. Si la generación de informes tarda demasiado, consulte el apartado “Problemas
de rendimiento durante la generación de informes” en la página 49.
Problemas de rendimiento durante la importación
Los problemas de rendimiento durante la importación se clasifican en general en
estas categorías:
v “Esperas de red”
v “Problemas con la memoria caché y los ID de la memoria” en la página 39
v “Cuellos de botella del subsistema de disco de la base de datos durante las
confirmaciones” en la página 44
v “Cuellos de botella de recursos del sistema de NetInsight” en la página 45
Esperas de red
Dos opciones de NetInsight que tienen el potencial de incorporar importantes
retrasos durante la importación:
v “Resolución de nombres de host”
v “Resolución de títulos de página” en la página 38
Resolución de nombres de host
Cuando la opción de NetInsight Resolver nombres de hosts está habilitada,
NetInsight realiza una búsqueda DNS inversa de direcciones IP en los registros
para determinar sus nombres de host asociados. Aunque NetInsight almacena en la
memoria caché la información de direcciones IP resueltas, la espera puede ser
considerable, incluso con un servidor DNS bien configurado.
Puede reducir el retraso realizando una de las acciones siguientes:
v “Inhabilitar la opción Resolver nombres de hosts” en la página 38
Capítulo 7. Ajuste avanzado NetInsight
37
v “Resolver nombres de host a través del servidor web”
Inhabilitar la opción Resolver nombres de hosts:
Si no se necesitan nombres de host en los informes, puede inhabilitar la resolución
de nombres de host.
1. Abra un perfil cuya importación sea lenta.
2. Pulse la pestaña Opciones. Se abrirá la página General.
3. Desmarque la casilla de verificación Resolver nombres de hosts.
Resolver nombres de host a través del servidor web: Si se necesitan nombres de
host para los informes, pero su resolución mediante NetInsight notifica un retraso
inaceptable, puede resolverlos, en cambio, mediante el servidor web. El servidor
web escribirá los nombres de host resueltos directamente en los archivos de
registro. Tras haber cambiado los valores del servidor web y haber procesado el
último archivo de registro que contenga nombres de host sin resolver, puede
desactivar la resolución de nombres de host en el perfil de NetInsight.
Nota: Al hacer que el servidor web resuelva los nombres de host, se genera cierta
sobrecarga en el servidor web, ya que se resolverá un nombre de host para cada
entrada en el archivo de registro.
Configurar Apache para resolver nombres de host:
1. Abra el archivo httpd.conf del servidor en un editor de texto.
2. Busque la línea HostnameLookups Off.
3. 3. Cambie el valor de la línea de Off a On.
Configurar iPlanet para resolver nombres de host:
1. Abra el archivo magnus.conf del servidor en un editor de texto.
2. Busque la línea DNS off.
3. Cambie el valor de la línea de off a on.
Configurar IIS para resolver nombres de host:
Instale el instalar plug-in de servidor web de NetInsight. Así se resolverán los
nombres de host automáticamente antes de escribirlos en el registro. (Este plug-in
está disponible para descargarlo en http://customercentral.unica.com).
Resolución de títulos de página
Cuando la opción Resolver títulos de página de NetInsight está habilitada,
NetInsight intenta resolver los títulos de página de cada página exclusiva que se
enumere en el archivo de registro. Lo hace solicitando cada página y analizando el
código HTML para buscar el título de la página. Los sitios que generan muchas
páginas dinámicas pueden sufrir importaciones lentas si esta opción está
habilitada.
Puede mejorar el rendimiento configurando adecuadamente la opción Resolver
títulos de página y ejecutando las actualizaciones en un momento en el que el
servidor web no tenga una carga muy alta.
De manera predeterminada, NetInsight limita las páginas que solicita para evitar
tensión en el servidor web y los retrasos durante la información:
38
IBM Unica NetInsight: Guía de ajuste
v Si NetInsight ha resuelto el título de una página en los últimos catorce días, no
intenta volver a resolver el título de la página.
v NetInsight no resuelve los títulos de las páginas que se enumeran en su opción
Títulos de página sin resolver. Esta opción incluye de forma predeterminada las
páginas cuya vía de acceso contiene /cgi-bin/ o /scripts/ y los archivos que
acaban en exe y cgi.
v NetInsight no incluye la cadena de consulta en las solicitudes de página.
Por lo general, no es recomendable que NetInsight resuelva títulos para solicitudes
de página que contengan identificadores exclusivos incluidos en el URL. Puede
impedir que NetInsight resuelva esas páginas creando un filtro que defina las
páginas sujetas a la resolución de títulos.
Determinar si la opción Resolver títulos de página está habilitada
1. Abra un perfil cuya importación sea lenta.
2. Pulse la pestaña Opciones. Se abrirá la página General.
3. Compruebe si la casilla de verificación Resolver títulos de página está
seleccionada.
Limitar las páginas cuyos títulos resuelve NetInsight
Puede limitar las páginas cuyos títulos intenta resolver NetInsight creando uno o
más filtros para las opciones Títulos de página sin resolver o Títulos de página
resueltos en el perfil.
1. Visualice el perfil en el que desee crear un filtro de título de página.
2. Pulse la pestaña Opciones.
3. En el panel izquierdo, en Títulos de página, pulse Títulos de página sin
resolver (para crear un filtro para las páginas que NetInsight no debe resolver)
o Títulos de página resueltos (para crear un filtro sólo para las páginas que
NetInsight debe resolver).
4. Pulse Añadir.
5. Especifique un filtro que coincida con las páginas a las que desee dirigirse.
(Para obtener información detallada sobre los filtros, consulte la guía del
usuario de NetInsight).
6. Pulse Añadir.
Nota: Para aplicar un filtro nuevo a datos importados anteriormente, debe
suprimir los datos del perfil y volver a importar los archivos de registro. Si ya
no tiene todos los archivos de registro importados anteriormente en el perfil,
puede que se pierdan datos.
Problemas con la memoria caché y los ID de la memoria
Durante la importación, NetInsight almacena en la memoria caché los valores de
los archivos de registro en memoria hasta que ha analizado una cantidad
predefinida de datos de punto de comprobación (de manera predeterminada, 125
MB). Cuando se alcanza este intervalo de punto de comprobación (o cuando se
alcanza el final de un archivo de registro o de un clúster de archivos de registro),
NetInsight concilia los datos almacenados en memoria caché con el contenido de
las tablas de ID de la base de datos.
Pueden producirse problemas de rendimiento si NetInsight tiene que conciliar un
número demasiado elevado de valores para un tipo concreto de datos con sus
tablas de ID. Estos problemas pueden ser:
Capítulo 7. Ajuste avanzado NetInsight
39
v Las cachés de la memoria pueden desbordarse en el disco, lo que generaría
esperas en el subsistema de disco.
v Los recursos necesarios para conciliar grandes cantidades de datos nuevos con la
tabla que contiene los ID existentes pueden convertirse en un cuello de botella
de rendimiento serio.
Nota: NetInsight también almacena en la memoria caché la información de
memoria de la base de datos para garantizar un acceso más rápido a los valores
que se utilizan con frecuencia.
Nota: Hay una lista exhaustiva de las tablas de ID de la guía de esquemas de base
de datos de NetInsightDatabase en http://customercentral.unica.com.
Verificar si la conciliación de ID está ocasionando un
problema de rendimiento
1. Abra el archivo cache.log en un editor de texto.
2. Localice la sección etiquetada Checkpoints Executed.
3. 3. Examine el valor de Reconcile IDs. (Los tiempos de los registros se expresan
en segundos).
Ejemplo: verificación de la conciliación de ID como problema
de rendimiento
En este ejemplo del archivo cache.log, los valores de conciliación destinados para
las tablas de ID son claramente los responsables del tiempo que se consume
durante la importación.
Checkpoints Executed: 1
40
Stage
Average Time
Reconcile IDs
75461.23
Misc
0.00
Totals
0.00
Traffic
0.00
IDs
0.00
Parameters
0.00
Titles
0.00
Views
0.00
SpiderViews
0.00
Ads
0.00
Errors
0.00
Links
0.00
Initial Referrers
0.00
Closed Visits
0.00
Clickstreams
0.00
Campaigns
0.00
Closed SpiderVisits
0.00
IBM Unica NetInsight: Guía de ajuste
Stage
Average Time
Spider Clickstreams
0.00
Spider Campaigns
0.00
Open Visits
0.00
Open Clickstreams
0.00
Open Visit Parameters
0.00
Open SpiderVisits
0.00
Open Spider Clickstreams
0.00
Open Spider Visit Parameters
0.00
End Transaction
0.00
Deletes
0.00
Determinar el ID que está ocasionando el problema de
rendimiento
Una vez que haya determinado que la conciliación de ID está ocasionando un
problema de rendimiento, tiene que determinar el ID responsable.
1. Abra el archivo cache.log en un editor de texto.
2. Busque la sección ID Reconciliation Times.
3. Compruebe el tiempo que se indica para cada ID para determinar los ID que
están ocasionando problemas.
4. Consulte la guía de esquemas de base de datos de NetInsight para obtener
información detallada sobre qué se almacena en esa tabla de ID.
5. Examine los archivos de registro para determinar por qué se están creando
tantos ID exclusivos.
6. Consulte a los usuarios finales de NetInsight para determinar si se utiliza toda,
parte o ninguna de la información disponible en el campo del ID en cuestión
en los informes de NetInsight.
Ejemplo: verificación del origen del problema de conciliación
de ID
En este ejemplo del archivo cache.log, PageBrkDwn es el origen de los problemas
de conciliación de ID.
ID Reconciliation Times:
ID
Average Time
CookieID
0.59
HostID
2.47
PageBrkdwnID
75449.03
PageID
0.26
RefBrkdwnID
0.27
BrowserBrkdnID
0.03
BrowserID
0.00
DepartmentID
0.00
Capítulo 7. Ajuste avanzado NetInsight
41
ID
Average Time
DirectoryID
0.09
DomainID
0.00
KeywordsID
0.00
PlatformID
0.00
RefID
0.00
UserID
0.33
ServerID
0.00
CampaignID
0.00
VisitorID
0.34
ContentID
0.00
ProfileID
0.00
ScreenResID
0.00
ChannelID
0.00
SegmentID
0.00
ChannelTypeID
0.00
Al consultar el esquema de base de datos se muestra que la tabla PageBrkdwnID
almacena la parte del URL que sigue a “?” (la cadena de consulta). Un examen
posterior del archivo de registro muestra que parte de la solicitud HTTP contiene
una cadena de identificación exclusiva que utiliza un servidor de aplicaciones para
almacenar la información de sesión para que los visitantes naveguen por el sitio.
Puesto que este valor es exclusivo de cada vista que NetInsight procesa, se genera
un nuevo ID de desglose de página, que se almacena en la memoria caché y,
finalmente, se confirma en la base de datos para cada vista. En este caso, la
sobrecarga necesaria para conciliar la tabla de ID existentes con los nuevos valores
del archivo de registro y la confirmación del gran número de valores exclusivo en
la tabla PageBrkdwnID son la causa de los problemas de rendimiento.
Ajuste cuando la información en el valor de ID es obligatoria
para la generación de informes
Si la información del valor de ID que genera el cuello de botella de rendimiento es
necesaria para la generación de informes, puede mejorar el rendimiento reduciendo
el intervalo de punto de comprobación. Esto hace que NetInsight realice
confirmaciones más pequeñas de datos, lo que genera escrituras más frecuentes
pero más pequeñas en la base de datos. Las bases de datos con recursos
disponibles limitados o las diseñadas para confirmaciones pequeñas frecuentes
pueden beneficiarse de este cambio.
Nota: La modificación del intervalo de punto de comprobación afecta a cada perfil
de la instalación de NetInsight. El efecto de esta modificación en los perfiles que ya
funcionen adecuadamente debería ser mínimo. Si detecta problemas, póngase en
contacto con el servicio de soporte técnico de IBM.
Reducir el intervalo de punto de comprobación
1. Abra NetTracker.cfg en un editor de texto.
2. Localice la línea:
<checkpointmegs>125</checkpointmegs>
42
IBM Unica NetInsight: Guía de ajuste
3. Modifique el valor, según desee. Es posible que tenga que probar varios valores
antes de encontrar el que mejor se adapte al sistema.
4. Guarde los cambios.
Ajustar cuando el campo de ID contiene información
obligatoria para la generación de informe
Si la tabla de ID en cuestión contiene datos necesarios para la generación de
informes, pero la información que genera el elevado número de valores de ID no
es necesaria, puede resolver el problema utilizando la opción Búsqueda y
reescritura de URL de NetInsight para reescribir el valor durante la importación.
Por ejemplo, supongamos que los URL PageBreakdown tiene un aspecto como el
siguiente:
?item=676&referrer=GGLE&UniqueID=1xertyuxclsaljdss
Supongamos, además, que utiliza los valores del elemento y el referenciador en la
generación de informes, pero no necesita el UniqueID. Puede utilizar la búsqueda
y sustitución para eliminar el ID exclusivo antes que la información que se va a
asociar con un ID de desglose de página.
Configurar una regla de búsqueda y sustitución
1. Visualice el perfil en el que desee sustituir o suprimir parte del URL.
2. Pulse la pestaña Opciones.
3. En el panel de la izquierda, pulse, bajo Contenido dinámico, Búsqueda y
reescritura de URL.
4. Pulse Añadir.
5. En el recuadro Descripción, especifique un nombre para la regla de búsqueda
y sustitución.
6. En el cuadro Regla de búsqueda, especifique una expresión regular para
buscar coincidencias con el texto que desee buscar. En este ejemplo, podría
utilizar:
(UniqueID=.*&?)
Para obtener más información sobre cómo escribir reglas de búsqueda,
consulte la ayuda en línea de NetInsight o la guía del usuario de NetInsight.
7. Para eliminar por completo el texto de la coincidencia, deje el recuadro Valor
de reemplazo en blanco.
8. Si sólo hay un ID exclusivo por cada URL, en el recuadro Tipo de regla, elija
Cadena de consulta. Ello indica que desea aplicar la regla a la parte del URL
correspondiente a la cadena de consulta.
9. Pulse Guardar opciones.
10. Pulse Continuar.
11. Seleccione la regla de búsqueda y sustitución y pulse URL.
12. Pulse Añadir.
13. Cree un filtro para definir las páginas en las que se debe ejecutar la nueva
regla de búsqueda y sustitución. Si desea que la regla se ejecute en todas las
vistas que importe, utilice el filtro:
that contains /
14. Pulse Añadir.
Una vez creada, la regla de búsqueda y sustitución se ejecutará cada vez que
se lleve a cabo una actualización. No obstante, no afectará los datos que ya
estén en la base de datos. En tal caso, tendrá que borrar el perfil y volver a
Capítulo 7. Ajuste avanzado NetInsight
43
importar todos los datos. Puede que si los conjuntos de datos son más
grandes esto no sea posible. Si trabaja con un conjunto de datos grande,
póngase en contacto con el servicio de soporte técnico de IBM para obtener
ayuda sobre cómo implementar ese cambio en la base de datos.
Volver a configurar NetInsight cuando el campo de ID
contiene información no necesaria para la generación de
informes
Si no necesita el campo que almacena valores exclusivos para los informes, puede
inhabilitar su importación, con lo que se evitan las consultas de conciliación que
están ocasionando los problemas de rendimiento.
Impedir que se importe un campo
Abra el archivo de configuración de perfiles en un editor de texto.
1. Localice el elemento <ignoredfields>. Si <ignoredfields*gt; no existe, añádalo
bajo el elemento <weboptions>.
2. Modifique <ignoredfields> para incluir el campo que desee inhabilitar. Para
obtener una lista de campos que se pueden añadir a <ignoredfields>, consulte
la tabla siguiente. El fragmento de código modificado debe tener un aspecto
similar al siguiente:
<ignoredfields>
<ignoredfield>PageBreakdown</ignoredfield>
</ignoredfields>
3. Guarde y cierre el archivo.
Campos ignorables en los perfiles de servidor web
Hay diez campos que se pueden ignorar en los perfiles de servidor web.
Campo
Valor cuando está inhabilitado
Browser
Unknown
BrowserBreakdown
Unknown
Cookie
None
Domain
Unresolved
Keywords
KeywordsID 0
PageBreakdown
PageBrkdwnID 0
Platform
Unknown
Referrer
None
ReferrerBreakdown
None
User
UserID 0
Cuellos de botella del subsistema de disco de la base de
datos durante las confirmaciones
Si el archivo cache.log muestra que todos los aspectos de la sincronización por
puntos de comprobación tardan mucho tiempo, normalmente ello se debe a la E/S
de disco en la base de datos. A continuación se muestra la sección del archivo
cache.log que lo suele mostrar:
Checkpoints Executed: 45
44
IBM Unica NetInsight: Guía de ajuste
Stage
Average Time
Reconcile IDs
20.71
Misc
0.02
Totals
0.02
Traffic
0.01
IDs
4.91
Parameters
0.77
Titles
0.07
Views
7.36
SpiderViews
0.53
Ads
0.00
Errors
0.14
Links
0.00
Initial Referrers
0.16
Closed Visits
33.05
Clickstreams
2.11
Campaigns
0.00
Closed SpiderVisits
0.49
SpiderClickstreams
0.04
SpiderCampaigns
0.00
Open Visits
0.42
Si la mayoría de estos tiempos son de más de unos cuantos segundos, es posible
que tenga que examinar el subsistema de disco del servidor de la base de datos
para asegurarse de que esté lo suficientemente ajustado para escritura. El Monitor
de rendimiento de Windows, iostat o las herramientas que se entreguen con la base
de datos pueden ayudarle a diagnosticar el origen del cuello de botella.
Al configurar una base de datos para utilizarla con NetInsight, se recomienda
utilizar una configuración RAID (RAID 0 o 0+1) en bandas tanto para NetInsight
como para los volúmenes de datos de la base de datos. No se recomienda utilizar
RAID 5, porque esta configuración puede proporcionar un rendimiento bajo
cuando se llevan a cabo un gran número de operaciones de escritura.
Si el análisis muestra problemas con la E/S de disco y no utiliza una configuración
RAID (RAID 0 o 0+1) en bandas tanto para NetInsight como para los volúmenes
de datos de la base de datos, considere la posibilidad de exportar los datos de
NetInsight, volver a configurar la matriz de discos y, a continuación, volver a
importar los datos en la base de datos. Antes de hacerlo, sin embargo, consulte a
su proveedor de matrices RAID cuáles son las mejores medidas de E/S de disco
para la matriz RAID que utilice y las opciones de ajuste para manejar mejor la alta
demanda de ancho de banda del disco.
Cuellos de botella de recursos del sistema de NetInsight
Entre las confirmaciones de datos durante la importación, NetInsight almacena en
memoria caché los datos analizados de los archivos de registro en memoria. Si esas
memorias caché se desbordan, NetInsight escribo los datos en archivos temporales
del disco. Además, durante la importación, NetInsight inicia una hebra por cada
Capítulo 7. Ajuste avanzado NetInsight
45
servidor en clúster configurado en el perfil con el fin de analizar el archivo de
registro de cada servidor. Si todos los registros que vaya a importar se encuentran
en el mismo disco en una configuración en clúster, esas hebras pueden competir
por el ancho de banda del disco.
Cuando intente identificar un cuello de botella de rendimiento, supervise el uso de
la memoria, la E/S de disco y el uso de CPU en el sistema NetInsight.
Problemas con la memoria de intercambio del sistema operativo
Si el sistema NetInsight intercambia memoria en el disco de forma sistemática, la
solución consiste en limitar lo que se ejecute en el servidor o en añadir memoria.
Aunque es posible limitar la memoria que utiliza NetInsight, en la mayoría de los
casos el impacto en el rendimiento será tan grave como los problemas derivados
del intercambio de memoria en el disco.
Problemas con la E/S de disco en el disco de NetInsight
Si experimenta problemas de E/S de disco en el disco donde está instalado el
programa NetInsight, mueva NetInsight a un disco más rápido. Si no es posible, es
posible que resulte útil reducir el intervalo de punto de comprobación. Consulte el
apartado “Reducir el intervalo de punto de comprobación” en la página 42.
Problemas en la unidad de archivos de registro
Al importar y procesar archivos de registro, si experimenta problemas de E/S en la
unidad donde se almacenan los registros durante la importación, considere la
posibilidad de distribuir los registros en varios discos físicos. Puede resultar útil
reubicar los archivos de registro a un disco físico distinto del que contiene el
directorio del programa NetInsight. La contención de disco entre las hebras que
leen archivos de registro y las que utilizan los archivos temporales de NetInsight
puede convertirse en un cuello de botella importante.
Problemas con los cuellos de botella de CPU
Si el análisis del uso de la CPU muestra que hay un cuello de botella de
procesador, por lo general, la práctica recomendada es añadir más CPU al sistema
NetInsight o mover NetInsight a un sistema con CPU más rápidas. Si no es
posible, es posible que pueda ajustar las hebras de NetInsight hasta cierto punto.
Nota: Los cambios en la generación de hebras afectan a todos los perfiles de la
instalación de NetInsight.
Ajustar la generación de hebras
1. Abra NetTracker.cfg en un editor de texto.
2. Localice la línea: <maxqueuedlines parser="2000" sorter="10000"/>
3. 3. Reduzca el valor de la hebra analizadora. Se reducirá el trabajo que cada
hebra tiene que hacer para mantener su cola llena. En función de la
disponibilidad de otros recursos del sistema, este cambio puede mejorar el
rendimiento. Si reduce este valor a cero, la generación de hebras se desactivará
por completo.
4. Guarde y cierre el archivo.
46
IBM Unica NetInsight: Guía de ajuste
Problemas de rendimiento durante la indexación y el
mantenimiento de las tablas
De manera predeterminada, NetInsight vuelve a crear los índices sobre las tablas
de parámetros durante cada actualización. Cuando se utiliza con Oracle y DB2,
NetInsight también actualice las estadísticas de análisis sobre las tablas y los
índices cada quince actualizaciones. En los casos en los que no sea necesario
actualizar las estadísticas de análisis con tanta frecuencia, la inhabilitación del
mantenimiento automática puede reducir el tiempo de importación.
Nota: Si inhabilita la reindexación automática o la actualización de las estadísticas
de análisis, el DBA debe asegurarse de que las estadísticas sobre las tablas y los
índices se actualicen con regularidad y de que los índices se mantengan de la
forma adecuada.
Inhabilitar la reconstrucción de índices
1. Abra el archivo de configuración de perfiles en un editor de texto.
2. Añada lo siguiente al archivo bajo el elemento <weboptions>:
<noimportreindex/>
3. Guarde y cierre el archivo.
Problemas de rendimiento durante la creación de perfiles de
visitante
Los problemas de rendimiento que surgen con los perfiles de visitante suelen ser
temporales y afectan sólo a la primera actualización después de que se haya
añadido o modificado un perfil de visitante. Los problemas de rendimiento
persistentes con los perfiles de visitante sólo tienen lugar en los casos en los que se
configuran centenares de perfiles de visitante. En la mayoría de los casos en los
que surgen problemas de rendimiento persistentes puede mejorar el rendimiento
añadiendo un índice a la base de datos.
Durante la primera actualización después de que se añada o modifique un perfil
de visitante, NetInsight analiza todo el conjunto de datos para determinar si las
visitas se adaptan al perfil nuevo o modificado. Ello puede hacer que la
actualización tarde más de lo habitual. Las actualizaciones posteriores sólo
examinan los datos recién importados para determinar si se debe realizar o no una
entrada para cada perfil de visitante aplicable.
Si la creación de perfiles de visitantes es lenta de forma continuada, examine los
filtros de los perfiles de visitante. Prácticamente en todos los casos donde se
producen problemas de rendimiento, los perfiles de visitante no tienen filtros o los
filtros implicados se basan en el directorio, la página o el grupo de contenido.
Perfiles de visitante sin filtros
Los perfiles de visitante sin filtros suelen ser el resultado de la supresión accidental
de un filtro durante la modificación a otra opción de NetInsight. Por ejemplo, si un
usuario crea un perfil de visitante según un parámetro definido en la opción de
NetInsight y ese parámetro se suprime posteriormente, el perfil de visitante
permanecerá sin filtros. Cuando un perfil de visitante no tiene filtros, NetInsight
añade una fila a la tabla de perfiles de la base de datos para cada visita en los
archivos de registro. Puede resolver este problema suprimiendo los perfiles de
visitante que no tengan filtros.
Capítulo 7. Ajuste avanzado NetInsight
47
Verificar si cada perfil de visitante tiene un filtro
1.
2.
3.
4.
Visualice el perfil que contiene el perfil de visitante.
Pulse la pestaña Opciones.
En el panel izquierdo, pulse Perfiles de visitante en Visitantes.
Seleccione un perfil de visitante y pulse Visitantes para ver los filtros que están
asociados con este perfil.
Suprimir un perfil de visitante
1.
2.
3.
4.
Visualice el perfil que contiene el perfil de visitante.
Pulse la pestaña Opciones.
En el panel izquierdo, pulse, en Visitantes, Perfiles de visitante.
4. Seleccione el perfil de visitante que desee suprimir y pulse Borrar.
Nota: La actualización inicial después de suprimir un perfil de visitante sin
perfiles puede tardar más tiempo porque se volverá a crear el perfil de los
visitantes según los nuevos valores de perfiles de visitante. Las actualizaciones
posteriores se ejecutarán mucho más rápido.
Perfiles de visitante con filtros basados en directorio, página
o grupo de contenido
NetInsight almacena información sobre directorios, páginas y grupos de contenido
en la tabla de vistas. Para buscar las visitas que coinciden con los perfiles de
visitante que tienen filtros basados en dichos valores, NetInsight efectúa una unió
entre la tabla de vistas y la tabla de visitas. Aunque esta unión sólo devuelve unas
cuantas filas, la consulta puede consumir mucho tiempo.
Puede reducir el coste de la unión y mejorar considerablemente el rendimiento
creado un índice de cobertura para los datos a los que se hace referencia en la
tabla de vistas. En general, tendrá que añadir un índice sobre una combinación del
VisitID y el ID de los que se deriva el filtro. Consulte el apartado “Crear un índice
de cobertura”.
Crear un índice de cobertura
En algunos casos, puede mejorar considerablemente el rendimiento de las
consultas lentas creando un índice de "cobertura". Por ejemplo, en el caso de un
perfil de visitante basado en página, puede añadir un índice sobre VisitID y
PageID con una sintaxis similar a la siguiente:
CREATE INDEX ViewVisitIDX ON <nombre_perfil_abreviado>_Views (VisitID, PageID);
Después de crear el índice, evalúe con atención el rendimiento de NetInsight
durante las siguientes actualizaciones para determinar si la creación de perfiles de
visitante es más rápida. Si el rendimiento ha mejorado, añada el índice al esquema
de NetInsight.
Nota: El mantenimiento de los índices es costoso. Añada índices adicionales con
precaución al esquema de base de datos, porque puede llegar a un punto en que la
disminución de devoluciones de cada índice añadido añadirá más tiempo al
proceso de importación de NetInsight, aunque debería ahorrar tiempo durante el
proceso de creación de perfiles.
CREATE INDEX ViewVisitIDX ON <nombre_perfil_abreviado>_Views (PageID, VisitID);
48
IBM Unica NetInsight: Guía de ajuste
Añadir un índice al esquema de NetInsight
Una vez que haya probado y determinado que un índice nuevo ha mejorado el
rendimiento, debe añadirlo al archivo de definición de esquema de base de datos
de NetInsight para que NetInsight reconozca el índice.
Para añadir un índice al esquema:
1. Abra el archivo .xml correspondiente del directorio de datos de NetInsight.
2. Localice la definición de tabla adecuada.
3. Añada el tipo de elemento siguiente:
<index name="ViewVisitIdx" unique="true">
<definition>(VisitID, PageID)</definition>
</index>
Nota: Encontrará información detallada sobre los archivos de esquema de
NetInsight en la guía de archivos de definición de esquema de NetInsight
disponible en http://customercentral.unica.com.
Problemas de rendimiento durante la generación de informes
Los problemas con la generación de informes se pueden dividir en general en
cuatro tipos independientes:
v Generación lenta de agregados
v Generación lenta de informes estándar en un perfil
v Generación lenta de informes personalizados
Para determinar cuál es el caso durante una actualización, examine el archivo
rpttimes.log. El registro se desglosa por periodo de tiempo, lo que permite
determinar el tiempo que se tarda en generar agregados y generar resúmenes,
conjuntos de resultados e informes personalizados para cada periodo de tiempo.
Ejemplo: rpttimes.log
A continuación se muestra un ejemplo del contenido habitual de un archivo
rpttimes.log:
*****************************************************************************
Beginning aggregate calculations at Wed May 04 02:45:14 2005
Date(s) being aggregated: 2453494
*****************************************************************************
Aggregate #1 (Visit) completed in 3 minutes, 0 seconds
Aggregate #2 (User Agent) completed in 31 seconds
Aggregate #3 (Visit Duration) completed in 20 seconds
*****************************************************************************
Beginning summary calculations for May 2005 at Wed May 04 03:29:02 2005
*****************************************************************************
Summary #1 (Day of the Week Summary) completed in 35 seconds
Summary #3 (Browser Summary) completed in 4 seconds
Summary #9 (Date Summary) completed in 32 seconds
*****************************************************************************
Beginning resultset calculations for May 2005 at Wed May 04 03:38:00 2005
*****************************************************************************
Resultset for summary #1 (Day of the Week Summary) completed in 0 seconds
Resultset for summary #3 (Browser Summary) completed in 0 seconds
Resultset for summary #9 (Date Summary) completed in 0 seconds
*****************************************************************************
Beginning custom report calculations for May 2005 at Wed May 04 03:40:40 2005
*****************************************************************************
Resultset for custom summary #3 (Page Summary) completed in 0 seconds
Resultset for custom summary #2 (Parameter Summary for P_Param0) completed in
Capítulo 7. Ajuste avanzado NetInsight
49
6 minutes, 24 seconds
Resultset for custom summary #1 (Parameter Summary for P_Param1) completed in
2 minutes, 15 seconds
*****************************************************************************
Beginning summary calculations for All Months at Wed May 04 04:11:55 2005
*****************************************************************************
Summary #1 (Day of the Week Summary) completed in 1 minute, 5 seconds
Summary #3 (Browser Summary) completed in 6 seconds
Summary #11 (Directory Summary) completed in 1 second
*****************************************************************************
Beginning resultset calculations for All Months at Wed May 04 05:27:06 2005
*****************************************************************************
Resultset for summary #1 (Day of the Week Summary) completed in 0 seconds
Resultset for summary #3 (Browser Summary) completed in 0 seconds
Resultset for summary #9 (Date Summary) completed in 1 second
*****************************************************************************
Beginning custom report calculations for All Months at Wed May 04 05:52:40 2005
*****************************************************************************
Resultset for custom summary #3 (Page Summary) completed in 1 second
Resultset for custom summary #2 (Parameter Summary for P_Param0) completed in
46 minutes, 43 seconds
Resultset for custom summary #1 (Parameter Summary for P_Param1) completed in
6 minutes, 47 seconds
Problemas de rendimiento durante la generación de agregados
Las tablas de agregación almacenan los totales calculados a partir de los datos
almacenados en otras tablas. Por ejemplo, la tabla Views contiene cada vista de
página de los archivos de registro, la tabla Agg_View contiene el número total de
vistas y visitas para cada página del sitio, agrupadas por una fecha específica. Las
tablas de agregación permiten que NetInsight genere informes dinámicos según la
fecha de manera más rápida. Las fechas de los agregados se listan al principio de
la sección de agregado como fechas julianas.
Nota: Para obtener más información sobre las fechas julianas, incluidos los
procedimientos almacenados de ejemplo para convertirlas a un formato más
convencional para el tipo de base de datos, consulte la guía de esquemas de base
de datos de NetInsight en http://customercentral.unica.com. En Internet también
puede encontrar una amplia variedad de convertidores de fechas julianas.
Si la adición de información a las tablas de agregación tarda mucho tiempo,
examine las fechas que se vayan a agregar. Por lo general, la generación de
agregados sólo tiene lugar para las fechas contenidas en los registros que haya
importado como parte del mismo proceso de actualización. Si se enumeran más de
varias fechas en el archivo rpttimes.log, puede deberse a que se haya ejecutado un
mandato –recalc de línea de mandatos. (El mandato –recalc hace que NetInsight
vuelva a calcular los informes de todos los datos de la base de datos de
NetInsight). El rendimiento durante estos tipos de operaciones no es el habitual.
Supervise el perfil para obtener un registro generado por el proceso de
actualización de NetInsight. Si, tras unos cuantos días, NetInsight aún realiza el
agregado de fechas sobre las que no está importando datos de registro
actualmente, póngase en contacto con el servicio de soporte técnico de
UCompany/> para obtener ayuda.
Si todos los agregados tardan mucho tiempo cada día, ello indica, por lo general,
que existe un problema de E/S de disco en la base de datos. Realizar tareas de
supervisión adicionales de la base de datos con las herramientas del sistema
operativo y de la base de datos puede ayudar a aislar el problema.
Cada agregado contiene datos que se utilizan para crear uno o más resúmenes. Si
un agregado concreto tarda demasiado tiempo en generarse, puede:
50
IBM Unica NetInsight: Guía de ajuste
v Inhabilitarla (si no es relevante para el perfil en cuestión). Los agregados se
inhabilitan inhabilitando sus resúmenes asociados en las opciones de perfil de
NetInsight. Por ejemplo, si los datos contenidos en Resumen de rendimiento del
servidor y Resumen de entregas de páginas no son relevantes en un perfil
concreto porque el perfil se utiliza principalmente para ventas y marketing,
puede inhabilitar Resumen de entregas de páginas y Resumen de rendimiento
del servidor. Esto, por su parte, inhabilitará el agregado de rendimiento.
v Reduzca el número de ID asociados con el agregado. Si necesita ayuda para
determinar los resúmenes que están asociados con un agregado concreto,
póngase en contacto con el servicio de soporte técnico de IBM.
A menudo la inhabilitación de un agregado no es una opción porque sus datos son
necesario para uno o más resúmenes que se desean incluir en el perfil. En tal caso,
analice el número de filas añadidas al agregado diariamente. (Cuente las filas de la
tabla de agregación antes y después de una actualización para obtener el número
de filas añadidas). Si el número de filas adicionales es alto (en comparación con los
demás agregados del perfil), por lo general, se genera un número alto de valores
exclusivos para uno de los campos del agregado. Por ejemplo, la tabla Agg_View
contiene información sobre PageID. Si este agregado es un problema persistente,
normalmente se debe a que está generando un número elevado de valores
exclusivos para las páginas o cadenas de consulta de los archivos de registro. Para
obtener información sobre cómo ajustar los problemas relacionados con un número
elevado de ID, consulte el apartado “Problemas con la memoria caché y los ID de
la memoria” en la página 39.
Inhabilitar un resumen:
1. Visualice el perfil en NetInsight.
2. Pulse la pestaña Opciones.
3. En el panel izquierdo, en Principal, pulse Resúmenes.
4. En la lista Resúmenes seleccionados, seleccione el resumen que desee
inhabilitar y pulse Eliminar informe.
5. Cuando haya acabado de inhabilitar los resúmenes, pulse Guardar opciones y,
a continuación, pulse Continuar.
Problemas de rendimiento para resúmenes y conjuntos de
resultados estándar
Si todos los resúmenes y conjuntos de resultados tardan demasiado en generarse
diariamente, esto indica, por lo general, que existe un problema de E/S de disco en
la base de datos. Realizar tareas de supervisión adicionales de la base de datos con
las herramientas del sistema operativo y de la base de datos puede ayudar a aislar
el problema.
Si un resumen concreto tarda demasiado tiempo en generarse, puede:
v Inhabilitarla (si no es relevante para el perfil en cuestión). En la mayoría de los
casos, sin embargo, el resumen será necesario.
v Reduzca el número de ID asociados con el resumen. Los tiempos prolongados
de generación de resúmenes suelen deberse a la generación de un gran número
de valores exclusivos para uno de los ID en el que se basa el resumen. Por
ejemplo, si el resumen de páginas está provocando problemas de rendimiento, la
causa suele ser que se está generando un gran número de ID de página. Para
obtener información sobre cómo ajustar los problemas relacionados con un gran
número de ID, consulte el apartado “Problemas con la memoria caché y los ID
de la memoria” en la página 39.
Capítulo 7. Ajuste avanzado NetInsight
51
Problemas de rendimiento con los informes personalizados
El primer paso para resolver los problemas de rendimiento con los informes
personalizados es asegurarse de que los usuarios necesiten cada uno de los
informes personalizados cuya actualización automática se ha establecido. Si hay
informes que no se van a utilizar, considere la posibilidad de suprimirlos o de
impedir que se actualicen automáticamente.
Inhabilitar la actualización automática de un informe personalizado:
1. Abra el perfil que contenga el informe personalizado.
2. Pulse la pestaña Personalizado.
3. Seleccione el informe personalizado que no desee que NetInsight actualice
automáticamente.
4. Pulse Editar informe.
5. Pulse Guardar.
6. Desmarque la casilla de verificación Actualizar automáticamente el informe.
7. Asegúrese de desmarcar también la casilla de verificación Guardar como nuevo
informe.
8. Pulse Continuar.
Ajustar NetInsight para informes personalizados lentos:
El archivo rpttimes.log indica cuánto tarda cada informe personalizado en
generarse. Si un informe tarda demasiado, es posible que tenga que reducir el
tiempo de generación de informes ajustando NetInsight para el informe siguiendo
estos pasos:
1. “Determinar las consultas que tardan demasiado en ejecutarse”.
2. “Ajustar la base de datos para consultas lentas” en la página 53.
3. “Visualice el plan de ejecución de la consulta” en la página 53.
4. “Volver a ejecutar el informe personalizado” en la página 53.
5. “Añadir índices nuevos al esquema de base de datos de NetInsight” en la
página 53.
Determinar las consultas que tardan demasiado en ejecutarse:
Obtenga un rastreo de la actividad de la base de datos cuando se ejecuta un
informe personalizado concreto. Cada una de las bases de datos a las que
NetInsight da soporte tiene la capacidad de proporcionar información de rastreo
sobre el rendimiento de las consultas. Para obtener más información, consulte la
documentación de la base de datos.
Si está seguro de que otros usuarios no intentarán acceder a la interfaz de
NetInsight durante el rastreo, puede ejecutar el informe desde la interfaz de
NetInsight. Si no puede garantizarlo, restrinja el acceso a la interfaz desactivando
el servidor web y utilice el mandato –drill para ejecutar el informe personalizado
manualmente. Para obtener ayuda sobre cómo utilizar el mandato –drill, póngase
en contacto con el servicio de soporte técnico de IBM.
El archivo de rastreo mostrará las consultas o conjuntos de consultas que tardan
más en ejecutarse.
Nota: Si no puede recrear el problema de rendimiento cuando es el único usuario
de la base de datos, ello sugiere que la base de datos no se está adaptando para
gestionar varios usuarios que generen informes personalizados. Es posible que
52
IBM Unica NetInsight: Guía de ajuste
sean necesarias otras evaluaciones del rendimiento y ajustes durante el uso normal
de NetInsight. La mejor manera de hacerlo es utilizar las herramientas que
proporcionan los proveedores de la base de datos y el sistema operativo para
evaluar el uso de recursos. Debe prestar especial atención a la E/S de disco y al
uso de la memoria cuando varios usuarios accedan a NetInsight.
Ajustar la base de datos para consultas lentas:
Ejecute las consultas que tarden más tiempo en ejecutarse con un programa de
utilidad diseñado para mostrar el plan de ejecución y el coste de la consulta. Si en
el plan de ejecución de la consulta hay exploraciones de tabla, considere los
distintos índices que puede añadir para evitarlas.
Si la consulta lenta aplica a un filtro basado en visita a un informe basado en vista,
o a la inversa, una manera de optimizar la consulta es utilizar un índice de
cobertura. (La aplicación de un filtro basado en visita a un informe basado en
vista, o a la inversa, puede aportar mucha tensión a la base de datos, ya que
NetInsight debe realizar una unión entre las tablas de vistas y de visitas). El índice
de cobertura debe contener las columnas aplicables que NetInsight consultará en
una tabla determinada. Por ejemplo, si uno de los informes personalizados
contiene un filtro de página que se aplica al resumen de visitantes, un índice sobre
la tabla de vistas que contenga PageID y VisitID podría permitir que la base de
datos sirviera la solicitud sin acceder a la tabla de vistas directamente. Consulte el
apartado “Crear un índice de cobertura” en la página 48.
Visualice el plan de ejecución de la consulta:
Ejecute la consulta con un programa de utilidad de base de datos adecuado a fin
de determinar si la base de datos está utilizando correctamente el índice que ha
añadido.
Volver a ejecutar el informe personalizado:
Vuelva a ejecutar el informe personalizado para ver si el tiempo de generación de
informes ha mejorado. Antes de volver a ejecutar el informe, depure la tabla
RecentResults ejecutando este mandato:
nettracker <nombre_perfil> -purgeresults
Al depurar la tabla RecentResults se obliga a NetInsight a recalcular la información
mediante el nuevo índice en lugar de los resultados almacenados en memoria
caché. (Si se utilizan los resultados almacenados en memoria caché, la consulta no
se volverá a ejecutar).
Añadir índices nuevos al esquema de base de datos de NetInsight:
Si el índice resuelve el problema de rendimiento, añada el índice nuevo al esquema
de NetInsight. Consulte el apartado “Añadir un índice al esquema de NetInsight”
en la página 49.
Aislar problemas de rendimiento con informes dinámicos (ampliación
de detalles)
El análisis de los problemas de rendimiento en la generación de informes
dinámicos es complicado porque NetInsight almacena en memoria caché los
resultados de los informes que genera. Un efecto de este almacenamiento en
memoria caché es que si ejecuta un informe concreto dos veces, las consultas
Capítulo 7. Ajuste avanzado NetInsight
53
utilizadas la segunda vez son distintas de las consultas utilizadas la primera vez.
El segundo informe se generará mucha más rápidamente que el primero. Puede
inhabilitar el almacenamiento en memoria caché durante el ajuste.
Una vez desactivado el almacenamiento en memoria caché, analice con atención las
ampliaciones de detalles que los usuarios finales han informado que eran
problemáticas. Intente identificar qué tienen en común esos informes. Por ejemplo,
¿comparten uniones concreta en su código SQL?
En la mayor parte de los casos en los que surgen problemas que se pueden rastrear
hasta los informes dinámicos, el código SQL generado incluye una unión entre las
tablas de vistas y visitas del perfil. Suelen ser las tablas más grandes. Las uniones
se dan cuando un filtro basado en datos almacenados en la tabla de vistas (por
ejemplo, una página, un directorio o un grupo de contenido) se aplica a un
resumen basado en la tabla de visitas (por ejemplo, un resumen de visitantes
reincidente, un resumen de visitante, un resumen de anfitriones o un resumen de
usuarios). También se dan en los paneles de control que contienen resúmenes
basados en la tabla de visitas.
Una vez que haya identificado el informe dinámico concreto que causa el problema
consulte el apartado “Problemas de rendimiento con los informes personalizados”
en la página 52.
Inhabilitar el almacenamiento en memoria caché
1. Abra NetTracker.cfg en un editor de texto.
2. Cambie la línea <resultsetretention>900</resultsetretention> por
<resultsetretention>0</resultsetretention>.
3. Guarde el cambio en el archivo.
Nota: La desactivación del almacenamiento en memoria caché puede tener un
impacto importante en el tiempo que tarda en generar informes dinámicos.
Inhabilite el almacenamiento en memoria caché cuando realice procedimientos
de resolución de problemas y preferiblemente durante horas de poca actividad.
Vuelva a habilitarlo lo antes posible.
Personalizar el análisis de tablas de NetInsight en los despliegues de
Oracle
Para los despliegues de Oracle, NetInsight incluye un proceso de análisis de tablas
incorporado que utiliza para ajustar las consultas durante la importación y/o la
generación de informes. El análisis estadístico de las tablas de NetInsight examina
métricas, como los recuentos de filas, la cardinalidad, etc. Según esas métricas, las
consultas de NetInsight se ajustan automáticamente para obtener un rendimiento
óptimo. Se ejecutan procesos independientes para las tablas de informes y las
tablas de esquema. El análisis de tablas para las tablas de informes se ejecuta
durante cada fase de generación de informes. El análisis de tablas para las tablas
de esquema se ejecuta una vez cada quince importaciones.
Si tiene problemas de rendimiento que detecta o sospecha que están relacionados
con errores o ineficacias del código SQL de análisis de tablas de NetInsight, puede
inhabilitar el análisis de tablas como parte del proceso de resolución de problemas.
También puede crear una variable de entorno de NetInsight en la que especifique
SQL propio que se ejecute para el análisis de tablas. Estas medidas sólo se pueden
54
IBM Unica NetInsight: Guía de ajuste
tomar siguiendo las indicaciones del servicio de soporte técnico de IBM o el
administrador de la base de datos Oracle de NetInsight de la empresa.
El análisis de tablas de NetInsight se inhabilita perfil a perfil. El código SQL
personalizado especificado para ejecutarse en lugar del código SQL de análisis de
tablas predeterminado de NetInsight se aplica a todos los perfiles que se ejecuten
en la instalación.
Inhabilitar el análisis de tablas de informe para un perfil
1. Abra el archivo de configuración del perfil para el que desee inhabilitar el
análisis de tablas.
2. Añada esta etiqueta xml: <noreporttableanalysis/>
3. Guarde el archivo.
NetInsight ya no efectuará el análisis de tablas en las tablas de informe del perfil.
Inhabilitar el análisis de tablas de esquema para un perfil
1. Abra el archivo de configuración del perfil para el que desee inhabilitar el
análisis de tablas.
2. Añada esta etiqueta xml: <notableanalysis/>
3. Guarde el archivo.
NetInsight ya no efectuará el análisis de tablas en las tablas de esquema del perfil.
Especificar un código SQL de análisis de tablas personalizado
1. En Opciones administrativas de NetInsight, seleccione Opciones > Principal >
Variables de entorno.
2. Pulse Añadir para añadir una variable nueva.
3. Para anular el valor predeterminado de NetInsight:
v SQL de análisis de tablas de informes: cree una variable con el nombre
NI_STATS_OVERRIDE.
v SQL de análisis de tablas de informes y esquema, cree una variable con el
nombre NI_STATS_OVERRIDE_ALL.
4. Para obtener el valor, especifique el procedimiento de PL/SQL que desee
utilizar. En el ejemplo siguiente, el 50% de las filas de las tablas del esquema
plat80qa3 se incluyen para su análisis y las estadísticas resultantes se
almacenan en la tabla aasavestats:
begin DBMS_STATS.GATHER_TABLE_STATS(’plat80qa3’, ’%tablename%’,
estimate_percent=>50,stattab => ’aasavestats’);end;
Nota: Si se han definido ambos, NI_STATS_OVERRIDE_ALL anulará a
NI_STATS_OVERRIDE.
Capítulo 7. Ajuste avanzado NetInsight
55
56
IBM Unica NetInsight: Guía de ajuste
Capítulo 8. Ubicaciones de archivos y directorios
cache.log
El archivo cache.log se genera durante el proceso de importación. Permite realizar
el seguimiento de la memoria de NetInsight y proporciona información sobre el
tiempo que consumen las inserciones de base de datos en cada punto de
comprobación de NetInsight. El archivo cache.log se encuentra en el directorio de
perfiles.
Directorio del programa de NetInsight
En los sistemas Windows, el directorio del programa NetInsight predeterminado se
encuentra en C:\Archivos de programa\NetInsight. En los sistemas UNIX, el
directorio de perfiles predeterminado se encuentra en /usr/local/NetInsight.
NetTracker.cfg
El archivo NetTracker.cfg se encuentra en el directorio del programa NetInsight.
Archivo de configuración de perfil
El archivo de configuración de perfil se denomina nombre_perfil_abreviado.cfg. Se
encuentra en el directorio de perfiles predeterminado.
Directorio de perfiles
En los sistemas Windows, el directorio de perfiles predeterminado se encuentra en
C:\Archivos de programa\NetInsight\Data\nombre_perfil_abreviado. En los
sistemas UNIX, el perfil de directorios predeterminado se encuentra en
/usr/local/NetInsight/data/nombre_perfil_abreviado.
rpttimes.log
El archivo rpttimes.log se genera durante la generación de informes. Contiene
información sobre el tiempo que tardan en generarse cada resumen y los
componentes en que se basa. El archivo rpttimes.log se encuentra en el directorio
de perfiles.
© Copyright IBM Corp. 1996, 2011
57
58
IBM Unica NetInsight: Guía de ajuste
Avisos
Esta información se ha desarrollado para productos y servicios ofrecidos en EE.UU.
Es posible que IBM no ofrezca los productos, servicios o funciones que se tratan en
este documento en otros países. Consulte con el representante de IBM de su
localidad si desea información sobre los productos y servicios disponibles
actualmente en su zona. Las referencias a programas, productos o servicios de IBM
no pretenden establecer ni implicar que sólo puedan utilizarse dichos productos,
programas o servicios de IBM. En su lugar, se puede utilizar cualquier producto,
programa o servicio funcionalmente equivalente que no infrinja ninguno de los
derechos de propiedad intelectual de IBM. Sin embargo, es responsabilidad del
cliente evaluar y verificar el funcionamiento de cualquier producto, programa o
servicio que no sea de IBM.
IBM puede tener patentes o solicitudes de patentes pendientes que cubran el tema
principal descrito en este documento. El suministro de este documento no le otorga
ninguna licencia sobre estas patentes. Puede enviar consultas sobre licencias, por
escrito, a:
IBM Director of Licensing
IBM Corporation
North Castle Drive
Armonk, NY 10504-1785
EE.UU.
Para consultas sobre licencias relacionadas con información de doble byte (DBCS),
póngase en contacto con el departamento de propiedad intelectual de IBM de su
país o envíe sus consultas, por escrito, a:
Intellectual Property Licensing
Legal and Intellectual Property Law
IBM Japan Ltd.
1623-14, Shimotsuruma, Yamato-shi
Kanagawa 242-8502 Japan
El párrafo siguiente no se aplica al Reino Unido ni a ningún otro país donde estas
disposiciones sean incompatibles: INTERNATIONAL BUSINESS MACHINES
CORPORATION PROPORCIONA ESTA PUBLICACIÓN "TAL CUAL" SIN
GARANTÍAS DE NINGÚN TIPO, NI EXPLÍCITAS NI IMPLÍCITAS,
INCLUYENDO PERO NO LIMITÁNDOSE A ELLAS, LAS GARANTÍAS
IMPLÍCITAS DE NO VULNERACIÓN, COMERCIALIZACIÓN O IDONEIDAD
PARA UN FIN CONCRETO. Algunos países no permiten la renuncia a garantías
explícitas o implícitas en determinadas transacciones, por lo que puede que esta
declaración no sea aplicable en su caso.
Esta información puede contener inexactitudes técnicas o errores tipográficos.
Periódicamente se efectúan cambios en la información incluida en este documento;
estos cambios se incorporarán en nuevas ediciones de la publicación. IBM puede
realizar en cualquier momento mejoras o cambios en los productos o programas
descritos en esta publicación sin previo aviso.
© Copyright IBM Corp. 1996, 2011
59
Todas las referencias hechas en este documento a sitios web que no son de IBM se
proporcionan únicamente para su información y no representan en modo alguno
una recomendación de dichos sitios web. El material de esos sitios web no forma
parte del material para este producto IBM, por lo que el uso de esos sitios web es
a cuenta y riesgo del usuario.
IBM puede utilizar o distribuir cualquier información que se le proporcione en la
forma que considere adecuada, sin incurrir por ello en ninguna obligación para con
el remitente.
Los titulares de licencias de este programa que deseen obtener información sobre el
mismo con el fin de permitir: (i) el intercambio de información entre programas
creados independientemente y otros programas (incluido éste) y (ii) el uso mutuo
de información que se haya intercambiado, deben ponerse en contacto con:
IBM Corporation
170 Tracer Lane
Waltham, MA 02451
EE.UU.
Dicha información puede estar disponible, sujeta a los términos y condiciones
correspondientes, incluyendo, en algunos casos, el pago de una tarifa.
El programa bajo licencia que se describe en este documento y todo el material
bajo licencia disponible los proporciona IBM bajo los términos de las Condiciones
Generales de IBM, Acuerdo Internacional de Programas Bajo Licencia de IBM o
cualquier acuerdo equivalente entre las partes.
Los datos de rendimiento contenidos en el presente documento se han
determinado en un entorno controlado. Por lo tanto, los resultados obtenidos en
otros entornos operativos pueden variar de modo significativo. Tal vez se hayan
realizado mediciones en sistemas que estén en fase de desarrollo y no existe
ninguna garantía de que esas mediciones vayan a ser iguales en los sistemas
disponibles en el mercado. Además, algunas mediciones podrían haberse estimado
mediante extrapolación. Puede que los resultados reales varíen. Los usuarios de
este documento debería verificar los datos aplicables para sus entornos específicos.
La información relacionada con productos que no son de IBM se ha obtenido de
los proveedores de dichos productos, de sus anuncios publicados o de otras
fuentes de disponibilidad pública. IBM no ha comprobado estos productos y no
puede confirmar la precisión de su rendimiento, compatibilidad ni contemplar
ninguna otra reclamación relacionada con los productos que no son de IBM. Las
preguntas relacionadas con las funciones de los productos que no son de IBM
deberán dirigirse a los proveedores de estos productos.
Todas las sentencias relacionadas con la futura dirección de IBM o intento están
sujetas al cambio o retirada sin previo aviso y sólo representan objetivos y metas.
Los precios indicados son precios sugeridos de IBM al por menor, están
actualizados y están sujetos a cambios sin previo aviso. Los precios de los
concesionarios pueden variar.
Esta información contiene ejemplos de datos e informes utilizados en operaciones
empresariales diarias. Para ilustrarlas de la forma más completa posible, los
ejemplos incluyen nombres de personas, empresas, marcas y productos. Todos
60
IBM Unica NetInsight: Guía de ajuste
estos nombres son ficticios y cualquier similitud a los nombres y direcciones que
haya utilizado una empresa real es pura coincidencia.
LICENCIA DE COPYRIGHT:
Esta información contiene programas de aplicaciones de ejemplo en código fuente,
que ilustran técnicas de programación en las distintas plataformas operativas.
Puede copiar, modificar y distribuir estos programas de ejemplo en cualquier
formato sin necesidad de efectuar ningún pago a IBM, con el fin de desarrollar,
utilizar, comercializar o distribuir programas de aplicación que se ajusten a la
interfaz de programación de aplicaciones para la plataforma operativa para la cual
se han escrito los programas de aplicación. Los ejemplos no se han probado
minuciosamente bajo todas las condiciones. Por lo tanto, IBM no puede garantizar
ni implicar la fiabilidad, servicio o funcionamiento de estos programas. Los
programas de ejemplo se ofrecen "TAL CUAL", sin garantía de ningún tipo. IBM
no es responsable de ningún daño resultante de la utilización de los programas de
ejemplo por parte del usuario.
Si consulta esta documentación en soporte software, puede que no aparezcan las
fotografías e ilustraciones en color.
Marcas registradas
IBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales
registradas de International Business Machines Corp., registrada en muchas
jurisdicciones en todo el mundo. Otros nombres de servicios y productos podrían
ser marcas registradas de IBM u otras compañías. Hay disponible una lista actual
de marcas registradas de IBM en la Web en “Información de marca registrada y
copyright en ” www.ibm.com/legal/copytrade.shtml.
Avisos
61
62
IBM Unica NetInsight: Guía de ajuste
Impreso en España
Descargar