TECNOLOGÍA INFORMÁTICA 3.1 El problema del almacenamiento

Anuncio
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.1 El problema del almacenamiento de datos.
3.1.1 Ventajas y desventajas del almacenamiento de datos.
3.1.2 Almacenamiento tradicional de datos y archivos.
3.1.3 Problemas comunes en sistemas de almacenamiento tradicional.
3.1.4 Consideraciones empresariales al evaluar medios de
almacenamiento.
3.2 Estructura de datos y archivos
3.2.1 Estructura de datos
3.2.2 Estructura de archivos.
3.3 Organización de datos y archivos.
3.3.1 Almacenamiento físico de los archivos.
3.3.2 Administración de recursos de datos.
3.3.3 Conceptos fundamentales de los datos.
3.3.4 Tipos de bases de datos.
3.3.5 Almacén de datos y minería de datos.
3.3.6 Estructuras de base de datos.
3.4 Tecnologías de almacenamiento.
3.4.1 Tecnología de disco magnético y de cinta.
3.4.2 Tecnologías de Disco Óptico.
3.4.3 Almacenamiento de Estado Sólido.
3.4.4 DAS, NAS y SAN
3.5 Herramientas de explotación.
3.5.1 Sistema de Administración de bases de datos (DBMS).
3.5.2 Desarrollo de aplicaciones.
3.5.3 Bases de datos en la Web.
3.5.4 Extracción de datos y análisis en línea.
Curso de Microsoft Access
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.1 El problema del almacenamiento de datos.
3.1.1 Ventajas y desventajas del almacenamiento de datos.
Los datos y la información deben almacenarse hasta que sean necesarios
mediante una variedad de métodos de almacenamiento. Por ejemplo, muchas
personas y organizaciones todavía confían en los documentos de papel guardados
en gabinetes de archivo, como su forma principal de medio de almacenamiento.
Sin embargo, es más probable que usted y otros usuarios de computadoras
dependan de los circuitos de memoria y de los dispositivos de almacenamiento
secundario de los sistemas informáticos para satisfacer sus requerimientos de
almacenamiento. El progreso en la integración, de muy alta escala, que
empaqueta millones de elementos de circuitos de memoria en circuitos integrados
diminutos de semiconductores, es el responsable del continuo incremento en la
capacidad de memoria principal de las computadoras. Las capacidades de
almacenamiento secundario también se están incrementando hacia los miles de
millones y billones de caracteres, debido a los avances en los medios magnéticos
y ópticos.
Existen muchos tipos de medios y dispositivos de almacenamiento. Las
interrelaciones de costo/velocidad/capacidad según uno se mueve de memoria de
semiconductor a discos magnéticos, discos ópticos y cintas magnéticas. Los
medios de almacenamiento de alta velocidad cuestan más por byte y proporcionan
capacidades menores. Los medios de almacenamiento de gran capacidad cuestan
menos por byte, pero son más lentos. Ésta es la razón por la que se tienen
diferentes tipos de medios de almacenamiento.
Sin embargo, todos los medios de almacenamiento, en especial los circuitos
integrados de memoria y los discos magnéticos, continúan aumentando en
velocidad y capacidad y disminuyendo en costo. Los desarrollos, como los
montajes automatizados de cartucho de alta velocidad, han dado tiempos de
acceso más rápidos para las cintas magnéticas, y la velocidad de las unidades de
discos ópticos sigue en aumento.
Las memorias de semiconductor se utilizan en especial para el almacenamiento
primario, aunque a veces se utilizan como dispositivos de almacenamiento
secundario de alta velocidad. El disco y la cinta magnética y los dispositivos de
discos ópticos, por otra parte, se utilizan como dispositivos de almacenamiento
secundario para agrandar de manera significativa la capacidad de
almacenamiento de los sistemas informáticos. Además, dado que la mayoría de
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
los circuitos de almacenamiento primario utilizan circuitos integrados RAM o
memoria de acceso aleatorio, que pierden su contenido cuando se interrumpe la
corriente eléctrica, los dispositivos de almacenamiento secundario proporcionan
un tipo más permanente de medio de almacenamiento.
3.1.2 Almacenamiento tradicional de datos y archivos.
Sólo imagine qué tan difícil sería obtener cualquier información de un sistema de
información si los datos se almacenaran de una manera desorganizada, o si no
hubiera alguna forma sistemática para recuperarlos. Por lo tanto, en todos los
sistemas de información, los recursos de datos tienen que organizarse y
estructurarse de alguna manera lógica, de forma que puedan ser accesados con
facilidad, procesados de manera eficiente, recuperados con rapidez y
administrados eficazmente. Por eso, se han inventado estructuras y métodos de
acceso a los datos, que van desde simples a complejos, para organizar y tener
acceso a la información almacenada por los sistemas de información de manera
eficaz.
¿Cómo se sentiría si usted fuera ejecutivo de una empresa y le dijeran que la
información que usted requiere acerca de sus empleados es demasiado difícil y
costosa de obtener? Suponga que el vicepresidente de servicios de información le
diera las siguientes razones:
 La información que usted quiere esta en diversos archivos, cada uno
organizado de manera diferente.
 Cada archivo ha sido organizado para utilizarse con un programa de
aplicación diferente, ninguno de los cuales produce la información que
desea en la forma que la necesita.
 No hay disponible ningún programa de aplicación para ayudar a obtener la
información que usted requiere de esos archivos.
Así como los usuarios finales pueden verse frustrados cuando una organización
depende de sistemas de procesamiento de datos y archivos, en los cuales los
datos se organizan, almacenan y procesan en archivos independientes de
registros de datos. En el enfoque tradicional del procesamiento de archivos que se
utilizaba en el procesamiento de información de negocio durante muchos años,
cada aplicación de negocio se diseñaba para utilizar uno o más archivos
especializados de datos que solo contenían tipos específicos de registros de
datos. Por ejemplo, se diseño una aplicación bancaria de procesamiento de
cuentas de cheques para accesar y actualizar un archivo de datos que contenía
registros especializados de datos de los clientes de cuentas de cheques del
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
banco. De manera similar, la aplicación del procesamiento de créditos revolventes
del banco es necesaria para acceder y actualizar un archivo especializado de
datos, que contenga los registros de datos acerca de los clientes de los créditos
revolventes.
El enfoque de almacenamiento y procesamiento de datos y archivos en
definitiva llego a ser demasiado engorroso, costoso e inflexible para proporcionar
la información necesaria a fin de administrar el negocio moderno y fue remplazado
por el enfoque de administración de base de datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.1.3 Problemas comunes en sistemas de almacenamiento tradicional.
Redundancia de datos. Los archivos independientes de datos incluían muchos
datos duplicados; la misma información (tal como el nombre y la dirección de un
cliente) se registraban y almacenaban en diversos archivos. Esta redundancia de
datos causaba problemas separados cuando la información debía actualizarse,
dado que tenían que desarrollarse programas separados de mantenimiento de
archivos y coordinarlos para asegurarse de que cada archivo era actualizado de
manera adecuada. Por supuesto, esto resulto ser difícil en la práctica, ya que se
presentaban muchas inconsistencias entre los datos almacenados en archivos
separados.
Falta de integración de datos. Tener datos en archivos independientes hizo
difícil proporcionar a los usuarios finales información para solicitudes específicas
que requerían acceder a datos almacenados en diferentes archivos. Tenían que
desarrollarse programas especiales de cómputo para recuperar datos de cada
archivo. Independiente. Esto era tan difícil, consumía tanto tiempo y es tan costoso
para algunas organizaciones, que les era imposible proporcionar dicha información
a los usuarios finales o a la administración. Si era necesario, los usuarios finales
tenían que extraer de forma manual la información requerida a partir de diversos
reportes producidos por cada aplicación separada y preparar reportes específicos
para la administración.
Dependencia de datos: en los sistemas de procesamiento de archivos, los
componentes principales de un sistema, la organización de los archivos, sus
ubicaciones físicas en la hardware de almacenamiento y el software de aplicación
utilizado para acceder a esos archivos, dependían unos de otros de manera
importante. Por ejemplo, los programas de aplicación contenían, por lo general,
referencias al formato específico de los datos almacenados en los archivos que
utilizaban. Así, los cambios en el formato y en la estructura de los datos y registros
de un archivo requerían que los cambios se hicieran a todos los programas que
utilizaran los sistemas de procesamiento de archivos. Demostró ser difícil de llevar
a cabo de manera adecuada, lo que produjo una gran inconsistencia en los
archivos de datos.
Otros problemas. En los sistemas de procesamientos de archivos, era fácil que
los diferentes usuarios finales y aplicaciones definieran los elementos de datos,
tales como números de inventario y direcciones de clientes, de manera diferente.
Esto causó serios problemas de inconsistencia en el desarrollo de los programas
para acceder a tales datos. Además se desconfiaba de la integridad de la
información (es decir, la precisión y la entereza), porque no había control de su
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
uso y mantenimiento por usuarios finales autorizados. Por lo tanto, la carencia de
estándares provocó importantes problemas en el desarrollo y el mantenimiento de
los programas de aplicación, y en la seguridad e integridad de los archivos de
datos que las organizaciones necesitaban.
3.1.4 Consideraciones empresariales al evaluar medios de almacenamiento.
Antes de gastar dinero en dispositivos de almacenamiento, los administradores
deben considerar varios factores: el propósito del almacenamiento de los datos, la
cantidad de datos que se van a guardar, la velocidad requerida para almacenar y
recuperar los datos, cuán portátil necesita ser el dispositivo y el costo.
Utilización de los datos almacenados.
La primera consideración antes de adoptar un medio de almacenamiento es cómo
se utilizarán los datos; sobre todo, si se emplearan para las operaciones actuales
o como respaldo. Si sólo se van a utilizar como respaldo y no para procesamiento,
una cinta magnética o los Discos Compactos (CD) son una opción adecuada. La
cinta magnética cuesta menos y contiene más datos por carrete o cassette que un
solo CD; esto también debe ser una consideración. Si los usuarios necesitan
acceder con rapidez a los registros individuales, los discos duros magnéticos son
la mejor opción. Por lo tanto, una empresa que permite a los clientes recuperar
sus registros en línea debe utilizar discos magnéticos rápidos. Si la información es
permanente, como las enciclopedias o los mapas utilizados en las bibliotecas, la
información debe colocarse en CD o DVD, porque el usuario necesita una
recuperación rápida y directa de información específica (registros) y no le conviene
una búsqueda secuencial en una cinta.
Cantidad de datos almacenados.
Cuando el volumen de almacenamiento es el factor más importante, los
administradores primero deben considerar el precio por megabyte, es decir, la
proporción de dinero entre la capacidad de almacenamiento. Si el medio se va a
utilizar solo para respaldo, su bajo costo vuelve ideales las cintas magnéticas y los
CD-R. Si el medio se va utilizar para una recuperación rápida, los mejores son los
discos magnéticos. Si es necesario guardar muchos datos, sobre todo archivos
grandes como imágenes, sonidos y video, pero no es tan importante la velocidad
para encontrar un archivo o registro específico, un DVD es una buena opción.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Para algunos propósitos, es importante la capacidad absoluta del dispositivo, no la
densidad. Cuando se requiere guardar en un solo dispositivo un conjunto muy
grande de aplicaciones de software y/o datos, debe elegirse un dispositivo con
capacidad grande. Por ejemplo, si un representante de ventas debe mostrar
aplicaciones que representan 4GB, un disco duro portátil pequeño o una unidad
flash USB sería una opción más práctica.
Velocidad.
La velocidad de los discos magnéticos se suele medir en rotaciones por minuto
(RPM). Los discos actuales vienen con velocidades de 10 000 y 15 000 RPM.
Cuanto mas altas son las RPM, más corto es el tiempo de transferencia de datos y
mejor el desempeño general. Aunque son atractivos la gran capacidad y el bajo
costo de los CD, la velocidad de transferencia de los discos duros magnéticos
todavía es mucho mejor que los CD y DVD. Si se requiere una velocidad muy alta,
en la actualidad la mejor opción es un SSD (Disco de Estado Sólido) la cual es
una alternativa para los discos magnéticos, se conectan a las computadoras de
manera similar a los discos magnéticos y viene con su propia CPU, acelerando el
procesamiento de datos. Las organizaciones utilizan los SSD para guardar el
software que se utilizan con frecuencia con el fin de evitar “atascos” en el
procesamiento de datos.
Espacio unitario y portabilidad.
A veces el costo de un gigabyte almacenado no es la consideración más
importante, sino el tamaño físico del medio de almacenamiento. Un disco duro
portátil puede ser económico y rápido, pero para un vendedor puede ser más
práctico llevar un CD para sus demostraciones, pero le puede convenir más llevar
consigo una unidad flash USB (Bus Serial Universal) de 4 GB en lugar de varios
CD, gracias al hecho de que todas las PC tienen puertos USB.
Costo.
Una vez que los administradores determinan el mejor tipo de dispositivo de
almacenamiento de datos para una empresa específica, necesitan considerar el
costo. El método sencillo es obtener el mayor tamaño de almacenamiento por la
menor cantidad de dinero. Para cada dispositivo propuesto, considere la
proporción de pesos por gigabyte de capacidad, cuanto más baja es la proporción,
más favorable es el producto.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Confiabilidad y expectativa de vida.
Si bien ésta no suele ser la prioridad más alta, las empresas también deben
considerar la confiabilidad del medio de almacenamiento y su expectativa de vida.
Por ejemplo, los discos ópticos son más confiables y durables que los discos
magnéticos. Los datos almacenados en forma magnética permanecen confiables
durante unos 10 años, mientras que se espera que los CD y DVD guarden los
datos de manera confiable durante 50 o 100 años, siempre y cuando se respeten
las condiciones ideales para su conservación física.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.2 Estructura de datos y archivos
3.2.1 Estructura de datos
Una estructura de datos es una forma de organizar un conjunto de datos
elementales con el objetivo de facilitar su manipulación. Un dato elemental es la
mínima información que se tiene en un sistema.
Una estructura de datos define la organización e interrelación de éstos y un
conjunto de operaciones que se pueden realizar sobre ellos. Las operaciones
básicas son:



Alta, adicionar un nuevo valor a la estructura.
Baja, borrar un valor de la estructura.
Búsqueda, encontrar un determinado valor en la estructura para realizar
una operación con este valor, en forma secuencial o binario (siempre y
cuando los datos estén ordenados).
Otras operaciones que se pueden realizar son:


Ordenamiento, de los elementos pertenecientes a la estructura.
Apareo, dadas dos estructuras originar una nueva ordenada y que
contenga a las apareadas.
Cada estructura ofrece ventajas y desventajas en relación a la simplicidad y
eficiencia para la realización de cada operación. De esta forma, la elección de la
estructura de datos apropiada para cada problema depende de factores como la
frecuencia y el orden en que se realiza cada operación sobre los datos.
Listas.
La lista enlazada básica es la lista enlazada simple la cual tiene un enlace por
elemento. Este enlace apunta al siguiente elemento en la lista, o al valor nulo a la
lista vacía, si es el último elemento.
Una lista enlazada simple contiene dos valores: el valor actual del elemento y un
enlace al siguiente elemento
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Lista Doblemente Enlazada
Un tipo de lista enlazada más sofisticado es la lista doblemente enlazada o lista
enlazadas de dos vías. Cada elemento tiene dos enlaces: uno apunta al elemento
anterior, o apunta al valor NULO si es el primer elemento; y otro que apunta al
elemento siguiente, o apunta al valor NULO si es el último elemento.
Una lista doblemente enlazada contiene tres valores: el valor, el link al elemento
siguiente, y el link al anterior
Matriz.
Desde el punto de vista lógico una matriz se puede ver como un conjunto de
elementos ordenados en fila (o filas y columnas si tuviera dos dimensiones). En
principio, se puede considerar que todas las matrices son de una dimensión, la
dimensión principal, pero los elementos de dicha fila pueden ser a su vez matrices,
lo que nos permite hablar de la existencia de matrices multidimensionales, aunque
las más fáciles de imaginar son los de una, dos y tres dimensiones.
Estas estructuras de datos son adecuadas para situaciones en las que el acceso a
los datos se realice de forma aleatoria e impredecible. La forma de acceder a los
elementos de la matriz es directa; esto significa que el elemento deseado es
obtenido a partir de su índice y no hay que ir buscándolo elemento por elemento
(en contraposición, en el caso de una lista, para llegar, por ejemplo, al tercer
elemento hay que acceder a los dos anteriores.
Pilas.
Una pila es una lista ordinal o estructura de datos en la que el modo de acceso a
sus elementos es último en entrar, primero en salir, que permite almacenar y
recuperar datos. Se aplica en multitud de ocasiones en informática debido a su
simplicidad y ordenación implícita en la propia estructura.
Para el manejo de los datos se cuenta con dos operaciones básicas: apilar, que
coloca un objeto en la pila, y su operación inversa, retirar, que retira el último
elemento apilado.
En cada momento sólo se tiene acceso a la parte superior de la pila, es decir, al
último objeto apilado. La operación retirar permite la obtención de este elemento,
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
que es retirado de la pila permitiendo el acceso al siguiente (apilado con
anterioridad), que pasa a ser el nuevo último elemento de la pila. Por analogía con
objetos cotidianos, una operación apilar equivaldría a colocar un plato sobre una
pila de platos, y una operación retirar a retirarlo el que se encuentra hasta arriba.
Colas
Una cola es una estructura de datos, caracterizada por ser una secuencia de
elementos en la que la operación de inserción se realiza por un extremo y la
operación de extracción por el otro. El primer elemento en entrar será también el
primero en salir.
Las colas se utilizan en sistemas informáticos, transportes y operaciones de
investigación (entre otros), dónde los objetos, personas o eventos son tomados
como datos que se almacenan y se guardan mediante colas para su posterior
procesamiento.
La particularidad de una estructura de datos de cola es el hecho de que sólo
podemos acceder al primer y al último elemento de la estructura. Así mismo, los
elementos sólo se pueden eliminar por el principio y sólo se pueden añadir por el
final de la cola.
Ejemplos de colas en la vida real serían: personas comprando en un
supermercado, esperando para entrar a ver un partido de béisbol, esperando en el
cine para ver una película, etc. La idea esencial es que son todas líneas de
espera.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
En estos casos, el primer elemento de la lista realiza su función (pagar comida,
pagar entrada para el partido o para el cine) y deja la cola. Este movimiento está
representado en la cola por la función desencolar. Cada vez que otro elemento se
añade a la lista de espera se añaden al final de la cola representando la función
encolar. Hay otras funciones auxiliares para ver el tamaño de la cola, para ver si
está vacía en el caso de que no haya nadie esperando o para ver el primer
elemento de la cola.
Árbol.
Un árbol es una estructura de datos ampliamente usada que imita la forma de un
árbol (un conjunto de elementos conectados). Un elemento es la unidad sobre la
que se construye el árbol y puede tener cero o más elementos hijos conectados a
él. Se dice que un elemento a es padre de un elemento b si existe un enlace
desde a hasta b (en ese caso, también decimos que b es hijo de a). Sólo puede
haber un único elemento sin padres, que llamaremos raíz. Un elemento que no
tiene hijos se conoce como hoja. Los demás elementos (tienen padre y uno o
varios hijos) se les conoce como rama.
Las operaciones comunes en árboles son:
 Enumerar todos los elementos.
 Buscar un elemento.
 Dado un elemento, listar los hijos (si los hay).
 Borrar un elemento.
 Eliminar un subárbol (algunas veces llamada podar).
 Añadir un subárbol (algunas veces llamada injertar).
 Encontrar la raíz de cualquier elemento.
Usos comunes de los árboles son:


Representación de datos jerárquicos.
Como ayuda para realizar búsquedas en conjuntos de datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.2.2 Estructura de archivos.
Un archivo o fichero informático es un conjunto de bits almacenado en un
dispositivo periférico. Un archivo es identificado por un nombre y la descripción de
la carpeta o directorio que lo contiene. Los archivos informáticos se llaman así
porque son los equivalentes digitales de los archivos en tarjetas, papel o
microfichas del entorno de oficina tradicional. Los archivos informáticos facilitan
una manera de organizar los recursos usados para almacenar permanentemente
datos en un sistema informático.
El termino archivo fue utilizado para los archiveros y los conjuntos de documentos
mucho antes de que se volviera parte del lenguaje de las computadoras
personales. Hoy, los archivos de computadora en formato digital ofrecen un modo
compacto y conveniente para guardar documentos, fotografías, videos y música.
Los archivos de computadora tienen varias características, como nombre, formato,
ubicación, tamaño y fecha.
Un archivo de computadora o, simplemente, un archivo se define como un
conjunto de datos nombrados que existe en un medio de almacenamiento, como
un disco, CD, DVD, o cinta. Un archivo puede contener un grupo de registros, un
documento, una fotografía, un video, música, un mensaje de correo electrónico o
un programa de computadora.
Un archivo de datos informático normalmente tiene un tamaño, que generalmente
se expresa en bytes; en todos los sistemas operativos modernos, el tamaño puede
ser cualquier número entero no negativo de bytes hasta un máximo dependiendo
del sistema. Depende del software que se ejecuta en la computadora el interpretar
esta estructura básica como por ejemplo un programa, un texto o una imagen,
basándose en su nombre y contenido. Los datos de un archivo informático
normalmente consisten de paquetes más pequeños de datos (a menudo llamados
registros) que son individualmente diferentes pero que comparten algún rasgo en
común. Por ejemplo, un archivo de nóminas puede contener datos sobre todos los
empleados de una empresa y los detalles de su nómina; cada registro del archivo
de nóminas se refiere únicamente a un empleado, y todos los registros tienen la
característica común de estar relacionados con las nóminas, esto es muy similar a
colocar todos los datos sobre nóminas en un archivador concreto en una oficina
que no tenga ninguna computadora. Un archivo de texto puede contener líneas de
texto, correspondientes a líneas impresas en una hoja de papel.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
La manera en que se agrupan los datos en un archivo depende completamente de
la persona que diseñe el archivo. Esto ha conducido a unas estructuras de archivo
más o menos estandarizadas para todos los propósitos imaginables, desde los
más simples a los más complejos. La mayoría de los archivos informáticos son
usados por programas de computadora. Estos programas crean, modifican y
borran archivos para su propio uso bajo demanda. Los programadores que crean
los programas deciden qué archivos necesitan, cómo se van a usar, y (a menudo)
sus nombres.
Cada archivo tiene un nombre y también una extensión. Cuando guarda un
archivo, debe proporcionarle un nombre valido que respete las reglas específicas,
conocidas como conversiones para nombrar archivos. Cada sistema operativo
tiene un conjunto único de conversiones para nombrar archivos.
En algunos casos, los programas de computadora manipulan los archivos que se
hacen visibles al usuario de la computadora. Por ejemplo, en un programa de
procesamiento de texto, el usuario manipula archivos-documento a los que él
mismo da nombre. El contenido del archivo-documento está organizado de una
manera que el programa de procesamiento de texto entiende, pero el usuario elige
el nombre y la ubicación del archivo, y proporciona la información (como palabras
y texto) que se almacenará en el archivo.
Los archivos de una computadora se pueden crear, mover, modificar, aumentar,
reducir y borrar. En la mayoría de los casos, los programas de computadora que
se ejecutan en la computadora se encargan de estas operaciones, pero el usuario
de una computadora también puede manipular los archivos si es necesario. Por
ejemplo, los archivos de Microsoft Office Word son normalmente creados y
modificados por el programa Microsoft Word en respuesta a las órdenes del
usuario, pero el usuario también puede mover, renombrar o borrar estos archivos
directamente usando un programa gestor de archivos como Windows Explorer (en
computadoras con sistema operativo Windows).
También un archivo es un documento donde uno introduce algún tipo de Dato para
almacenar en un objeto que lo pueda leer o modificar una computadora.
En los sistemas informáticos modernos, los archivos siempre tienen nombres. Los
archivos se ubican en directorios. El nombre de un archivo debe ser único en ese
directorio. En otras palabras, no puede haber dos archivos con el mismo nombre
en el mismo directorio.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
El nombre de un archivo y la ruta al directorio del archivo lo identifica de manera
unívoca entre todos los demás archivos del sistema informático, no puede haber
dos archivos con el mismo nombre y ruta. El aspecto del nombre depende del tipo
de sistema informático que se use. Las computadoras modernas permiten
nombres largos que contengan casi cualquier combinación de letras y dígitos,
haciendo más fácil entender el propósito de un archivo de un vistazo. Algunos
sistemas informáticos permiten nombres de archivo que contengan espacios; otros
no. La distinción entre mayúsculas y minúsculas en los nombres de archivo está
determinada por el sistema de archivos. La mayoría de las computadoras
organizan los archivos en jerarquías llamadas carpetas, directorios o catálogos. (El
concepto es el mismo independientemente de la terminología usada.) Cada
carpeta puede contener un número arbitrario de archivos, y también puede
contener otras carpetas. Las otras carpetas pueden contener todavía más archivos
y carpetas, y así sucesivamente, construyéndose una estructura en árbol en la que
una “carpeta raíz” puede contener cualquier número de niveles de otras carpetas y
archivos. A las carpetas se les puede dar nombre exactamente igual que a los
archivos (excepto para la carpeta raíz, que a menudo no tiene nombre). El uso de
carpetas hace más fácil organizar los archivos de una manera lógica.
Cuando una computadora permite el uso de carpetas, cada archivo y carpeta no
sólo tiene un nombre propio, sino también una ruta, que identifica la carpeta o
carpetas en las que reside un archivo o carpeta. En la ruta, se emplea algún tipo
de carácter especial (como una barra / ) para separar los nombres de los archivos
y carpetas. Por ejemplo, en la ilustración mostrada en este artículo, la ruta
/Payroll/Salaries/Managers identifica unívocamente un archivo llamado Managers
que está en una carpeta llamada Salaries que a su vez está contenida en una
carpeta llamada Payroll. En este ejemplo, los nombres de las carpetas y archivos
están separados por barras; la superior o carpeta raíz no tiene nombre, y por ello
la ruta comienza con una barra (si la carpeta raíz tuviera nombre, precedería a
esta primera barra).
Muchos sistemas informáticos usan extensiones en los nombres de archivo para
ayudar a identificar qué contienen. En computadoras Windows, las extensiones
consisten en un punto al final del nombre del archivo, seguido de unas pocas
letras para identificar el tipo de archivo. Una extensión de archivo también
conocida como extensión de nombre de archivo) es un identificador de archivo
opcional separado del nombre principal del archivo por un punto, como Paint.exe.
Cuando se familiarice con las extensiones de archivo, le permitirán suponer qué
contiene el archivo. Los archivos con extensiones .exe son los que puede ejecutar
la computadora. Por ejemplo, Paint.exe es una utilería de gráficos incluida en el
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
sistema operativo Windows, Los archivos con extensiones .dat suelen ser archivos
de datos. Los archivos con extensiones .doc contienen documentos de un
procesador de textos. Incluso cuando se utilizan extensiones en un sistema
informático, el grado con el que un sistema informático los reconoce y trata puede
variar; en algunos sistemas son obligatorios, mientras que en otros sistemas se
ignoran completamente si están presentes.
Utilerías para la administración de archivos.
Casi todos los sistemas operativos ofrecen utilerías para la administración de
archivos que presentan una imagen general de los archivos que ha almacenado
en sus discos y le ayudan a trabajar con ellos. Por ejemplo, Windows ofrece una
utilería para administración de archivos a la que tiene acceso desde el icono Mi
PC o Equipo desde la opción en el menú Inicio. En las computadoras Mac OS, las
utilerías para administración de archivos se llaman Finder y Spotlight. Estas
utilerías, le ayudan a observar una lista de archivos, encontrarlos, mover archivos
de un lugar a otro, hacer copias, eliminarlos, descubrir sus propiedades y
renombrarlos.
Las utilerías para administración de archivos emplean una especie de metáfora de
almacenamiento para que visualice y organice dispositivos de almacenamiento.
Estas metáforas también se denominan modelos lógicos de almacenamiento,
porque se supone que le ayudan a formar una imagen mental (lógica) de la
manera en que guarda sus archivos. En esta metáfora cada dispositivo de
almacenamiento corresponde a una de las gavetas de un archivero. Las gavetas
contienen carpetas y las carpetas contienen archivos.
Otra metáfora de almacenamiento se basa en un diagrama jerárquico, que se
conoce como estructura de árbol. En esta metáfora un árbol representa un
dispositivo de almacenamiento. El tronco del árbol corresponde al directorio raíz.
Las ramas del árbol representan las carpetas. Estas ramas se pueden dividir en
ramas más pequeñas que representan carpetas dentro de otras La metáfora de la
estructura de árbol ofrece una imagen mental útil del modo en que se organizan
los archivos y las carpetas.
Una utilería para administración de archivos contienen herramientas y
procedimientos que le ayudan a rastrear sus programas y archivos de datos, pero
estas herramientas son más útiles cuando usted tiene un plan lógico para
organizar sus archivos y cuando sigue algunos lineamientos básicos de
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
administración de archivos. Las sugerencias siguientes le ayudarán a administrar
los archivos:

Emplee nombres descriptivos. Asigne a sus carpetas y archivos nombres
descriptivos y evite utilizar abreviaturas innecesarias.

Conserve las extensiones de archivos. Al renombrar un archivo,
mantenga la extensión original para que pueda abrirlo con facilidad con la
aplicación correcta.

Agrupe los archivos similares. Separe los archivos en carpetas con base
en un tema específico. Por ejemplo, guarde sus tareas de redacción
creativa en una carpeta y sus archivos de música MP3 en otra.

Organice sus carpetas de lo general a lo particular. Al diseñar una
jerarquía de carpetas, piense como quiere consultar y respaldar los
archivos. Por ejemplo, es fácil especificar una carpeta y sus carpetas
secundarias para hacer un respaldo. Sin embargo, si sus datos importantes
están dispersos en diversas carpetas, tardará más tiempo en respaldarlos.

Considere emplear el directorio predeterminado Mis documentos. La
carpeta predeterminada por el software de Windows para guardar archivos
de datos es Mis documentos. Es recomendable utilizar Mis documentos
como su carpeta y datos principales y agregar las carpetas secundarias
necesarias para organizar sus archivos.

No mezcle archivos de datos y archivos de programas. No guarde
archivos de datos en las carpetas que contienen su software; en Windows,
casi todo el software se guara en carpetas secundarias de la carpeta
Archivos de Programas.

No guarde archivos en el directorio raíz. Si bien es posible crear
carpetas en el directorio raíz, no es una buena práctica guardar programas
o archivos de datos en el directorio raíz del disco duro de la computadora.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN

Consulte los archivos desde el disco duro. Para un mejor desempeño,
copie los archivos de los dispositivos flash USB o los CD’s en el disco duro
de su computadora antes de consultarlos.

Elimine o guarde de manera permanente los archivos que ya no se
necesitan. Eliminar los archivos y carpetas que ya no necesita evita que su
lista de archivos alcance un tamaño poco manejable.

Recuerde las ubicaciones de almacenamiento. Cuando guarde archivos,
compruebe que la letra de la unidad y el nombre de la carpeta especifiquen
la ubicación de almacenamiento correcta.

Haga respaldos. Respalde sus carpetas de regularidad.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.3 Organización de datos y archivos.
3.3.1 Almacenamiento físico de los archivos.
A la estructura de archivos y carpetas que observa en el Explorador de Windows
se le denomina modelo lógico, porque se supone que le ayuda a crear una imagen
mental. El modelo de almacenamiento físico describe lo que en realidad ocurre
en los discos y los circuitos. Como puede observar, el modelo físico, es muy
diferente al modelo lógico.
Antes que una computadora pueda guardar un archivo en un disco, CD o DVD, el
medio de almacenamiento debe estar formateado. El proceso de formateado crea
el equivalente de recipientes electrónicos para almacenamiento al dividir un disco
en pistas y después cada pista en sectores. Las pistas y los sectores se
enumeran con el fin de proporcionar direcciones para cada recipiente de
almacenamiento de datos. El esquema de numeración depende del dispositivo de
almacenamiento del sistema operativo. En los discos flexibles y en el disco duro,
las pistas están ordenadas como círculos concéntricos; en los CDs o DVDs, una o
más pistas forman una espiral hacia fuera del centro del disco.
En la actualidad, casi todos los discos duros se formatean en la fábrica; sin
embargo, los sistemas operativos de las computadoras contienen utilería para
formatear que usted puede utilizar para volver a formatear algunos dispositivos de
almacenamiento: por lo general, discos flexibles y discos duros. Las empresas que
fabrican discos duros, unidades grabadoras de CDs o DVDs, y software de
grabación también proporcionan utilerías para formatear.
Cuando emplea una utilería para formatear, ésta borra cualquier dato que esté en
el disco, y después prepara las pistas y los sectores necesarios para contener
datos.
El sistema operativo emplea un sistema de archivos para rastrear los nombres y
las ubicaciones de los archivos que residen en un medio de almacenamiento,
como un disco duro. Los distintos sistemas operativos emplean diferentes
sistemas de archivos. Casi todas las versiones de Mac OS utilizan el Macintosh
Hierarchical File System (HFS). El sistema de archivos nativo para Linux es
Ext2fs (extended 2 file system). Windows XP y Vista emplean en un sistema de
archivos llamado NTFS (New Technology File System). Para acelerar el proceso
de guardar y recuperar datos, el disco duro suele trabajar con un grupo de
sectores llamados clúster o “bloque”. El número de sectores que forman un
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
clúster es variable, dependiendo de la capacidad del disco y del modo en que el
sistema operativo trabaja con los archivos. La tarea principal de un sistema de
archivos es mantener una lista de los clústeres y rastrear cuales están vacíos y
cuales contienen datos. Esta información se guarda en un archivo índice especial.
Si su computadora emplea NTFS, se llama Tabla Maestra de Archivos (MFT).
Cada uno de esos discos contiene su propio archivo índice para tener siempre
disponible información acerca de su contenido cuando se emplea. Por desgracia,
guardar este archivo crucial en el disco también representa un riesgo, porque si
una falla de una cabeza o un virus dañan el archivo índice, ya no puede tener
acceso a los datos guardados en el disco. Los archivos índices se dañan con
mucha frecuencia, por lo que es importante que respalde sus datos.
Cuando guarda un archivo, el sistema operativo de su PC consulta el archivo
índice para verificar los clústeres que están vacíos, registran ahí los datos del
archivo y después incluye en el archivo índice el nuevo nombre de archivo y su
ubicación.
Un archivo que no cabe en un solo clúster se aloja en el siguiente clúster
adyacente, a menos que este clúster ya contenga datos. Cuando no están
disponibles clúster adyacentes, el sistema operativo guarda las partes de un
archivo en clústeres no adyacentes.
Cuando usted quiere recuperar un archivo, el sistema operativo consulta el índice
su nombre y su ubicación. Mueve la cabeza de lectura-escritura del disco duro al
primer clúster que contiene los datos del archivo. Con los datos adicionales del
archivo índice, el sistema operativo puede mover las cabezas de lectura escritura
a cada uno de los clústeres que contiene las partes restantes del archivo.
Cuando hace clic en el icono de archivo y después selecciona la opción Eliminar,
el sistema operativo simplemente cambia el estado de clústeres del archivo a
“vacío” y elimina el nombre del archivo del archivo índice. El nombre del archivo ya
no aparece en la lista del directorio, pero los datos permanecen en los clústeres
hasta que se guarda ahí un archivo nuevo. Usted puede pensar que estos datos
se han borrado, pero es posible adquirir utilerías que recuperan gran parte de
estos datos supuestamente eliminados.
Para eliminar los datos de un disco de manera que nadie pueda leerlos jamás, es
posible utilizar el software especial para triturar archivos, que escribe sobre los
sectores supuestamente vacíos con 1’s y 0’s aleatorios.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
La Papelera de reciclaje Windows y utilerías similares en otros sistemas
operativos están diseñadas para que cuente con una protección ante el hecho de
eliminar por accidente archivos del disco duro que en realidad necesita. En lugar
de marcar los clústeres de un archivo como disponibles, el sistema operativo
mueve al archivo la carpeta Papelera de reciclaje. El archivo eliminado todavía
ocupa espacio en el disco, pero no aparece en la lista de directorios.
Es posible recuperar los archivos que están en la Papelera de reciclaje para que
vuelvan a aparecer en el directorio. También es posible vaciar la papelera de
reciclaje para eliminar de manera permanente los archivos que contiene.
Conforme una computadora escribe archivos, las partes de los archivos tienden a
dispersarse por todo el disco. Estos archivos fragmentados se guardan en
clústeres no adyacentes. El rendimiento de la unidad suele declinar cuando las
cabezas de lectura-escritura avanzan y retroceden para localizar los clústeres que
contiene las partes de un archivo. Para recuperar un rendimiento optimo, se
emplea una utilería de desfragmentación como el Desfragmentador del disco de
Windows, para reorganizar los archivos en un disco de modo que se guarde en los
clústeres contiguos.
3.3.2 Administración de recursos de datos.
La información es un recurso vital de las organizaciones, que tiene que
administrarse como cualquier otro activo importante de un negocio. En la
actualidad, las empresas no pueden sobrevivir o tener éxito sin información de
calidad acerca de sus operaciones internas y de su ambiente externo.
Con cada clic del ratón cuando se está en línea, o bien se crea un nuevo bit de
datos o bien datos ya almacenados son recuperados a partir de todos esos sitos
Web de negocios. Todo eso se presenta junto con la gran demanda por
almacenamiento de calidad industrial ya en uso por parte de grandes
corporaciones. Lo que está impulsando el crecimiento es un imperativo aplastante
para que las corporaciones analicen cada bit de información que puedan extraer
de sus enormes almacenes de datos para lograr una ventaja competitiva. Esto ha
convertido la función de almacenamiento y administración de datos en una función
estratégica clave de la era de la información.
Esa es la razón por la cual las organizaciones y sus administradores tiene que
practicar la administración de recursos de datos, una actividad administrativa
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
que aplica tecnologías de sistemas de información (como administración de bases
de datos, almacenes de datos y otras herramientas de administración de datos) a
la tarea de administrar los recursos de datos de una organización, con el fin de
satisfacer las necesidades de información de sus participantes de negocio. Se
mostrará las implicaciones administrativas de utilizar las tecnologías y los métodos
de administración de recursos de datos para administrar los activos de información
de una organización, con el fin de satisfacer los requerimientos de información del
negocio.
3.3.3 Conceptos fundamentales de los datos.
Se ha desarrollado un esquema conceptual de varios niveles de datos, que
identifica las diferencias entre diversas agrupaciones, o elementos, de datos. De
este modo, los datos pueden organizarse de forma lógica en caracteres, campos,
registros, archivos y bases de datos, del mismo modo como la escritura puede
organizarse en letras, palabras, oraciones, párrafos y documentos.
Caracter.
El elemento más básico de los datos lógicos es el caracter, que consiste en un
símbolo único alfabético, numérico o de otro tipo. Uno podría argumentar que el bit
o el byte es un elemento de dato más básico, pero recuerde que esos términos se
refieren a los elementos de almacenamiento físico, proporcionados por el
hardware de cómputo. Desde el punto de vista de un usuario ( es decir, desde un
punto de vista lógico de los datos en contraposición mal punto de vista físico o de
hardware) , un carácter es el elemento más básico de dato que puede ser
observado y manipulado.
Campo.
El siguiente nivel de datos es el campo o elemento de dato. Un campo consiste en
una agrupación de caracteres relacionados. Por ejemplo, la agrupación de los
caracteres alfabéticos del nombre de una persona puede formar un campo de
nombre (o por lo general, campos de primer apellido, segundo apellido y nombre)
y la agrupación de números de los montos de ventas forma un campo de monto
de ventas. En específico, un campo de información representa un atributo (una
característica o cualidad) de alguna entidad (objeto, persona, lugar o evento) por
ejemplo, el salario de un empleado es un atributo que es un campo de información
típico utilizado para describir una entidad que un empleado de una empresa.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Registro.
Los campos relacionados de información se agrupan para formar un registro. Por
eso, un registro representa una colección de atributos que describen una entidad.
Un ejemplo es el registro de nomina de una persona, el cual consiste en campos
de información que describen atributos tales como el nombre de la persona, su
número de seguro social y el monto de su paga. Los registros de longitud variable
contienen un número variable de campos y de longitudes de campo.
Archivo.
Un grupo de registros relacionados es un archivo de datos, o tabla. Así un archivo
de empleados contendría los registros de los empleados de una empresa. A
menudo, los archivos se clasifican según la aplicación para la cual se utilizan
principalmente, como por ejemplo, un archivo de nomina o un archivo de
inventarios, por el tipo de datos que contienen, como un archivo de documento o
un archivo de imágenes graficas. Los archivos también se clasifican según su
permanencia, por ejemplo, un archivo maestro de nomina, frente a un archivo de
transacción semanal de nomina. Un archivo de transacción, por lo tanto,
contendría registros de todas las transacciones que ocurren durante un periodo y
que puede utilizarse de forma periódica para actualizar los registros permanentes
contenidos en un archivo maestro. Un archivo histórico es un archivo maestro o
de transacciones obsoleto retenido para propósitos de respaldo o para un
almacenamiento histórico a largo plazo llamado almacenamiento de archivo.
Base de datos.
Una base de datos es una colección integrada de elementos de datos
relacionados de manera lógica. Una base de datos consolida los registros
almacenados de antemano en archivos separados dentro de un grupo común de
elementos de datos, el cual proporciona información para muchas aplicaciones.
Los datos almacenados en una base de datos son independientes de los
programas de aplicación que los utilizan, y del tipo de dispositivos de
almacenamiento en los que están almacenados.
Así, las bases de datos contienen elementos de datos que describen entidades
y relaciones entre las entidades, también muestra algunas de las aplicaciones de
negocio (facturación, procesamiento de pagos) que dependen del acceso a los
elementos de datos de la base de datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.3.4 Tipos de bases de datos.
Los continuos desarrollos en la tecnología de información y en sus aplicaciones
de negocio han dado como resultado la evolución de diversos tipos importantes de
bases de datos.
Bases de datos operativas.
Las bases de datos operativas almacenan datos detallados necesarios para
apoyar el proceso y operaciones de negocio de una empresa. También se le llama
bases de datos de áreas temáticas (SABD, siglas de termino Subset Área
Databases), bases de datos transaccionales o base de datos de producción.
Como ejemplos tenemos una base de datos de clientes, base de datos de
recursos humanos, base de datos de inventario y otras bases de datos que
contienen información generada por las operaciones de negocios. Por ejemplo,
una base de datos de recursos humanos incluirá datos que identifican a cada
empleado y su tiempo trabajando, compensaciones, beneficios, evaluaciones de
desempeño, estatus de capacitación y desarrollo y otros datos relacionados con
los recursos humanos. Se señalan algunas de las bases de datos operativas
comunes que pueden crearse y administrarse para un negocio pequeño mediante
el software de administración de bases de datos Microsoft Access.
Bases de datos distribuidas.
Muchas organizaciones reproducen y distribuyen copias o partes de bases de
datos a servidores de red en una diversidad de sitios. Estas bases de datos
distribuidas pueden residir en servidores de red en Internet, en intranets,
extranets corporativas, o en otras redes de la empresa. Las bases de datos
distribuidas pueden ser copias de bases de datos operativas o analíticas, de bases
de hipermedios o de discusión, o cualquier otro tipo de bases de datos. La
reproducción en las estaciones de trabajo de los usuarios finales. Asegurar que la
información de las bases de datos distribuidas de una organización sea
actualizada de manera consistente y concurrente es un desafío importante de la
administración de este tipo de bases de datos.
Bases de datos externas.
El acceso a un acervo de información de bases de datos externas está
disponible por una tarifa para servicios comerciales en línea, y con o sin cargo
desde muchas fuentes en Internet. Los sitios Web ofrecen una variedad infinita de
paginas hipervinculadas de documentos multimedia en bases de datos de
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
hipermedios para un acceso. Los datos están disponibles en forma de
estadísticas. O pueden ver o descargar resúmenes o copias completas de cientos
de periódicos, revistas, cartas, documentos de investigación y otro material
publicado o periódico a partir de bases de datos bibliografía y de textos
completos.
Bases de datos de hipermedios.
El rápido crecimiento de sitios Web en Internet y de intranets y extranets
corporativas ha incrementado de manera radical el uso de bases de datos de
documentos de hipertexto e hipermedios. Un sitio Web almacena dicha
información en una base de datos de hipermedios que consiste en paginas
multimedia hipervinculadas (texto, graficas, imágenes fotográficas, segmentos de
video, audio, etc.), es decir, desde el punto de vista de la administración una base
de datos de elementos interrelacionados de páginas de hipermedios, en lugar de
registros de datos interrelacionados.
3.3.5 Almacén de datos y minería de datos.
Un almacén de datos guarda datos que se han extraído desde diversas bases de
datos operativas, externas y de otro tipo de organización. Es una fuente central de
datos que han sido limpiados, transformados y catalogados, de tal manera que los
administradores y otros profesionales de negocios puedan utilizarlos para la
minería de datos, el procesamiento analítico en línea otras formas de análisis de
negocio, investigación de mercados y apoyo a la toma de decisiones. Los
almacenes de datos pueden subsidiarse en mercados de datos, que contienen
subconjuntos de datos del almacén y que se enfocan en aspectos específicos de
una empresa, tales como un departamento o un proceso de negocio.
Los datos se capturan a partir de una variedad de bases de datos operativas y
externas, y como se limpian y se transforman en datos que pueden ser mejor
utilizados para el análisis. Este proceso de adquisición puede incluir actividades
como la consolidación de datos de diferentes fuentes, la filtración de datos no
deseados, la corrección de datos incorrectos, la conversión de datos en nuevos
elementos de datos y la concentración de datos en nuevos subconjuntos de datos.
Después, estos datos se almacenan en el almacén de datos de la empresa, desde
donde pueden ser trasladados a mercados de datos o a un almacén analítico de
datos, que contenga los datos en una forma más útil para ciertos tipos de análisis.
Los metadatos (información que define a los datos en el almacén de datos) se
almacenan en un depósito de metadatos y se catalogan mediante un directorio de
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
metadatos. Por último, puede proporcionarse una variedad de herramientas
analíticas se software para consultar, reportar, realizar minería y analizar los datos
para distribuiros mediante Internet y mediante los sistemas de intranet en Web a
los usuarios finales de negocio.
Minería de datos.
La minería de datos es una aplicación principal de las bases de datos de los
almacenes de datos. En la minería de datos, los daos de un almacén de datos se
analizan para revelar patrones y tendencias ocultos en la actividad histórica del
negocio. Esto puede utilizarse para ayudar a los administradores a tomar
decisiones acerca de los cambios estratégicos en las operaciones de negocio, con
el fin de lograr ventajas competitivas en el mercado.
La minería de datos puede descubrir nuevas correlaciones, patrones y tendencias
de las grandes cantidades de datos de negocio (con frecuencia varios terabyetes
de datos), almacenados en los almacenes de datos. El software de minería de
datos utiliza algoritmos avanzados de reconocimiento de patrones, así como una
variedad de técnicas matemáticas y estadísticas para filtrar grandes volúmenes de
datos y extraer información estratégica de negocio antes ignorada. Por ejemplo,
muchas utilizan minería de datos para:



Desempeñar “análisis de canasta de mercado” con el fin de identificar
nuevos grupos de productos
Descubrir las causa de origen de los problemas de calidad o de
manufactura.
Prevenir el agotamiento de los clientes y adquirir otros nuevos.
Vender de forma cruzada a clientes existentes.

Realizan la generación de perfiles de los clientes con más precisión.

SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.3.6 Estructuras de base de datos.
Las relaciones entre los muchos elementos de datos individuales almacenados en
las bases de datos se basan en una de diversas estructuras lógicas de datos, o
modelos. Los paquetes de sistemas de administración de bases de datos se
diseñan para utilizar una estructura específica de datos con el fin de proporcionar
a los usuarios finales un acceso rápido y fácil a la información almacenada en las
bases de datos
Estructura jerárquica
Los primeros paquetes de sistemas de administración de bases de datos para los
grandes sistemas centrales (mainframe) utilizaban la estructura jerárquica, en la
cual las relaciones entre los registros forman una jerarquía o estructura de árbol.
En el modelo jerárquico tradicional, todos los registros son dependientes y están
colocados en estructuras de multiniveles, que consisten en un registro raíz, y un
número de niveles subordinados. Así, todas las relaciones entre los registros son
de uno a muchos, dado que cada elemento de dato se relaciona con sólo un
elemento sobre él. El elemento de dato o registro en el nivel más alto de la
jerarquía se denomina el elemento raíz. Cualquier elemento de dato puede ser
accesado al moverse de forma progresiva hacia abajo desde una raíz y a largo de
las ramas del árbol hasta que se localiza el registro deseado (por ejemplo, el
elemento de dato de un empleado).
Estructura de red.
La estructura de red puede representar relaciones lógicas más complejas, y
todavía se utiliza en algunos paquetes de sistemas de administración de bases de
datos para grandes sistemas (mainframes). Permite relaciones de muchos a
muchos entre los registros, es decir, el modelo de red puede accesar un elemento
de dato al seguir uno de diversos caminos, porque se puede relacionar cualquier
elemento de datos o registro con cualquier numero de otros elementos de datos.
Por ejemplo, los registros departamentales pueden relacionarse con más de un
registro de empleado, y los registros de empleados pueden relacionarse con más
de un registro de proyecto. Así, uno podría localizar todos los registros de
empleados de un departamento en particular, o todos los registros de proyectos
relacionados con un empleado determinado.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Estructura relacional.
El modelo relacional es el más utilizado de las tres estructuras de base de datos.
La mayoría de los paquetes de sistemas de administración de bases de datos y
para microcomputadoras lo utilizan, así como la mayoría de los sistemas de rango
medio y de grandes sistemas (mainframe). En el modelo relacional, todos los
elementos de datos dentro de la base de datos se visualizan como almacenados
en forma de tablas simples.
Otras tablas, o relaciones, para esta base de
datos de una organización pudieran representar las relaciones de los elementos
de datos entre proyectos, divisiones, líneas de productos, etc. Los paquetes de
sistemas de administración de base de datos en el modelo relacional pueden
vincular elementos de datos desde diversas tablas para proporcionar información
a los usuarios.
Estructura multidimensional.
La estructura multidimensional de base de datos es una variación del modelo
relacional, que utiliza estructuras multidimensionales para organizar datos y
expresar las relaciones entre ellos. Se pueden visualizar las estructuras
multidimensionales como cubos de datos y como cubos dentro de los cubos de
datos. Cada lado del cubo se considera una dimensión de la información.
Cada celda dentro de una estructura multidimensional contiene datos agregados
relacionados con elementos a lo largo de cada una de sus dimensiones. Por
ejemplo, una única celda puede contener las ventas totales de un producto en una
región para un canal de ventas específico de un mes. Un beneficio importante de
las bases de datos multidimensionales es que son una forma compacta y fácil de
entender para visualizar y manipular los elementos de datos que tienen muchas
relaciones entre ellos. Así, se han convertido en la estructura de bases de datos
más popular para las bases de datos analíticas que apoyan las aplicaciones de
procesamiento analítico en línea (OLAP), en las cuales se esperan respuestas
rápidas a consultas complejas de negocio.
Estructura orientada a objetos.
El modelo de base de datos orientado a objetos se considera como una de las
tecnologías clave de una nueva generación de aplicaciones multimedia basada en
Web. Un objeto consistente en valores de datos que describen los atributos de una
entidad, mas las operaciones que pueden realizarse sobre los datos. Esta
capacidad de encapsulación permite al modelo orientado a objetos manejar con
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
más facilidad tipos complejos de datos (graficas, dibujos, voz, texto) que en otras
estructuras de base de datos.
El modelo orientado a objetos también soporta la herencia; es decir, pueden
crearse automáticamente nuevos objetos al replicar algunas o todas las
características de uno o más objetos padre. Así, los objetos cuentas de cheques y
ahorros pueden heredar los atributos y operaciones comunes del objeto padre
cuenta de banco. Dichas capacidades han hecho de los sistemas de
administración de bases de datos orientados a objetos (OODBMS, siglas del
termino object-oriented database management system) algo popular en un
creciente número de aplicaciones. Por ejemplo, la tecnología de objetos permite a
los diseñadores desarrollar diseños de productos, almacenarlos como objetos en
una base de datos orientada a objetos, y replicarlos y modificarlos para crear
nuevos diseños de productos. Además, las aplicaciones multimedia basadas en
Web para Internet, intranets y extranets corporativas se han convertido en un área
importante de aplicación para la tecnología de objetos.
Los defensores de la tecnología de objetos argumentan que un sistema de
administración de bases de datos orientado a objetos puede trabajar con tipos de
datos complejos, tales como imágenes de documentos y graficas, segmentos de
video, segmentos de audio y otros subgrupos de páginas Web, de forma mucho
más eficaz que los sistemas de administración de bases de datos relacionales han
respondido al añadir módulos orientados a objetos a su software relacional.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.4 Tecnologías de almacenamiento.
Un sistema de almacenamiento de datos tiene dos componentes principales: un
medio de almacenamiento y un dispositivo de almacenamiento. Un medio de
almacenamiento es el disco, la cinta, el CD, el DVD, el papel u otra sustancia que
contenga datos. Un dispositivo de almacenamiento es el aparato mecánico que
graba y recupera los datos de un medio de almacenamiento. Entre los
dispositivos de almacenamiento están las unidades de discos flexibles, las
unidades de disco duro, las unidades de cinta, las unidades de CD, las unidades
de DVD y las unidades de memoria flash. El término tecnología de
almacenamiento se refiere a un dispositivo de almacenamiento y los medios que
utiliza.
Puede considerar los dispositivos de almacenamiento como tener una conexión
directa a la RAM. Los datos se copian del dispositivo de almacenamiento a la
RAM, donde esperan ser procesados. Después que se procesan los datos, se
mantienen temporalmente en la RAM, pero se suelen copiar en un medio de
almacenamiento para ser conservados de manera más permanente. El
procesador de una computadora funciona con datos codificados en bits que se
representan mediante 1’s y 0’s. Cuando se guardan los datos, estos 1’s y 0’s
deben convertirse a algún tipo de señal o marca bastante permanente, pero que
se pueda cambiar cuando sea necesario.
Es obvio que los datos no se escriben literalmente como "1’s" o "0’s". En lugar de
eso, los 1’s y los 0’s deben transformarse en cambios en la superficie de un
medio de almacenamiento. Cómo ocurre esta transformación exactamente
depende de la tecnología de almacenamiento. Por ejemplo, los discos duros
guardan los datos de una manera diferente que los CD-ROM’s. Se suelen usar
tres tipos de tecnologías de almacenamiento para las computadoras personales:
 Magnético,
 Óptico y
 De estado sólido.
Cada tecnología de almacenamiento tiene ventajas y desventajas. Si un sistema
de almacenamiento fuera perfecto, no necesitaríamos tantas unidades de disco
y unidades de cinta conectadas a nuestras computadoras.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.4.1 Tecnología de disco magnético y de cinta.
Disco Magnético.
Las tecnologías de almacenamiento en disco duro, disco flexible y cinta se
clasifican como almacenamiento magnético, el cual guarda los datos al
magnetizar partículas microscópicas en la superficie de un disco o una cinta.
Las partículas conservan su orientación magnética hasta que se modifica la
orientación, lo cual hace a los discos y a la cintas medios de almacenamiento
bastante permanentes, pero modificables. Un mecanismo de lectura escritura en
la unidad de disco magnetiza las partículas para escribir datos y detecta la
polaridad de las partículas para leer datos. Antes de guardar los datos, las
partículas sobre la superficie del disco se dispersan en esquemas aleatorios. La
cabeza de lectura-escritura de la unidad del disco magnetiza las partículas y las
orienta en una dirección positiva (norte) o negativa (sur) para representar los bits
0 y 1.
Los datos guardados magnéticamente se modifican o eliminan con facilidad con
sólo alterar la orientación magnética de las partículas adecuadas en la superficie
del disco. Esta característica del medio magnético ofrece mucha flexibilidad para
editar datos y reutilizar las áreas del medio de almacenamiento que contienen
datos innecesarios.
La tecnología de Disco Duro es el tipo preferido de almacenamiento principal
para casi todos los equipos de cómputo por tres razones.
 Primero, ofrece mucha capacidad de almacenamiento.
 Segundo, aporta un acceso rápido a los archivos.
 Tercero, un disco duro es económico.
El costo de almacenar un megabyte de datos es aproximadamente 1/1700 de
dólar. Las unidades de disco duro se encuentran en todo tipo de dispositivos
digitales, incluso las computadoras personales, los iPods, etc.
Como el principal dispositivo de almacenamiento en casi todas las computadoras,
una unidad de disco duro contiene una o más placas y sus cabezas de lecturaescritura asociadas. Una placa de disco duro es un disco plano y rígido hecho de
aluminio o vidrio y recubierto con partículas magnéticas de óxido de hierro. Más
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
placas significan más capacidad de almacenamiento de datos. Las placas giran
como una unidad sobre un eje a miles de rotaciones por minuto. Cada placa tiene
una cabeza de lectura-escritura que se mueve sobre la superficie para leer los
datos. La cabeza se desplaza sólo algunas micropulgadas sobre la superficie del
disco.
Las placas del disco duro de una computadora personal suelen tener 3.5" de
diámetro, y su capacidad de almacenamiento va de 40 a 500 GB. Los discos
duros en miniatura (también llamados micro discos), como la unidad de 1.8" del
reproductor de música digital iPod de Apple, guardan de 30 a 80 GB.
Los tiempos de acceso al disco duro de 6 a 11 ms son frecuentes, mientras que
un disco flexible o un CD tarda medio segundo para alcanzar su velocidad y
encontrar los datos. La velocidad de la unidad de disco duro se suele medir en
revoluciones por minuto (rpm). Entre más rápido gira una unidad, más rápido se
coloca la cabeza de lectura-escritura sobre los datos específicos. Por ejemplo, una
unidad de 7200 rpm accede a los datos más rápido que una unidad de 5400 rpm.
Las especificaciones de las computadoras muestran la capacidad, el tiempo de
acceso y la velocidad de un disco duro. De modo que "disco duro de 160 GB de
8 ms a 7200 rpm" significa una unidad de disco duro con capacidad de 160
gigabytes, tiempo de acceso de 8 milisegundos y velocidad de 7200
revoluciones por minuto. Estos anuncios rara vez especifican la cantidad de
datos que puede transferir un disco duro, pero la velocidad de transferencia de
datos promedio es de alrededor de 50 megabytes por segundo.
Los discos duros no duran tanto como muchas otras tecnologías
dé
almacenamiento. Las cabezas lectura-escritura en un disco duro se mueven a
una distancia microscópica sobre la superficie del disco. Si una cabeza de
lectura-escritura choca contra una partícula de polvo o algún otro contaminante
en el disco, puede provocar una falla de la cabeza, la cual daña algunos de los
datos en el disco. Para evitar que los contaminantes entren en contacto con las
placas y provoquen fallas de la cabeza, un disco duro se sella dentro de su
cubierta. Una falla dé la cabeza también ocurre al sacudir el disco duro mientras
está en uso. Aunque los discos duros se han vuelto más resistentes en los años
recientes, todavía deben manejarse y transportarse con cuidado. También debe
hacer una copia de respaldo de los datos guardados en su disco duro en caso de
una falla en la cabeza.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Usted aumenta la capacidad de almacenamiento de su computadora al agregar
una segunda unidad de disco duro, la cual también sirve de respaldo para su
disco duro principal. Los discos duros también se ofrecen como unidades
internas o externas. Las unidades internas son económicas y se instalan con
facilidad en la unidad de un equipo de cómputo de escritorio. Las unidades
externas son más costosas y se conectan a una computadora de escritorio o
laptop mediante un cable.
Cinta.
Proteger la enorme cantidad de datos en el disco duro es de particular interés,
porque sería difícil y requeriría mucho tiempo restituirlos. Puede hacerse una
copia de respaldo de los datos en un disco duro con diversos dispositivos de
almacenamiento, entre ellos las unidades de cinta. Una unidad de cinta es un
dispositivo que lee los datos, y los escribe en una extensa variedad de medios
para grabar, similar a las cintas utilizadas en el audio cassettes. Las unidades de
cinta se usan principalmente en las computadoras de negocios. A diferencia de
los CD’s y los DVD’s, un dispositivo de respaldo en cinta no es conveniente para
tareas de almacenamiento cotidianas.
Una cinta es un medio de almacenamiento secuencial, no de acceso aleatorio. En
esencia, los datos se ordenan como una extensa secuencia de bits que comienza
en un extremo de la cinta y avanza hacia el otro extremo. El inicio y el fin de cada
archivo se marcan con etiquetas especiales.
Para localizar un archivo, la unidad de cinta debe comenzar en un extremo de la
cinta y leer todos los datos hasta que encuentra la etiqueta correcta. Una cinta
puede contener cientos o en el caso de las supercomputadoras miles de metros
de cinta. El tiempo de acceso se mide en segundos, no en milisegundos como
para las unidades de disco duro. La cinta es muy lenta para ser práctica como
dispositivo principal de almacenamiento de una computadora.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.4.2 Tecnologías de Disco Óptico.
En la actualidad, casi todas las computadoras vienen equipadas con algún tipo
de unidad de CD o unidad de DVD, diseñadas para funcionar con diversos CD’s
o DVD’s. Las tecnologías de CD y DVD son similares, pero es diferente la
capacidad de almacenamiento. La tecnología de CD (disco compacto) fue
diseñada originalmente para contener 74 minutos de música grabada. El
estándar original del CD fue adoptado para el almacenamiento de las
computadoras con una capacidad para 650 MB de datos. Mejoramientos
posteriores en los estándares del CD aumentaron la capacidad a 80 minutos de
música o 700 MB de datos.
El DVD (disco de video digital o disco versátil digital) es una variación de la
tecnología de CD diseñado como una alternativa para las videograbadoras, pero
adoptado con rapidez por la industria de las computadoras para guardar datos. El
estándar DVD inicial ofrecía 4.7 GB de almacenamiento de datos; unas siete
veces la capacidad de un CD. Los mejoramientos posteriores en la tecnología
DVD ofrecen todavía más capacidad de almacenamiento. Un DVD de doble capa
tiene dos capas para grabar en el mismo lado y puede almacenar 8.5 GB de
datos. Un HD-DVD puede guardar 15 GB por capa en un solo lado; un Blue-Ray
DVD (BD) tiene una capacidad de 25 GB por capa.
Las tecnologías de almacenamiento en CD y en DVD se clasifican como
almacenamiento óptico, el cual guarda los datos como puntos microscópicos de
luz y oscuridad en Ia superficie del disco. Los puntos oscuros, se llaman huecos.
Las áreas del disco más claras que no son huecos se llaman planos.
Las unidades de CD y DVD contienen un eje que hace girar el disco sobre un
lente láser. El láser dirige un haz de luz hacia la parte inferior del disco. Los
huecos oscuros y los planos iluminados de la superficie del disco reflejan la luz de
distinta manera. Cuando el lente lee el disco, las diferencias se traducen en los
0’s y 1’s que representan los datos
La superficie de un disco óptico está recubierta con un plástico transparente, lo
cual hace duradero el disco y menos susceptible al daño ambiental que los
datos grabados en los medios magnéticos. Un disco óptico, igual que un CD, no
es susceptible a dañarse con la humedad, las huellas digitales, el polvo, los
imanes o las bebidas derramadas, Los rasguños en la superficie del disco
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
interfieren con la transferencia de datos, pero una buena pulida con dentífrico
puede eliminar el rasguño sin dañar los datos que están debajo. Se calcula que
la vida útil de un disco óptico es de más de 30 años.
Las unidades de CD originales accedían 150 KB de datos por segundo. La
siguiente generación de unidades duplicó la velocidad de transferencia de datos y
fue calificada como de unidades de “2X”. Las velocidades de transferencia
parecen aumentar sin cesar. Por ejemplo, una unidad de 52X transfiere datos a
80 Mbps, lo cual todavía es relativamente lento en comparación con la velocidad
de transferencia de un disco.
La velocidad de una unidad de DVD se mide en una escala diferente a la de una
unidad de CD. Una unidad de DVD de 1X tiene aproximadamente la misma
velocidad que una unidad de CD de 9X. Las unidades de DVD actuales suelen
tener velocidades desde 16X para una velocidad de transferencia.
Las tecnologías ópticas se agrupan en tres categorías:



De sólo lectura,
Grabables y
Para reescritura.
La tecnología de sólo lectura (ROM) guarda los datos de manera permanente en
un disco, los cuales después no se pueden agregar o cambiar. Los discos de sólo
lectura, como los CD-ROM’s, CD-DA, DVD Video y DVD-ROM’s se graban
durante la producción en masa y se usan para distribuir software, música y
películas.
La tecnología grabable (R) emplea un láser para cambiar el color en una capa de
tinta que está bajo la superficie de plástico transparente del disco. El láser crea
puntos oscuros en la tinta que se leen como huecos. El cambio en la tinta es
permanente, de modo que los datos no pueden cambiarse una vez grabados.
La tecnología regrabable (RW) emplea tecnología de cambio de fase para alterar
una estructura de cristales en la superficie del disco. La alteración de la estructura
de cristales crea esquemas de puntos claros y oscuros similares a los huecos y
los planos en un CD. La estructura de cristales puede cambiar de claro a oscuro y
viceversa muchas veces, lo cual permite grabar y modificar los datos de una
manera similar a un disco duro.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
En la actualidad, varios formatos para CD y DVD son populares para uso en
computadoras personales:
• CD-DA (audio digital de disco compacto), más conocido como CD de audio es el
formato para los CD’s de música comercial. El fabricante graba la música en los
CD’s de audio, pero el consumidor no puede modificarlos.
• DVD-Video (video disco versátil digital) es el formato para los DVD’s
comerciales que contienen películas extensas.
• CD-ROM (disco compacto con memoria de sólo lectura) fue el formato original,
para guardar datos de computadora. Los datos se graban en el disco en el
momento en que se fabrica. No es posible agregar, modificar o eliminar datos de
estos discos.
• DVD-ROM (disco versátil digital con memoria de sólo lectura) contienen datos
grabados en la superficie del disco en el momento de la fabricación. Igual que los
CD-ROM’s, los datos en estos discos son permanentes, usted no puede
agregarlos o modificarlos.
• CD-R (disco compacto grabable), estos discos guardan los datos usando una
tecnología regrabable. Los datos en un CD-R no pueden borrarse o eliminarse una
vez grabados. Sin embargo, casi todas las unidades CD-R le permiten grabar sus
datos en varias secciones. Por ejemplo, puede guardar dos archivos en un disco
CD-R hoy, y tiempo después agregar al disco los datos de otros archivos.
• DVD+R o DVD-R (disco versátil digital grabable), los discos guardan los datos
usando una tecnología grabable similar a un CD-R, pero con una capacidad de
almacenamiento de DVD.
• CD-RW (disco compacto regrabable), los discos guardan los datos utilizando una
tecnología regrabable. Los datos guardados se graban y borran varias veces, lo
cual la vuelve una opción de almacenamiento muy flexible.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
• DVD+RW o DVD-RW (disco versátil digital regrabable), los discos guardan los
datos mediante una tecnología regrabable similar a un CD-RW, pero con una
capacidad de almacenamiento de DVD.
Una unidad de CD o DVD regrabable es una buena adición a un equipo de
cómputo, pero no es un buen reemplazo para un disco duro. Por desgracia, el
proceso de consultar, guardar y modificar los datos en un disco regrabable es
relativamente lento en comparación con la velocidad de acceso a un disco duro.
Casi todas las unidades de CD pueden leer discos CD-ROM, CD-R y CD-RW,
pero no pueden leer DVD’s. Casi todas las unidades DVD pueden leer formatos
de CD y DVD. El almacenamiento de datos de computadora y la creación de CD’s
de música requieren un dispositivo grabable o regrabable. El dispositivo de
almacenamiento óptico más versátil es una combinación
DVD-R/RWCD-RW.
3.4.3 Almacenamiento de Estado Sólido.
El almacenamiento de estado sólido (también llamado memoria flash) es una
tecnología que guarda los datos en circuitos borrables regrabables, y no en discos
que giran o en una cinta que se enreda. Se utiliza mucho en dispositivos portátiles
como cámaras digitales, reproductoras de música MP3, computadoras laptop,
PDAs, y teléfonos celulares.
El almacenamiento de estado sólido es portátil y ofrece un acceso bastante
rápido a los datos. Es una solución ideal para guardar datos en dispositivos
móviles y transportar datos de un dispositivo a otro.
El almacenamiento de estado sólido contiene una retícula de circuitos. Cada
celda en la retícula contiene dos transistores que funcionan como compuertas.
Cuando las compuertas se abren, fluye la corriente y la celda tiene un valor que
representa un bit "1". Cuando las compuertas se cierran mediante un proceso
llamado canalización de Fowler-Nordheim, la celda tiene un valor que representa
un bit "0".
Sé requiere muy poca corriente eléctrica para abrir o cerrar las compuertas, lo
cual hace ideal el almacenamiento de estado sólido para dispositivos que
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
funcionan con baterías, como las cámaras digitales y los PDA’s. Una vez
guardados los datos, se vuelven no volátiles: el chip conserva los datos sin
necesidad de una fuente externa de corriente.
El almacenamiento de estado sólido aporta un acceso rápido a los datos porque
no incluye partes móviles y es muy durable; prácticamente es indiferente a la
vibración, los campos magnéticos o las fluctuaciones extremas de temperatura.
En la actualidad, la capacidad del almacenamiento de estado sólido ya alcanza la
de los discos duros o los DVD’s. El costo por megabyte de almacenamiento
alrededor de 0.03 dólares es bastante más alto que el del almacenamiento
magnético u óptico.
Existen varios tipos de almacenamiento de estado sólido para los consumidores
actuales. Los formatos para estas pequeñas tarjetas planas son Compact Flash
MultiMedia, SecureDigital (SD) y SmartMedia. Debido a que la fotografía digital es
tan popular, algunas PC’s para medios tienen un lector de tarjetas incorporado
para simplificar la transferencia de las fotografías de una cámara a su
computadora.
Al trasladar datos en otra dirección, una computadora puede descargar archivos
de música MP3 y guardarlos en una tarjeta de memoria de estado sólido. La
tarjeta se puede retirar de la computadora e insertarse en un reproductor MP3
portátil, para que pueda escuchar sus canciones favoritas mientras sale de casa.
Aunada a esa versatilidad, las memorias flash USB de estado sólido sirven para
guardar archivos de datos de computadora y programas. Una memoria flash
USB, como MicroVault de Sony, Cruzer de SanDisk, o Traveler de Kingston,
funciona como almacenamiento portátil que se conecta directamente en un
puerto USB de una computadora mediante un conector incorporado.
También se denominan memorias miniatura, memorias de pluma, memorias USB,
y memorias de llavero. Las memorias flash USB tienen el tamaño aproximado
de un marca textos y son tan durables que puede traer una como llavero. Los
archivos guardados en una memoria flash USB se pueden abrir, modificar,
eliminar y ejecutar como si estuvieran almacenados en un medio magnético u
óptico. Se puede decir que las memorias flash USB son los nuevos discos
flexibles porque no sólo le permiten acceder a los archivos como si estuvieran en
discos, sino que también puede ejecutar software desde ellas.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Las memorias flash USB tienen capacidades que van de 16 MB a mas de 8 GB.
Tienen velocidades máximas de transferencia de datos de aproximadamente 100
Mbps. Pero es más común que funcionen en el intervalo de 18-28 megabytes por
segundo. Cuando quiera retirar una memoria flash USB de una computadora,
debe emplear el control de expulsión adecuado en la pantalla.
Un dispositivo U3 (también llamado dispositivo inteligente U3) es un tipo especial
de memoria flash USB pre-configurado para reproducción automática cuando se
inserta en una computadora. Ejecuta una aplicación llamada Launchpad, la cual
es similar al menú Inicio de Windows, y enlista los programas a los que se puede
acceder desde el dispositivo U3. Existen aplicaciones de software para los
dispositivos U3 en el sitio Web de U3.
3.4.4 DAS, NAS y SAN
Almacenamiento de Acceso Directo (DAS).
Las organizaciones confían cada vez más en sistemas de almacenamiento que
permitan a varios usuarios compartir el mismo medio en una red. En el
almacenamiento de acceso directo (DAS) el disco o conjunto de discos se
conecta directamente a un servidor. Los dispositivos de almacenamiento también
pueden ser cintas, sobre todo si son para respaldo. Otras computadoras en la red
deben acceder al servidor par utilizar los discos o las cintas. Un DAS es
relativamente fácil de desplegar y dirigir y conlleva un costo relativamente bajo.
Sin embargo, la velocidad de acceso a los datos se reduce debido a que el
servidor también procesa otro software, como el correo electrónico y las bases de
datos. Asimismo, si el servidor deja de funcionar, las otras computadoras no
pueden acceder a los dispositivos de almacenamiento. Un DAS es conveniente
para compartir archivos específicos, lo cual suele ocurrir en la empresas
pequeñas. Su escalabilidad es complicada, porque cada servidor adicional y sus
dispositivos de almacenamiento deben administrarse por separado. La
escalabilidad es la capacidad de agregar más hardware o software con el fin de
atender las cambiantes necesidades empresariales.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Otras dos disposiciones ponen a los dispositivos de almacenamiento en la red de
una organización para que otras computadoras accedan a ellos directamente.
Estos métodos se conocen como almacenamiento conectado a una red (NAS) y
red de área de almacenamiento (SAN).
Almacenamiento Conectado a una Red (NAS).
El almacenamiento conectado a una red (NAS) es un dispositivo especialmente
diseñado para almacenamiento en red. Está formado por el medio de
almacenamiento, que pueden ser discos duros y el software de administración, el
cual se dedica por completo a atender (dar acceso) a los archivos en la red. El
NAS alivia al servidor de manejar almacenamiento, con el fin de que pueda
procesar otras aplicaciones, como el correo electrónico y las bases de datos. Los
discos pueden guardar muchos terabytes de datos en un pequeño espacio central
y la administración de un almacenamiento grande en un solo lugar ahora dinero.
La escalabilidad del NAS es buena. Aunque en el NAS cada servidor ejecuta su
propio sistema operativo, NAS puede comunicarse con otros servidores que
ejecuten sistemas operativos diferentes y, por lo tanto, es mucho más flexible al
agregar computadoras y otros dispositivos a la red.
Red de Área de Almacenamiento (SAN).
La red de área de almacenamiento (SAN) es una red completamente dedicada al
almacenamiento y la transferencia de datos entre los servidores y los dispositivos
de almacenamiento. Los dispositivos de almacenamiento son parte de esta red
dedicada, la cual se administra separada de la red de área local de la
organización. Una SAN puede combinar dispositivos DAS y NAS. Las líneas de
comunicación en esta red son fibras ópticas de alta velocidad. Un NAS identifica
los datos mediante archivos. Una SAN identifica cantidades mucho mayores de
datos, llamadas bloques de datos y, por lo tanto, puede transferir y respaldar
cantidades mucho mayores de datos a la vez. Esto es importante cuando se
requiere una transferencia de datos de alta velocidad, como en las transacciones
empresariales en línea que contienen una gran cantidad de registros en una base
de datos almacenada. Muchos usuarios pueden acceder al mismo tiempo a los
datos, sin retrasos. Las SAN tienen una alta escalabilidad. Por estas razones, las
SAN son utilizadas por las organizaciones que efectúan negocios en la Web y
requieren un procesamiento de transacciones de alto volumen. Si embargo, las
SAN son relativamente costosas y su administración es compleja.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
El DAS, el NAS y la SAN suelen incluir RAID (conjunto redundante de discos
independientes), en donde los datos se duplican en diferentes discos para
mejorar la velocidad de procesamiento y la tolerancia a las fallas. La tolerancia a
las fallas es la capacidad del sistema para soportar una falla en un disco, debido
a que los mismos datos también aparecen en otro disco.
Para
de:




comparar los dispositivos de almacenamiento, es útil aplicar los criterios
Versatilidad,
Durabilidad,
Velocidad y
Capacidad.
Algunos dispositivos de almacenamiento acceden a los datos sólo desde un tipo
de medio. Los dispositivos más versátiles acceden a los datos desde medios
distintos. Por ejemplo, una unidad de discos flexibles sólo tiene acceso a los
discos flexibles, mientras que una unidad de DVD tiene acceso a los DVD’s de
computadora, las películas en DVD, los CD’s de audio, los CD’s de
computadora, y los CD-R’s.
Casi todas las tecnologías de almacenamiento son susceptibles a daños por
manejo deficiente u otros factores ambientales, como el calor y la humedad.
Algunas tecnologías son más susceptibles que otras a sufrir un daño que pueda
provocar la pérdida de datos. Por ejemplo, los CD’s y los DVD’s tienden a ser
más durables que los discos duros.
El acceso rápido a los datos es importante, de modo que se prefieren los
dispositivos de almacenamiento más rápidos. El tiempo de acceso es el tiempo
promedio que tarda una computadora en localizar los datos en el medio de
almacenamiento y leerlos. El tiempo de acceso para un dispositivo de
almacenamiento de una computadora personal, como un disco duro, se mide en
milisegundos (millonésimas de segundo). Un milisegundo (ms) es la milésima
parte de un segundo. Los números más bajos indican tiempos de acceso más
rápidos. Por ejemplo, una unidad con un tiempo de acceso de 6 ms es más
rápida que una unidad con un tiempo de acceso de 11 ms.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
El tiempo de acceso es mejor para los dispositivos de acceso aleatorio. El
acceso aleatorio (también llamado acceso directo) es la capacidad de un
dispositivo para "saltar" directamente a los datos solicitados. Las unidades de
disco flexible, disco duro, CD, DVD y de estado sólido son dispositivos de acceso
aleatorio, al igual que las tarjetas de memoria utilizadas en las cámaras digitales.
Por otra parte, una unidad de cinta debe utilizar un acceso secuencial más lento
para leer los datos desde el principio de la cinta. La ventaja del acceso aleatorio
se vuelve evidente cuando considera que es mucho más rápido y fácil localizar
una canción en un CD (acceso aleatorio) que en un cassette (acceso
secuencial).
La velocidad de transferencia de datos es la cantidad de datos que puede
mover un dispositivo de almacenamiento por segundo desde el medio de
almacenamiento hacia la computadora. Los números más altos indican
velocidades de transferencia más rápidas. Por ejemplo, una unidad de CD-ROM
con una velocidad de transferencia de datos de 600 KBps (kilobytes por segundo)
es más rápida que una velocidad de transferencia de datos de 300 KBps.
En el ambiente de la computación actual, casi siempre se prefiere una mayor
capacidad. La capacidad de almacenamiento es la máxima cantidad de datos
que se pueden conservar en un medio de almacenamiento, y se mide en
kilobytes, megabytes, gigabytes o terabytes.
La capacidad de almacenamiento se relaciona directamente con la densidad de
almacenamiento, la cantidad de datos que se pueden guardar en un área
específica de un medio de almacenamiento, como la superficie de un disco. Entre
más alta es la densidad de almacenamiento, se conservan más datos. La
densidad de almacenamiento puede aumentar al hacer más pequeñas las
partículas que representan los bits, al ponerlas en capas, al guardarlas más cerca
entre sí o al apilarlas.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
3.5 HERRAMIENTAS DE EXPLOTACIÓN.
3.5.1 Sistema de Administración de bases de datos (DBMS).
El enfoque de administración de base de datos, como la base de los métodos
modernos de administrar datos organizativos. El enfoque de administración de
base de datos consolida de manera formal los registros de datos en archivos
separados dentro de bases de datos, que pueden ser accesadas por muchos
programas de aplicación diferentes. Además, un sistema de administración de
bases de datos (DBMS, siglas del término database management system) actúa
como una interfase de software entre los usuarios y las bases de datos. Esto
ayuda a los usuarios a acceder con facilidad a la información de una base de
datos. Por eso, la administración de base de datos implica el uso del software de
administración de bases de datos para controlar la forma en que se crean,
consultan y se da mantenimiento a las bases de datos y para proporcionar la
información necesaria a los usuarios finales.
Por ejemplo, los registros de clientes y otros tipos comunes de datos son
necesarios para diferentes aplicaciones bancarias, tales como procesamiento de
cheques, sistemas de cajeros automáticos, tarjetas de crédito bancarias, cuentas
de ahorros y contabilidad de créditos revolventes. Estos datos pueden
consolidarse. En una base común de datos de clientes, en lugar de mantenerlos
en archivos separados para cada una de esas aplicaciones.
Por ejemplo tenemos el caso de la compañía Kingslake que utiliza la conexión de
clientes e información en Sri Lanka: Los representantes de ventas viajan en
motocicleta en la carretera durante semanas a la vez. La fuerza de ventas de la
empresa de servicios públicos recorre largos trayectos que duran días, desde su
oficina hasta los medidores. Es un ambiente donde las personas y los negocios
están tan dispersos, y la comunicación es tan vital, que algunos elegirían un
teléfono celular en lugar de un refrigerador. Es la forma usual de hacer negocios
en Sri Lanka. Estos escenarios explican por qué las empresas en Sri Lanka
buscan con desesperación formas de mejorar la productividad de sus fuerzas de
ventas, y dan la bienvenida a la tecnología como la herramienta para lograrlo. Esto
también explica por qué Kingslake International, con base en Sri Lanka, una
empresa de consultoría y administración de proyectos para Europa con sede en el
Reino Unido, que se enfoca en soluciones innovadoras de TI en el país, ha
colocado buena parte de su capital para desarrollar computación móvil y
soluciones de administración de datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Kingslake se encontró a sí misma limitada en el tipo de aplicaciones móviles para
la automatización de la fuerza de ventas que podría desarrollar, porque no existían
bases de datos. Sin software de bases de datos, las aplicaciones tenían que
depender de funciones básicas y de bajo nivel de administración de datos, no
podían sincronizarse y no permitían a los usuarios manipular datos en sus
dispositivos de mano. Además, Kingslake exigía cuatro condiciones no
negociables: confiabilidad, capacidad de trabajar con baterías, una pequeña
superficie y un excelente apoyo del proveedor. Sus condiciones y la oportunidad
de ampliar su capacidad de desarrollar soluciones móviles sofisticadas, se
cumplieron con el DB2 Everyplace de IBM.
Son muchos los ejemplos de los beneficios de la administración móvil de datos.
Uno es la solución de automatización de la fuerza de ventas para una empresa
que envía a sus representantes de ventas lejos con camionetas cargadas de
bienes. Antes, estos representantes pasaban 30 por ciento de su tiempo en
trabajos de papelería: escribiendo pedidos para productos que no estaban en la
camioneta, emitiendo facturas y regresando luego con dificultades a las oficinas
centrales para asegurarse de que el papeleo se procesara. La solución DB2
Everyplace les permitió trabajar con mayor productividad 100 por ciento de su
tiempo. Al portar dispositivos móviles, los representantes de ventas podían
conectarse con su sistema central para colocar los pedidos directamente desde el
lugar donde se encontraran, emitir las facturas y realizar las comprobaciones de
crédito en el lugar.
Otra aplicación da seguimiento a todo el proceso de una empresa que recoge y
renueva llantas de camiones de sus clientes y luego se las regresa. En este caso,
la integración entre la aplicación portátil y la aplicación de planeación de recursos
empresariales (ERP, siglas del término Enterprise Resource Planning) de la
empresa es crítica porque la fuerza de ventas tiene que confirmar los programas
de fabricación y las fechas de entrega directamente desde el campo. Incluso otra
solución, para una empresa de servicio público de electricidad, permite a los
lectores de medidores que viajan lejos, descargar la cuenta del cliente y los
códigos de subsidio, introducir y almacenar valiosos datos de semanas, calcular
con precisión los costos en sus dispositivos de mano y emitir facturas en el lugar.
La ventaja más importante es que los ciudadanos de una economía desafiada por
la distancia se han acercado más unos a otros, y a su información. ¡El negocio
está prosperando!
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Un sistema de administración de base de datos (DBMS, siglas del término
database management system) es la herramienta principal de software del
enfoque de la administración de base de datos, dado que controla la creación, el
mantenimiento y el uso de las bases de datos de una organización y de sus
usuarios finales. Los paquetes de administración de bases de datos para
microcomputadoras, tales como Microsoft Access, Lotus Approach o Corel
Paradox, permiten configurar y administrar bases de datos en una PC, servidor de
red o Internet. En sistemas informáticos de grandes sistemas centrales
(mainframe) o de servidores, el sistema de administración de bases de datos es
un importante paquete de software que controla el desarrollo, uso y mantenimiento
de las bases de datos de las organizaciones que utilizan computadoras. Ejemplos
de versiones populares de mainframe y de servidor de software de sistema de
administración de base de datos son DB2 Universal Database de IBM, Oracle 10G
y MySQL, un popular sistema de administración de bases de datos de código libre.
Principales funciones de un DBMS.
Las tres principales funciones de un sistema de administración de base de datos
son:
(1) Crear nuevas bases de datos y aplicaciones para ellas,
(2) Mantener la calidad de la información en las bases de datos de una
organización y
(3) Utilizar las bases de datos de una organización para proporcionar la
información necesaria a sus usuarios finales.
Si bien una base de datos es un conjunto de varios archivos relacionados, el
programa utilizado para desarrollar bases de datos, llenarlas con datos y
manipular los datos se llama un sistema de administración de bases de datos
(DBMS). Los archivos mismos son la base de datos, pero los DBMS hacen todo el
trabajo: estructuran los archivos, guardan los datos y vinculan los registros.
Si usted emplea una base de datos, necesita moverse con rapidez de un registro a
otro, clasificarlos mediante diversos criterios, crear diferentes tipos de informes y
analizar los datos de distintas maneras. Por estas necesidades, las bases de
datos se guardan en o se procesan desde dispositivos de almacenamiento con
acceso directo, como los discos magnéticos o los CD. Se pueden respaldar en
dispositivos de almacenamiento secuencial, como las cintas magnéticas u ópticas,
pero no se procesan con eficiencia desde tales medios porque se requiere mucho
tiempo para acceder a los registros.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
El desarrollo de base de datos implica definir y organizar el contenido, las
relaciones y la estructura de los datos necesarios para construir una base de
datos. El desarrollo de la aplicación de base de datos implica utilizar un sistema de
administración de bases de datos para desarrollar prototipos de consultas,
formularios, reportes y páginas Web para una aplicación de negocio propuesta.
Consulta de bases de datos.
Se accede a los datos en una base de datos al enviar mensajes conocidos como
"consultas", los cuales solicitan los datos de los recursos y/o campos específicos e
indican a la computadora que muestre los resultados. También se introducen
consultas para manipular los datos. Por lo general el mismo software que sirve
para desarrollar y llenar una base de datos, es decir, el DBMS, sirve para
presentar consultas. Los DBMS modernos ofrecen medios fáciles para que el
usuario consulte una base de datos
La capacidad de consulta de una base de datos es un beneficio importante del
enfoque de la administración de base de datos. Los usuarios finales pueden
utilizar un sistema de administración de base de datos para solicitar información
desde una base de datos mediante el uso de una característica de consulta o un
generador de reportes. Pueden recibir una respuesta inmediata en forma de
pantallas de video o de reportes impresos. No se requiere una programación
difícil. La característica de lenguaje de consulta permite obtener con facilidad
respuestas inmediatas a solicitudes específicas de datos: usted sólo teclea unas
cuantas solicitudes breves. La característica del generador de reportes permite
especificar de manera expedita un formato de reporte para la información que se
quiera presentar como un reporte.
Operaciones relacionales.
Los DBMS más populares son los que apoyan el modelo relacional. Por lo tanto, a
usted le serviría familiarizarse con una base de datos relacional muy utilizada,
como Access, Oracle o SQL Server. Al emplearla, sabrá como funcionan las
operaciones relacionales. Una operación relacional crea una tabla temporal que es
un subconjunto de la tabla o tablas originales. Le permite crear un informe que
contenga registros que satisfagan una condición, crear una lista con solo algunos
campos acerca de una entidad o generar un informe de una tabla combinada, la
cual incluye datos relevantes de dos o más tablas. Si lo requiere, el usuario puede
guardar la tabla recién creada. Casi siempre la tabla temporal solo se necesita
para un informe ad hoc y suele desecharse de inmediato.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Las tres operaciones relacionales más importantes son:
La selección de los registros que cumplen ciertas condiciones. Por ejemplo, un
gerente de recursos humanos necesita un informe que muestre el registro
completo de cada empleado cuyo sueldo es mayor de $60 000.
Proyección es la selección de ciertas columnas de una tabla, como los sueldos
de todos los empleados. Una consulta puede especificar una combinación de
selección y proyección. En el ejemplo anterior, el gerente puede requerir solo el
número de identificación, el apellido (proyección) y el sueldo de los empleados que
superan los $60 000 (selección).
Una de las manipulaciones más útiles de una base de datos relacional es la
creación de una tabla nueva a partir de dos o más tablas. La combinación de
datos de varias tablas se llama una join (combinación). Sin embargo, las consultas
combinadas pueden ser mucho más complejas. Por ejemplo, una base de datos
relacional empresarial puede tener cuatro tablas: Vendedores, Catalogo, Pedidos
y Clientes. Un gerente puede necesitar un informe que muestre, para cada
vendedor, una lista de todos los clientes que compraron algo el mes anterior, los
artículos que adquirió cada cliente y la cantidad total que gasto cada uno. Se crea
una tabla nueva a partir de la operación relacional que extrae datos de las cuatro
tablas.
La operación de combinación es una manipulación poderosa que puede crear
informes muy útiles para tomar decisiones. Una tabla combinada se crea "en un
paso" como resultado de una consulta y solo mientras el usuario quiera verla o
imprimirla. Las funciones de diseño permiten al usuario cambiar el encabezado de
los campos (aunque los nombres de los campos se conservan intactos en la tabla
interna), preparar el resultado en diferentes diseños en la pantalla o el papel y
agregar imágenes y texto al informe. La tabla nueva puede guardarse como una
tabla adicional en la base de datos.
El esquema.
Al desarrollar una base de datos nueva, los usuarios primero desarrollan un
esquema (de la palabra griega que significa "plan"). El esquema describe la
estructura de la base de datos que se diseña: los nombres y tipos de los campos
en cada tipo de registro y las relaciones generales entre los diferentes conjuntos
de registros o archivos. Incluye una descripción de la estructura de la base de
datos, los nombres y tamaños de los campos y detalles como cual campo es una
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
llave principal. El número de registros no se especifica nunca porque puede
cambiar y la capacidad del medio de almacenamiento determina el número
máximo de registros.
Los campos pueden contener diferentes tipos de datos: numéricos, alfanuméricos,
imágenes o relacionados con el tiempo. Los campos numéricos contienen
números que se manipulan mediante suma, multiplicación, promedio y demás. Los
campos alfanuméricos contienen valores de texto: palabras, números y símbolos
especiales, los cuales forman nombres, direcciones y números de identificación.
Los números introducidos en los campos alfanuméricos, como el número del
seguro social o el código postal, no se manipulan matemáticamente. El diseñador
de una base de datos nueva también debe indicar cuales campos se van a usar
como llaves principales, Muchos DBMS también permiten a un diseñador indicar
cuando un campo no es único, lo que significa que el valor en ese campo puede
ser igual para más de un registro.
Una tabla de bases de datos creada con el DBMS Microsoft Access. Se pide al
usuario que introduzca los nombres y tipos de los campos. Access permite al
usuario nombrar los campos y determinar los tipos de datos. La sección
descripción permite al diseñador describir la naturaleza y las funciones de los
campos para las personas que conservan la base de datos. La parte inferior de la
ventana ofrece al usuario muchas opciones para cada campo, como el tamaño y el
formato del campo y demás. En Access, el campo de la llave principal se indica
mediante un icono de una llave pequeña a su izquierda.
Los metadatos.
La descripción de cada estructura de la tabla y tipos de los campos se vuelve
parte de un diccionario de datos, el cual es un depósito de información acerca de
los datos y su organización. Los diseñadores suelen agregar mas información
sobre cada campo, como de donde provienen los datos (de otro sistema o
introducidos de manera manual); quien posee los datos originales; a quien se le
permite agregar, eliminar o actualizar los datos del campo; y otros detalles que
ayudan a los DBA a conservar la base de datos y comprender el significado de los
campos y sus relaciones. (Algunas personas prefieren llamar a esto metadatos, lo
cual significa "datos acerca de los datos"). Entre los metadatos estan:


El origen de los datos, entre ellos información de una persona para
comunicarse.
Las tablas relacionadas con los datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN



Información del campo y del índice, como el tamaño y tipo del campo (de
texto o numérico) y los modos en que se clasifican los datos.
Los programas y procesos que emplean los datos.
Las reglas de llenado: que se inserta o actualiza y con cuanta frecuencia.
Lenguaje de consulta estructurado.
SQL (Strutctured Query Language (lenguaje de consultas estructurado) es un
lenguaje internacional estándar de consulta, que se encuentra en muchos
paquetes de sistemas de administración de bases de datos. La forma básica de
una consulta SQL es:
SELECT… FROM… WHERE
Después de la cláusula SELECT se hace una lista de los campos de datos que se
quieren recuperar. Después de la cláusula FROM se hace una lista de los archivos
o tablas desde los cuales deben recuperarse los datos. Después de la cláusula
WHERE se especifican las condiciones que limitan la búsqueda a sólo aquellos
registros de datos en los cuales se está interesado.
El lenguaje de consulta estructurado (SQL) se ha convertido en el lenguaje de
consulta preferido por muchos desarrolladores de DBMS relacionales. SQL es un
estándar internacional y se proporciona con casi todos los programas de
administración de una base de datos relacional. Su ventaja son sus comandos
intuitivos fáciles de recordar. Por ejemplo suponga que el nombre de la base de
datos es DVD_Store, para crear una lista de todos los títulos de DVD de "acción"
cuyo precio de venta sea menor que $5.00, la consulta seria:
SELECT TITLE, CATEGORY FROM DVD_STORE
WHERE CATEGORY = 'Thriller' and RENTPRICE < 5
Se emplean instrucciones como esta para las consultas ad hoc o se integran en un
programa que se guarda para uso repetido. Los comandos para actualizar las
bases de datos también son fáciles de recordar: INSERT, DELETE y UPDATE
(insertar, eliminar y actualizar).
Existen varias ventajas de integrar el SQL en un DBMS:
Con un lenguaje estándar, los usuarios no tienen que aprender con juntos de
comandos diferentes para crear y manipular bases de datos en diferentes DBMS.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Las instrucciones del SQL se incluyen en lenguajes de tercera generación muy
utilizados como COBOL o C y en los lenguajes orientados a objetos como C++ o
Java, en cuyo caso estos lenguajes se llaman "lenguajes anfitriones". La
combinación de instrucciones de 3GL muy adaptadas y eficientes, e instrucciones
orientadas a objetos con SQL aumenta la eficiencia y la eficacia de las
aplicaciones que consultan las bases de datos relacionales.
Debido a que las instrucciones del SQL se pueden trasladar de un sistema
operativo a otro, el programador no se ve obligado a redactar de nuevo las
instrucciones.
Algunos DBMS relacionales como Microsoft Access, proporcionan GUI para
crear consultas de SQL, las cuales se preparan al hacer clic en iconos y
seleccionar elementos de un menú, los cuales se convierten de manera interna en
consultas de SQL y se ejecutan. Esta capacidad permite emplear el SQL a los
diseñadores poco experimentados con una base de datos.
Consultas gráficas y naturales. Muchos usuarios finales (y profesionales de SI)
tienen dificultades para formular de manera correcta estatutos SQL y consultas de
otros lenguajes de bases de datos. De modo que la mayoría de los paquetes de
administración de bases de datos para usuarios finales ofrecen métodos de
interfase gráfica de usuario (GUI, siglas del término graphical user interface) de
apuntar y pulsar, que son más fáciles de usar y son traducidos por el software en
comandos SQL.
Seguridad y privacidad en bases de datos.
El uso de las bases de datos plantea problemas de seguridad y privacidad. El
hecho de que los datos se guarden solo una vez en una base de datos para varios
propósitos diferentes no significa que todos los que consultan esa base de datos
tengan acceso a todos los datos que contiene. La limitación del acceso se
consigue al personalizar los menús de los diferentes usuarios y al solicitar a los
diferentes usuarios que introduzcan códigos que limitan el acceso a ciertos
campos o registros. Como resultado, los usuarios tienen vistas diferentes de la
base de datos. La posibilidad de limitar las vistas de los usuarios a solo columnas
con registros específicos da otra ventaja al administrador de una base de datos
(DBA): la posibilidad de implementar medidas de seguridad. Las medidas se
implementan una vez para la base de datos, en vez de varias veces para archivos
distintos. Por ejemplo, en una base de datos empresarial aunque el gerente de
recursos humanos tiene acceso a todos los campos del archivo de los empleados,
el personal de nómina solo tiene acceso a cuatro campos y el gerente de
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
proyectos solo tiene acceso a los campos del nombre y las horas trabajadas. En
una base de datos, las vistas se pueden limitar a ciertos campos, ciertos registros
o una combinación de ambos.
Mantenimiento de la base de datos.
El proceso de mantenimiento de la base de datos se logra mediante sistemas de
procesamiento de transacciones y otras aplicaciones de usuario final, con el apoyo
del sistema de administración de bases de datos. Los usuarios finales y los
especialistas en información también pueden emplear varias utilerías
proporcionadas por un sistema de administración de bases de datos para el
mantenimiento de bases de datos. Las bases de datos de una organización
necesitar ser actualizadas de continuo para reflejar nuevas transacciones de
negocio (tales como ventas realizadas, productos fabricados o inventario
distribuido) y otros eventos. Otros cambios diversos también deben actualizarse y
los datos corregirse (tales como cambios en el nombre y dirección de clientes o
empleados), para asegurar la precisión de los datos en las bases de datos.
El mantenimiento de base de datos implica utilizar sistemas de procesamiento de
transacciones y otras herramientas para añadir, borrar, actualizar y corregir la
información de una base de datos. El uso principal de una base de datos por parte
de los usuarios finales implica emplear las capacidades de consulta de base de
datos de un sistema de administración de bases de datos para accesar la
información de una base de datos, con el fin de recuperar y desplegar información
y producir reportes, formularios y otros documentos de manera selectiva.
3.5.2 DESARROLLO DE APLICACIONES.
Los paquetes de sistemas de administración de bases de datos también
desempeñan una función primordial en el desarrollo de aplicaciones. Los usuarios
finales, analistas de sistemas y los desarrolladores de otras aplicaciones pueden
utilizar un módulo de un 4GL (lenguaje de programación de cuarta generación).
Los programadores emplean este módulo para desarrollar aplicaciones que
faciliten las consultas y produzcan informes diseñados con anticipación.
y herramientas de desarrollo de software integradas proporcionadas por muchos
paquetes de sistemas de administración de bases de datos, para desarrollar
programas de aplicación a la medida. Por ejemplo, se puede utilizar un sistema de
administración de bases de datos para desarrollar con facilidad las pantallas de
captura, formularios, reportes o páginas Web de una aplicación de negocio que
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
tenga acceso a la base de datos de una empresa para encontrar y actualizar los
datos que necesita. Un sistema de administración de bases de datos también
facilita el trabajo de los desarrolladores de software de aplicación, dado que no
tienen que desarrollar procedimientos detallados de manejo de datos mediante el
uso de lenguajes de programación convencionales cada vez que escriben un
programa. En lugar de eso, pueden incluir características tales como estatutos de
lenguaje de manipulación de datos (DML, siglas del término Data Manipulation
Language) en su software, que llaman al sistema de administración de bases de
datos para realizar las actividades necesarias del manejo de datos.
3.5.3 BASES DE DATOS EN LA WEB.
Internet y la fácil de usar Web prácticamente no servirían si las personas no
pudieran consultar las bases de datos en línea. La premisa de la Web es que las
personas no solo se desplacen por páginas Web atractivas, sino también que
busquen y localicen información. Con mucha frecuencia esa información se
guarda en bases de datos. Cuando un comprador entra a una tienda en línea,
puede buscar información entre miles o cientos de miles de artículos ofrecidos
para venta. Por ejemplo, cuando usted entra al sitio de Buy.com, recibe
información en línea (como una imagen de un artículo electrónico, el precio, el
tiempo de embarque y las evaluaciones de los clientes) de miles de artículos en
venta. Los mayoristas ponen sus catálogos en línea. Las aplicaciones en los sitios
de subastas reciben consultas por categoría, rango de precios, país u origen,
color, fecha y otros atributos y registros de identidad de los artículos que
coinciden, entre los cuales están imágenes y descripciones detalladas. Detrás de
cada uno de estos sitios esta una base de datos. La única manera para que las
organizaciones efectúen estas actividades basadas en la Web es permitir el
acceso a sus bases de datos a las personas que están fuera de la organización.
En otras palabras, las organizaciones deben vincular sus bases de datos a
Internet.
Desde un punto de vista técnico, las bases de datos en línea que se usan con los
navegadores Web no son diferentes de otras bases de datos. Sin embargo, debe
diseñarse una interfaz que funcione con la Web. El usuario debe observar un
formulario en el cual introducir consultas o palabras clave para obtener
información de la base de datos del sitio. Los diseñadores de la interfaz deben
proporcionar un mecanismo para determinar que datos deben insertar los usuarios
en los formularios en línea con el fin de colocarlos en los campos adecuados de la
base de datos. El sistema también necesita un mecanismo para trasladar las
consultas y las palabras clave del usuario a la base de datos. Hay varios
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
programas de interfaz, como CGI (Interfaz Común de Gateway), los servlets de
Java, las Páginas Activas del Servidor (ASP) y las API (Interfaz de Programas de
Aplicación).
Para asegurar que sus bases de datos de producción no sean vulnerables a
ataques a través de Internet, las organizaciones evitan vincular sus bases de
datos de transacciones a Internet, a menos que estén dedicadas a las
transacciones en línea, en cuyo caso la organización debe aplicar software
adecuado de seguridad. También deben tener cuidado al vincular un almacén de
datos (Data warehouse) con Internet.
3.5.4 EXTRACCIÓN DE DATOS Y ANÁLISIS EN LÍNEA.
Por sí solos, los almacenes de datos son inútiles. Para que se vuelvan útiles, las
organizaciones deben emplear herramientas de software para convertir el
contenido de estas enormes bases de datos en información significativa. Debido a
que los ejecutivos obtienen mucha más información acerca de sus clientes,
proveedores y de sus propias organizaciones, prefieren llamar a la información
extraída con tales herramientas inteligencia de negocios (BI). Siendo sus usos
principales para estas bases de datos: la minería de datos y el procesamiento
analítico en línea.
Minería de datos.
Podemos considerar a los almacenes de datos como una especie de mina, en
donde los datos son el mineral, y la información útil nueva es un hallazgo precioso.
La minería de datos es el proceso de elegir, explorar y modelar grandes
cantidades de datos para descubrir relaciones antes desconocidas que apoyen la
toma de decisiones. El software de minería de datos busca por enormes
cantidades de datos patrones de información significativos.
Si bien algunas herramientas ayudan a detectar relaciones y proporciones
predefinidas, no responden lo que las herramientas de minería de datos más
poderosas pueden contestar: “Cuáles son las relaciones que todavía no
conocemos?”. Esto se debe a que, para comenzar, el investigador debe
determinar cuál relación debe buscar el software. Para responder esta pregunta,
se utilizan otras técnicas en minería de datos, entre ellas las de inteligencia
artificial.
Para ilustrar la diferencia entre las consultas tradicionales y las consultas en la
minería de datos, piense en los ejemplos siguientes. Una consulta tradicional
común sería: “ es la relación entre la cantidad del producto X y la cantidad del
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
producto Y que vendimos durante el trimestre anterior?”. Una consulta de minería
de datos normal sería: “Descubrir cuáles son los dos productos que es más
probable que se vendan juntos un fin de semana”. Esta última consulta permite al
software encontrar patrones que no se detectarían mediante la observación. Si
bien los datos se han empleado para ver si existe éste o qué patrón, la minería de
datos le permite preguntar cuáles patrones existen. Por lo tanto, algunos expertos
dicen que la minería de datos permite que la computadora responda las preguntas
que usted no sabe formular. La combinación de técnicas de almacenamiento de
datos y software de minería de datos facilita predecir los resultados futuros con
base en los patrones descubiertos dentro de los datos históricos.
La minería de datos tiene cuatro objetivos principales:
• Secuencia o análisis de rutas. La detección de patrones donde un evento
conduce a otro evento posterior.
• Clasificación. La determinación de si ciertos hechos caen dentro de grupos
predefinidos.
• Agrupamiento. La detección de grupos de hechos relacionados no detectados
antes.
• Predicción. El descubrimiento de patrones en los datos que conduzcan a
predicciones razonables.
Estas técnicas se usan en mercadotecnia, detección de fraudes y otras áreas. La
minería de datos es muy usada por los gerentes de mercadotecnia, quienes en
forma constante analizan patrones de compra para orientarse a los clientes
potenciales de manera más eficiente mediante ventas especiales, exhibiciones de
productos o campañas de correo directo o electrónico. La minería de datos es un
recurso muy poderoso en un ambiente en el que las empresas cambian de
comercializar un producto de manera masiva a erigir el cliente individual con
diversos productos que quizá lo satisfagan. Algunos observadores llaman a este
método “mercadotecnia para uno”.
Predicción del comportamiento del cliente. La minería de datos también se emplea
en actividades bancarias, en donde sirve para detectar los clientes rentables y los
patrones de fraudes. También se usa para predecir las quiebras y el
incumplimiento de los préstamos. Por ejemplo, cuando Bank of America buscaba
nuevos métodos para conservar clientes, usó técnicas de minería de datos.
Combinó diversos patrones de comportamiento en perfiles del cliente bien
asignados. Los datos se usaban en grupos más pequeños de personas que
utilizaban servicios bancarios que no apoyaban bien sus actividades. Los
empleados bancarios se comunicaban con estos clientes y ofrecían sugerencias
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
sobre servicios más satisfactorios. El resultado fue una mayor lealtad de la
clientela (medida en menos cuentas canceladas y menos transferencias a otros
bancos). Las personas contactadas pensaban que el banco intentaba cuidar bien
su dinero.
Posibles aplicaciones de la minería de datos.
Agrupamiento de clientes:
Identificar las características comunes de los clientes que tienden a comprar los
mismos productos y servicios de su compañía.
Detección de cambio de proveedor:
Identificar la razón por la que los clientes se cambian con un competidor; predecir
qué clientes es probable que hagan eso.
Detección de fraudes:
Identificar las características de las transacciones que tengan más probabilidad de
ser fraudulentas.
Mercadotecnia directa:
Identificar qué clientes prospectivos deben incluirse en el correo directo o
electrónico para obtener la tasa de respuestas más alta.
Mercadotecnia interactiva:
Predecir qué es lo más probable que le interese a cada persona que consulta un
sitio Web.
Análisis de la canasta del mercado:
Comprender cuáles productos o servicios se compran juntos y en cuáles días de la
semana.
Análisis de tendencias:
Revelar la diferencia entre un cliente normal en este mes y un cliente normal en el
mes anterior.
Las empresas que venden servicios de telefonía celular o móvil encaran un
creciente desafío de inquietud de los clientes (se cambian con un competidor).
Algunas encuestas muestran que más de 50% de los usuarios de teléfonos
celulares piensa en cambiarse con un competidor en cierto momento y 15%
planean cambiarse con un competidor tan pronto como expire su contrato.
Mobilcom GmbH, una empresa alemana con 4.56 millones de clientes y 1100
empleados, emplea la minería de datos para identificar a tales clientes y
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
abordarlos con ofertas para continuar o renovar su contrato antes del cambio. La
compañía emplea una aplicación llamada DB Intelligent Miner de IBM. El software
busca en forma periódica patrones de inquietud de los clientes y designa a cada
cliente una calificación que representa la probabilidad de cancelar el contrato. El
software considera muchas variables, entre ellas el número de días que faltan
para que venza el contrato y el historial de quejas. La lealtad de los clientes es
muy importante porque el costo de obtener un nuevo cliente es muy superior al
costo de conservar a quien ya lo es, sobre todo en un mercado muy competitivo
como el de los teléfonos celulares.
Para asegurar un flujo uniforme de datos de clientes en sus almacenes de datos,
las compañías en casi todas las industrias —desde aerolíneas hasta de
alojamiento, comida y apuestas— operan programas de clientes leales similares a
los programas originales de viajero frecuente. La participación es gratuita y los
clientes dejan un registro cada vez que hacen una compra incluso si no emplean
una tarjeta de crédito para pagar. En muchos casos la extracción de tales datos
aporta la inteligencia de negocios para orientarse a los clientes individuales.
Procesamiento analítico en línea (OLAP).
Otro tipo de aplicación para aprovechar los almacenes de datos tal vez no sea tan
sofisticado en términos del análisis efectuado, pero su respuesta es muy rápida y
permite a los ejecutivos tomar decisiones oportunas: el procesamiento analítico en
línea (OLAP). Las tablas, incluso si reúnen datos de varias fuentes, limitan la
revisión de la información. Los ejecutivos suelen necesitar de la información en
varias combinaciones de dos dimensiones. Por ejemplo, una ejecutiva quiere
ver un resumen de la cantidad de cada producto vendida en cada región.
Después, quiere ver las cantidades totales de cada producto vendidas dentro de
cada ciudad de una región. Y es posible que quiera ver las cantidades vendidas de
un producto específico en todas las ciudades de todas las regiones. El OLAP está
especialmente diseñado para responder consultas como éstas. Las aplicaciones
OLAP permiten a un usuario girar “cubos” de información virtuales, en donde cada
lado del cubo ofrece otras dos dimensiones de información relevante.
La fuerza del OLAP.
Las aplicaciones OLAP operan sobre los datos organizados especialmente para
tal uso o procesan los datos de bases de datos relacionales. Una aplicación OLAP
dinámica responde a los comandos mediante la preparación de tablas “mientras
funciona”. Para acelerar la respuesta, las bases de datos se organizan en primer
lugar como dimensionales. En las bases de datos dimensionales —también
llamadas bases de datos multidimensionales— los datos básicos se organizan en
tablas que muestran la información en resúmenes y en proporciones, para que
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
quien consulta no tenga que esperar el procesamiento de los datos básicos.
Muchas empresas organizan los datos en bases de datos relacionales y
almacenes de datos, pero también emplean aplicaciones que en forma automática
resumen esos datos y organizan la información en bases de datos dimensionales
para OLAP. Oracle, Cognos, Hyperion y muchas otras compañías venden
paquetes de bases de datos multidimensionales y herramientas OLAP para
emplearlas.
Las aplicaciones OLAP responden con facilidad a preguntas como “ Qué
productos se venden bien?” o “ están mis oficinas de ventas con el peor
desempeño?”. Observe que, aun que la palabra “cubo” se usa para ilustrar la
multidimensionalidad de las tablas OLAP, la cantidad de tablas no se limita a seis,
el cual es el número de lados de un cubo real. Es posible producir tablas que
muestran las relaciones de dos variables que estén en la bases de datos, siempre
y cuando existan los datos. OLAP permite a los administradores ver los
resúmenes y las proporciones de la intersección de cualesquiera dos dimensiones.
Las aplicaciones OLAP son recursos poderosos para los ejecutivos.
Las aplicaciones OLAP se suelen instalar en un servidor especial ubicado entre la
computadora del usuario y el servidor o los servidores que contienen un almacén
de datos o bases de datos dimensionales (aunque OLAP también puede procesar
datos de una base de datos de transacciones). Como las aplicaciones OLAP están
diseñadas para procesar grandes cantidades de registros y producir resúmenes,
suelen ser mucho más rápidas que las aplicaciones relacionales como las que
utilizan consultas de SQL (Lenguaje de Consulta Estructurado). Las aplicaciones
OLAP pueden procesar 20 000 registros por segundo. Como ya se mencionó, al
emplear tablas dimensionales preorganizadas, el único procesamiento es
encontrar la tabla que corresponde a las dimensiones y el modo de presentación
(como valores o porcentajes) que especificó el usuario. OLAP y técnicas similares
ayudan a los administradores y otros usuarios a analizar con rapidez lo que
sucede en los negocios. Los administradores en algunas compañías ahora
registran información acerca de sus productos desde la adquisición de materias
primas hasta la recepción del pago, no sólo para las operaciones, sino también
para aprender más acerca de sus clientes y su propio negocio.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
MICROSOFT OFFICE ACCESS 2007
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
CONCEPTOS DE BASE DE DATOS
ARCHIVOS DE BASE DE DATOS DE ACCESS
TABLAS.
CONSULTAS
FORMULARIOS
INFORMES
DISEÑO DE UNA BASE DE DATOS.
EL PROCESO DEL DISEÑO DE UNA BASE DE DATOS.
ESPECIFICAR CLAVES PRINCIPALES
FINALIDAD DE LA BASE DE DATOS
BUSCAR Y ORGANIZAR LA INFORMACIÓN
DIVIDIR LA INFORMACIÓN EN TABLAS
CONVERTIR LOS ELEMENTOS DE INFORMACIÓN EN COLUMNAS
ESPECIFICAR CLAVES PRINCIPALES
CREAR RELACIONES ENTRE TABLAS
INTRODUCCIÓN A MICROSOFT OFFICE ACCESS 2007
CONCEPTOS BÁSICOS.
Una base de datos es una colección de información relacionada con un tema u objetivo
concreto, como el seguimiento de pedidos de clientes o el mantenimiento de una
colección de música. Si la base de datos no está almacenada en un equipo, o sólo lo
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
están partes de la misma, es posible que tenga que hacer el seguimiento de la
información en diversos orígenes que tendrá que coordinar y organizar.
Por ejemplo, supongamos que los números de teléfono de sus proveedores están
almacenados en diversas ubicaciones: en un archivo de tarjetas que contiene los
números de teléfono de los proveedores, en archivos de información de los productos,
en un archivador y en una hoja de cálculo que contiene información de pedidos. Si
cambia el número de teléfono de un proveedor, tendría que actualizar la información
en los tres sitios. En una base de datos de Access bien diseñada, el número de teléfono
se almacena sólo una vez, de modo que sólo tiene que actualizar esa información en un
lugar. Como resultado, al actualizar el número de teléfono de un proveedor, se
actualiza automáticamente en cualquier lugar que lo utilice en la base de datos.
Archivos de base de datos de Access
Puede utilizar Access para administrar todos sus datos en un solo archivo. Dentro de
un archivo de base de datos de Access, puede utilizar:
 Tablas para almacenar los datos.
 Consultas para buscar y recuperar exactamente los datos que desee.
 Formularios para ver, agregar y actualizar datos en las tablas.
 Informes para analizar o imprimir los datos con un diseño específico.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN




Guardar una vez los datos en una tabla, pero verlos desde varias ubicaciones.
Cuando se actualizan los datos, se actualizan automáticamente en cualquier
lugar que aparezcan.
Recuperar datos mediante una consulta.
Ver o introducir datos mediante un formulario.
Visualizar o imprimir datos mediante un informe.
Todos estos elementos: tablas, consultas, formularios e informes son objetos de Base
de Datos.
Tablas.
Para almacenar los datos, se crea una tabla para cada tipo de información del que se
hace un seguimiento. Los tipos de información podrían incluir información de los
clientes, productos y otros detalles. Para reunir los datos procedentes de varias tablas
en una consulta, formulario o informe, hay que definir las relaciones entre las tablas.

La información de los clientes que una vez existió en una lista de direcciones,
ahora está ubicada en la tabla Clientes.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN


La información de pedidos que una vez estuvo en una hoja de cálculo, ahora
está ubicada en la tabla Pedidos.
Un identificador exclusivo, como un Id. del cliente, distingue un registro de
otro dentro de una tabla. Al agregar un campo de identificador exclusivo de
una tabla a otra tabla y definir una relación entre los dos campos, Access
puede hacer coincidir los registros relacionados de ambas tablas para que
pueda reunirlos en un formulario, informe o consulta.
Consultas
Una consulta puede ayudarle a recuperar los datos que cumplen las condiciones que
especifique, incluidos los datos de varias tablas. También puede utilizar una consulta
para actualizar o eliminar varios registros a la vez y realizar cálculos predefinidos o
personalizados con los datos.



La tabla Clientes tiene información sobre los clientes.
La tabla Pedidos tiene información sobre los pedidos de los clientes.
Esta consulta recupera el Id. de pedido y los datos de la fecha que se requiere
de la tabla Pedidos y el nombre de la compañía y los datos de la ciudad de la
tabla Clientes. La consulta sólo devuelve los pedidos que se requerían en abril
y sólo para los clientes con sede en Londres.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Formularios
Se puede utilizar un formulario para ver, introducir o cambiar los datos de filas de
una en una fácilmente. También se puede utilizar un formulario para realizar otras
acciones, como enviar datos a otra aplicación. Los formularios contienen
normalmente controles que están vinculados a campos subyacentes de las tablas. Al
abrir un formulario, Access recupera los datos de una o más tablas y los muestra en el
diseño que haya elegido al crear el formulario. Puede crear un formulario mediante
uno de los comandos Formulario de la cinta de opciones, el Asistente para
formularios, o crear su propio formulario en la vista Diseño.



Las tablas muestran muchos registros al mismo tiempo, pero es posible que
tenga que desplazarse horizontalmente para ver todos los datos de un solo
registro. Asimismo, al visualizar una tabla no puede actualizar los datos de
más de una tabla al mismo tiempo.
Los formularios se centran en un registro cada vez y pueden mostrar campos
de más de una tabla. También pueden mostrar imágenes y otros objetos.
Los formularios pueden tener un botón donde hacer clic para imprimir un
informe, abrir otros objetos o realizar otras tareas automatizadas.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Informes
Los informes se pueden utilizar para analizar rápidamente los datos o presentarlos de
una forma concreta, impresos o en otros formatos. Por ejemplo, puede enviar a un
colega un informe que clasifique los datos y calcule los totales. O puede crear un
informe con los datos de la dirección en un formato para imprimir etiquetas postales.



Utilizar un informe para crear etiquetas postales.
Utilizar un informe para mostrar los totales en un gráfico.
Utilizar un informe para mostrar los totales calculados.
Ahora que ya conoce la estructura básica de las bases de datos de Access, siga leyendo
para saber cómo utilizar las herramientas integradas para explorar una base de datos
de Access concreta.
Microsoft Office Access 2007 organiza la información en tablas, que son listas y
columnas similares a las de los libros contables o a las de las hojas de cálculo de
Microsoft Office Excel 2007. Una base de datos simple puede que sólo contenga una
tabla, pero la mayoría de las bases de datos necesitan varias tablas. Por ejemplo,
podría tener una tabla con información sobre productos, otra con información sobre
pedidos y una tercera con información sobre clientes.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Cada fila recibe también el nombre de registro y cada columna se denomina también
campo. Un registro es una forma lógica y coherente de combinar información sobre
alguna cosa. Un campo es un elemento único de información: un tipo de elemento que
aparece en cada registro. En la tabla Products (Productos), por ejemplo, cada fila o
registro contendría información sobre un producto, y cada columna contendría algún
dato sobre ese producto, como su nombre o el precio.
DISEÑO DE UNA BASE DE DATOS.
El proceso de diseño de una base de datos se guía por algunos principios. El primero
de ellos es que se debe evitar la información duplicada o, lo que es lo mismo, los datos
redundantes, porque malgastan el espacio y aumentan la probabilidad de que se
produzcan errores e incoherencias. El segundo principio es que es importante que la
información sea correcta y completa. Si la base de datos contiene información
incorrecta, los informes que recogen información de la base de datos contendrán
también información incorrecta y, por tanto, las decisiones que tome a partir de esos
informes estarán mal fundamentadas.
Un buen diseño de base de datos es, por tanto, aquél que:
 Divide la información en tablas basadas en temas para reducir los datos
redundantes.
 Proporciona a Access la información necesaria para reunir la información de
las tablas cuando así se precise.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN


Ayuda a garantizar la exactitud e integridad de la información.
Satisface las necesidades de procesamiento de los datos y de generación de
informes.
EL PROCESO DEL DISEÑO DE UNA BASE DE DATOS.
El proceso de diseño consta de los pasos siguientes:
 Determinar la finalidad de la base de datos
 Esto le ayudará a estar preparado para los demás pasos.
 Buscar y organizar la información necesaria
 Reúna todos los tipos de información que desee registrar en la base de datos,
como los nombres de productos o los números de pedidos.
 Dividir la información en tablas
 Divida los elementos de información en entidades o temas principales, como
Productos o Pedidos. Cada tema pasará a ser una tabla.
 Convertir los elementos de información en columnas
Decida qué información desea almacenar en cada tabla. Cada elemento se convertirá
en un campo y se mostrará como una columna en la tabla. Por ejemplo, una tabla
Empleados podría incluir campos como Apellido y Fecha de contratación.
Especificar claves principales







Elija la clave principal de cada tabla. La clave principal es una columna que se
utiliza para identificar inequívocamente cada fila, como Id. de producto o Id.
de pedido.
Definir relaciones entre las tablas
Examine cada tabla y decida cómo se relacionan los datos de una tabla con las
demás tablas. Agregue campos a las tablas o cree nuevas tablas para clarificar
las relaciones según sea necesario.
Ajustar el diseño
Analice el diseño para detectar errores. Cree las tablas y agregue algunos
registros con datos de ejemplo. Compruebe si puede obtener los resultados
previstos de las tablas. Realice los ajustes necesarios en el diseño.
Aplicar las reglas de normalización
Aplique reglas de normalización de los datos para comprobar si las tablas
están estructuradas correctamente. Realice los ajustes necesarios en las tablas.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
FINALIDAD DE LA BASE DE DATOS
Es conveniente plasmar en papel el propósito de la base de datos: cómo piensa
utilizarla y quién va a utilizarla. Para una pequeña base de datos de un negocio
particular, por ejemplo, podría escribir algo tan simple como "La base de datos de
clientes contiene una lista de información de los clientes para el envío masivo de
correo y la generación de informes". Si la base de datos es más compleja o la utilizan
muchas personas, como ocurre normalmente en un entorno corporativo, la finalidad
podría definirse fácilmente en uno o varios párrafos y debería incluir cuándo y cómo
va a utilizar cada persona la base de datos. La idea es desarrollar una declaración de
intenciones bien definida que sirva de referencia durante todo el proceso de diseño.
Esta declaración de intenciones le permitirá centrarse en los objetivos a la hora de
tomar decisiones.
BUSCAR Y ORGANIZAR LA INFORMACIÓN
Para buscar y organizar la información necesaria, empiece con la información
existente. Por ejemplo, si registra los pedidos de compra en un libro contable o guarda
la información de los clientes en formularios en papel en un archivador, puede reunir
esos documentos y enumerar cada tipo de información que contienen (por ejemplo,
cada casilla de un formulario). Si no dispone de formularios, imagine que tiene que
diseñar uno para registrar la información de los clientes. ¿Qué información incluiría
en el formulario? ¿Qué casillas crearía? Identifique cada uno de estos elementos y
cree un listado. Suponga, por ejemplo, que guarda la lista de clientes en fichas. Cada
ficha podría contener un nombre de cliente, su dirección, ciudad, provincia, código
postal y número de teléfono. Cada uno de estos elementos representa una columna
posible de una tabla.
Cuando prepare esta lista, no se preocupe si no es perfecta al principio. Simplemente,
enumere cada elemento que se le ocurra. Si alguien más va a utilizar la base de datos,
pídale también su opinión. Más tarde podrá ajustar la lista.
A continuación, considere los tipos de informes o la correspondencia que desea
producir con la base de datos. Por ejemplo, tal vez desee crear un informe de ventas
de productos que contenga las ventas por región, o un informe de resumen de
inventario con los niveles de inventario de los productos. Es posible que también desee
generar cartas modelo para enviárselas a los clientes con un anuncio de una actividad
de ventas o una oferta. Diseñe el informe en su imaginación y piense cómo le gustaría
que fuera. ¿Qué información incluiría en el informe? Cree un listado de cada
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
elemento. Haga lo mismo para la carta modelo y para cualquier otro informe que
tenga pensado crear.
Detenerse a pensar en los informes y en la correspondencia que desea crear le
ayudará a identificar los elementos que necesita incluir en la base de datos. Suponga,
por ejemplo, que ofrece a sus clientes la oportunidad de inscribirse o borrarse de las
actualizaciones periódicas de correo electrónico y desea imprimir un listado de los que
han decidido inscribirse. Para registrar esa información, agrega una columna "Enviar
correo electrónico" a la tabla de clientes. Para cada cliente, puede definir el campo en
Sí o No.
La necesidad de enviar mensajes de correo electrónico a los clientes implica la
inclusión de otro elemento. Cuando sepa que un cliente desea recibir mensajes de
correo electrónico, tendrá que conocer también la dirección de correo electrónico a la
que éstos deben enviarse. Por tanto, tendrá que registrar una dirección de correo
electrónico para cada cliente.
Parece lógico crear un prototipo de cada informe o listado de salida y considerar qué
elementos necesita para crear el informe. Por ejemplo, cuando examine una carta
modelo, puede que se le ocurran algunas ideas. Si desea incluir un saludo (por
ejemplo, las abreviaturas "Sr." o "Sra." con las que comienza un saludo), tendrá que
crear un elemento de saludo. Además, tal vez desee comenzar las cartas con el saludo
"Estimado Sr. García", en lugar de "Estimado Sr. Miguel Ángel García". Esto
implicaría almacenar el apellido independientemente del nombre.
Un punto clave que hay que recordar es que debe descomponer cada pieza de
información en sus partes lógicas más pequeñas. En el caso de un nombre, para poder
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
utilizar el apellido, dividirá el nombre en dos partes: el nombre y el apellido. Para
ordenar un informe por nombre, por ejemplo, sería útil que el apellido de los clientes
estuviera almacenado de forma independiente. En general, si desea ordenar, buscar,
calcular o generar informes a partir de un elemento de información, debe incluir ese
elemento en su propio campo.
Piense en las preguntas que le gustaría que la base de datos contestara. Por ejemplo,
¿cuántas ventas de un determinado producto se cerraron el pasado mes? ¿Dónde
viven sus mejores clientes? ¿Quién es el proveedor del producto mejor vendido?
Prever esas preguntas le ayudará a determinar los elementos adicionales que necesita
registrar.
DIVIDIR LA INFORMACIÓN EN TABLAS
Para dividir la información en tablas, elija las entidades o los temas principales. Por
ejemplo, después de buscar y organizar la información de una base de datos de ventas
de productos, la lista preliminar podría ser similar a la siguiente:
Las entidades principales mostradas aquí son los productos, los proveedores, los
clientes y los pedidos. Por tanto, parece lógico empezar con estas cuatro tablas: una
para los datos sobre los productos, otra para los datos sobre los proveedores, otra
para los datos sobre los clientes y otra para los datos sobre los pedidos. Aunque esto
no complete la lista, es un buen punto de partida. Puede seguir ajustando la lista hasta
obtener un diseño correcto.
Cuando examine por primera vez la lista preliminar de elementos, podría estar
tentado a incluirlos todos ellos en una sola tabla en lugar de en las cuatro tablas
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
mostradas en la ilustración anterior. A continuación le explicaremos por qué eso no es
una buena idea. Considere por un momento la tabla que se muestra a continuación:
En este caso, cada fila contiene información sobre el producto y su proveedor. Como
hay muchos productos del mismo proveedor, la información del nombre y la dirección
del proveedor debe repetirse muchas veces, con lo que se malgasta el espacio en disco.
Registrar la información del proveedor una sola vez en una tabla Proveedores distinta
y luego vincular esa tabla a la tabla Productos es una solución mucho mejor.
Otro problema de este diseño surge cuando es necesario modificar la información del
proveedor. Suponga, por ejemplo, que necesita cambiar la dirección de un proveedor.
Como ésta aparece en muchos lugares, podría sin querer cambiar la dirección en un
lugar y olvidarse de cambiarla en los demás lugares. Ese problema se resuelve
registrando la información del proveedor en un único lugar.
Cuando diseñe la base de datos, intente registrar siempre cada dato una sola vez. Si
descubre que está repitiendo la misma información en varios lugares, como la
dirección de un determinado proveedor, coloque esa información en una tabla
distinta.
Por último, suponga que el proveedor Bodega Sol sólo suministra un producto y desea
eliminar ese producto pero conservar el nombre del proveedor y la información de
dirección. ¿Cómo eliminaría el producto sin perder la información del proveedor? No
puede. Como cada registro contiene datos sobre un producto, además de datos sobre
un proveedor, no puede eliminar unos sin eliminar los otros. Para mantener estos
datos separados, debe dividir la tabla en dos: una tabla para la información sobre los
productos y otra tabla para la información sobre los proveedores. Al eliminar un
registro de producto sólo se eliminarían los datos del producto y no los datos del
proveedor.
Una vez seleccionado el tema representado por una tabla, las columnas de esa tabla
deben almacenar datos únicamente sobre ese tema. Por ejemplo, la tabla de productos
sólo debe contener datos de productos. Como la dirección del proveedor es un dato del
proveedor, pertenece a la tabla de proveedores.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
CONVERTIR LOS ELEMENTOS DE INFORMACIÓN EN COLUMNAS
Para determinar las columnas de una tabla, decida qué información necesita registrar
sobre el tema representado por la tabla. Por ejemplo, para la tabla Clientes, una
buena lista de columnas iniciales sería Nombre, Dirección, Ciudad-Provincia-Código
postal, Enviar correo electrónico, Saludo y Correo electrónico. Cada registro de la
tabla contiene el mismo número de columnas, por lo que puede almacenar
información sobre el nombre, dirección, ciudad-provincia-código postal, envío de
correo electrónico, saludo y dirección de correo electrónico para cada registro. Por
ejemplo, la columna de dirección podría contener las direcciones de los clientes. Cada
registro contendrá datos sobre un cliente y el campo de dirección, la dirección de ese
cliente.
Cuando haya determinado el conjunto inicial de columnas para cada tabla, puede
ajustar con mayor precisión las columnas. Por ejemplo, tiene sentido almacenar los
nombres de los clientes en dos columnas distintas (el nombre y el apellido) para poder
ordenar, buscar e indizar por esas columnas. De igual forma, la dirección consta en
realidad de cinco componentes distintos: dirección, ciudad, provincia, código postal y
país o región, y parece lógico también almacenarlos en columnas distintas. Si desea
realizar, por ejemplo, una búsqueda o una operación de ordenación o filtrado por
provincia, necesita que la información de provincia esté almacenada en una columna
distinta.
Debe considerar también si la base de datos va a contener información sólo de
procedencia nacional o internacional. Por ejemplo, si piensa almacenar direcciones
internacionales, es preferible tener una columna Región en lugar de Provincia, ya que
esa columna puede incluir provincias del propio país y regiones de otros países o
regiones. De igual forma, es más lógico incluir una columna Región en lugar de
Comunidad Autónoma si va a almacenar direcciones internacionales.
En la lista siguiente se incluyen algunas sugerencias para determinar las columnas de
la base de datos.
 No incluya datos calculados
 En la mayoría de los casos, no debe almacenar el resultado de los cálculos en
las tablas. En lugar de ello, puede dejar que Access realice los cálculos cuando
desee ver el resultado. Suponga, por ejemplo, que tiene un informe Productos
bajo pedido que contiene el subtotal de unidades de un pedido para cada
categoría de producto de la base de datos. Sin embargo, no hay ninguna tabla
que contenga una columna de subtotal Unidades en pedido. La tabla Productos
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN

contiene una columna Unidades en pedido que almacena las unidades incluidas
en un pedido de cada producto. Con esos datos, Access calcula el subtotal cada
vez que se imprime el informe, pero el subtotal propiamente dicho no debe
almacenarse en una tabla.
Almacene la información en sus partes lógicas más pequeñas
Puede ceder a la tentación de habilitar un único campo para los nombres completos o
para los nombres de productos junto con sus descripciones. Si combina varios tipos de
información en un campo, será difícil recuperar datos individuales más adelante.
Intente dividir la información en partes lógicas. Por ejemplo, cree campos distintos
para el nombre y el apellido, o para el nombre del producto, la categoría y la
descripción.
Una vez ajustadas las columnas de datos de cada tabla, ya puede seleccionar la clave
principal de cada tabla.
ESPECIFICAR CLAVES PRINCIPALES
Cada tabla debe incluir una columna o conjunto de columnas que identifiquen
inequívocamente cada fila almacenada en la tabla. Ésta suele ser un número de
identificación exclusivo, como un número de identificador de empleado o un número
de serie. En la terminología de bases de datos, esta información recibe el nombre de
clave principal de la tabla. Access utiliza los campos de clave principal para asociar
rápidamente datos de varias tablas y reunir automáticamente esos datos.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Si ya tiene un identificador exclusivo para una tabla, como un número de producto
que identifica inequívocamente cada producto del catálogo, puede utilizar ese
identificador como clave principal de la tabla, pero sólo si los valores de esa columna
son siempre diferentes para cada registro. No puede tener valores duplicados en una
clave principal. Por ejemplo, no utilice los nombres de las personas como clave
principal, ya que los nombres no son exclusivos. Es muy fácil que dos personas tengan
el mismo nombre en la misma tabla.
Una clave principal siempre debe tener un valor. Si el valor de una columna puede
quedar sin asignar o vacío (porque no se conoce) en algún momento, no puede
utilizarlo como componente de una clave principal.
Debe elegir siempre una clave principal cuyo valor no cambie. En una base de datos
con varias tablas, la clave principal de una tabla se puede utilizar como referencia en
las demás tablas. Si la clave principal cambia, el cambio debe aplicarse también a
todos los lugares donde se haga referencia a la clave. Usar una clave principal que no
cambie reduce la posibilidad de que se pierda su sincronización con las otras tablas en
las que se hace referencia a ella.
A menudo, se utiliza como clave principal un número único arbitrario. Por ejemplo,
puede asignar a cada pedido un número de pedido distinto. La única finalidad de este
número de pedido es identificar el pedido. Una vez asignado, nunca cambia.
Si piensa que no hay ninguna columna o conjunto de columnas que pueda constituir
una buena clave principal, considere la posibilidad de utilizar una columna que tenga
el tipo de datos Autonumérico. Cuando se utiliza el tipo de datos Autonumérico,
Access asigna automáticamente un valor. Este tipo de identificador no es "fáctico", es
decir, no contiene información objetiva sobre la fila que representa. Los
identificadores de este tipo son perfectos para usarlos como claves principales, ya que
no cambian. Una clave principal que contiene datos sobre una fila, como un número
de teléfono o el nombre de un cliente, es más probable que cambie, ya que la propia
información "fáctica" podría cambiar.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN
Una columna establecida en el tipo de datos Autonumérico suele constituir una buena
clave principal. No hay dos identificadores de producto iguales.
En algunos casos, tal vez considere conveniente utilizar dos o más campos juntos como
clave principal de una tabla. Por ejemplo, una tabla Detalles de pedidos que contenga
artículos de línea de pedidos tendría dos columnas en su clave principal: Id. de pedido
e Id. de producto. Cuando una clave principal está formada por más de una columna
se denomina clave compuesta.
Para la base de datos de ventas de productos, puede crear una columna autonumérica
para cada una de las tablas que funcione como clave principal: IdProducto para la
tabla Productos, IdPedido para la tabla Pedidos, IdCliente para la tabla Clientes e
IdProveedores para la tabla Proveedores.
CREAR RELACIONES ENTRE TABLAS
Ahora que ha dividido la información en tablas necesita un modo de reunir de nuevo
la información de forma provechosa. Por ejemplo, el siguiente formulario incluye
información de varias tablas.
SEMA, GOMA, COAT
UNIDAD DE APRENDIZAJE: TECNOLOGÍA INFORMÁTICA
UNIDAD III. TECNOLOGÍAS INFORMÁTICAS DE ALMACENAMIENTO
ELECTRÓNICO DE INFORMACIÓN





La información de este formulario procede de la tabla Clientes...
...la tabla Empleados...
...la tabla Pedidos...
...la tabla Productos...
...y la tabla Detalles de pedidos.
Access es un sistema de administración de bases de datos relacionales. En una base de
datos relacional, la información se divide en tablas distintas en función del tema.
SEMA, GOMA, COAT
Descargar