ESPECIFICACIONES DE LOS NUEVOS PROCESADORES IA-32e Modo Extendido de 64 bits (AMD64, x86-64, EM64T) El modo de extensión de 64-bit es una mejora a la arquitectura IA-32, originalmente diseñada por AMD y después adoptada por Intel. Los procesadores con la tecnología de extensión de 64-bit pueden correr en modo real (8086), en modo protegido (IA-32), o en modo real vitual (IA-32). El modo IA-32 permite al procesador correr en modo protegido y en modo real virtual. El modo IA-32e permite el procesador correr en el modo del 64-bit y en modo compatible, lo que significan puede ejecutar aplicaciones de 64-bits y de 32-bits simultáneamente. El modo IA-32e incluye dos submodos: Modo 64-bit. Habilita un sistema operativo de 64 bits para correr aplicaciones de 64 bits. Modo compatible. Habilita un sistema operativo de 64 bits para correr la mayoria de software de 32 bits. El modo IA-32e 64-bit se habilita cargando un sistema operativo de 64 bits y es usado por las aplicaciones de 64 bits. En el submodo de 64 bits, están disponibles las siguientes nuevas caracteristicas: Direcccionamiento lineal de memoria de 64 bits. Soporte de memoria física mas alla de 4GB (limitada por las especificaciones del procesador) 8 nuevos registros de propósito general (GPRs). 8 nuevos registros de extensiones de transmisión de flujos SIMD (MMX, SSE, SSE2 Y SSE3). GPRs de 64 bits de ancho y punteros de instrucción. El modo compatible IE-32e permite a aplicaciones de 32 bits y de 16 bits correr bajo un sistema operativo de 64 bits. Desgraciadamente, programas heredados de 16 bits que corren en modo real virtual (es decir, programas DOS) no son soportados y no correrán, lo que probablemente sea el problema más grande para muchos usuarios. Similar al modo 64 bits, el modo compatible se habilita por el sistema operativo en un código base individual, lo que significa que aplicaciones de 64 bits ejecutandose en el modo de 64 bits pueden operar simultáneamente con las aplicaciones de 32 bits ejecutandose en el modo compatible. Lo qué nosotros necesitamos para hacer todo este trabajo es un sistema operativo de 64 bits y, mucho más importante, controladores de 64 bits para todo nuestro hardware para trabajar bajo ese OS. Ya existe Un OS de 64 bits en dos versiones: Windows XP 64-bit Edition para Itanium. Windows XP 64-bit Edition para sistemas extendidos a 64 bits. De estos, el primero es para procesadores IA-64, como Itanium e Itanium 2, y ha estado disponible en una versión de la producción liberada desde 2001. El último es para procesadores IA-32 con extensiones de 64 bits, tal como el Athlon 64, Opteron, y futuros procesadores Xeon y Pentium que soportan extensiones de 64 bits, y fue liberado en una versión producida en la última mitad de 2004. Las diferencias entre las versiones de Windows XP 32-bit y 64-bit se muestran en la tabla 1.0. Tabla 1.0 Windows XP 32-Bit contra 64-Bit Espacio de direcciones Windows XP 32-bit Windows Xp 64-bit Memoria fisica Memoria virtual Archivo de paginación Bloque paginado Bloque no paginado Cache del sistema 32TB 16TB 512TB 128GB 128GB 1TB 4GB 4GB 16TB 470MB 256MB 1GB La mayor diferencia entre Windows XP 32-bit y 64-bit es el soporte de memoria, especifimente en el salto a la barrera de los 4GB encontrado en los sistemas Windows de 32 bits. Windows XP 32-bit soporta hasta 4GB de memoria física o virtual, hasta con 2GB de memoria dedicada por proceso. Windows XP 64-bit Edición soporta hasta 32GB de memoria física y hasta 16TB de memoria virtual. El soporte para más memoria significa que las aplicaciones puedan precargar más datos dentro de culquier memoria física o virtual, a los que el procesador puede acceder mucho más rápidamente. Si usted necesita más de 4GB de RAM, se requieren sistemas de 64 bits y Windows de 64 bits. Windows XP 64-bit ejecuta aplicaciones Windows de 32 bits sin problemas, pero no ejecuta aplicaciones DOS u otros programas que corren en modo real virtual. Los controladores también son otro gran problema. Los procesos de 32 bits no pueden cargar las bibliotecas de enlace dinámico de 64 bits (DLLs), y los procesos de 64 bits no pueden cargar las DLLs de 32 bits. Esto significa esencialmente que, necesita los dos controladores de 32 y 64 bits de todos los dispositivos conectados a su sistema para poder trabajar. Adquirir los controladores de 64 bits para dispositivos más viejos o dispositivos que ya no los soportan puede ser difícil o imposible. Incluso para los nuevos dispositivos, pueden pasar un par de años antes de que los fabricantes proporcionen controladores de 64 bits como una característica estandar. CLASIFICACION DE VELOCIDADES DE PROCESADOR Tabla 1.1 Procesadores Intel y velocidades de Motherboard. Tipo de CPU Velocidad de CPU (MHz) Multiplicador de reloj de CPU Velocidad de tarjeta madre (MHz) Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium Pentium 1300 1400 1500 1600 1700 1800 1900 2000 2200 2400 2266 3.25x 3.5x 3.75x 4x 4.25x 4.5x 4.75x 5x 5.5x 6x 4.25x 400 400 400 400 400 400 400 400 400 400 533 4 4 4 4 4/Celeron 4 4 4 4 4 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Pentium 4 Itanium Itanium Itanium 2 Tabla 1.2 2400 2500 2533 2600 2660 2800 3060 3200 3400 733 800 1000 4.5x 6.25x 4.75x 6.5x 5x 5.25x 5.75x 4x 4.25x 2.75x 3x 2.5x 533 400 533 400 533 533 533 800 800 266 266 400 Rendimiento nominal AMD contra velocidad real del Chip en MHz. Tipo de CPU Rendimiento Velocidad Real nominal del CPU Multiplicador Velocidad de de reloj motherboard (MHz) Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP Atlón XP 1500+ 1600+ 1700+ 1800+ 1900+ 2000+ 2100+ 2200+ 2400+ 2500+ 2600+ 2600+ 2700+ 2800+ 2800+ 3000+ 3200+ 5x 5.25x 5.5x 5.75x 6x 6.25x 6.5x 6.75x 7.5x 5.5x 6.25x 8x 6.5x 6.25x 6.75x 6.5x 7x 1333 1400 1466 1533 1600 1666 1733 1800 2000 1833 2083 2133 2167 2083 2250 2167 2333 266 266 266 266 266 266 266 266 266 333 333 266 333 333 333 333 333 CARACTERÍSTICAS DEL PROCESADOR SSE, SSE2, y SSE3 En febrero de 1999, Intel presentó el procesador Pentium III e incluyo en ese procesador una actualización a MMX llamada Streaming SIMD Extensiones (SSE). Hasta su debut también se llamaron Katmai News Instructions (KNI) porque eran incluidos originalmente en el procesador Katmai que era el nombre clave para el Pentium III. Los procesadores Celeron 533A y los Celeron más rápidos basados en núcleo del Pentium III también soportan instrucciones SSE. El Pentium II más antiguo y el Celeron 533 e inferiores (basado en el núcleo del Pentium II ) no soportan SSE. SSE incluye 70 nuevas instrucciones para procesamiento de gráficos y sonido mas de lo que proporcionaba MMX. SSE es similar a MMX; de hecho, además de llamarse KNI, SSE se llamó también MMX-2 poco antes de que fuera liberado. Además de agregar más instrucciones estilo MMX, las instrucciones de SSE permiten cálculos de punto flotante y ahora usan una unidad separada dentro del procesador en lugar de compartir la unidad estandar de punto flotante como lo hacia MMX. SSE2 se introdujo en noviembre del 2000, junto con el procesador Pentium 4, y agrega 144 instrucciones SIMD adicionales. SSE2 también incluye todas las instrucciones MMX y SSE anteriores. SSE3 se introdujo en febrero de 2004, junto con el procesador Pentium 4 Prescott, y agrega 13 nuevas instrucciones SIMD para mejorar las matemáticas complejas, los gráficos, la codificación de video, y la sincronización de subprocesos. SSE3 también incluye todas las instrucciones MMX, SSE y SSE2 anteriores. La SSE se componen de nuevas instrucciones, incluyendo las SIMD de punto flotante, adicional a las SIMD de enteros, y las instrucciones de control de la capacidad de cache. Algunas de las tecnologías que se benefician delas SSE incluyen diseño de imagenes avanzado, video 3D, flujo de sonido y video (reproduccion de DVD), y aplicaciones de reconocimiento de voz. Las ventajas de SSE incluyen lo siguiente: Mayor resolución y mayor calidad de visualizacion de imágenes para software de manipulación de graficos. Alta calidad de audio, video MPEG2 y codificación y decodificacion simultanea MPEG2 para aplicaciones multimedia. Reducida utilización del CPU para reconocimiento de voz, así como mejor precision y tiempos de respuesta más rápidos cuando se corre software de reconocimiento de voz. Las instrucciones SSEx son particularmente útiles con decodificacion MPEG2, que es el diseño estandar usado en los discos de video DVD. Los procesadores provistos de SSE deben ser por consiguiente más capaces de ejecutar decodificacion MPEG2 a toda velocidad en el software sin requerir un codificador de MPEG2 de una tarjeta hardware adicional. Los procesadores provistos de SSE son mucho mejores y más rápidos que los procesadores anteriores cuando se va al reconocimiento de voz, también. Uno de los principales beneficios de SSE sobre las MMX normales es que soporta operaciones SIMD de punto flotante de simple precisión, el cual habia presentado un cuello de botella en el procesamiento de gráficos 3D. Así como con el MMX normal, SIMD habilita múltiples operaciones para ser ejecutadas por instrucción del procesador. Específicamente, SSE soporta hasta cuatro operaciones de punto flotante por ciclo; es decir, una sola instrucción puede operar sobre cuatro trozos de datos simultáneamente. Las instrucciones SSE de punto flotante pueden mezclarse con las instrucciones MMX sin penalizacion de rendimiento. SSE también soporta pre-extraccion de datos (pre-fetching), que es un mecanismo de lectura de datos dentro de la cache antes de que se requieran realmente. Note que para ser beneficiosas cualquiera de las instrucciones SSE, deben códificarse en el software que está usando, tambien deben usarse aplicaciones adaptadas a las SSE para ver los beneficios. La mayoria de las compañías relacionadas hoy al software de edición de gráficos y sonido, han actualizado sus aplicaciones para adaptarse a las SSE y usar sus caracteristicas. Por ejemplo, las potentes aplicaciones de gráficos como Adobe Photoshop soportan instrucciones SSE para alto rendimiento en procesadores equipados con SSE. Microsoft incluye soporte para SSE en su DirectX 6.1 y controladores avanzados de audio y video, que son incluidos en Windows 98 Segunda Edición, Windows Me, WINDOWS NT 4.0 (con service pack 5 o mas reciente), Windows 2000 y Windows XP. SSE es una extensión de MMX; SSE2 es una extensión de SSE; y SSE3 es una extensión de SSE2. Por lo tanto, los procesadores que soportan SSE3 tambien soportan instrucciones SSE2, los procesadores que soportan SSE2 tambien soportan SSE, y procesadores que soportan SSE tambien soportan las instrucciones MMX originales. Esto significa que las aplicaciones habilitadas al estandar MMX, corren como si hubiera un solo procesador MMX. 3DNow!, Enhanced 3DNow!, y Professional 3DNow! La tecnología ¡3DNow! se presentó originalmente como una alternativa de AMD a las instrucciones SSE de los procesadores Intel. Realmente, 3DNow! se introdujo primero en las series K6 antes de que Intel presentara las SSE en el Pentium III, y entonces AMD agregó Enhanced 3DNow! a los procesadores Athlon y Duron. La última versión, Professional 3DNow!, fue introducidda en los primeros procesadores Athlon XP. AMD registro la licencia MMX de Intel, y todas sus series de K6, Athlon, Duron, y los ultimos procesadores incluyen soporte completo de instrucciones MMX. No quiso autorizar las instrucciones SSE que habian sido desarrolládas adicionalmente por Intel, AMD vino primero a con un conjunto diferente de extensiones más allá de las MMX que llamó 3DNow!. Introdujo en mayo de 1998 el procesador K6-2 y lo mejoro cuando se introdujo el Athlon en junio de 1999, 3DNow!, y Enhanced 3DNow! son conjuntos de instrucciones que extienden las capacidades multimedia de los chips AMD más allá de las MMX. Esto habilita intensamente el rendimiento para 3D gráficos, multimedia, y otras aplicaciones de PC de punto flotante intensivo. La tecnología 3DNow! es un conjunto de 21 instrucciones que usan las técnicas SIMD para operar arreglos de datos en lugar de simples elementos. Enhanced 3DNow! agrega 24 instrucciones más (19 SSE y 5 DSP / instrucciones de comunicacion) a las 21originales para un total de 45 nuevas instrucciones. Posicionado como una extensión a la tecnología MMX, 3DNow! es similar a las SSE halladas en los procesadores Pentium III y Celeron de Intel. Según AMD, 3DNow! proporciona aproximadamente el mismo nivel de mejora que hizo SSE a MMX, pero en pocas instrucciones con menos complejidad. Aunque similares en capacidad, no son compatibles en el nivel de instrucción, de manera que el software escrito específicamente para soportar SSE no soporta 3DNow!, y viceversa. La última versión de 3DNow!, 3DNow! Pprofessional, agrega 51comandos SSE a 3DNow! Enhanced, lo que significa que 3DNow! Profesional ahora soporta todo los comandos SSE, lo que significa que ahora los chips AMD tienen esencialmente capacidades SSE. Desafortunadamente, AMD incluye SSE2 sólo en los procesadores Athlon 64, Athlon 64FX, y Opteron 64-bit. Así como las SSE, 3DNow! también soporta operaciones SIMD de punto flotante de precisión y habilita hasta cuatro operaciones de punto flotante por ciclo. Las instrucciones 3DNow! de punto flotante pueden mezclarse con las instrucciones MMX sin penalizacion de rendimiento. 3DNow! también soporta extracción de datos. También como SSE, 3DNow! es bien soportado por el software, incluyendo Windows 9x, Windows NT 4.0, y todos los más recientes sistemas operativos de Microsoft. El soporte específico 3DNow! no es mas ningún gran problema si está usando un procesador Athlon XP o Athlon 64 porque ahora soportan totalmente las SSE por medio dela compatibilidad de 3DNow! Professional. Tecnología Hyper-Threading Las computadoras con dos o más procesadores físicos han tenido buena ventaja de rendimiento sobre las computadoras de processor unico cuando el sistema operativo soportaba múltiples procesadores, como es el caso de WINDOWS NT 4.0, 2000, XP Professional y Linux. Sin embargo, las tarjetas madres y sistemas de procesador doble siempre han sido más caros que los sistemas de procesador unico, y actualizar un sistema apto para procesador doble a estado de doble procesador puede ser difícil con un solo procesador por la necesidad de coincidir velocidades y especificaciones del procesador. Sin embargo, la nueva Tecnología Hyper-Threading (HT) de Intel permite un solo procesador ocuparse de dos conjuntos independientes de instrucciones al mismo tiempo. En esencia, la Tecnología HT convierte a un solo procesador físico en dos procesadores virtuales. Originalmente Intel introdujo la Tecnología de HT en su línea de procesadores Xeon para servidores en marzo de 2002. La tecnología HT habilita a servidores multiprocesador actuar como si tuvieran el doble de los procesadores instalados. La tecnología HT fue introducida en los procesadores Xeon del grupo de estaciones de trabajo con bus de sistema a 533MHz y después encontro su camino en los procesadores de PC, con el procesador Pentium 4 a 3.06GHz en noviembre de 2002. La tecnología HT también está presente en todo los procesadores Pentium 4 con velocidad de bús de 800MHz (2.4GHz hasta los ultimos de 3.4GHz). Como trabaja Hyper-threading Internamente, un procesador habilitado con HT tiene dos conjuntos de registros de proposito general, dos registros de control, y otros componentes de arquitectura, pero ambos procesadores lógicos comparten la misma cache, unidades de ejecución y los búses. Durante la operacion, cada procesador lógico maneja un solo procesamiento (vea Figura 1.3). CPU unico Procesamiento 1 Doble procesador físico Procesamiento 2 CPU inactivo CPU con Hyoer-Threading Figura 1.0 Un procesador con Tecnologia HT habilitada puede completar el tiempo de algun modo inactivo con un segundo proceso, mejorando la multitarea y el rendimiento de aplicaciones simples multiproceso. Aunque la distribucion de algunos componentes del procesador significa que la velocidad total de un sistema habilitado con HT no es tan alto como sería un verdadero sistema de doble procesador, son posibles aumentos de velocidad de un 25% o más cuando se ejecutan aplicaciones múltiples o una simple aplicación multiproceso. Requisitos de Hyper-Threading El primer procesador habilitado con HT es el Intel Pentium 4 a 3.06GHz. Todos los modelos Pentium 4 a 3.06GHz y más rápidos soportan la Tecnología HT, tambien todos los procesadores a 2.4GHz y más rápidos que usan el bús a 800MHz. Sin embargo, un procesador P4 habilitado con HT no puede producir por si mismo los beneficios de la Tecnología HT a su sistema. También necesita lo siguiente: Una motherboard compatible (chipset). Podria necesitar una actualizacion de BIOS. Soporte de BIOS para habilitar/deshabilitar Tecnología HT. Si su sistema operativo no soporta Tecnologia HT, debe deshabilitar esta característica. Un sistema operativo compatible como Windows XP Home o Profesional Editions. Cuando esta habilitado Hyper-Threading en esos sistemas operativos, el administrador de dispositivos muestra dos procesadores. Los chipsets más nuevos de Intel para el Pentium 4 soportan Tecnología HT; vea el listado en Capítulo 4 para mas detalles. Sin embargo, si su tarjeta madre o computadora fueran lanzadas antes de que se introdujera la Tecnología HT, necesitará una actualización del BIOS de la tarjeta madre o que el vendedor del sistema la habilita para usar tecnología HT. Aunque WINDOWS NT 4.0 y Windows 2000 estan diseñados para usar múltiples procesadores físicos, la Tecnología de HT exige optimizaciones específicas del sistema operativo para trabajar correctamente. Las distribuciones Linux basadas en el kernel 2.4.18 y superiores también soportan Tecnología HT. ESPECIFICACIONES DE SOCKET DE PROCESADOR Y TIPOS DE RANURAS Tabla 1.3 Clase de chip Socket Intel clase Pentium 4 AMD clase K7 Pins Voltaje Procesadores soportados Introduccion Socket 423 423 Auto VRM Pentium 4 FC-PGA Nov. ‘00 Socket 478 478 Auto VRM Pentium 4/Celeron FC-PGA2 Oct. ‘01 Socket T (LGA775) Ranura A 7775 Auto VRM Pentium 4/Celeron LGA775 Jun. ‘04 242 Auto VRM AMD Athlon SECC Jun. ‘99 462 Auto VRM Jun. ‘00 754 939 940 330 Auto VRM Auto VRM Auto VRM Auto VRM AMD Athlon/ Athlon XP/ Duron PGA/FC-PGA AMD Athlon 64 AMD Athlon 64 v.2 AMD Athlon 64FX, Opteron Pentium II/III Xeon 603 604 418 Auto VRM Auto VRM Auto VRM split SPGA Auto VRM mPGA Auto VRM Xeon (P4) Xeon (P4) Itanium May. ‘01 Oct. ‘03 May. ‘01 Itanium 2 Jul. ‘02 AMD Athlon 64FX, Opteron Abr. ‘03 Socket A (462) AMD clase K8 Socket 754 Socket 939 Socket 940 Ranura 2 Intel/AMD clase servidor y (SC330) estaciones de Socket 603 trabajo Socket 604 Socket PAC418 Socket PAC611 Socket 940 611 940 Sep. ‘03 Jun. ‘04 Abr. ‘03 Abr. ‘98 SOCKETS DE PROCESADORES ACTUALES Socket 423 Socket 423 es un socket de tipo ZIF introducido en noviembre del 2000 para el Pentium 4 original. El socket 423 soporta bús de procesador a 400MHz, que conecta el procesador al concentrador controlador de Memoria (MCH), que es la parte principal del chipset de la tarjeta madre y similar al North Bridge en los primeros chipsets. Los procesadores Pentium 4 hasta 2GHz estan disponible para Socket 423; en cambio todas las versiones más rápidas requieren socket 478. El Socket 423 usos un método único de montaje de disipador de calor, que necesita a cada sujetador adjuntado al chasis o a una placa especial que se monta debajo de la tarjeta madre. Fue diseñado para soportar el peso del disipador de calor más grande requerido para el Pentium 4. Debido a esto, muchas motherboard Socket 423 necesitan un chasis especial que tienen los sujetadores adicionales necesarios instalados. Afortunadamente, la necesidad de estos sujetadores se eliminó con el nuevo Socket 478 para procesadores Pentium 4. El procesador usa cinco pines de identificación de voltaje (VID) para señalar la constitucion VRM en la tarjeta madre para entregar el voltaje correcto para el CPU particular que instalo. Esto hace la selección de voltaje completamente automática y segura. La mayoria de los procesadores Pentium 4 para Socket 423 requieren 1.7V. Una pequeña marca triangular indica la esquina del pin-1 para la apropiada orientación del chip. Socket 478 El socket 478 es un socket tipo ZIF para Pentium 4 y Celeron 4 (Celerons basados en el núcleo del Pentium 4) introducido en octubre de 2001. Fue diseñado especialmente para soportar los pines adicionales para los futuros procesadores Pentium 4 y velocidades superiores a 2GHz. El montaje de disipación de calor es diferente del anterior Socket 423, permitiendo que disipadores de calor más grandes sean sujetados al CPU. El socket 478 soporta bús del procesador a 400MHz, 533MHz, o 800MHz que conectan el procesador al concentrador de controlador de memoria (MCH) que es la parte principal del chipset de la tarjeta madre. El socket 478 usa un nuevo método de sujecion del disipador de calor que sujeta el disipador de calor directamente a la tarjeta madre, y no al socket del CPU o chasis (como con el socket 423). Por lo tanto,cualquier chasis estandar puede usarse, y los sujetadores especiales usados por las tarjetas Socket 423 no se requieren. El nuevo montaje de disipación de calor permite una carga mucho mayor de fijacion entre el disipador de calor y el procesador que ayudan al refrescamiento. Los procesadores Socket 478 usan cinco pinesVID para señalar la construccion VRM en la tarjeta madre para entregar el voltaje correcto para el CPU particular que instalo. Esto hace la selección de voltaje completamente automática y segura. Una pequeña marca triangular indica la esquina del pin 1 para la apropiada orientación del chip. Socket A (Socket 462) AMD introdujo el Socket A, también llamado Socket 462, en junio de 2000 para soportar las versiones PGA de los procesadores Athlon y Duron. Se diseña como un reemplazo para la Ranura A usados por los procesadores Athlon originales. Porque ahora el Athlon incorpora la cache L2 en el circuito integrado, y el nuevo Duron sólo está disponible en una versión de cache asimilada al circuitto integrado, ya no había necesidad del costoso empaque de cartucho usado por los procesadores Athlon originales. El Socket A tiene 462 pines y 11 plugs con diseño SPGA (Arreglo de Malla de Pines Escalonado). El Socket A Tiene las mismas dimensiones físicas y diseño que el Socket 370; sin embargo, la ubicación de sus pines previenen la inserción de procesadores para Socket 370. El Socket A soporta 31 niveles de voltaje, de 1.100V a 1.850V en incrementos de 0.025V, a traves del control de los pines VID0-VID4 del procesador. El módulo de circuitería para regulación automatica de voltaje normalmente esta incrustado en la tarjeta madre. Hay un total de 11 agujeros cerrados, incluyendo dos de los exteriores para pines en A1 y AN1. Estos se emplean para forzar la inserción en la orientación correcta. Después de la introducción del Socket A, AMD mudo todos los procesadores Athlon (incluyendo todos los Athlon XP) a este factor de forma, descontinuando la ranura A. Ademas, durante un tiempo AMD vendió también una versión del Athlon con cache L2 reducida, llamada Duron en este factor de forma. El Athlon 64 usa un Socket de procesador diferente llamado Socket 754. Socket 603 El Socket 603 es usado con el procesador Intel Xeon en configuraciones DP (procesador dual) y MP (procesador múltiple). Éstos se usan típicamente en tarjetas madres diseñadas para el uso en servidores de archivos de red. Socket 754 El Socket 754 es usado con el nuevo procesador AMD Athlon 64 versión Socket 754, que es el primer procesador AMD de 64 bits para computadoras del escritorio. Este Socket soporta memoria de un solo canal DDR SDRAM sin bufer. Socket 939 y 940 El Socket 939 es usado con las versiones de Socket 939 del AMD Athlon 64 y 64 FX. Las tarjetas madre que usan este Socket soportan módulos de memoria convencional DDR SDRAM sin bufer en ambos modos de simple y doble canal, en lugar de los módulos registrados orientados a los servidores (más caros) requeridos por las tarjetas madres Socket 940. Los Socket 939 y 940 tienen diferentes arreglos de pines para cada uno de los procesadores y no es intercambiable. El Socket 940 es usado con la versión de Socket 940 del AMD Athlon 64 FX, así como con todos los procesadores AMD Opteron. Las tarjetas madres que usan este Socket soportan solo módulos registrados DDR SDRAM en modo de doble canal. Debido a que el arreglo de pines es diferente, los procesadores de Socket 939 no funcionan en el Socket 940, y viceversa. Socket T El Socket T (LGA775) es usado por las últimas versiones del procesador Intel Pentium 4 Prescott. La primera generacion de procesadores Prescott usaron Socket 478. El Socket T es el único que usa un tierra en la forma del arreglo de malla, de modo que los pines están en el socket, en lugar del procesador. Los primeros procesadores LGA estaban en los procesadores Pentium II y Celeron en 1997; en esos procesadores el paquete LGA se usó para el montaje del chip en el cartucho ranura-1. LGA usa rellenos de oro (llamadas tierras) en la base del substrato para reemplazar los pines usados en los paquetes PGA. En las formas de socket, esto permite mucho mayor fuerza de sujecion y por consiguiente mayor estabilidad y mejoramiento en la transferencia termal (mejor refrescamiento). En realidad LGA es sólo una versión reciclada del que previamente era llamado paquete LCC (leadless chip carrier, portador de chip sin terminales). Se usó anteriormente en el procesador 286 en 1984, que sólo tenía tierras doradas alrededor del borde (en ese entonces tenian pocos pines). De todos modos LGA es simplemente una versión modificada del arreglo de malla de bolas (BGA), con las tierras doradas reemplazando a las bolas soldadas, haciéndolo más conveniente para las aplicaciones de socket (en lugar de las soldadas). Los antiguos paquetes LCC eran cerámicos, mientras que el primer paquete LGA Pentium II eran plásticos, con el paquete soldado a el substrato del cartucho. En un nivel técnico, los chips Pentium 4 LGA combinan varias tecnologías de empaquetamiento, que han sido usados todos en el pasado, incluyendo el arreglo de malla de tierras orgánicas (organic land grid array, OLGA) del substrato y del controlador de colapsos de la conexión del Chip (C4) flip-chip de el original procesador integrado. NOMBRES CLAVE DE PROCESADORES Tabla 1.4 Nombre clave AMD Descripción K8 Athlon 64 Thunderbird Athlon (Slot A, Socket A) Mustang Athlon c/L2 extendida; cancelado Corvette Athlon Mobile anterior (ahora Palomino) Palomino Athlon XP/MP, Athlon mobile 4 (Socket A) Thoroughbred Athlon XP/MP (Socket A) Barton Athlon XP/MP c/512K de L2 (Socket A) Spitfire Duron (Socket A) Camaro Morgan anterior Morgan Duron Mobile y Duron Modelo 7 (Socket A) Appaloosa Morgan (Socket A) Clawhammer Athlon 64 (CPU 64-bit) (Socket 754) Clawhammer DP Antiguo nombre para Opteron DP (Socket 940) San Diego Athlon 64 Odessa Athlon Mobile 64 Sledgehammer Opteron c/L2 extendida (Socket 940) Tabla 1.5 Nombre clave Intel Descripción Coppermine-128 Celeron c/128K de L2 (Socket 370) Timna Celeron Mobile c/controlador DRAM; cancelado P68 Willamette Willamette Pentium 4 (Socket 423, 478) Northwood Pentium 4 (Socket 478) Prescott Pentium 4 (Socket 478 LGA-775) Banias Pentium M c/1MB de L2 Foster Xeon DP (Socket 603) Foster MP Xeon MP (Socket 603) Prestonia Xeon DP (Socket 603) Gallatin Xeon MP (Socket 603) Nocona Xeon (Socket 603) Dothan Pentium M c/2MB de L2 P7 Anterior Merced (Itanium) Merced Itanium (PAC 418) Mckinley Itanium 2 c/3MB de L3 integrada (PAC 418) Madison Itanium 2 Deerfield Madison de bajo costo Montecito Madison Shavano Futuros chips de la familia Itanium MEJORAMIENTO DEL CELERON Comparado con los Celerons basados en el núcleo del anterior Pentium III Coppermine, los Celerons basados en el Tualatin, tienen las siguientes diferencias: Memoria cache L2 extendida (256KB contra 128KB) Cache L2 mejorada diseñada para un mejor rendimiento Empaquetamiento FC-PGA2, que incluye un esparcidor de calor de metal sobre el frágil núcleo del CPU para protegerlo cuando se le sujete un disipador de calor. Sin embargo, estas mejoras tuvieron un costo en la compatibilidad. Como las versiones del Pentium III de núcleo Tualatinl, los Celerons basados en el nucleo Tualatin no trabajan en tarjetas madres diseñadas para los viejos chips Pentium III o Celeron. El Socket 370 es físicamente el mismo, pero el nucleo Tualatin redefine 10 pines en el socket, lo que requiere los cambios correspondientes en el chipset y la tarjeta madre. Así, si usted es buscando la manera de acelerar un Celeron más viejo instalando un Celeron IIIA de nucleo Tualatin, asegúrese la tarjeta madre este lista para Tualatin. También fijese que los Celerons de núcleo Tualatin usan el Empaquetamiento FC-PGA2, qué incluye un esparcidor de calor integrado en la superficie del CPU. Esto requiere un disipador de calor compatible. Debido a las variaciones del empaquetamiento, las cuales requieren diferentes soluciones de disipación de calor, normalmente recomiendo adquirir las versiones de los procesadores en caja, que incluye un disipador de calor compatible de alta calidad en la caja. Así, usted está seguro de tener el disipador de calor apropiado, los clips, el material de la interfaz termal, y otros artículos necesarios para la operación apropiada y segura del chip en su sistema. Los procesadores en caja también ofrecen una garantía directa de tres años con Intel que no está disponible con procesadores OEM o a granel. Los más recientes procesadores Celeron 4 estan diseñados para proporcionar una alternativa económica a los usuarios de tarjetas madres Socket 478 y Socket T (LGA775) (el factor de forma usado por los recientes y actuales procesadores Pentium 4). Los Celerons Socket 478 generalmenteusan el nucleo Willamette encontrado en el Pentium 4 original, pero las versiones más nuevas del Celeron 4A usan el núcleo Northwood y los modelos Celeron D usan el núcleo Prescott encontrado en la mayoria de los modelos Pentium 4. La única diferencia entre los últimos procesadores Celeron y los modelos Pentium 4 en que estan basados es que las versiones Celeron tienen menos cache L2 y corre a velocidades de bús más bajas cuando se comparan con su versión Pentium 4 correspondiente. Comparados con los anteriores Celerons basados en Pentium III, los Celerons basados en Pentium 4 tienen las siguientes mejoras: Velocidades de relog mas rapidas (hasta 3.2GHz y superiores). Bus de datos de 400MHz o 533MHz y transferencia de memoria hasta 4.266GBps (dependiendo de la memoria usada en la tarjeta madre). Soporte para instrucciones SSE2, que incluyen las instrucciones SSE encontradas en los celerons basados en pentium III, mas 144 instrucciones adicionales para graficos y procesamiento de sonido. Los modelos Celeron D soportan SSE3, que incluye 13 instrucciones adicionales sobre SSE2. Deeper de conductores internos de 20 fases o 31 fases (Celeron D). Ancho de cache L2 de 256 bits. Todas las otras características del Pentium 4. Celerons tienen menos cache que los procesadores Pentium 4 en que estan basados. Aunque los procesadores Celeron tienen menos cache, las mejoras en la arquitectura de cache, de CPU y de las velocidades de bús, les permite a los procesadores de bajo rendimiento de generaciones anteriores que puedan tener aun mas cache. Los CPU’s Celeron 4A tienen 256KB de cache L2 y funcionan aun mejor que el actual Celeron 4. Todo los nuevo chips Celeron usan el diseño de intel FC-PGA2l. Este diseño agrega un esparcidor de calor de metal a la superficie del procesador para mejorar la transferencia de calor al disipador de calor. Este disipador de calor integrado también previene daños físicos al CPU durante la instalación del procesador y del disipador de calor. Piense en esto como una tapa de metal protectora sobre el CPU. Debido a esto Intel ha presentado Celerons en muchas variaciones distintas, es fácil confundirse de cual es cual, o cual está disponible a una velocidad específica. Leyendo el número de especificación de un chip particular y buscando el número en el sitio Web de desarrolladores de Intel (developer.intel.com), puede averiguar la especificación exacta incluyendo el tipo de socket, voltaje, escalamiento, tamaño de cache y otros datos sobre el chip. PROCESADORES DURON AMD El procesador AMD Duron (originalmente nombrado en clave spitfire) se anunció en junio de 2000 y es un derivado del procesador Athlon AMD de el mismo modo como el Celeron es un derivado del Pentium II y III. Básicamente, el Duron es un Athlon con menos cache L2; todo las otras capacidades son esencialmente las mismas. Se diseño para ser una versión de bajo costo con menos cache pero sólo ligeramente menos rendimiento. Siguiendo el tema económico, el Duron contiene 64KB de cache L2 integrada y esta diseñado para Socket A, una versión del socket de el Athlon Ranura A. salvo por las marcas de Duron, el Duron es externamente casi idéntico a las versiones de socket A de el Athlon original. Esencialmente, el Duron fue diseñado para competir contra el Intel Celeron en el mercado de las PC’s de bajo costo, así como el Athlon fue diseñado para competir en el segmento superior contra el Pentium III. El Duron se ha discontinuado hace tiempo, pero la mayoría de los sistemas que usan el procesador Duron pueden usar los procesadores Athlon AMD o, en algunos casos el Athlon XP, como una actualización. Debido a que el procesador Duron se deriva del nucleo del Athlon, incluye bus frontal de sistema del Athlon a 200MHz (la interfaz al chipset) así como instrucciones Enhanced 3DNow! en el Modelo 3. Los procesadores Modelo 7 incluyen instrucciones 3DNow! Professional (qué incluyen una ejecución completa de instrucciones SSE). AMD ATHLON XP La versión más nueva del Athlon se llama Athlon XP. Este es básicamente una versión mejorada del Athlon anterior, con mejoras en el conjunto de instrucciones para que puede ejecutar las instrucciones SSE de Intel y un nuevo esquema del mercadeo que compite directamente con el Pentium 4. Los último modelos de Athlon XP también han adoptado un mayor cache integrada (512KB) a velocidad total. AMD usa el término” QuantiSpeed” (un término de mercadeo, no un término técnico) para referirse a la arquitectura del Athlon XP. Esta definición de AMD incluye lo siguiente: Una completa novena emisión superescalar de microarquitectura de procesamiento en cadena. Esto proporciona mas vias de instrucciones para enviarse a las secciones de ejecución del CPU e incluye tres unidades de ejecución de punto flotante, tres unidades de numeros enteros y tres unidades de direccionamiento de calculos. Una completa unidad superescalar de calculos de punto flotante de microarquitectura de procesamiento en cadena. Esto proporciona operaciones mas rapidas por ciclo de relog y soluciona las antiguas deficiencias de los procesadores AMD contra los de Intel. Hardware de pre-extraccion de datos. Este recoge los datos necesarios de la memoria del sistema y los pone en la cache L1 del procesador para ahorrar tiempo. Mejoramiento de traducción de bufers de examinacion marginada, (look-aside buffers, TLB’s). Eso habilita el almacenamiento de datos adonde el procesador pueda accederlos mas rapidamente sin duplicación o parándolo a falta de información fresca. Estas mejoras de diseño sacan más calculos de cada ciclo de reloj, habilitando un “lento” procesador Athlon XP para latir como un “rápido” Pentium 4 en trabajo real (y juegos). Los primeros modelos de Athlon XP usaron el núcleo Palomino, que también es compartido por el procesador (laptop) Athlon 4 mobile. Los ultimos modelos han usado el nucleo Thoroughbred, que fue revisado mas tarde para mejorar sus características termales. Los diferentes núcleos Thoroughbred son llamados algunas veces como Thoroughbred-A y Thoroughbred-B. El último de los procesadores Athlon XP conocido como Barton usa un nuevo nucleo con 512KB de cache L2 integrada a velocidad completa. Las caracteristicas adicionales incluyen: Instrucciones multimedia 3Dnow! Profesional (agrega compatibilidad con las 70 instrucciones adicionales SSE de el Pentium III pero no con las 144 instrucciones adicionales SSE2 de el Pentium 4). FSB de 266MHz 333MHz. Memoria cache integrada de 128KB nivel 1 y 256KB o 512KB nivel 2 ejecutandose a la velocidad completa del CPU. Interconexiones de cobre (en lugar de aluminio) para mas eficiencia electrica y menos calor. También nuevo en el Athlon XP es el uso de un empaquetamiento compuesto organico del chip, mas delgado y ligero, similar a el usado por los recientes procesadores Intel. Este empaquetamiento permite un diseño más eficaz de los componentes eléctricos. Las últimas versiones del Athlon XP estan hechos usando un nuevo proceso de 0.13 micras, lo que da por resultado un chip con un circuito integrado más pequeño que usa menos potencia, genera menos calor, y es más capaz de correr mas rapido en comparacion delos anterior modelos. La nueva versiones de 0.13 micras del Athlon XP corren a las velocidades reales del reloj excediendo los 2GHz. Tabla 1.6 INFORMACIÓN DE LOS PROCESADORES AMD ATHLON XP Rendimiento Nomnal Velocidad Real (MHz) Velocidad del bus (MHz) Cache L2 Voltaje Potencia máxima (W) Transistores 1500+1 1333 266 256KB 1.75V 60.0W 37.5 1600+1 1400 266 256KB 1.75V 62.8W 37.5 1700+1 1467 266 256KB 1.75V 64.0W 37.5 1800+1 1533 266 256KB 1.75V 66.0W 37.5 1900+1 1600 266 256KB 1.75V 68.0W 37.5 2000+1 1667 266 256KB 1.75V 70.0W 37.5 2100+1 1733 266 256KB 1.75V 72.0W 37.5 1700+2 1467 266 256KB 1.5V 49.4W 37.2 1700+3 1467 266 256KB 1.6V 59.8W 37.2 1800+2 1533 266 256KB 1.5V 51.0W 37.2 1800+3 1533 266 256KB 1.6V 59.8W 37.2 1900+2 1600 266 256KB 1.5V 52.5W 37.2 2000+2 1667 266 256KB 1.6V 60.3W 37.2 2000+3 1667 266 256KB 1.6V 61.3W 37.2 2100+2 1733 266 256KB 1.6V 62.1W 37.2 2100+3 1733 266 256KB 1.6V 62.1W 37.2 2200+2 1800 266 256KB 1.65V 67.9W 37.2 2200+3 1800 266 256KB 1.6V 62.8W 37.2 2400+3 2000 266 256KB 1.65V 68.3W 37.2 2500+5 1833 333 512KB 1.65V 68.3W 54.3 2600+3 2133 266 256KB 1.65V 68.3W 37.2 2600+4 2083 333 256KB 1.65V 68.3W 37.2 2700+4 2167 333 2167 1.65V 68.3W 37.2 2900+5 2083 333 2083 1.65V 68.3W 54.3 3000+5 2167 333 2167 1.65V 74.3W 54.3 3000+5 3200+5 2100 400 512KB 1.65V 68.3W 54.3 2200 400 512KB 1.65V 76.8W 54.3 1. Athlon XP Modelo 6 (palomino) 2. Athlon XP Modelo 8 CPUID 680 (Thoroughbred) 3. Athlon XP Modelo 8 CPUID 681 (Thoroughbred) 4. Athlon XP Modelo 8 con FSB de 333MHz (Thoroughbred) 5. Athlon XP Modelo 10 (Barton) Athlon MP El Athlon MP es el primer procesador AMD diseñado para soporte multiprocesador. Así, puede usarse en servidores y estaciones de trabajo que exigen soporte multiprocesador. El Athlon MP viene en las tres siguientes versiones que son similar a los diversos modelos Athlon y Athlon XP: Modelo 6 (1GHz, 1.2GHz). Este modelo es similar al Athlon Modelo 4. Modelo 6 OPGA (1500+ al 2100+). Este modelo es similar al Athlon XP Modelo 6. Modelo 8 (2000+, 2200+, 2400+, 2600+). Este modelo es silmilar al Athlon XP Modelo 8. Modelo 10 (2500+, 2800+, 3000+). Este modelo es silmilar al Athlon XP Modelo 8, pero con 512KB de cache L2. Todo los procesadores Athlon MP usan el mismo conector Socket A usado por los ultimos modelos Athlon y todos los procesadores Duron y Athlon XP. Procesadores Intel Pentium 4 (Séptima Generación) El Pentium 4 se introdujo en noviembre de 2000 y representó una nueva generación en procesadores. Si este tuviera un número en lugar de un nombre, podría haberse llamado el 786 porque representa una generación más allá de los anteriores procesadores clase 686. Tres variaciones principales del Pentium 4 ha sido liberadas, basadas en el procesador integrado y la arquitectura. Son llamados Willamette, Northwood, y Prescott. Los principales detalles técnicos del Pentium 4 comprenden: Rango de velocidades de 1.3GHz a 4GHz y superiores. 42 millones de transistores, proceso de 0.18 micras, integrado en 217 mm² (Willamette). 55 millones de transistores, proceso de 0.13 micras, integrado en 131 mm² (Northwood). 125 millones de transistores, proceso de 0.09 micras, integrado en 112 mm² (Prescott). Software compatible con anteriores procesadores Intel de 32 bits. Bus (frontal) de procesador ejecutándose a 400MHz, 533MHz u 800MHz. Unidades logicas aritméticas (ALUs) ejecutándose al doble de la frecuencia del núcleo del procesador. Tecnología Hyper-pipelined (20 fases o 31 fases). Soporte de tecnología Hyper-threading en todos los procesadores a 2.4GHz o mas rapidos con FSB de 800MHz y en todos los procesadores a 3.6GHz y mas rapidos con FSB de 533MHz. Instrucciones de ejecución profundamente muy desordenadas. Prediccion de bifurcación mejorada. Ejecución de localización de cache de 8KB o 16KB en cache L1 mas 12Kb de microoperación. 256KB, 512KB o 1MB de circuito integrado, cache L2 a la velocidad total del núcleo de 256 bit de ancho con asociatividad de 8 vias. La cache L2 puede manejar hasta 4GB RAM y soportar ECC (codigo de coreccion de errores). 2MB de circuito integrado, cache L3 a velocidad total. SSE―SSE2 mas 144 nuevas instrucciones para procesamiento de graficos y sonido (Willamette y Northwood). SSE2―SSE3 mas 13 nuevas instrucciones para procesamiento de graficos y sonido (Prescott). Unidad de Punto Flotante mejorada. Estados multiples de baja potencia. Intel abandonó los números romanos para una denominación estandar árabe númerica 4. Internamente, el Intel Pentium 4 introduce una nueva arquitectura que llama microarquitectura NetBurs, que es un término de mercadeo y no un término técnico. Intel usa NetBurst para describir la tecnología hyper-pipelined, un procesador de ejecución rápida, un bus de sistema de gran velocidad (400MHz, 533MHz, u 800MHz), y una ejecución de localización de cache. La tecnología Hyper-pipelined dobla o triplica la profundidad de instrucción pipeline en comparacion al Pentium III (o al Athlon y Athlon 64), lo que significa que requiere más y mas pequeños pasos para ejecutar las instrucciones. Aunque esto podría parecer menos eficaz, permite lograr velocidades de reloj mucho más altas y más fácilmente. Los procesadores de rápida ejecución permiten a las dos unidades lógicas aritméticas de enteros (ALUs), correr a dos veces la frecuencia del nucleo del procesador, lo que significa que las instrucciones puede ejecutarse la mitad de un ciclo de reloj. El bus de sistema a 400MHz/533MHz/800MHz es un bús cuadriplicado que ejecuta un reloj del sistema a 100MHz/133MHz/200MHz, transfiriendo datos cuatro veces por cada ciclo de reloj. La ejecución de localización de cache es una cache Nivel 1 de alto rendimiento que almacena aproximadamente 12kb de microoperaciones decodificadas. Esto traslada el decodificador de instrucción de la ejecución-pipeline principal, incrementando el rendimiento.