Ley de Moore Gordon Moore, Intel, 1965, Electronics Magazine z Familia de Procesadores Intel x86 Sistemas Computacionales Mario Medina C. [email protected] “El número de transistores en un chip se duplica cada 24 meses y esto no cambiará en los próximos 10 años” Tenía razón z Las razones son: Tamaño del chip Dimensión de los transistores Ingenio de los diseñadores Ley de Moore (número de transistores) Ley de Moore (tamaño de transistores) Tamaño del transistor Velocidad de reloj de CPU Dennard Scaling z z Consumo de potencia de un transistor MOSFET es proporcional al área del transistor International Technology Roadmap for Semiconductors ©2013 Mario Medina C. 1 Tendencias en CPUs Intel Intel 8086/8088 8086: 1978, 29K transistores z 8 Registros de 16 bits Bus de datos de 16 bits Bus de dirección de 20 bits z Aprox. 2.5 MIPS z z Multiplexado con bus de datos 8088: CPU de IBM-PC z z z Bus de datos de 8 bits para reducir costos Clock de 4.77 MHz (IBM-PC) Fabricantes: Intel y AMD Intel 80286 80286: 1982, 134K transistores z z z 80386: 1985, 275K transistores Clock de 6 a 12.5 MHz Procesador del IBM PC-AT Bus de direcciones de 24 bits z z z Direcciona 16 MiB z z Intel 80386 z Tiene modos real y protegido Mejoras en microarquitectura lo hacían 2 veces más rápido que 8086 de misma velocidad z z z Arquitectura de 32 bits Registros extendidos de 32 bits Modos real, protegido y virtual 16 y 20 MHz 386SX: versión barata con bus de datos de 16 bits 386SLC es 386SX con cache interna de 8 KiB Intel niega la licencia del 80386 a AMD Clonado por Cyrix, AMD y otros Intel 80486 i486: 1989, 1.2M transistores z z z z z z Intel Pentium Pentium: 1993, 3.1 M transistores Integra FPU 387 al chip Agrega instrucciones atómicas fetch-and-add Agrega cache L1 interna D+I de 8 KiB i486SX: 486 sin unidad de punto flotante Desempeño es 50% mejor que i386 de la misma velocidad Pipeline de 5 etapas z z z z z Microarquitectura P5 60 y 66 MHz Bus de datos de 64 bits Desempeño es el doble que i486 Procesador superescalar Ejecuta 2 ops. aritméticas por ciclo z z Cache interna de datos 8 KiB e instr. 8 KiB Predicción de saltos i486 ©2013 Mario Medina C. 2 Intel Pentium MMX Pentium MMX: 1997, 4.5 M transistores z Intel Pentium Pro Pentium Pro: 1995, 5.5 M transistores Instrucciones MMX z Vectores enteros de 64 bits datos de 1, 2 o 4 bytes z 8 registros de punto flotante z Cache interna de 32 KiB z Microarquitectura P6 Bus de direcciones de 36 bits Direcciona 64 GiB z 64 bits cada uno z z z Clock de 150 y 166 MHz Instr. move condicional Superescalar de 3 vías Memoria cache L2 de 256 KiB a 1 MiB Conectada via backside bus Opera en paralelo a RAM Intel Pentium II Pentium II: 1997, 7M transistores z Memoria cache L2 de 256 ó 512 KiB conectada via backside bus Intel Pentium III Pentium III: 1999, 8.2 M transistores z Instr. vectoriales de 128 bits (SSE) Versión Xeon tiene caches 512 KiB a 2 MiB z z z z Front-side bus de 100 MHz Agrega instrucciones MMX a Pentium Pro Cache L1 de 32 KiB Clock de 266 MHz Aceleran cálculos de punto flotante z Versión Coppermine agrega cache L2 de 256KB en el chip 28 M transistores z Versión Tualatin aumenta cache L2 a 512 KiB Intel Pentium M Intel Pentium 4 Pentium 4: 2001, 42 M transistores z z z z z Microarquitectura NetBurst, 1.5 GHz Incorpora tecnología HyperThreading (3.4 GHz) Agrega instr. vectoriales de 8 bytes (SSE2) Luego agrega nuevas instrucciones x86-64 Limitado por alta disipación a altas velocidades 180 ns a 65 ns Clock hasta 3.8 GHz z Pentium 4 Extreme Edition Pentium III Pentium M 775: 2003, 140M transistores z Pentium III muy modificado Basado en microarquitectura P6 Bus del Pentium 4, SSE2, MMX No hyperthreading, no SSE3 z Optimizado para bajo consumo Desempeño Pentium M 1.6 GHz ~ P4 2.4 GHz z z Cache L1 Datos 32 KiB + Instr. 32 KiB Cache interna L2 de hasta 2 MiB Arquitectura Intel 64 bits ©2013 Mario Medina C. 3 Intel Pentium EE Pentium Extreme Edition (2005), 164M transistores z z z z z Pentium 4 dual-core Microarquitectura NetBurst MMX, SSE, SSE2, SSE3 Hyperthreading Arquitectura Intel de 64 bits Intel Core Intel Core: 2006, 150M transistores z z z z z z Microarquitectura Core derivada del P6 1 ó 2 Cores de 32 bits en el chip Cache L1 de 64 KiB Cache L2 compartida de 2 MiB No Hyperthreading Instrucciones SSSE3 Intel Core 2 Intel Core 2: 2006, 291M transistores z z z z z z Microarquitectura Core de 64 bits Solo, Duo o Quad Core Tecnología de 65nm y 45nm Cache L2 compartida de 4MB ó 6 MB Instrucciones SSE3 y SSSE3 Modo SpeedStep (Reloj variable) Intel Atom Intel Atom: 2008, 47M transistores z Muy popular en netbooks z z z z z z Intel i7 (Nehalem) Intel i7: 2008, 770M transistores z z Microarquitectura Nehalem de 64 bits Buses Quick Path Interconnect (QPI) Elimina Front-Side Bus z z z z z z Cache L2 de 4 a 12 MiB Hyperthreading Dynamic overclocking (Turbo Boost) Dual-core, Quad-core ó Six-core MMX, SSE, SSE2, SSE3, SSSE3 3 canales de memoria DDR3 ©2013 Mario Medina C. Microarquitectura Atom de 64 bits Optimizada para bajo consumo de potencia 2 pipelines de 16 etapas Hyperthreading MMX, SSE, SSE2, SSE3, SSSE3 Cache L1 Datos 24 KiB + Instr. 32 KiB Cache L2 de 512 KiB Intel i7 (Sandy Bridge) Intel i7: 2008, 995M transistores z z z z z z z z Microarquitectura Sandy Bridge de 64 bits Tecnología de 32 nm Quad-core Cache L1 de 32 + 32 KiB por core Cache L2 de 256 KiB por core Cache L3 compartida de 4 a 8 MiB Procesador gráfico incorporado en el chip Advanced Vector Extensions (AVX) 4 Intel i7 (Ivy Bridge) Intel Xeon E5 (Sandy Bridge) Intel Xeon E5: 2012, 2260M transistores z z z z z z z z Microarquitectura Sandy Bridge-E de 64 bits Fecha de aparición: marzo 2012 Tecnología de 32 nm De 2 a 8 cores Cache L2 por core de 256 KiB Cache L3 compartida de 2 a 20 MiB Advanced Vector Extensions (AVX) Línea Xeon dirigida a servidores y estaciones de trabajo ©2013 Mario Medina C. 4 Cores 6 Unidades GPU Microarquitectura Ivy Bridge Sobre 1400M transistores Velocidad: 3.5/3.9 GHz Cache L1: 64 KB/core Cache L2: 256 KB/core Cache L3: 8 MB Consumo: 77W Tamaño: 133 mm2 Precio inferior a US$300 5