www.monografias.com Procesadores multi-núcleo Edgar Miraya Anamaría (edmiraya@yahoo.com) 1. 2. 3. 4. 5. 6. 7. 8. Introducción Panorama Actual Descripción inicial Antecedentes de los procesadores multinúcleo Ejemplos de procesadores multinúcleo Futuro de los procesadores multinúcleo Conclusiones Glosario 1. Introducción La presente monografía trata el tema de los procesadores multinúcleo, dando un panorama de porque se decidió fabricarlos, sus antecedentes, como trabajan. Además se muestra algunos procesadores multi-núcleos actuales, de Intel, de AMD. Se ha puesto énfasis en el procesador Cell, por su potencial y su capacidad. Este trabajo pretende dar una vista amplia de los procesadores multinúcleo. Para mayores detalles se puede consultar la bibliografía. 2. Panorama Actual La fuerte competencia en el mundo de los procesadores, especialmente entre Intel y AMD, ha producido que la tecnología actual de fabricación de procesadores esta llegando a sus límites. Cada vez la miniaturización de los componentes del procesador es más difícil (el límite de construcción del silicio ronda los 15-20nm, donde el silicio empieza a ceder por falta de consistencia, ya se ha llegado a los 65nm), el problema de la generación de calor a aumentado, produciendo que sea más difícil aumentar la frecuencia principal del procesador. Todos estos problemas dificultan el aumento de rendimiento de los procesadores. Los procesadores actuales no sobrepasan los 3.8 GHz (obtenido por el Pentium 4 Prescott), necesitan grandes disipadores y ventiladores porque generan mucho calor. No se podía continuar fabricando procesadores de la misma manera, se estaba llegando a un “estancamiento”; era necesario tomar otro camino, utilizar otra variable que hiciera que el rendimiento del procesador aumentará. Entonces, basándose en el procesamiento en paralelo, se empezaron a construir los procesadores multi-núcleo. 3. Descripción inicial Los procesadores multi-núcleo son un procesador que contiene dentro de su empaque a varios núcleos o “cerebros”. La mayoría de los procesadores son mono-núcleo, o sea tienen un solo cerebro. Mientras un procesador mono-núcleo tiene un solo cerebro para ejecutar procesos, un procesador multi-núcleo puede repartir los procesos entre sus varios cerebros para su posterior ejecución. Es como cuando a una persona le dan muchos trabajos por hacer, si otro lo ayuda entre los dos pueden dividirse el trabajo y terminar más rápido. Si los dos les toca hacer un solo trabajo, si este es divisible, entonces los dos lo también lo harán mas rápido. Pero si el trabajo no es divisible, entonces en ese caso uno solo lo haría. Por eso las aplicaciones que sacan más provecho de estos procesadores multinúcleo son aquellas que pueden generar muchos hilos de ejecución (thread) como las aplicaciones de audio/video, cálculo científico, juegos, tratamiento de gráficos en 3D, etc. Pero de todas maneras siempre hay aplicaciones que no se dividen en hilos de ejecución, que no aprovechan por completo estos procesadores. Pero estos procesadores pueden ejecutar varias de estas aplicaciones al mismo tiempo. Solo cuando uno ejecute una sola aplicación que no sea paralelizable (no se pueda descomponer en hilos) es cuando no se aprovecha el potencial de procesamiento que tienen estos procesadores. Actualmente muchos programas son poco paralelizables (excepto en los sectores donde se usan supercomputadoras, sistemas distribuidos y paralelos, etc.), pero se pueden ejecutar muchos de ellos a la vez. Con el auge de estos procesadores, saldrán aplicaciones más paralelizables. Como historia se puede decir que el primer procesador multinúcleo en el mercado fue el IBM Power 4 en el año 2000. Una alternativa a los procesadores multinúcleo son los sistemas multiprocesadores, que consisten en una placa madre que podía soportar desde 2 a más procesadores. El rendimiento es bastante bueno, pero también es bastante caro. 4. Antecedentes de los procesadores multinúcleo Los procesadores multinúcleo se basaron en los sistemas distribuidos, la computación paralela, y las tecnologías como el Hyperthreading; que mostraban como dividir el trabajo entre varias unidades de ejecución. Procesamiento en Paralelo El procesamiento en paralelo es la división de una aplicación en varias partes para que sean ejecutadas a la vez por diferentes unidades de ejecución. El procesamiento en paralelo se utiliza en Computación Paralela y la Computación Distribuida. HyperThreading Esta tecnología fue creada por Intel, para los procesadores Pentium 4 más avanzados. El Hyperthreading hace que el procesador funcione como si fuera dos procesadores. Esto fue hecho para que tenga la posibilidad de trabajar de forma multihilo (multithread) real, es decir pueda ejecutar muchos hilos simultáneamente. Un procesador con la tecnología Hyperthreading tiene un 5% más de transistores que el mismo procesador sin esa tecnología. Los dos procesadores lógicos, que posee el procesador hyperthreading, tienen su propio estado de la arquitectura: registros de control, registros de datos, registros de depuración, etc. y el APIC (controlador avanzado de interrupción programable). Los dos procesadores lógicos comparten la memoria caché, la interfaz del bus del sistema, etc. 5. Ejemplos de procesadores multinúcleo Se verá un resumen de los principales procesadores multinúcleo de la actualidad. Se comienza por Intel, mostrando los procesadores multinúcleo que ha sacado al mercado, luego viene AMD, y por último se muestra al nuevo procesador Cell, que próximamente va a salir en la PlayStation 3. Procesadores Multinúcleo de Intel Actualmente Intel esta fabricando procesadores de doble núcleo. Comenzó fabricando los Pentium D en el 2005, luego en el 2006 lanzó los Core Duo y el Core 2 Duo. Pentium D Los Pentium D están conformados por dos procesadores Pentium 4 Prescott sin Hyperthreading. Luego Intel sacó el Pentium Extreme Edition (No confundir con el Pentium 4 Extreme Edition) que era un procesador que tenía los procesadores P4 Prescott, con la tecnología Hyperthreading, lo que hacia que el software viera cuatro procesadores. Las características de los Pentium D son: - Proceso de fabricación de 90nm - Tienen la tecnología EM64T, que permite trabajar con 64 bits de forma nativa - Utilizan núcleos SmithField (basados en los Prescott), cada uno de ellos tiene una memoria caché L2 de 1MB - Van desde 2.80GHz, del modelo menos potente, hasta 3.20GHz para el modelo más potente. El procesador que contiene dos núcleos Prescott se llama Smithfield. Los nuevos procesadores de doble núcleo Pentium D se llaman Presler, están construidos con tecnología de fabricación de 65nm y van desde 2.8 hasta 3.73Ghz. Tienen una caché L2 por cada núcleo de 2MB (4MB en total). Core Duo Los procesadores Core Duo es una versión para los portátiles, implementa 2MB de caché de memoria compartida para ambos núcleos. Están hechos con la tecnología de 65nm. Su velocidad va desde 1.20 hasta 2.33Ghz. El FSB (bus del sistema) va desde 533Mhz del modelo menos potente hasta 667Mhz para los demás. El gasto de energía va desde 9.0w hasta 31w. Por los datos se ve que tienen una gran relación rendimiento/energía. Core 2 Duo Esta nueva familia de procesadores de Intel esta basado en la microarquitectura Core, que reemplaza a la antigua microarquitectura Netburst que fue aplicada en los demás procesadores y que ya estaba llegando a sus límites. La arquitectura Core proviene de la arquitectura que produjo al Pentium M (utilizado por los Intel Centrino), que destaca por el gran rendimiento que obtiene de la poca energía que gasta. El Pentium M además proviene del Pentium III, y este del Pentium Pro (Los Pentium 4 son una rama genealógica aparte). Las subfamilias del Core 2 Duo son: Merom, para portátiles. Conroe, para equipos de sobremesa. WoodCrest, para servidores. Los Core 2 Duo, recién han salido en julio del 2006. Además de la versión normal, hay una versión extrema. No se tienen todos los datos disponibles, pero ya se han probado algunos de ellos. Los Core 2 Duo que han sido probados, por la mayoría de testeadores, son el Core 2 Extreme X6800, el Core 2 Duo E6700 y el E6600. En las pruebas estos procesadores demuestran tener más rendimiento que el más poderoso procesador del AMD, el AMD FX-62. Los mas fuertes (X6800 y E6700) vencen en casi todo al FX-62, en algunas pruebas por un margen considerable y el tercero (E6600) esta muy cerca. Procesadores Multinúcleo de AMD Antes de sacar sus procesadores multinúcleo al mercado, AMD ya había conseguido un gran éxito con su procesador Athlon 64, que incorporaba la capacidad de direccional 64 bits de memoria, la tecnología HyperTransport que era un nuevo bus bastante rápido que eliminaba cuellos de botella anteriores, y otras tecnologías; este procesador fue tomado como base para la construcción de su procesador de doble núcleo Athlon 64 X2, que salió al mercado a partir del 2005. Para Servidores, AMD sacó el procesador Opteron X2, que se basaba también en el Opteron de un solo núcleo, el hermano mayor de los Athlon 64. Para Portátiles AMD ha sacado el Turion X2, que lleva el poder de los procesadores de doble núcleo al campo de los móviles. AMD fue el primero en sacar la tecnología de 64 bits, y también fue la primera en sacar los procesadores de doble núcleo para servidores, portátiles y computadoras de escritorio. Han tenido un gran éxito, pero con la aparición de los Core 2 Duo de Intel, basados en su exitoso Pentium M Centrino, la iniciativa vuelve a las manos de Intel en todos los frentes. Hay que esperar a que AMD saque sus nuevos procesadores K8L, de 4 núcleos y con tecnologías mejoradas, como el HyperTransport 3 y una caché L3. Procesador CELL El procesador Cell, es un procesador multi-núcleo diseñado por las empresas IBM, Sony y Toshiba desde el marzo del 2001. Este procesador va a ser usado inicialmente por la PlayStation 3, pero se tiene previsto usarlo también en los productos electrónicos que fabrican estas empresas, que van desde televisores de alta definición hasta ordenadores. Los componentes del procesador son: 1 Power Processor Element (PPE). 8 Synergistic Processor Elements (SPEs). Bus de Interconexión de los Elementos (EIB). Controlador de Acceso Directo a Memoria (DMAC). 2 Controladores de Memoria Rambus XDR. Una interfaz Rambus FlexIO (Input / Output). El PPE es el núcleo principal, este se encarga de coordinar el trabajo de todos los demás núcleos (SPEs), mediante la tecnología SMT (Simoultaneous Multi-Threading). El PPC toma el control del sistema operativo y deja a los SPEs el trabajo de los demás procesos. EL PPE esta basado en la arquitectura PowerPC de 64 bits, tiene 32 KB de caché L1 y 512 KB de caché L2, tiene también tecnología de doble hilo y puede ejecutar dos instrucciones por hilo. Este procesador esta hecho como los RISC clásicos, o sea no es como los PowerPC tradicionales, por eso no tiene implementado la predicción de saltos, y la ejecución de instrucciones es en orden; lo que ahorra una cantidad considerable de transistores, pasando todo ese trabajo al compilador. Los SPE son los procesadores auxiliares, son unidades de cálculo vectorial. Pueden ejecutar hasta dos instrucciones por ciclo. Cada SPE tiene 128 registros de 128 bits cada uno, 4 unidades de coma flotante, 4 unidades aritméticas enteras y una memoria local de 256 KB (esta memoria es SRAM como las memorias caché, pero no es una de ellas). Al no utilizar memoria caché, se simplifica el diseño del SPE. Los SPEs tienen memoria local para tomar los datos que requieren más rápidamente. El bus de interconexión de elementos, EIB, esta compuesto por 4 canales de datos de 128 bits, permite la comunicación entre todos los elementos del procesador, permite también cargar y mover 16GB de datos por segundo hacia y fuera del Cell respectivamente. Para mantener lleno este ancho de banda, el procesador Cell utiliza en sus controladores de I/O y la memoria las tecnologías diseñadas por la empresa Rambus (conocida por haber fabricado las veloces memorias RAM para Pentium 4, las RIMM, que no tuvieron aceptación en el mercado). La memoria XDR de Rambus es bastante rápida, llegando a velocidades 12 veces superiores a las memorias convencionales de 533Mhz actuales. La velocidad a la que llega es de 4.8Ghz. La tecnología FlexIO, también de Rambus, es una interface de entrada y salida bastante rápida. Esta constituido por 12 conexiones punto a punto unidireccionales de 1byte, 7 de estas conexiones son de salida y 5 son de entrada. El FlexIO puede tener una velocidad desde 400Mhz hasta 8GHz. El chip Cell ha ahorrado muchos transistores al no implementar caché para los SPEs, ejecución fuera de orden, predicción de saltos, etc., dejando todo ese trabajo al compilador; con el fin de poner mas procesadores (SPEs) lo que aumenta el poder de procesamiento, y además para que el chip sea más sencillo y gaste menos energía. Este chip es un monstruo con sus 234 millones de transistores, la mayoría dedicados al poder de procesamiento por lo anteriormente expuesto, y como utiliza muchos “cerebros”, la generación de calor se disemina por todo el procesador. Otras características de este procesador son: Fabricación en 90nm (nanómetros). Frecuencia de trabajo desde 3.2 GHz. 1,3 Voltios. Operación a 85ºC con un disipador. El prototipo tiene 221mm 2. Utiliza la tecnología SOI (Silicio sobre aislante) Otras características que tiene el Cell es que es escalable, fue diseñado para poder trabajar con otros Cell. Un PPC de un Cell tiene el potencial de comunicarse con un PPC o un SPE de otro Cell que se encuentre en la misma placa madre, en la misma red o en cualquier parte del mundo si ambos estos conectados a Internet. Otros Procesadores Otros procesadores multinúcleo importantes que han salido son: - el PowerPC G5 para las Apple. - El UltraSparc T1 Niagara, poderoso procesador para servidores, que genera un gran ahorro de energía por su relación rendimiento/energía. Su fabricante Sun Microsystems antes también ha sacado buenos procesadores multinúcleo para sus servidores. 6. Futuro de los procesadores multinúcleo Actualmente Intel y AMD están ofreciendo sus procesadores de doble núcleo. En los siguiente años saldrán sus procesadores de 4 núcleos, 8, etc. Intel prevé llegar a construir un procesador de 32 núcleos para el 2010. El procesador Cell ha comenzado a ser construido con la tecnología de fabricación de 65nm. IBM esta desarrollando el procesador Kilocore, un procesador que tiene un núcleo principal PowerPC que maneja a 1024 núcleos auxiliares pequeños de 8 bits. En cuanto a tecnologías, IBM ha fabricado, en experimentos, chips con la tecnología SiGe (tecnología que añade al silicio, mediante procesos nanotecnológicos, capas de germanio, para mejorar sus propiedades electrónicas) que pueden alcanzar 500GHz con el cero absoluto, previendo que pueden llegar a 350 Ghz a temperatura ambiente. Esta tecnología no es tan costosa, pudiéndose implementar en las fabricas de chips a muy bajo precio. Esto puede ser el comienzo de una nueva generación de procesadores ultrarápidos, comparados con los actuales. 7. Conclusiones - Los procesadores AMD e Intel multinúcleo seguirán mejorando, pues llevan compatibilidad con las instrucciones x86. Las empresas de desarrollo de software se verán obligadas, por motivos competitivos, a desarrollar software que aproveche el procesamiento paralelo que tienen estos procesadores. Estos les generará gastos de desarrollo mayores de los normales. - En cambio el procesador Cell tiene más problemas, porque no es compatible con el software existente. Es difícil que las empresas de software hagan programas para el Cell, por el enorme costo de desarrollo que implica. Pero fue una buena idea ponerlo en la consola PlayStation 3, porque ello generará una enorme cantidad de programadores, provenientes de las industrias de juegos, que quieran aprovechar todo el potencial que tiene. - El rendimiento de los procesadores ha tomado nuevo aliento, después de dejar de avanzar en MHz. Con esta tecnología se puede seguir mejorando el rendimiento durante un buen tiempo. - Dentro de poco, las personas normales tendremos el poder de cómputo que tenían los supercomputadores hace algunos años. (Se dice que 4 procesadores Cell tienen el poder equivalente a la supercomputadora más poderosa de EEUU de hace solo 10 años). 8. Glosario Procesador CELL http://www.idg.es/pcworld/conocimiento/pdfs/PCWORLD_NT219.pdf http://www.faq-mac.com/mt/archives/011150.php http://www.faq-mac.com/mt/archives/011228.php http://barrapunto.com/journal.pl?op=display&uid=19560&id=15379 http://www.blachford.info/computer/Cell/Cell1_v2.html http://www.pcwla.com/pcwla2.nsf/articulos/0AB6B09F7369E0A500257060004D9E08 http://www.help400.es/asp/scripts/nwart.asp?Num=159&Pag=24&Tip=M http://www.computeridea.net/Actualidad/An%C3%A1lisis/Inform%C3%A1tica_personal/Hardware/ 20050413015/1 http://sanatox.f2o.org/?cat=9 http://www.rambus.com Procesadores y Tecnología INTEL http://www.intel.com http://www.intel.com/support/sp/processors/pentium4/pentium4_ht.htm http://www.active-hardware.com/spanish/reviews/processor/3Ghz.htm http://www.canal-ar.com.ar/Noticias/NoticiaMuestra.asp?Id=3396 http://www.fayerwayer.com/archivo/2006/07/que_tal_es_el_intel_core_duo_2.php http://es.wikipedia.org/wiki/Intel_Pentium_M Procesadores AMD http://www.amd.com/ es.wikipedia.org/wiki/AMD64 http://www.meristation.com/v3/des_noticia.php?pic=HRD&id=cw4471c55c7e8db Información General http://www.atc.uniovi.es/inf_med_oviedo/3iccrp/Transparencias/1-Hardware%20del%20PC.pdf http://www.lcc.uma.es/~pedre/Trabajos_MP/29_Nuevos_Microprocesadores.pdf http://www.fdi.ucm.es/profesor/sdelpino/ETC/historia.pdf http://www.jeuazarru.com/docs/procesadores_dual_core.pdf http://arstechnica.com/news.ars/post/20060407-6556.html http://www.macuarium.com/foro/lofiversion/index.php/t108847-0.html http://cum.unex.es/Profes/profes/jlguisado/materiales_ec_teoria/Trabajos%20monograficos%2020 05-2006/Paralelismo%20a%20nivel%20de%20thread%20-%20grupo%202.ppt http://www.arcos.inf.uc3m.es/~jdaniel/seminarios/ssooa06/tendencias-proc.ppt Edgar Miraya Anamaría edmiraya@yahoo.com Estudiante de la Facultad de Ingeniería de Sistemas e Informática de la Universidad Nacional Mayor de San Marcos. Lima, Perú. Trabajo para el curso de Arquitectura de Computadoras. Intel Core i7: Descripción y características del nuevo procesador de Intel. Con el nombre en clave de Nehalem conocido hasta ahora desde hace varios años que se lleva desarrollando, por fin llega al mercado rebautizado con el nombre comercial Intel Core i7 en sus versiones de dos, cuatro y ocho núcleos. Construído a 45 nm., es el primer procesador del Intel en conseguir poner cuatro y ocho procesadores integrados de forma nativa compartiendo una misma memoria caché y procesador de instrucciones. Asímismo vuelve la tecnología hyperthreading ya utlizada en el Pentium 4, por lo el sistema operativo nos reportaría 16 procesadores si tuvierámos instalado el Intel Core i7 Octo. Además el controlador de memoria va integrado dentro del propio procesador con la nueva tecnología QuickPath, algo a lo que AMD ya nos tiene acostumbrados desde hace bastante tiempo con su tecnología HyperTransport. Tenemos cambio de socket y de chipsets, es decir, este procesador no será compatible con ninguna de las placas madres desarrolladas para Intel Core 2 y procesadores anteriores. Intel Core i7 necesita placas madre nuevas y chipsets nuevo. El zócalo para el procesador ha crecido considerablemente de tamaño pasando a ser LGA1366 en comparación con el anterior LGA775. El Nombre “Intel Core i7″ Aunque Intel aún no se han pronunciado acerca de la procedencia del nombre “i7″, se ha especulado mucho sobre este nombre en la web. No coincido con ninguna de estas especulaciones, por lo que publico aquí la mía. La letra “i” vendría de Intel, y el número haría referencia a la generación del procesador según la siguiente tabla. Generación 1: Abarcaría todos los procesadores de Intel hasta el 80188. Generación 2: El procesador Intel 286 y todas sus variantes. Generación 3: El procesador Intel 386 y todas sus variantes. Generación 4: El procesador Intel 486 y todas su variantes. Generación 5: El procesador Intel Pentium y todas sus variantes. Generación 6: El procesador Intel Core, Intel Core 2 y todas sus variantes. Generación 7: El procesador Intel Core i7. Múltiples Núcleos con HyperThreading (HT) Multi-Threading (SMT). Una de las principales características de este procesador es el integrar múltiples núcleos de forma nativa (single die). Es decir, núcleos que comparten la memoria caché y el juego de instrucciones. Disponible en versiones de dos, cuatro y ocho núcleos a velocidades que van inicialmente desde los 2.66 Ghz. hasta por encima de los 4 Ghz. Con Hyperthreading Multi-Threading, tecnología ya utilizada con Pentium 4, cada procesador será capaz de ejecutar dos instrucciones por cada ciclo de reloj, por lo que en un sistema que tenga instalado el Intel Core i7 Octo, el sistema operativo le reportará que tiene instalado 16 núcleos. El viejo HyperThreading (HT), cambia de nombre con Intel Core i7, para llamarse Simultaneous Multi-Threading (SMT) contará con 2 vías (2-way) que permitirá administrar hasta 16 hilos (threads) de ejecución en un procesador de ocho cores, que es lo que permite Intel Core i7 o en su defecto 8 hilos de ejecución en un procesador Quad core. Resulta algo contradictorio pues los procesadores multi-núcleos deberían suplir lo que se intentaba hacer con el HyperThreading en procesadores de un solo núcloe de la compañía años atrás, pero la idea de tener mas hilos de ejecución es algo que para futuros sistemas de computo seduce bastante y si se pueden entre comillas tener mas hilos, habrá que ver como los sistemas y aplicaciones aprovechan estos canales adicionales para optimizar la performance, pues es sabido que cuando Intel incorporo el HT en sus P4, no todas las aplicaciones hacían uso o sabían aprovecharlo, pues todo o casi todo se programaba para un solo hilo de ejecución. Actualmente la tendencia es aprovechar los procesadores dual o quad core para optimizar el rendimiento, veremos si este remozado HT logra hacer diferencia. Memoria Caché Compartida de Alto-Nivel. Mejoras en la memoria caché con una nueva arqitectura de tres niveles: la caché L1 con 32 Kb. de caché para intrucciones y otros 32 Kb para caché de datos; nueva caché L2 por núcleo de latencia muy baja con 256 Kb por núcleo para datos e instrucciones; y una nueva caché L3 compartida por todos los núcleos y con diferentes configuraciones en Mb. según el tipo de procesador, 8 Mb en el caso de un Core i7 Quad con cuatro núcelos, aunque con el tiempo se irá ampliando esta memoria caché compartida. Intel tendrá en sus procesadores lo que ha denominado Multi-level shared cache, esto quiere decir que seguramente tanto la memoria cache de nivel 2 (L2) como la memoria Cache de nivel 3 (L3) serán memorias compartidas por cada uno de los núcleos del procesador, esto trae la ventaja de que se simplifica el diseño de la arquitectura interna del procesador, pero hay que ser cuidadosos en la forma en al que cada uno de los cores intenta acceder a la memoria para que no se produzcan conflictos en los accesos, quizás con un switch interno que administre las peticiones. Esto por que siempre será mas optimo que cada core tenga su propio cache y que acceda a el exclusivamente a que tener un solo Gran cache en que dos, cuatro o mas núcleos intenten acceder a el provocando, colas o latencias demasiado altas en los accesos, lo que provoca un contrasentido en la razón de ser del la memoria Cache de un procesador, la cual es ahorrarse tiempos al tener un cache externo o tratar de acceder a la memoria principal en tareas críticas. Intel QuickPath El procesador Intel Core i7 lleva integrado el controlador de memoria dentro del propio procesador. La tecnología Intel QuickPath Interconnect, es una tecnología de interconexión con el procesador punto a punto desarrollada por Intel en competencia con la tecnología HyperTransport de AMD. Esta tecnología incluye un controlador de memoria dentro del propio procesador. Reemplaza al Front Side Bus (FSB) de los procesador Xeon e Itanium. El rendimiento de esta tecnología está reportado para ser de 4,8 a 6,4 Gigatransferencias por segundo (GT/s) por dirección, y un enlace puede ser 5, 10 o 20 bits de largo en cada dirección. Además el ancho de banda provisto por un enlace largo completo asciende de 12,0 a 16,0 GB/s por dirección, o de 24,0 a 32,0 GB/s por enlace. Admite hasta tres canales de memoria DDR3 a 1600 Mhz. Integrated Graphics Processor Tambien incluirá un procesador gráfico integrado dentro del propio procesador también en respuesta al anuncio de AMD con su tecnología Fusion que consiste en integrar un procesador gráfico dentro del propio procesador. En el caso de Intel Core i7, habrá versiones distintas de este procesador, unas sin este controlador y otras con este procesador integrado. Aunque no veremos procesadores Intel Conre i7 hasta el año 2.009, la idea es la de incluir una GPU, procesador gráfico discreto integrado, para modelos concretos, como por ejemplo portátiles y dispositivos ultra-móviles (UMPC) ya que se consegurían consumos de energía muy bajos por lo que se aumentaría considerablemente la duración de las baterías en sistemas móviles como los portátiles. Nuevo Conjunto de Instrucciones SSE 4.2 Streaming SIMD Extensions (SSE) es un conjunto de instrucciones SIMD (Single Instruction, Multiple Data - Única Instrucción, Múltiples Datos) añadidas en el año 1.999 al procesador Pentium III, como extension a la arquitectura x86 como respuesta a la tecnología 3DNow! que AMD tenía implementada años atrás. La versión 4.2 de las extensiones de vector de Intel SSE trae de regreso al futuro el x86 ISA atrás con la adición de nuevas instrucciones de manipulación de cadenas. Digo “Regreso al futuro” porque el soporte a nivel de cadena de procesamiento ISA es una característica de las arquitecturas CISC que se considera obsoleta actualmente en los años post-RISC. Pero la cadena de instrucciones del nuevo SSE 4,2 están destinadas a acelerar el procesamiento de XML, lo que las convierte en perfectas para la Web y aplicaciones futuras basadas en XML. SSE 4.2 también incluye una instrucción CRC que acelera el almacenamiento y las aplicaciones de red, así como una instrucción POPCNT útil para una variedad de tareas de patrón especificado. Además, para ofrecer mejopr soporte a las aplicaciones multi-hilo, Intel ha reducido la latencia de los hilos de las primitivas de sincronización. En el frente de virtualización, acelera las transiciones y tiene algunas mejoras sustanciales, que no voy a detallar aquí, en su sistema de memoria virtual que reduce en gran medida el número de esas transiciones requeridas por el Hypervisor. Otras Características Cuatro unidades de dispatch en vez de tres, lo que se traduce en un 33% más de mejora de proceso de datos por parte del procesador. El Intel Core i7 podrá ejecutar cuatro microinstrucciones a la vez en lugar de las tres de Intel Core 2, consiguiendo un aumento considerable en velocidad. Además este procesador llevará un segundo buffer de 512-entradas TLB (Translation Look-aside Buffer). Este circuito es una tabla utilizada para convertir las direcciones físicas y virtuales por el circuito de memoria virtual. Añadiendo esta segunda tabla se mejora considerablemente el rendimiento del procesador. Un nuevo segundo buffer de predicción de bifurcaciones o BTB (Branch Target Buffer) y aumentando el tamaño del primer y este segundo nuevo buffer permitirá carga más instrucciones y predecir con más exactitud cual es la siguiente instrucción a procesador mejorando aún más el rendimiento del procesador. Disponibilidad y Modelos. Incialmente en octubre de 2.008 veremos los primeros modelos con socket LGA1366, cuatro núcleos y 8 Mb. de memoria caché, serán los Intel Core i7 Quad a velocidades de 2,66 Ghz, 2,93 Ghz y en su version Extreme Editon a 3,2 Ghz con versiones de doble y triple canal de memoria DDR3 a 800, 1066, 1333 y 1600 MHz con buses de memoria de 1x 4.8 GT/s QuickPath, 1x 6.4 GT/s QuickPath y 2x QuickPath. El consumo de este procesador estará en 130 W y socket LGA1366.