Cacheminne Intel Core i7

Relevanta dokument
Cache-koherens protokoll MESI och MOSI

Cacheminne i en Intel Core 2 Duo-processor

Mer datorarkitektur. En titt I datorn Minnen

MESI i Intel Core 2 Duo

Datorhistorik. Föreläsning 3 Datorns hårdvara EDSAC. Eniac. I think there is a world market for maybe five computers. Thomas Watson, IBM, 1943

Schemaläggnings metoderna AMP & SMP i en Multiprocessor

Cacheminne i en AMD Opteron Processor

Emil Kristiansson Kurs: EDT621 Delmoment: Rapport. En introduktion till Smart cache

Datorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)

Jämförelse av skrivtekniker till cacheminne

En Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär:

Rapport (1,5 HP) Lunds Universitet HT15

MESI-protokollets funktion i multiprocessorer

Datorarkitekturer med Operativsystem

What Is Hyper-Threading and How Does It Improve Performance

Datorarkitektur. Informationsteknologi sommarkurs 5p, Agenda. Slideset 3

Grundläggande datavetenskap, 4p

MESI-Protokollet. Richard Elvhammar. Lund Universitet 4/12-16

Att köpa ny dator SeniorNet Lidingö Februari-2019

Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.

Datorhårdvaruteknik 1DV426 - Seminarie 1

System S. Datorarkitektur - en inledning. Organisation av datorsystem: olika abstraktionsnivåer. den mest abstrakta synen på systemet

Elektriska Kretsar. En fördjupning gjord av Philip Åhagen. Philip Åhagen Mälardalens Högskola Produktutveckling /2010 KPP 039

Aktivitetsschemaläggning för flerkärninga processorer

Processor pipelining genom historien (Intel i9-intel i7)

En överblick på cachedesignen i Intels mikroarkitektur Nehalem

SYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR

Digitala System: Datorteknik ERIK LARSSON

Hyper-Threading i Intelprocessorer

Fö 2: Minnen. Introduktion. Primärminnet. Interna och externa minnen. Introduktion, Klassificiering

Minnessystem. Minneshierarki. Flyktigt eller icke flyktigt huvudsakliga egenskaper. Minneshierarki

Hannes Larsson - IDA 2, LTH Campus Helsingborg. NEC V R 4300i. Interlock-handling EDT621

Random Access Memory. Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya

Pipelining i Intel 80486

Tentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60)

En processor kan ha en klockfrekvens på flera GHz. Det går alltså a9 exekvera en instruk=on väldigt for, givet a9 instruk=onen finns i processorn.

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

HF0010. Introduktionskurs i datateknik 1,5 hp

Parallellism i CDC 7600, pipelinens ursprung

Cache coherence hos multicoreprocessorer

Moment 2 Digital elektronik. Föreläsning Inbyggda system, introduktion

Hantering av hazards i pipelines

Föreläsning 1: Intro till kursen och programmering

Svar till tentamen den 16 december 2013 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng

Att köpa ny dator SeniorNet Lidingö September-2017

Tentamen den 12 januari 2017 Datorarkitektur med operativsystem, EDT621

KURSMÅL WINDOWS STARTA KURSEN

Minnets komponenter. Digitala System: Datorteknik. Programexekvering. Programexekvering. Enhet för utdata. Enhet för indata CPU.

Datorarkitekturer med operativsystem ERIK LARSSON

Inför laborationen "Öppna din dator"

MESI protokollet och dess derivater

Datorarkitekturer med operativsystem ERIK LARSSON

Beijer Electronics AB 2000, MA00336A,

Anujan Balasingam IDA14 NAND flashminnen

Digitalteknik och Datorarkitektur 5hp

Föreläsningsanteckningar 5. Cacheminnen

Tentamen den 14 januari 2015 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng

Komma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap

Moderkortet Persondatorer Moderkortet Innehåll

Hyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2

Module 6: Integrals and applications

Tentamen PC-teknik 5 p

SVAR TILL TENTAMEN I DATORSYSTEM, VT2013

Datorteknik ERIK LARSSON

Föreläsning 1: Intro till kursen och programmering

Tentamen den 14 januari 2016 Datorarkitektur med operativsystem, EDT621

Tentamen i Informationsteknologi 5p Fredagen den 13 augusti 2004

Digital- och datorteknik

Exempeltentamen Datorteknik, EIT070,

Att köpa ny dator SeniorNet Lidingö Januari-2016

Agenda. Syfte med datorbygge Datorns delar. Datorbygge. Moderkort Processor Minne och hårddisk Instickskort Övrigt

CHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018

Improved-MOESI Cache koherens Protokoll

Syfte. Praktisk datorkunskap. Personal. Kursinfo. Examination- Krav för godkänt. Agenda idag DVG A06

Datorsystemteknik DAV A14 Föreläsning 1

Parallellism i NVIDIAs Fermi GPU

c a OP b Digitalteknik och Datorarkitektur 5hp ALU Design Principle 1 - Simplicity favors regularity add $15, $8, $11

Förskola i Bromma- Examensarbete. Henrik Westling. Supervisor. Examiner

Minnet från processorns sida Datorteknik

IT för personligt arbete F5

SIMD i Intel s P5- baserade Pentium MMX

Tentamen PC-teknik 5 p

Processprogrammering och operativsystem Introduktion. Kursinformation. Varför operativsystem?

Prestandapåverkan på databashanterare av flertrådiga processorer. Jesper Dahlgren

Datorsystemteknik DAV A14 Föreläsning 1

Innehållsförteckning. Viktiga Begrepp

Definition DVG A06. Varför operativsystem? Operativsystem. Översikt. - Vad är ett operativsystem?

Styrteknik 7.5 hp distans: E-1000 och E-Designer

Introduktion till programmering

Du kan även lyssna på sidorna i läroboken: Teknik direkt s Lyssna gör du på inläsningstjänst.

Digital- och datorteknik

2.1 Installation of driver using Internet Installation of driver from disk... 3

F Secure Booster är ett verktyg för att snabba upp och städa upp i din pc eller

Fö 8: Operativsystem II. Minneshantering. Minneshantering (1) Minneshantering (2) Minneshantering och Virtuelltminne.

Tentamen den 17 mars 2016 Datorteknik, EIT070

DVG A06. Operativsystem, mm. Karlstads universitet Datavetenskap. DVG A06 Johan Eklund. Datavetenskap, Karlstads universitet 1

0.1. INTRODUKTION Instruktionens opcode decodas till en språknivå som är förstålig för ALUn.

Digital IC konstruktion

1. Revisionsinformation

Vad är en dator? Introduktion till datorer och nätverk. Pontus Haglund Institutionen för datavetenskap (IDA) 21 augusti 2018

Transkript:

EDT621 Datorarkitekturer med operativsystem 7,5 hp 2015-12-07 Cacheminne i Intel Core i7 Författare: Adnan Karahmetovic Handledare: Erik Larsson

Innehåll 1. Inledning... 1 1.1 Syfte... 1 1.2 Frågeställning... 1 2. Teori... 1 3. Jämförelse och resultat... 2 4. Reflektion... 3 Källförteckning... 4

Abstract To see how the cache memory works with the other components in the processor, we have to take a look at how the cache memory is structured on the motherboard. Our processor is built according to the Haswell architecture, which means that the memory controller, in comparison to previous architecture, has been moved from the motherboard and on to the processors own chip. Beyond that, there has been added an extra memory channel to the motherboard, which means that every individual memory channel can communicate with one or two memory modules. The cache memory works at three levels. When compared to the previous architecture, it is clear there has been a major improvement when it comes to speed and performance to be able to run more demanding applications more smoothly.

1. Inledning Att vänta i evigheter på att datorn ska öppna en fil eller hämta en hemsida på webben kan vara fruktansvärt frustrerande. Det kan hända att vi stänger av datorn helt innan den hunnit göra klart instruktionen, att vi i frustration klickar hårdare och hårdare med musen för att på något sätt tvinga fram resultatet snabbare, eller att vi lite lätt slår till datorn. Jag valde att undersöka hur en del av processen i att hämta data egentligen går till. 1.1 Syfte Syftet med arbetet är att undersöka hur cacheminnet i Intels processor Core i7 fungerar jämfört med tidigare Core 2. 1.2 Frågeställning För att undersöka hur cacheminnet i processorn fungerar har jag valt följande frågeställning: Hur samarbetar cacheminnet med de andra komponenterna i minneshierarkin jämfört med tidigare arkitektur? 2. Teori Processorfamiljen Intel Core i7 har fyra olika arkitekturer. Bland de lite äldre Nehalem och Ivy Bridge, och det senaste Skylake, tillhör vår processor Haswell-arkitekturen. Jämfört med tidigare teknik har bland annat ett helt nytt moderkort gjorts och ny teknik som till exempel Intel Turbo Boost 1 lagts till. Mest fokus har varit kring strukturen på minne. Minneskontrollen i tidigare Core 2 2 har flyttats från moderkortet till processorn och man har utöver det lagt till en extra minneskanal, vilket gör att varje minneskanal sedan kan kommunicera med en eller två minnesmoduler. Det finns tre nivåer av cacheminnet. Den första nivån, L1, är den minsta, men också den snabbaste. Sedan finns en mellannivå, L2, som följs av en stor L3-cache som alla kärnor i processorn delar på. Tack vare den nya inbyggda minneskontrollen och den nya strukturen på cacheminnet slår den sin företrädare markant. Minnet i en dator utgör en stor del i datorns förmåga att utföra instruktioner snabbt. I och med att ljusets hastighet bestämmer hur fort signalerna sänds till och från minnet, finns det dessvärre begränsningar på hur snabba minnen kan vara. Genom åren har det därför utvecklats diverse minnen som kan ställas upp i en hierarki där de snabbaste, men dessvärre dyraste och med begränsad kapacitet, är på toppen av hierarkin, och där de mest långsamma minnen, men desto billigare och med nästan oändlig kapacitet, är på botten av hierarkin 3. Minnet i datorn delas upp i primärminne och sekundärminne. Primärminnet är ett så kallat flyktigt minne, vilket innebär att det förlorar sitt innehåll när strömmen stängs av, till skillnad från sekundärminnet som inte gör det. 1 https://en.wikipedia.org/wiki/intel_turbo_boost 2 https://en.wikipedia.org/wiki/intel_core_2 3 https://en.wikipedia.org/wiki/memory_hierarchy 1

Processorns register, som används direkt för att utföra arbetet, är den snabbaste typen av minne. I registren bearbetas befintlig data och beroende på instruktionerna från processorn, förflyttas data mellan stegen i hierarkin. De ligger närmast processorn jämfört med de andra i hierarkin. Antalet register är begränsat beroende på hur mycket plats det finns på processorns fysiska krets. Processorers klockfrekvens ökade rejält precis innan 2000-talet samtidigt som primärminnenas drifthastighet knappt rörde sig. Det innebar att processorn ofta fick vänta länge på att hämta från primärminnet eller lagra i det. Det är vad den ungerska matematiker John von Neumann 4 grundade sin flaskhalsteori kring. För att åtgärda det problemet skapades det som vi ska titta närmare på, nämligen cacheminnen. Cacheminnen är mindre och snabbare än primärminnet och deras uppgift är att lagra ofta använd data, så att det tar mindre tid att utföra kända arbeten. Hela program får inte plats i cacheminnen, utan det är data och instruktioner som ska vara tillgängliga när de behövs som finns i dem. Vissa cacheminnen byggs in på processorns fysiska krets, men kan också byggas in på egna kretsar som ligger nära processorns krets på moderkortet. En hårddisk är ett exempel på ett sekundärminne. Jämfört med de tidigare nämnda minnena, är dessa mycket långsammare. De är däremot billigare och har i princip obegränsad kapacitet. 3. Jämförelse och resultat Primärminnet är oftast mellan 2 till 8 Gigabytes i en modern dator. Primärminnet har en lång accesstid på 100 nanosekunder. Processorns register kan variera mellan 8 till 32 stycken och har en väldigt kort accesstid på bara ett fåtal nanosekunder. Cacheminnen ligger oftast på mellan 32 Kilobytes till 12 Megabytes, beroende på ifall de ligger på processorns krets eller en egen krets, och har en kort accesstid på ett 10-tal nanosekunder. Hårddiskar ligger idag på ungefär 500 Gigabytes till 1 Terabyte i en typisk modern datorn, vilket innebär väldigt mycket lagringsutrymme, men har en accesstid på 10- talet millisekunder. Efter jämförelse med tidigare teknik, blir det tydligt att cacheminnet i processorn är strukturerad på ett nyare och bättre sätt för att kunna köra krävande applikationer mer smidigt. 4 https://en.wikipedia.org/wiki/john_von_neumann 2

4. Reflektion Syftet med rapporten var att undersöka hur cacheminnet i Intels Core i7 fungerar jämfört med tidigare Intel Core 2. Undersökningen har visat att strukturen på cacheminnet har ändrats betydligt och att bättre resultat gällande snabbhet och prestanda uppnåtts. 3

Källförteckning CPU cache. Wikipedia. 2015. http://en.wikipedia.org/wiki/cpu_cache (Hämtad 2015-12-07) EDT621: Föreläsning 3-4. LTH. 2015. http://www.eit.lth.se/fileadmin/eit/courses/edt621/f%d63-4.15.a4.pdf (Hämtad 2015-12-07) Haswell (microarchitecture). Wikipedia. 2015. http://en.wikipedia.org/wiki/haswell_(microarchitecture) (Hämtad 2015-12-07) List of Intel Core i7 microprocessors. Wikipedia. 2015. http://en.wikipedia.org/wiki/list_of_intel_core_i7_microprocessors (Hämtad 2015-12-07)