Jämförelse av skrivtekniker till cacheminne

Relevanta dokument
Datorarkitekturer med Operativsystem

MESI i Intel Core 2 Duo

Cacheminne i en Intel Core 2 Duo-processor

Improved-MOESI Cache koherens Protokoll

Cache coherence hos multicoreprocessorer

Rapport (1,5 HP) Lunds Universitet HT15

Digitalteknik och Datorarkitektur 5hp

Minnet från processorns sida Datorteknik

Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.

Snapdragon 810: Cacheminnet

Cache-koherens protokoll MESI och MOSI

Hannes Larsson - IDA 2, LTH Campus Helsingborg. NEC V R 4300i. Interlock-handling EDT621

MESI-Protokollet. Richard Elvhammar. Lund Universitet 4/12-16

Digitala System: Datorteknik ERIK LARSSON

Föreläsningsanteckningar 5. Cacheminnen

Datorsystem. Tentamen

Tentamen den 17 mars 2016 Datorteknik, EIT070

Hantering av hazards i pipelines

Datorteknik ERIK LARSSON

Cacheminne Intel Core i7

Uppgift 1: a) u= a c + a bc+ ab d +b cd

SVAR TILL TENTAMEN I DATORSYSTEM, VT2013

Tentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60)

Svar till tentamen den 16 december 2013 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng

Datorsystemteknik för E/D

Tentamen den 12 januari 2017 Datorarkitektur med operativsystem, EDT621

Tentamen den 18 mars svar Datorteknik, EIT070

Datorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)

En processor kan ha en klockfrekvens på flera GHz. Det går alltså a9 exekvera en instruk=on väldigt for, givet a9 instruk=onen finns i processorn.

Datorhistorik. Föreläsning 3 Datorns hårdvara EDSAC. Eniac. I think there is a world market for maybe five computers. Thomas Watson, IBM, 1943

Öka prestanda i Shared-Cache multi-core processorer

Mer datorarkitektur. En titt I datorn Minnen

SVAR TILL TENTAMEN I DATORSYSTEM, HT2013

Datorarkitekturer med operativsystem ERIK LARSSON

TSEA28 Datorteknik Y (och U)

MESI protokollet och dess derivater

Digitala System: Datorteknik ERIK LARSSON

Cacheminne i en AMD Opteron Processor

Minnets komponenter. Digitala System: Datorteknik. Programexekvering. Programexekvering. Enhet för utdata. Enhet för indata CPU.

Fö 2: Minnen. Introduktion. Primärminnet. Interna och externa minnen. Introduktion, Klassificiering

Emil Kristiansson Kurs: EDT621 Delmoment: Rapport. En introduktion till Smart cache

Tentamen den 14 januari 2016 Datorarkitektur med operativsystem, EDT621

Parallellism i CDC 7600, pipelinens ursprung

Exempeltentamen Datorteknik, EIT070,

Filsystem - Inode. Datorteknik. Minnets komponenter. Programexekvering. Enhet för indata. Enhet för utdata CPU. Primärminne.

TSEA28 Datorteknik Y (och U)

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Cacheminne och adressöversättning

Tentamen den 14 januari 2015 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng

Datorsystem. Tentamen

Grundläggande datavetenskap, 4p

En överblick på cachedesignen i Intels mikroarkitektur Nehalem

SYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR

Datorsystem. Exempeltentamen

Hantering av begränsat antal skrivningar på Solid State diskar

Datorarkitektur. Informationsteknologi sommarkurs 5p, Agenda. Slideset 3

MESI-protokollets funktion i multiprocessorer

Dugga 1 status 41 godkända 39 ej godkända ERIK LARSSON

0.1. INTRODUKTION Instruktionens opcode decodas till en språknivå som är förstålig för ALUn.

Närliggande allokering Datorteknik

En Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär:

Datorarkitektur I. Tentamen Lördag 10 April Ekonomikum, B:154, klockan 09:00 14:00. Följande gäller: Skrivningstid: Fråga

CE_O5. Cacheminne. Hemlaboration 2.

Tentamen i Digitala system - EITA15 15hp varav denna tentamen 4,5hp

Datorarkitekturer med operativsystem ERIK LARSSON

Tentamen i Digitala system - EITA15 15hp varav denna tentamen 4,5hp

CE_O8. Cacheminne. Hemlaboration 2.

Digitala System: Datorteknik ERIK LARSSON

Cacheprobe: programbibliotek för extrahering av cacheminnesparametrar

Pipelining i Intel 80486

HF0010. Introduktionskurs i datateknik 1,5 hp

Datorsystem. Tentamen

Minnessystem. Minneshierarki. Flyktigt eller icke flyktigt huvudsakliga egenskaper. Minneshierarki

Digitalteknik och Datorarkitektur

Lösningsförslag till Tenta i Mikrodator

Prestandapåverkan på databashanterare av flertrådiga processorer. Jesper Dahlgren

Lösningsförslag till Tenta i Mikrodator

Hantering av hazards i multi-pipelines

Moment 2 Digital elektronik. Föreläsning Inbyggda system, introduktion

CDC en jämförelse mellan superskalära processorer. EDT621 Campus Helsingborg av: Marcus Karlsson IDA

Hur det går att minska effektutvecklingen i en processor genom att ändra pipeline

Arm Cortex-A8 Pipeline

Komma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap

Lathund Blanketthotell Komma igång

Syfte. Praktisk datorkunskap. Personal. Kursinfo. Examination- Krav för godkänt. Agenda idag DVG A06

Parallellism i NVIDIAs Fermi GPU

Hyper-Threading i Intelprocessorer

System S. Datorarkitektur - en inledning. Organisation av datorsystem: olika abstraktionsnivåer. den mest abstrakta synen på systemet

Schemaläggningsmetodik för multi-core inom Windows 7 OS Vad är scheduling och hur schemalägger Windows OS sina processer?

Operativsystem ID2206 Tentamen TEN1 4.5 hp :00-18:00

Schemaläggnings metoderna AMP & SMP i en Multiprocessor

OBS!! Detta är DEL 2 av tentan. För att få ut denna måste du ha lämnat in del 1. Om du inte fått ut del 1 bör du meddela skrivningsvakten. OBS!!

Institutionen för Datavetenskap Department of Computer Science

Random Access Memory. Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya

Diskprestanda Tester

Utvecklingen från en 8 bitars till en 16 bitars mikroprocessor

Välkomna Gör en gammal dator brukbar 1

SIMD i Intel s P5- baserade Pentium MMX

Datorteknik ERIK LARSSON

Flera processer. Minneshantering. Trashing kan uppstå ändå. Ersätta globalt

Transkript:

Jämförelse av skrivtekniker till cacheminne

1 Innehåll 1. Sammanfattning 2. Inledning 3. Diskussion 4. Referenslista 1. Sammanfattning En rapport innehållande jämförelser av olika skrivtekniker till minnen såsom write-through, write-around och write-back. De olika skrivteknikerna kommer med sina för- och nackdelar. Write-through skriver synkront till cache och minne medan Write-back till en början skriver till cache varpå data skrivs till primärminne. Write-around påminner lite om den teknik write-through använder.

2 2. Inledning För att på ett snabbt sätt kunna nå data i processorn används cacheminne. Information sparas i ett minne som går snabbt att nå. Ett vanligt minne som till exempel en hårddisk är långsam och tar tid att leta igenom. Man brukar prata om en minneshierarki där cacheminnet ligger närmre processorn än ramminnet som i sin tur är följt av någon slags lagringsenhet, exempelvis en hårddisk. När en instruktion ska hämtas men inte finns i cacheminnet kallas det för en miss. Förhoppningen är att dessa i så stor utsträckning som möjligt ska undvikas. Desto längre ner vi går i minneshierarkin desto längre tid tar det att läsa och skriva. Om dessa operationer görs om på nytt vill vi att de ska finnas i cacheminnet för att ge färre cache-missar. Ett cacheminne går att förbättra på många sätt. Till exempel genom att bestämma vilka data som ska sparas i det och även på vilket sätt. Färre skrivningar till minnet ger ett mer effektivt program, men kan istället kosta i exempelvis säkerhet. Vilken typ av skrivningar som kommer görs avgör vilken metod som ger bäst resultat. De flesta program är beroende av läsa och skriva. Därmed kommer dess prestanda bero på hur minnet fungerar. Syftet med denna rapport är att jämföra skrivstrategier till cacheminnet.

3 3. Diskussion Jämförelsen består av de tre olika typer av skrivteknikstrategierna: write-through, write-around samt write-back. Dessa har olika effektivitet beroende på läsningar och skrivningar som ska göras (Chris Evans, Computer Weekly). Dessutom finns en säkerhetsaspekt som innebär att data kan gå förlorad som ett pris till dess förmåga. Till exempel kan en snabb algoritm innebära flera cacheträffar samtidigt som data kan skrivas över och gå förlorad. Write-through fungerar på följande vis. Input och output-data skrivs till cacheminnet synkront som datan läggs på primärminnet. När detta sker innebär det att ny data nu finns både att hämta snabbt i cacheminnet samt på exempelvis en hårddisk. Vad som nu tar tid är att skriva till minnet och inte till cacheminnet. Därmed är Write-trough en teknik som är säker men också långsam. Varje skrivning, till exempelvis till en hårddisk, är dyr tidsmässigt. Eftersom dessa skrivningar också görs synkront till cacheminnet är tanken att mycket data förhoppningsvis ska läsas om. Om datan i cacheminnet gång på gång skrivs över kan en annan teknik vara bättre för detta fall. Då föredras istället Write-around som skrivteknik. För att data inte ska gå förlorad skrivs med write-around till en början till

4 lagringsenheten. Om många skrivningar görs till cachen innbär att write-through skulle fylla cachen gång på gång trots att informationen inte kommer användas. Poängen här är att undvika just det. Det innebär att vi får cache miss om data ska läsas som precis har skrivits i cacheminnet. Därmed måste denna data hämtas från primärminnet. Det är alltså helt beroende på vilka läsningar som ska göras som bestämmer den mest effektiva tekniken mellan dessa två.

5 Den tredje tekniken write-back fungerar lite annorlunda. Data som ska skrivas hamnar direkt i cachen och inte på lagringsenheten. Det resulterar i en mycket snabb skrivteknik med sämre säkerhet. I sin rapport beskriver Radhika Nagpal (1994) hur denna teknik fungerar. När dessa skrivs till cachen utan att uppdatera minnet så markeras denna rad som en dirty eller smutsig rad. Dessa block i cachen kommer endast skrivas till minnet om raden måste ersättas av en annan. Datan kan alltså hämtas direkt från cachen tills den blivit överskriven. Problemet är som sagt att det bara finns en kopia i cachen när en rad är dirty. Samtidigt är denna skrivtekniken den snabbaste av de tre. Det är upp till användaren huruvida risken är värd effektiviteten beroende på vilka skrivningar som ska göras. I sin rapport kommer Norman P. Jouppi fram till huruvida Write-back eller Write-through fungerar bäst i fall där hög prestanda efterfrågas. Båda teknikerna är krävande ur en komplexitetsaspekt. För write-back behövs ett slags register för de smutsiga raderna medan write-through-tekniken använder en skrivbuffert för att inte behöva skriva lägre ner till minneshierarkin. Norman P. Jouppi menar på att de extra platserna för dirty bits i write-back motsvarar den hårdvara skrivbufferten write-through kräver.

6 Referenser 1. Chris Evans (april 2014). Computer Weekly, 2012-2015, TechTarget. Kan nås via goo.gl/lbykjq. Information hämtad 2015-11-25 3. Norman P. Jouppi (december 1991). Cache Write Policies and Performance. Western Research Laboratory. Information hämtad 2015-12-04 2. Nagpal Radhika (1994). Single cycle store instructions in write-through, write-back and set associative caches. Massachussetts Institute of Technology. Information hämtad 2015-12-01.