En överblick på cachedesignen i Intels mikroarkitektur Nehalem
|
|
- Axel Bergqvist
- för 8 år sedan
- Visningar:
Transkript
1 En överblick på cachedesignen i Intels mikroarkitektur Nehalem Tillsammans med utvecklingen av cacheminnen förekommer det även ett flertal problem med att styra och organisera data. Trots att det sker stora framsteg inom hårdvaruutvecklingen för datorminnen kvarstår de logiska problemen med att designa och strukturera cache minnen för bästa prestanda i en processor. I denna rapport ges en överblick på mikroarkitekturen Nehalems cachedesign i syfte till att ge läsaren en överskådlig uppfattning på vad som kan förekomma i cache minnen, vilka problem en cachedesigner måste ha överseende med och möjliga lösningar till problemen. Introduktion Innan detaljerna kring cachedesignen diskuteras ges en kort introduktion på problemen kring cache designen och viktiga faktorer inom cache design. Cachedesign har en kritisk betydelse för en processors prestanda. Trots att cacheminnen ursprungligen hade en mer klar roll har det uppstått det fler problem i takt med framsteg inom mikroprocessorteknik. Flera av dessa problem ankrar sig i hårdvarubegränsningar men även suboptimal design av systemarkitektur. Därför är det viktigt att med senaste teknik kunna förse en processor med bästa möjliga designlösningar. Det finns flera parametrar som påverkar cachedesignen. Dels måste cacheminnet vara högeffektiv i den meningen att cacheminnet måste vara pålitlig. Detta inkluderar låg accesstid, låg strafftid vid miss, hög hit rate och minneskonsistens. Men på senare tid har fler problem uppstått i samband med multicore processorer och medvetenhet inom energiförbrukning. Detta ökar kraven på cachedesign och lösningarna blir även med komplexa. Bortsett från att allmänt förbättra arkitekturen ville Intel även göra Nehalem mer modulär och mer skalbart, vilket krävde en mindre omvälvning i cachestrukturen. Delämnen som kommer att beröras är följande: En översikt av cachearkitekturen i Nehalem MESIF protokollet och koherens Intels implementation av TLB, translation lookaside buffer, i Nehalem Intels implementation av cache inclusion. Tidigare implementation av minnesarkitektur. Problem med tidigare cachearkitekturer Innan Intel lanserade Nehalen led föregångaren Core av några fundamentala problem. I detta stycke adresseras några av de problemen gällande Cores cachedesign.
2 Core led av brister inom dataöverföring. De tidigare Core-arkitekturerna bestod av, beroende på prestandaklass, en eller fler singel eller dubbelkärniga mikrochip. Detta satte en oerhörd press på processorns buss, vilket till slut blev en flaskhals för systemet. Detta gäller för bussen mellan RAMminne och processor, men även mellan kärnor. Med en överbelastad dataöverföringsbuss lämnade detta lite utrymme för fler kärnor i arkitekturen (Rolf, 2009:1). Detta var ett stort problem innan, men idag är det mer en fråga om skalbarhet. En möjlig lösning på detta är att försöka göra processorn så modulär som möjligt, vilket betyder att varje mikrochip ska kunna kopplas ihop utan avsevärt försämrad prestanda (Awashti et al, 2011:57). I äldre processorer var minneskontrollern en ordentlig flaskhals eftersom den var placerad off-chip på moderkortets nordbrygga, vilket betyder att processorn inte kommunicerar direkt med RAMminnet utan kommunicerade i första hand med minneskontrollern, som i sin tur kommunicerade med RAM-minnet. Detta orsakade en högre latens än nödvändigt (Rolf, 2009:3). Nehalems systemarkitektur Intel ville göra arkitekturen mer modulär och mer skalbar. Detta krävde fundamentala förändringar, men lösningen är simpel i design. Nedanför förklaras översiktligt systemarkitekturen i Nehalem. I tidigare Core modeller satt två kärnor i ett mikrochip, där varje core hade en L1 Cache men delade på en L2 Cache. Detta blev minnesmässigt inte lika komplett då alla enkelkärniga processorer oftast hade en egen L1 och L2 cache per kärna. Nehalem löste detta genom att introducera en tredje delad cache, såkallad L3 Cache. L2 cache blev istället en självständig cache tillsammans med L1 för var kärna. Front Side Bus (FSB), databussen mellan processorn och nordbryggan, är inte längre aktuell i Nehalem och har ersatts med Quick Path Interconnect (QPI), som är en point-to-point länk mellan mikrochipsen (Molka et al 2009:261). Figur 1 En åttakärnig Nehalem processor (2009) I Core-arkitekturen var det ett problem med att minneskontrollen befann sig i moderkortets nordbrygga. Intel löste detta i Nehalemarkitekturen genom att införa en integrerad minneskontroller (eng. integrated memory controller, IMC) (Molka et al 2009:261). IMC:n är utrustad med trippel kanaler för dataöverföring, vilket ska enligt teori ska minska tiden för minnesaccess betydligt. Att integrera minneskontrollern i processorchippet medför att processorn blir mindre beroende av moderkortet, vilket gjorde processorn mer modulärt (Rolf, 2009:3).
3 Cachespecifikationer I den här delen presenteras de mer specifika cachespecifikationerna. Som tidigare förklarats har Intel gått från en minneshierarki med två nivåer till en minneshierarki med tre nivåer. L1 cachen är 32kB i storlek och använder sig av writeback policy. Cacheline storleken är på 64 bytes och utnyttjar 8-way set associative. L2 cache, som Intel själva kallar för MLC, är 256 kb stor. Den har likväl 64 bytes cachelinjestorlek, använder sig av 8-way set associative och writeback policy. MLC:n innehåller både instruktioner och data (Dixon et al 2010:17). Nehalems processorer använder sig utav inclusive 8 MB L3 cache. Vad detta innebär är att det data som finns i övre minneshierarkin måste även finnas i nivån under. Med andra ord måste L3 cachen i Nehalem innehålla data från L2 och L1. I L3 finns en så kallad core valid bit, som visar om sökt cachelinje finns i en kärnas cacheminne. Den cachedesignen skiljer sig från non-inclusive eller exclusive cachedesign, som betraktar minnen i hierarkin som självständiga. För att vara helt säker på om en cachelinje finns i en specifik kärna måste därför alla cacheminnen i minneshierarkin undersökas i ett non-inclusive cacheminne (Jaleel et al 2010:1). Fördelen med inclusive cachedesign är dess simpla design. Detta har stor betydelse då växande multiprocessorteknologi blir frågan kring minneshantering mer och mer komplex. Med en simpel design tillkommer även hinder i flexibilitet, vilket orsakar sämre prestanda. Grunden till detta ligger bland annat i att cachelinjer måste överskridas för att tillgodose att designen förblir inclusive (Jaleel et al 2010:1). Cache koherens och MESIF protokollet Med fler kärnor och fler cacheminnen blir det betydligt svårare att tillfredsställa minneskonsistensen. Intel löste detta i Nehalem genom att bland annat introducera MESIF protokollet, som är baserad på MESI protokollet. Följande text förklarar kort definitionen av cache koherens och även MESIF protokollet. Att en cache är koherent innebär i stora drag att cacheminnen för alla kärnor i en processor är tidsenligt konsekventa med varandra och minnet. Exempelvis kan en situation ske där en minnesplats läses av en processor under tiden en annan processor skriver till samma minnesplats, vilket kommer att medföra att en processor har tillgång till felaktig data. Ett viktigt koncept som löser detta problem är write serialization, som innebär att processorminnet uppdateras i samma ordning som den skrivs i (Patterson 2014:467) Det finns två huvudsakliga egenskaper ett cachesystem måste ha för att kunna bli koherent, migration och kopiering (eng. replication). Migration innebär att en cache ska kunna flytta på data inom systemet för användning. Som namnet antyder är kopiering snarlik, med skillnaden att data kopieras istället. Det finns flertal sätt att implementera detta, för Nehalem-arkitekturen är det MESIF protokollet som är aktuellt (Patterson 2014: ). Innan Intel introducerade MESIF-protokollet tillsammans med Nehalem var MESI ett vanligt val av protokoll. I fallet med en enkärnig processor bestod varje cachelinje av en valid bit. Denna del, cachelinjens tillståndsdel, är vidareutvecklad i MESI för att kunna stödja flertal kärnor och cache koherens. Grundkonceptet gäller fortfarande, att alla cachelinjer kan betraktas som modifierade eller
4 rena (eng. clean). Skillnaden är att beroende på hur lokalkärnan eller andra kärnor interagerar (read respektive write, se figur 2) med en viss cachelinje ändras tillståndet. I MESI finns det fyra tillstånd: Modified Likt i det enkärniga fallet är detta en modifierad cachelinje som inte är i enlighet med minnet. Vid ersättning måste cachelinjen skrivas till minnet. Exclusive En ren cachelinje som är garanterat exklusiv för cacheminnet den befinner sig i. Shared Tillståndet är detsamma som exklusiv men har blivit avläst och finns möjligen i något annat cacheminne. Om cachelinjen förändras måste cacheminnen som delar just denna cachelinje meddelas. Invalid Datan är ogiltig (Rolf, 2009:2-3). Figur 2 Ett MESI tillståndsdiagram (2007) För att kommunicera med varandra används oftast en gemensam buss (Patterson, 2014:468). På sådant sätt agerar cacheminnet mer enhetligt och blir därmed mer oberoende av det långsamma minnet. MESIF protokollet introducerade ett nytt tillstånd: forward. Forward är en vidareutveckling på tillståndet shared. Tidigare har problemet med shared varit att vid cachelinjeförfrågan svarade samtliga kärnor med att de har eftersökt cachelinje. I MESIF bär cachelinjen med forwardtillståndet ansvaret för att dela cachelinjen vid förfrågan. På så sätt minskas trafiken mellan kärnorna (Rolf, 2009:3). Translation Lookaside Buffer Translation Lookaside Buffer (TLB) är en minnesteknik som är viktig för en processors prestanda. Här introduceras TLB konceptuellt och hur det har implementerats i Nehalem. TLB är en höghastighetsbuffert som mappar virtuella adresser till fysiska adresser i cacheminnet eller minnet. Trots att detta är fullt möjligt utan en TLB så är det inte önskvärt eftersom det skulle kunna leda till att man behöver arbeta med minnet mer än nödvändigt: dels för att leta upp mappningen från den virtuella adressen till den fysiska adressen och dels för att faktiskt hämta data från det fysiska minnet. Med TLB är det möjligt att bortse från att behöva leta i minnet efter mappningen och istället låta TLB lagra mappningen. Rent fysiskt är TLB ett specialiserat cacheminne. Den är specialiserad på så sätt att den innehåller en delmängd av data som mappar virtuell adress till fysisk adress i minnet. Likt hur ett vanligt cacheminne fungerar med skrivstrategier, hantering av cache hit och cache miss och associativitet så fungerar ett TLB på ett liknande sätt. TLB har använts ofta i äldre processorarkitekturer men med Nehalem krävdes större förändringar då Nehalems arkitektur har en mer sofistikerad struktur. En sekundär TLB introducerades, kallad STLB, som kan översätta sidor (eng. pages) i minnet bestående av både instruktioner och data. STLB:n i Nehalem har 512 tillgängliga platser för lagring och stödjer sidor som är upp till 1 GB stora (Dixon et al, 2010:17-18).
5 Diskussion och sammanfattning Denna rapport har gett en överblick på hur Nehalems cachearkitektur ser ut och vilka tekniker Intel har valt att vidareutveckla från Core-arkitekturen. Att inkludera flera kärnor i en processorer är en kraftfull teknik för att förbättra prestanda, men likt mycket annat inom teknik tillkommer ett pris. Som det har diskuterats hittills finns det mycket att ta hänsyn till. Inom cacheminnen är det exempelvis koherens, trafikbelastning, cachestruktur och protokoll som är speciellt viktiga för multicore processorer. Med alla dessa lösningar på problemen som Core-arkitekturen led av så återstår frågan om vilka problem som fortfarande kvarstår i Nehalem-arkitekturen. Nehalem har bevisats vara väldigt tillförlitlig och har många starka sidor (Rolf, 2009:8). Ett problem som Molka et al skriver om i Memory Performance and Cache Coherency Effects on an Intel Nehalem Multiprocessor System, publicerad 2009, är att cacheminnet på L3 agerar flaskhals när alla fyra kärnor i ett mikrochip skriver eller läser samtidigt (Molka et al, 2009:270). En annan fråga är huruvida Intels största konkurrent inom processorer, AMD, lyckas hålla sig i marknaden. Enligt studier ska AMD:s marknadsandelar ökat i samband med Nehalems lansering (Reuters, 2009). Detta kopplar jag till rapporten då min fråga är om det är en teknisk betingelse som har orsakat denna stigning till AMD:s fördel, som kan betyda att AMD fortfarande hade stor relevans inom mikroprocessorteknik, eller om det rör sig om något annat.
6 Källförteckningar Fakta 1. 'AMD Market Share Leaps Forward, Intel Maintains Dominance' 2009, Channel Insider, p. 1, Business Source Complete, EBSCOhost, viewed 7 December Molka, D, Hackenberg, D, Schöne, R, & Müller, M 2009, 'Memory performance and cache coherency effects on an intel nehalem multiprocessor system', Parallel Architectures And Compilation Techniques - Conference Proceedings, PACT, Proceedings th International Conference on Parallel Architectures and Compilation Techniques, PACT 2009, p , Scopus, EBSCOhost, viewed 2 December Awasthi, M, Nellans, D, Sudan, K, Balasubramonian, R, & Davis, A 2012, 'Managing Data Placement in Memory Systems with Multiple Memory Controllers', International Journal Of Parallel Programming, 40, 1, pp , Academic Search Complete, EBSCOhost, viewed 7 December Dixon, M, Hammarlund, P, Jourdan, S & Singhal, R 2010, The Next Generation Intel Core Microarchitecture, Intel Technology Journal, volume 14, issue 3, pp. 8-28, URL: iss-3-intel-technology-journal.pdf, viewed 2 December Rolf, T, 2009, Cache Organization and Memory Management of the Intel Nehalem Computer Architecture, CS 6810 Final Project, University of Utah Computer Engineering 6. Jaleel, A, Borch, E, Bhandaru, M, Steely Jr., S, & Emer, J 2010, 'Achieving non-inclusive cache performance with inclusive caches: Temporal Locality Aware (TLA) cache management policies', Proceedings Of The Annual International Symposium On Microarchitecture, MICRO, Proceedings - 43rd Annual IEEE/ACM International Symposium on Microarchitecture, MICRO 2010, p , Scopus, EBSCOhost, viewed 2 December Hennessy, JL, Patterson, DA 2014, Computer Organization and Design: The Hardware/Software Interface, Elsevier, The Boulevard, Langford Lane, Kidlington, Oxford. Grafik 1. Figur 1. En åttakärnig Nehalem processor (2009) [digital image] At: viewed 2 December Figur 2. Ett MESI tillståndsdiagram (2007) [digital image] At: viewed 2 December 2015.
Rapport (1,5 HP) Lunds Universitet HT15
Rapport (1,5 HP) Lunds Universitet HT15 Cache-koherens protokoll i Intel Core i7 En rapport om cache-koherens och protokollet som används i Intel Core i7 processorer för att hålla minnet koherent Författare:
Läs merMESI i Intel Core 2 Duo
MESI i Intel Core 2 Duo Sammanfattning Denna rapport beskriver en processor (Intel Core 2 Duo) vars cache coherence protokoll är MESI. Rapporten beskriver hur processorn är uppbyggd, hur många kärnor den
Läs merMESI protokollet och dess derivater
LTH LUNDS TEKNISKA HÖGSKOLA MESI protokollet och dess derivater Peter Persson 2015-12-08 Sammanfattning Dagens multicore processorer använder sig av ett flertal cacheminnen. Därför behövs det metoder för
Läs merImproved-MOESI Cache koherens Protokoll
Improved-MOESI Cache koherens Protokoll Abstrakt I en multicore, flerkärninga processor med delat minne kan koherens problem förekomma. En lösning till detta är att implementera cache koherens protokoll.
Läs merCacheminne i en Intel Core 2 Duo-processor
Peter Hesslow EDT621 Cacheminne i en Intel Core 2 Duo-processor Abstrakt Det finns många olika sätt att bygga upp ett datorminne på, och med en flerkärnig processor så blir alternativen ännu fler. Denna
Läs merMinnet från processorns sida Datorteknik
Minnet från processorns sida Datorteknik ERIK LARSSON Processorn ger kommandon/instruktioner med en adress och förväntar sig data. Exempel: READ(ADR) -> DATA Fysisk adress Logisk adress READ 00001000 READ
Läs merSYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR
SYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR EN INBLICK I HUR INTERCONNECTION OCH NUMA FUNGERAR DEN 5 DECEMBER 2016 FÖRFATTARE: NIKLAS SCHLIKER Examinator: Erik Larsson Innehåll Abstrakt:... 2 1.1
Läs merSnapdragon 810: Cacheminnet
Snapdragon 810: Cacheminnet Daniel Eckerström dat14dec@student.lu.se Sammanfattnig Snapdragon 810 innehåller två olika processor arkitekturer, ARM Cortex-A53 samt Cortex-A57. Detta för att kunna på ett
Läs merMESI-Protokollet. Richard Elvhammar. Lund Universitet 4/12-16
MESI-Protokollet Richard Elvhammar Lund Universitet 4/12-16 Abstract För att ett system snabbt ska kunna hantera information så används, å sidan åt primärminnet och sekundärminnet, ett cacheminne. I modern
Läs merCache coherence hos multicoreprocessorer
Cache coherence hos multicoreprocessorer Benjamin Holmqvist, EDT621 December 5, 2016 1 Contents 1 Inledning 3 2 Syfte 3 3 Cache Coherence 3 3.1 Implementering.......................... 4 3.2 Snoop baserade..........................
Läs merEmil Kristiansson Kurs: EDT621 Delmoment: Rapport. En introduktion till Smart cache
En introduktion till Smart cache 1 Sammanfattning Syftet med den här rapporten är att ge en introduktion till tekniken smart cache för läsaren. Smart cache är en teknik som låter de olika cacheminnena
Läs merMulti-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.
Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant. Sammanfattning När processorns klockhastighet ökar medför det en ökning av instruktioner vilket såklart ökar
Läs merJämförelse av skrivtekniker till cacheminne
Jämförelse av skrivtekniker till cacheminne 1 Innehåll 1. Sammanfattning 2. Inledning 3. Diskussion 4. Referenslista 1. Sammanfattning En rapport innehållande jämförelser av olika skrivtekniker till minnen
Läs merHyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2
Hyper Threading Intels implementation av SMT Datorarkitekturer med operativsystem - EITF60 Felix Danielsson IDA2 Sammanfattning Simultaneous multithreading (SMT) är en teknik som används i processorer
Läs merCache-koherens protokoll MESI och MOSI
Handledare: Erik Larsson Lunds Tekniska Högskola HT2016 Cache-koherens protokoll MESI och MOSI Författare: Adnan Mohamed Abstrakt Cache koherens protokoll hanterar cacheminnet i ett multiprocessor system,
Läs merMESI-protokollets funktion i multiprocessorer
LUNDS TEKNISKA HÖGSKOLA CAMPUS HELSINGBORG MESI-protokollets funktion i multiprocessorer Jacob Petersson EDT621 Datorarkitekturer med Operativsystem 2016-HT Abstract Denna rapport syftar till att visa
Läs merÖka prestanda i Shared-Cache multi-core processorer
Öka prestanda i Shared-Cache multi-core processorer 1. Abstract Många processorer har nuförtiden flera kärnor. Det är även vanligt att dessa kärnor delar på högsta nivås cachen för att förbättra prestandan.
Läs merKomma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap
Komma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap Christofer Huynh IDA14 EDT621 Lärare: Erik Larsson Abstrakt Memory wall, något
Läs merHannes Larsson - IDA 2, LTH Campus Helsingborg. NEC V R 4300i. Interlock-handling EDT621
Hannes Larsson - IDA 2, LTH Campus Helsingborg NEC V R 4300i Interlock-handling EDT621 Läsperiod 2, 2017 Innehållsförteckning s.2 - Förord s.2 - Inledning s.2 - NEC VR-4305 s.3 - Pipeline s.4 - Interlocks
Läs merCacheminne Intel Core i7
EDT621 Datorarkitekturer med operativsystem 7,5 hp 2015-12-07 Cacheminne i Intel Core i7 Författare: Adnan Karahmetovic Handledare: Erik Larsson Innehåll 1. Inledning... 1 1.1 Syfte... 1 1.2 Frågeställning...
Läs merHantering av hazards i pipelines
Datorarkitektur med operativsystem Hantering av hazards i pipelines Lisa Arvidsson IDA2 Inlämningsdatum: 2018-12-05 Abstract En processor som använder pipelining kan exekvera ett flertal instruktioner
Läs merDatorarkitekturer med Operativsystem
Lunds Tekniska Högskola Campus Helsingborg Datorarkitekturer med Operativsystem EDT621 Rapport Cacheminneshantering för ARM3-processorer 7 december 2015 Pierre Aupeix dat11pau@student.lu.se 1 Abstract
Läs merPrestandapåverkan på databashanterare av flertrådiga processorer. Jesper Dahlgren
Prestandapåverkan på databashanterare av flertrådiga processorer av Sammanfattning Behandling av information bli vanligare i dagens samhälle och för att klara denna uppgiften används ofta en databashanterare
Läs merCacheminne i en AMD Opteron Processor
Handledare: Erik Larsson Lunds Tekniska Högskola HT15 Cacheminne i en AMD Opteron Processor En rapport om cacheminne och dess struktur, i en 12 kärnig AMD Opteron Magny-Cours processor. Författare: Hamza
Läs merSchemaläggnings metoderna AMP & SMP i en Multiprocessor
EDT621 Datorarkitekturer med operativsystem 7,5 HP 2015-12-05 Schemaläggnings metoderna AMP & SMP i en Multiprocessor Författare: Simon Plato Sammanfattning Rapporten beskriver två schemaläggnings metoder.
Läs mer32 Bitar Blir 64 Sammanfattning
32 Bitar Blir 64 Sammanfattning Syftet med rapporten är att ge en insyn i det tillvägagångssätt och problem som uppstod i utvecklingen från 32 bitars CPUs till 64 bitars CPUs samt inblick i skillnaden
Läs merDatorarkitekturer med operativsystem ERIK LARSSON
Datorarkitekturer med operativsystem ERIK LARSSON Översikt Minnets komponenter Minneshierarkin Cacheminne Paging Virtuellt minne Minnets komponenter Enhet för indata Primärminne (CPU) Enhet för utdata
Läs merDatorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)
Datorsystem 2 CPU Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur CPU Visning av Akka (för de som är intresserade) En dators arkitektur På en lägre nivå kan vi ha lite olika
Läs merFilsystem - Inode. Datorteknik. Minnets komponenter. Programexekvering. Enhet för indata. Enhet för utdata CPU. Primärminne.
Datorteknik Filsystem - Inode ERIK LARSSON ABBA: Dancing Queen Minnets komponenter Programexekvering Enhet för indata CPU Enhet för utdata Program i högnivåspråk.. Z:=(Y+X)*3. Kompilator Exekverbart program
Läs merSVAR TILL TENTAMEN I DATORSYSTEM, VT2013
Rahim Rahmani (rahim@dsv.su.se) Division of ACT Department of Computer and Systems Sciences Stockholm University SVAR TILL TENTAMEN I DATORSYSTEM, VT2013 Tentamensdatum: 2013-03-21 Tentamen består av totalt
Läs merAtt köpa ny dator SeniorNet Lidingö Januari-2016
Att köpa ny dator SeniorNet Lidingö Januari-2016 Att tänka på innan du köper bärbar dator Behov/Användningsområde Om man mest ska använda datorn till epost, Internet, lagra foton och skriva dokument i
Läs merDigitala System: Datorteknik ERIK LARSSON
Digitala System: Datorteknik ERIK LARSSON Huvudled (H) Trafikljus för övergångsställe Trafikljus för huvudled (H) Trafikljus: Sväng vänster (H->T) Gående - vänta Trafikljus för tvärgata (T) Tvärgata (T)
Läs merFöreläsningsanteckningar 5. Cacheminnen
Föreläsningsanteckningar 5. Cacheminnen Olle Seger 2012 Anders Nilsson 2016 1 Inledning Bakgrunden till att cacheminnen behövs för nästan alla datorer är enkel. Vi kan kallt räkna med att processorn är
Läs merDigitala System: Datorteknik ERIK LARSSON
Digitala System: Datorteknik ERIK LARSSON Översikt Minnets komponenter Minneshierarkin Cacheminne Paging Virtuellt minne Minnets komponenter Enhet för indata Primärminne (CPU) Enhet för utdata Sekundärminne
Läs merDatorteknik ERIK LARSSON
Datorteknik ERIK LARSSON Laborationer Gå bara på tillfällen där du är anmäld. Moment svarar mot 1.5hp, dvs 40 timmar arbete Schemalagd tid: 4*2 (lektioner)+4*4(laborationer)=20 timmar Material: Finns på
Läs merTentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60)
Lunds Universitet LTH Tentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60) Skrivtid: 08.00-13.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng
Läs merHyper-Threading i Intelprocessorer
Lunds Tekniska Högskola Campus Helsingborg DATORARKITEKTURER MED OPERATIVSYSTEM EITF60 RAPPORT Hyper-Threading i Intelprocessorer 4 december 2017 Rasmus Hanning IDA2 Sammanfattning Det har sedan den första
Läs merUtvecklingen från en 8 bitars till en 16 bitars mikroprocessor
Utvecklingen från en 8 bitars till en 16 bitars mikroprocessor Sammanfattning: Utvecklingen från processor till processor är inte lätt. Det finns många beslut som måste tas när det gäller kompatibilitet,
Läs merHF0010. Introduktionskurs i datateknik 1,5 hp
HF0010 Introduktionskurs i datateknik 1,5 hp Välkommna - till KTH, Haninge, Datateknik, kursen och till första steget mot att bli programmerare! Er lärare och kursansvarig: Nicklas Brandefelt, bfelt@kth.se
Läs merLunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:
Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer
Läs merEn processor kan ha en klockfrekvens på flera GHz. Det går alltså a9 exekvera en instruk=on väldigt for, givet a9 instruk=onen finns i processorn.
1 2 En processor kan ha en klockfrekvens på flera GHz. Det går alltså a9 exekvera en instruk=on väldigt for, givet a9 instruk=onen finns i processorn. Instruk=onerna =ll programmet som exekveras finns
Läs mer0.1. INTRODUKTION 1. 2. Instruktionens opcode decodas till en språknivå som är förstålig för ALUn.
0.1. INTRODUKTION 1 0.1 Introduktion Datorns klockfrekvens mäts i cykler per sekund, eller hertz. En miljon klockcykler är en megahertz, MHz. L1 cache (level 1) är den snabbaste formen av cache och sitter
Läs merFlera processer. Minneshantering. Trashing kan uppstå ändå. Ersätta globalt
Flera processer Minneshantering Operativsystem lektion 6 Potentiellt problem: Den sida som plockas bort behöver inte vara den sida som används minst!! Det kan finnas andra processer som inte körs eller
Läs merParallellism i NVIDIAs Fermi GPU
Parallellism i NVIDIAs Fermi GPU Thien Lai Phu IDA2 Abstract This report investigates what kind of computer architecture, based on Flynn s taxonomy, is used on NVIDIAs Fermi-based GPU to achieve parallellism
Läs merArm Cortex-A8 Pipeline
Marcus Havrell Dahl - 941206 Arm Cortex-A8 Pipeline Sammanfattning Arm Cortex-A8 processorn är en energisnål men samtidigt kraftfull enhet. Beroende på implementationen kan den ha en klockhastighet på
Läs merCacheprobe: programbibliotek för extrahering av cacheminnesparametrar
Cacheprobe: programbibliotek för extrahering av cacheminnesparametrar Gabriel Gerhardsson Cacheprobe p.1/38 Abstract Kan analytiskt ta reda på associativitet, line storlek och storlek på processorns cacheminnen
Läs merTentamen den 17 mars 2016 Datorteknik, EIT070
Lunds Universitet LTH Tentamen den 17 mars 2016 Datorteknik, EIT070 Skrivtid: 14.00-19.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng För betyg 4 krävs 30 poäng
Läs merDugga 1 status 41 godkända 39 ej godkända ERIK LARSSON
Datorteknik Dugga 1 status 41 godkända 39 ej godkända ERIK LARSSON e.g. Harvard or Boston Home About Rankings Survey Universities GRUP Initiative Conference Study in China Advertise with Us Home>> Global
Läs merHur det går att minska effektutvecklingen i en processor genom att ändra pipeline
Hur det går att minska effektutvecklingen i en processor genom att ändra pipeline Linda Wapner HT2018 EITF60 Sammanfattning Effektutvecklingen i en processor har länge ökat genom att klockfrekvensen för
Läs merDigital- och datorteknik
Digital- och datorteknik Föreläsning #21 Biträdande professor Jan Jonsson Institutionen för data- och informationsteknik Chalmers tekniska högskola Teknologier och hierarkier Minnestyper Vi har hittills
Läs merLUNDS UNIVERSITET. Parallell exekvering av Float32 och INT32 operationer
LUNDS UNIVERSITET Parallell exekvering av Float32 och INT32 operationer Samuel Molin Kursansvarig: Erik Larsson Datum 2018-12-05 Referat Grafikkort utför många liknande instruktioner parallellt då typiska
Läs mer4 grundregler. Minneshantering. Problemet. Windows minkrav
4 grundregler 1. Man kan aldrig få för mycket minne 2. Minnet kan aldrig bli för snabbt Minneshantering 3. Minne kan aldrig bli för billigt 4. Programmens storlek ökar fortare än minnet i datorerna (känns
Läs merEn Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär:
Lösningsförslag för 725G45-tentan 3/11-10 1. Vad menas med Von Neumann-arkitektur? (2p) En Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär: Data och instruktioner lagras i samma
Läs merPipelining i RISC-processorn. Joakim Lindström Institutionen för informationsbehandling Åbo Akademi E-post: jolindst@abo.fi
Pipelining i RISC-processorn Joakim Lindström Institutionen för informationsbehandling Åbo Akademi E-post: jolindst@abo.fi Innehållsförteckning 1. Inledning 2. Historia: Intel 8086 (1978) till Pentium
Läs merDatorhistorik. Föreläsning 3 Datorns hårdvara EDSAC. Eniac. I think there is a world market for maybe five computers. Thomas Watson, IBM, 1943
Datorhistorik Föreläsning 3 Datorhistorik Datorns uppbyggnad, komponenter Processor, primärminne, sekundärminne Minneshierarkier Inbyggda system, stora datorer I think there is a world market for maybe
Läs merHantering av hazards i multi-pipelines
Campus Helsingborg IDA2 Hantering av hazards i multi-pipelines Av: Mounir Salam Abstract Det finns tre olika problem som kan uppstå när vi kör en pipeline med flera steg. De tre problemen även så kallade
Läs merDigitalteknik och Datorarkitektur 5hp
Digitalteknik och Datorarkitektur 5hp Minnes-hierarkier och Cache 12 maj 2008 karl.marklund@it.uu.se issa saker använder vi ofta Dessa saker vill vi ha nära till hands Storleken har betydelse Litet är
Läs merRandom Access Memory. Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya
Random Access Memory Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya Introduktion Historia Vad är RAM? Hur fungerar RAM? Dataöverföring, tidsklocka och termer Vilka är de olika typerna av RAM? Vad
Läs merPOLICYSAMMANFATTNING FRÅN ENTREPRENÖRSKAPSFORUM VARFÖR SILOTÄNKANDE KAN VARA BRA FÖR INNOVATION
POLICYSAMMANFATTNING FRÅN ENTREPRENÖRSKAPSFORUM VARFÖR SILOTÄNKANDE KAN VARA BRA FÖR INNOVATION PS från Entreprenörskapsforum En viktig uppgift för Entreprenörskapsforum är att finna nya vägar att nå ut
Läs merMinnets komponenter. Digitala System: Datorteknik. Programexekvering. Programexekvering. Enhet för utdata. Enhet för indata CPU.
Digitala System: Datorteknik Minnets komponenter ERIK LARSSON Enhet för indata CPU Enhet för utdata Sekundärminne Programexekvering Program i högnivåspråk.. Z:=(Y+X)*3. Kompilator Exekverbart program i
Läs merFöreläsning 3.1: Datastrukturer, en översikt
Föreläsning.: Datastrukturer, en översikt Hittills har vi i kursen lagt mycket fokus på algoritmiskt tänkande. Vi har inte egentligen ägna så mycket uppmärksamhet åt det andra som datorprogram också består,
Läs merProcessor pipelining genom historien (Intel i9-intel i7)
Processor pipelining genom historien (Intel i9-intel i7) Besnik Redzepi Lunds Universitet Abstrakt/Sammanfattning Syftet med denna uppsats är att jämföra Intels nya generation processorer och deras pipelining.
Läs merSimulering av brand i Virtual Reality
Simulering av brand i Virtual Reality Bakgrund Användningen av virtual reality (VR, virtuell verklighet) som ett forskningsverktyg inom brandteknik och utrymning har på senare tid visat sig vara mycket
Läs merTentamen den 18 mars svar Datorteknik, EIT070
Lunds Universitet LTH Tentamen den 18 mars 2015 - svar Datorteknik, EIT070 Skrivtid: 14.00-19.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng För betyg 4 krävs 30
Läs merMönster. Ulf Cederling Växjö University Ulf.Cederling@msi.vxu.se http://www.msi.vxu.se/~ulfce. Slide 1
Mönster Ulf Cederling Växjö University UlfCederling@msivxuse http://wwwmsivxuse/~ulfce Slide 1 Beskrivningsmall Beskrivningsmallen är inspirerad av den som användes på AG Communication Systems (AGCS) Linda
Läs merSnacket går. Lärarhäfte med kopieringsunderlag. Catarina Littman Carin Rosander BONNIERS
Snacket går Lärarhäfte med kopieringsunderlag Catarina Littman Carin Rosander BONNIERS B11 Fyra bilder Kopiera bildserierna B 11 a, b, c eller d. Klipp isär bilderna. Dela ut en bild per studerande. Det
Läs merPlaneringsspelets mysterier, del 1
Peter Lindberg Computer Programmer, Oops AB mailto:peter@oops.se http://oops.se/ 28 februari 2002 Planeringsspelets mysterier, del 1 Om jag ska spela ett sällskapsspel för första gången så vill jag att
Läs merÖvergången från vård till vuxenliv. Vad vet vi och vad behöver vi veta?
Övergången från vård till vuxenliv. Vad vet vi och vad behöver vi veta? Ingrid Höjer Professor i socialt arbete Institutionen för socialt arbete Presentationens innehåll: Vad vet vi redan? Kort om situationen
Läs merSIMD i Intel s P5- baserade Pentium MMX
SIMD i Intel s P5- baserade Pentium MMX Maurits Gabriel Johansson - IDA2 Datorarkitekturer med operativsystem - 4 december 2016 SIMD I INTEL S P5-BASERADE PENTIUM MMX 1 Abstrakt Moderna CPU s (Central
Läs merDagens OS. Unix, Linux och Windows. Unix. Unix. En översikt av dagens OS Titt på hur de gör. Många varianter Mycket gemensamt. En del som skiljer
Dagens OS En översikt av dagens OS Titt på hur de gör Unix, Linux och Windows Unix Många varianter Mycket gemensamt Unix En del som skiljer Vanliga program, shell, etc System calls Interupts and traps
Läs merObjektorienterad programmering
Objektorienterad programmering Emil Ahlqvist (c10eat@cs.umu.se) Didrik Püschel (dv11dpl@cs.umu.se) Johan Hammarström (c08jhm@cs.umu.se) Hannes Frimmel Moström (c10hml@cs.umu.se) 1 1. Introduktion 1.1 Objektorienterad
Läs merDigital- och datorteknik
Digital- och datorteknik Föreläsning #21 Biträdande professor Jan Jonsson Institutionen för data- och informationsteknik Chalmers tekniska högskola Teknologier och hierarkier Minnestyper Vi har hittills
Läs merDatorhårdvaruteknik 1DV426 - Seminarie 1
Datorhårdvaruteknik 1DV426 - Seminarie 1 Marcus Wilhelmsson marcus.wilhelmsson@lnu.se 19 mars 2014 Introduktion Detta seminarie behandlar följande: 1. Processorer 2. Minne 3. Chipset 4. BIOS 5. Moderkort
Läs merDatorsystem. Tentamen
Datorsystem Tentamen 2012-03-17 Instruktioner Samtliga svar skall vara motiverade och läsbara. Eventuella tabeller, illustrationer och beräkningar som används för att nå svaret ska också finnas med i lösningen.
Läs merMer datorarkitektur. En titt I datorn Minnen
Mer datorarkitektur En titt I datorn Minnen von Neumann-modellen von Neumann-modellen CPU (Central Processing Unit) Styrenhet hämtar programinstruktioner ALU (Arithmetic and Logical Unit) utför beräkningar
Läs merTentamen den 14 januari 2016 Datorarkitektur med operativsystem, EDT621
Lunds Universitet LTH Tentamen den 14 januari 2016 Datorarkitektur med operativsystem, EDT621 Skrivtid: 08.00-13.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng
Läs merGrundläggande datavetenskap, 4p
Grundläggande datavetenskap, 4p Kapitel 2 Datamanipulation, Processorns arbete Utgående från boken Computer Science av: J. Glenn Brookshear 2004-11-09 IT och Medier 1 Innehåll CPU ALU Kontrollenhet Register
Läs merMin syn på koncepthantering generering och utvärdering
Min syn på koncepthantering generering och utvärdering Linus Granström KN3060, Produktutv. med formgivning Mälardalens högskola 2007-04-25 Inledning Denna essä beskriver författarens syn på de steg i produktutvecklingsprocessen
Läs merDatorarkitekturer med operativsystem ERIK LARSSON
Datorarkitekturer med operativsystem ERIK LARSSON Parallellberäkning Konstant behov av högre prestanda Prestanda har uppnåtts genom: Utveckling inom halvledarteknik Tekniker som:» Cacheminne» Flera bussar»
Läs merCE_O5. Cacheminne. Hemlaboration 2.
IS1500 Exempelsamling till övning CE_O5, 2014 CE_O5. Cacheminne. Hemlaboration 2. 5.1. Medeltidshistoria Diskutera förloppet då CPU:n gör en läsreferens i huvudminnet dvs information kopieras från huvudminne
Läs merJournal via nätet möjlighet eller riskfaktor. Rose-Mharie Åhlfeldt, Högskolan i Skövde
Journal via nätet möjlighet eller riskfaktor Rose-Mharie Åhlfeldt, Högskolan i Skövde Patientens delaktighet/medverkan!?!?! Historik SUSTAINS - Uppsala Uppsala landsting först ut i Sverige och Europa med
Läs merSlutrapport för Pacman
Slutrapport för Pacman Datum: 2011-05-30 Författare: cb222bj Christoffer Bengtsson 1 Abstrakt Jag har under våren arbetat med ett projekt i kursen Individuellt Mjukvaruutvecklingsprojekt. Målet med mitt
Läs merAgenda. Syfte med datorbygge Datorns delar. Datorbygge. Moderkort Processor Minne och hårddisk Instickskort Övrigt
Datorbygge Agenda Syfte med datorbygge Datorns delar Moderkort Processor Minne och hårddisk Instickskort Övrigt Datorbygge Syfte med datorbygge Att alla ska ha byggt ihop en dator eftersom många tror att
Läs merDesignmönster - EMW. Kent Petersson epost1: kentp@cs.chalmers.se epost2: kent.petersson@emw.ericsson.se URL: http://www.cs.chalmers.
Designmönster - EMW Kent Petersson epost1: kentp@cs.chalmers.se epost2: kent.petersson@emw.ericsson.se URL: http://www.cs.chalmers.se/~kentp arbetar på Inst. för Datavetenskap, Cth & Gu, 50% och Software
Läs merLiten introduktion till akademiskt arbete
Högskolan Väst, Inst för ekonomi och IT, Avd för medier och design 2013-09-14 Pierre Gander, pierre.gander@hv.se Liten introduktion till akademiskt arbete Den här texten introducerar tankarna bakom akademiskt
Läs merData visualization on Android
Datavetenskap Opponenter: Tobias Eriksson, Agni Rizk Respondent: Victor Ulhagen Data visualization on Android Oppositionsrapport, C/D-nivå 2010:xx 1 Sammanfattat omdöme av examensarbetet Rapporten är bra
Läs merF5 Introduktion till digitalteknik
George Boole och paraplyet F5 Introduktion till digitalteknik EDAA05 Roger Henriksson Jonas Wisbrant p = b! (s " r) George Boole (1815-1864) Professor i Matematik, Queens College, Cork, Irland 2 Exklusiv
Läs merSyfte. Praktisk datorkunskap. Personal. Kursinfo. Examination- Krav för godkänt. Agenda idag DVG A06
Syfte Praktisk datorkunskap DVG A06 Ge teoretisk förståelse och praktisk erfarenhet om hur en dator är uppbyggd Ge kunskap kring operativsystemets roll, samt ge kunskap om olika operativsystem. Ge praktisk
Läs merFö 2: Minnen. Introduktion. Primärminnet. Interna och externa minnen. Introduktion, Klassificiering
Fö 2: Minnen Introduktion, Klassificiering Primärminne Sekundärminne Minneshiearki Cache-minne Introduktion Primärminnet används för att lagra program och data som är aktuella att använda. Sekundärminnet
Läs merDatorsystem Laboration 2: Minnesmappade bussar
Datorsystem Laboration 2: Minnesmappade bussar Senast uppdaterad: 14 oktober 2012 Version 1.2 Student: Lärare: Underskrift: Underskrift: Datum: Datorsystem Laboration 2 1 Innehåll 1 Inledning 2 1.1 Introduktion..................................
Läs merHantering av begränsat antal skrivningar på Solid State diskar
LTH - LUNDS TEKNISKA HÖGSKOLA Hantering av begränsat antal skrivningar på Solid State diskar Filip Nilsson 2015-12-07 Sammanfattning På senare år har utvecklingen för SSD (Solid State Drive) enheter kommit
Läs merMetod- PM: Påverkan på Sveriges apotek efter privatiseringen
Metod- PM: Påverkan på Sveriges apotek efter privatiseringen Problem Sedan privatiseringen av landets apotek skedde för 3 år sedan är det många som hävdar att apoteken inte har utvecklats till det bättre,
Läs merBalanserade Styrkort. (Balanced Scorecard) En aptitretare från VisVires AB
Balanserade Styrkort (Balanced Scorecard) En aptitretare från VisVires AB Inledning Det torde inte ha undgått någon att vi idag får ett allt större fokus på ekonomi och finansiella resultat. De flesta
Läs merPipelining i Intel Pentium II
Pipelining i Intel Pentium II John Abdulnoor Lund Universitet 04/12/2017 Abstract För att en processor ska fungera måste alla komponenter inuti den samarbeta för att nå en acceptabel nivå av prestanda.
Läs mer1 juli 30 september 2011 Traveas AB (publ) Bookings Enriched
1 juli 30 september 2011 Bookings Enriched org. nr 556739-8143 / Adress Ringen 16 182 73 Stocksund Phone08-51 80 10 00 / Fax 08-51 80 10 10 www.traveas.com Juli till September, 2 2011 TRAVEAS AB (Publ)
Läs merElektroteknik MF1016 föreläsning 9 MF1017 föreläsning 7 Mikrodatorteknik
Elektroteknik MF1016 föreläsning 9 MF1017 föreläsning 7 - Inbyggda system - Analog till digital signal - Utvecklingssystem, målsystem - Labutrustningen - Uppbyggnad av mikrokontroller - Masinkod, assemblerkod
Läs merAtt köpa ny dator SeniorNet Lidingö Februari-2019
Att köpa ny dator SeniorNet Lidingö Februari-2019 Att köpa ny dator Kompakt bordsdator Stationär dator Allt-i-ett-dator Laptop Hybrid (laptop/surfplatta) Agenda Att tänka på innan du köper dator Faktorer
Läs merORDNA DINA BILDER. Var finns bilderna Var bör de finnas
ORDNA DINA BILDER Var finns bilderna Var bör de finnas VAR ÄR MINA BILDER? Några råd till dej som inte kan hitta dina dokument och bilder eller som tycker att de finns på flera ställen och ändå vet du
Läs merStorage. Effektivare datalagring med det intelligenta informationsnätet.
Storage. Effektivare datalagring med det intelligenta informationsnätet. 2 Teknik och samverkan i en gemensam infrastruktur skapar nya möjligheter för effektivare datalagring Datalagring är en central
Läs merDiskprestanda Tester
Linnéuniversitetet Projektrapport Grundläggande Operativsystem 1DV415 Diskprestanda Tester Matteus Gilis, Linus Fogelström 9 januari 2014 Sammanfattning Vi ville utföra läs och skrivhastighets tester mellan
Läs mer