Komma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap
|
|
- Marianne Lindgren
- för 8 år sedan
- Visningar:
Transkript
1 Komma över Memory wall med 3D stacked minne LTH Ingenjörshögskolan vid Campus Helsingborg Institutionen för datavetenskap Christofer Huynh IDA14 EDT621 Lärare: Erik Larsson
2 Abstrakt Memory wall, något som har varit problem inom dator arkitekturen då prestandan av processorer ökar mycket mer gentemot prestandan av minnet, vilket lämnar ett stort hål mellan dessa. Man strävar efter ett minne som man kan tillverka för ett låg pris, är kompakt, snabb och har bra skalbarhet. Det har varit många forskningar inom 3D stacked minne, då man tror att den vanliga DRAM inte kommer att räcka till, och att man behöver en ny teknik. 3D systemet kan vara tekniken som hjälper oss att minska på hålet mellan processorer och minnen. 3D minnen har mindre begränsningar än de 2D minnen, vilket leder till nya arkitekturer som till exempel en Footprint cache som försöker förutse Footprinten (storleken) av varje sida och hämta bara de block som tros behövas.
3 Introduktion Den senaste tiden har studier visat att processernas prestanda ökar med 50 % varje år medan prestandan på DRAM (minnet) bara ökar med 10 % varje år vilket lämnar ett stort hål mellan dessa processorer och DRAM, detta kallas även för Memory wall. I rapporten Overcoming the memory wall (Inouye et al 2012:3) nämns detta som ett problem då hålet blir större och större vilket gör att man inte längre kan öka prestandan genom att lägga till mer processorer. Den mest minneskrävande applikation just nu är video encoding, bara behandlingen och segmenteringen av 30 frames tar 15 minuter på en fyra-kärnig processor med 24GB RAM. Författarna menar att problemet inte var antal processor eftersom varje processor kördes bara runt 50-60%. Det man hade problem med var minnesåtkomsten av minnet och som framerate ökar med upplösningen, kan detta tiden förlänga med timmar eller även månader bara för att behandla en enda sekund av videon. En av den mest använda lösningen till Memory wall är användningen av cacheminnen. Man har försökt att hitta andra lösningar eller förbättra cacheminnen, som till exempel out of order execution som låter instruktioner att exekveras även om instruktionen före den har blivit blockerad eller innan den är färdig. Tyvärr så behöver dessa tekniker komplexa kretsar vilket betyder mer el konsumtion, som leder till reducering av investeringar av dessa komplexa tekniker. Shih-Lien Lu et al nämner i deras artikel Scaling the Memory Wall (2012:271) att en ideal minne måste ha ett låg pris, kompakt och ha en bra skalbarhet. Den ska även ha en snabb minnesåtkomst som matcha CPU frekvensen. Det viktigaste är att den ska vara energi-snål. Hög el konsumtion leder till komplicerade termiska lösningar vilket ökar omkostnaden för ett datorsystem. Författarna menar att teknologer har i många år försökt att hitta en ersättare till DRAM. Tyvärr finns det ingen klar ersättare för tillfället vilket betyder att vi måste kunna arbeta runt de begräsningar DRAM har och försöka få ut det bästa av vad DRAM har att ge i åtminstone 5 till 7 år till. Författarna föreslog också om att 3D stacking kan vara en möjlig lösning till att förlänga livs-längden av DRAM. Problemet med DRAM Två av de största problemen som man har med DRAM är skalbarhet och el konsumtionen (Shih-Lien Lu et al 2012:272). Författarna menar att DRAM fortsätter att krympa i fysiskt storlek, vilket gör det svårt att behålla kapaciteten på storleken samtidigt som man gör minnescellerna mindre. El konsumtionen har nyligen blivit ett stort problem för DRAM. Shih-Lien Lu et al referera till en publikation från 2009 Future Scaling of Processor-Memory Interfaces in the Proceedings of Super Computing, 2009 av J.Ahn, et al. Där visa författarna att DRAM chipen konsumera lika mycket eller mycket mer el än CPU:n när systemet kör ett krävande applikation. Anledningen till att el konsumtionen är så hög för DRAM är att man har fokuserat på att maximera effektiviteten på ytan för att minska på kostnaderna. Den nuvarande organiseringen av DRAM array (block) aktiverar tusentals bitar med varje begäran, returnera bara ett låg antal bitar till processorn, vilket gör detta väldigt ineffektivt. Ett annat exempel på el ineffektiviteten är på grund av att IC-kretsen är ihopsatt i något som kallas för DIMM (Dual-in-line Memory Module) som är en typ av minnesmodul med en datakanal som är 64 bitar bred. Det finns en chans att flera DIMM delar samma kanal som kommunicera med processorn, vilket leder till att en enda begäran måste aktivera flera IC kretsar som leder till att det körs mer än laddning.
4 En av anledningar till avtagningen av prestandan är att processorkärnan måste vänta på fördröjningen i DRAM när den ska hämta den data processorn behöver för att kunna exekveras (Inouye et al 2012:8). Här menar författarna att man skulle kunna öka bandbredden genom att öka bredden på data-bussen, men detta betyder en ökning av kostnaden. Ett annat förslag är att man öka på buss hastigheten istället, dock skulle detta leda till en högre el konsumtion. Det finns många olika förslag på att modifiera DRAM för att bli av med dessa problem, men det finns självklart nackdelar med modifiering vilket leder till forskningar inom 3DRAM för att lösa dessa problem. 3D stacked minne (3DRAM) Upplägget i ett 3DRAM är DRAM mikrochips som är staplad på varandra och är sammankopplade via vertikalt separationer. Genom att stapla minnet vertikalt på varandra skapas ett 3D IC-krets. Det finns olika design till detta som har sina för- och nackdelar. Ett exempel på detta är Intels Hybric Memory Cube (HMC), vilket sägs vara upp till 7 gånger mer energi effektiv än DDR3 (Inouye et al 2012:8). HMC är ett RAM inferface för TSV (through-silicon vias). Teknologin skapar mikrometer stora hål genom en vertikal kisel chip vilket skapar en mycket kompakt arkitektur. Bild 1 TSV, tagen från (Inouye et al 2012:4) Bild 2 visar en exempel på ett grundläggande struktur i ett 3D CPU-minne. CPU:n och L1 cache ligger på samma lager, L2 cache är staplad ovanför och primärminnet finns på de lager som är staplade ovanpå L2 cache lagret. Författarna menar att med ett 3D minne kan man dela upp stora chips till mindre IC-kretsar vilket leder till mindre kostnader då den minskar på tillverkningskostnaderna. Krets lagret kan byggas på olika processorer eller kiselskivor istället för att bli begränsad av en enda kiselskiva. Kablarna kan gå igenom mikrochipen istället för att lindra allting horisontellt som betyder att man få kortare kabel, vilket leder till en förminskning av fördröjningen i kretsen. Dessutom reducera detta även el konsumtionen, därmed minskas även värmebildningen och batterilivet förlängs vilket leder till att procedur kostnaden sjunker. Bild 2 Ett grundläggande 3D CPU-minne struktur (Inouye et al 2012:11) Nackdelarna med 3D minne är att det finns risk för att de blir defekta under tillverkningen, som till exempel hur värmet fördelas inom de staplade minnena.
5 Ändringar i arkitekturen i ett 3D minne Det enklaste ändringen man kan göra är att öka bredden på minnes-bussen. I ett 2D system är det mycket begränsat av antalet stift. Däremot i ett 3D system som använder TSV (through-silicon-vias) gör detta möjlig att ha tusen, om inte miljontals av anslutningar mellan processorn och primärminnet. Inouye et al (2012:15) nämner att det första logiska steget man tar är att öka minnesbussen till storleken av cache linjen för att utnyttja L2 cache maximalt. Man kan också öka storleken på en cache linje, men eftersom minnesåtkomsten för L2 cache ökas linjärt med cache linjens storlek så blir det inte så optimalt att göra det. En viktig optimering för ett 3D system är att öka klockfrekvensen för minnes-bussen och minnesstyrningen. I ett 2D system behöver inte minnesstyrningen att schemalägga någon begäran som är snabbare än vad DRAM:en kan respondera. Däremot när man växlar till ett 3D system där fördröjningstiden i primärminnet är drastiskt reducerad behöver man öka klockfrekvensen för att kompensera för ändringen. Inouye et al (2012:16) poängterar att denna ändring inte gör mycket ändring i prestandan, men det krävs för att kunna ta fördel av låg fördröjningstid av minnesåtkomsten. Dessa två ändringar som nämndes ovan är betraktas som ett grundläggande del av ett 3D system. Däremot är det möjligt att dela funktionella block över flera lager i ett 3D system. Till exempel, en minnesbank som innehåller rader av cell bitar och de separata peripheral logic (rad de-kodare, sense amp, rad buffert, kolumnväljare) kan delas upp mellan två lager som separera minnet från logiska enheten (Inouye et al 2012:15). Författarna nämner om en 3D minnes arkitektur som har fyra lager av DRAM minne och ett lager av DRAM:ens peripheral logic på toppen av processorn. Varje rank är splittrade över kisel lagren för att reducera längden på kabeln och kapacitansen (Figur b i bild 4). Figur a i bild 4 visar ett vanlig 2D DRAM som är staplade ovanför en processor. Fördelen med strukturen i figur b, genom att separera minnet från logiska enheten så kan man optimera varje lager och ge dem olika uppgifter genom olika process teknologi. Bild 3 Tagen från (Inouye et al 2012:16)
6 Ideala Cache för 3D stacked minne I artikeln Die-Stacked DRAM Caches for Servers: Hit Ratio, Latency, or Bandwidth? Have It All with Footprint Cache (Jevdjic et al 2013:406) ställer författarna upp några villkor för att ett 3D stacked cacheminne ska vara ideal. Ett cache minne ska bland annat vara snabb på att hitta tags, lagringen av tags och andra metadata ska vara minimalt. Off-chip trafiken ska också vara minimal. Den ska ha hög hit ratio och fördröjningstiden för hit och miss ska vara så låg så möjligt. Den lokala minnesåtkomsten måste vara snabb, och sist måste den ha en effektiv kapacitet hantering. Författarna jämför 2 cache design, Block-based cache och Page-based cache. De båda strukturen har sina för- och nackdelar, men varför inte låta dessa två tekniker komplimera varandra? Följande diagram visar en jämförelse mellan block- och page-based designen. Tabell 1 Jämförelse, tagen från (Jevdjic et al 2013:407) Författarna menar att page-based strukturen är generellt den bättre av de två designen. En ideal cache för 3D stacked minne är om man kan få de egenskaper i page-based struktur fast utan onödig trafik och med en bättre kapacitet hantering. Författarna föreslår något som heter Footprint cache en blandning mellan dessa två designen. För att uppnå dessa egenskaper i Footprint cache, används ett Footprint prediction, den förutspå alla block inom en sida som kommer att bli efterfrågade. Icke-förutspådda som begärs blir till cache miss, vilket leder till förluster i prestandan och energi, detta kallas för underprediction. Overprediction är när ett hämtat block inte används på grund att den har blivit ersatt, vilket bara slösar på bandbredd och energi. Footprint cache kan förutspå de block som kommer att bli efterfrågad med en hög precision, genom att kontrollera de tillgängliga data som finns i cacheminnet. Den första instruktionen innehåller värdefulla informationer om data som finns i sidan och är en god indikation vad som kommer att bli efterfrågad i den sidan. Genom att kontrollera vilka andra blocks den koden har access till och lagra den information kan man senare förutse med hög precision, vilka block som kommer att bli efterfrågade när en annan sida, hämtar information från samma kod. Footprint cache använder sig av en set-associative tag array. Den har två vektorer som håller reda på valid och dirty blocks (se bild 4). Tag arrayn är en pekare som koppla samman sidan till en prediction historik. Prediction historiken finns i en annan struktur som kallas för Footprint History Table (FHT). Där lagras förutspådda footprints som tros komma begäras. FHT har ett set-associative struktur och indexerad i par av PC (instruktionspekare) och offset key. FHT uppdateras varje gång en sida har blivit ersatt.
7 Bild 4 Design för en Footprint cache, tagen från (Jevdjic et al 2013:408) FHT används bara när man inte hitta en sida som innehåller adressen man söker. PC kommer att kontrollera vilken instruktion och offset bit av den adressen som orsakade missen, sedan returneras den förutspådda footprinten. När en miss uppstår kontrolleras det om PC & offset paren finns i FHT, finns den kommer de resterande blocken (som finns i den förutspådda footprinten) att hämtas från minnet. Sidan kommer sedan få en pekare som pekar på ett tag i FHT. Detta är föresatt att PC och offset paret finns i FHT, vilket det borde göra eftersom den redan har förutspått det. Om det inte innehåller PC och offset paret, vilket brukar hända i början när programmet exekveras, kommer en ny information och en pekare att allokeras i FHT. Footprint cache lyckades att ha den hit ratio som en page-based struktur och samtidigt ha samma bandbredd som block-based strukturen (Jevdjic et al 2013:414). I en simulation av författarna lyckades de demonstrera att Footprint cache ökade prestandan med 57 % i genomsnitt.
8 Diskussion 3D stacked minnes system är en lovande teknik som kan hjälpa oss att komma över memory wall. Men att det är ett system betyder inte att det inte finns begränsningar och utmaningar. Det har nämnts ovan att värme är ett problem inom 3D stacked system. Det finns många forskningar om olika metoder på hur man kan lösa detta problem, men även det har begränsningar och det kostar en del. Ett annat problem är produktionen. Det krävs mycket kommunikation för processor- och minnestillverkarna för att få 3D systemet att fungera. Dessa problem leder till att utvecklingen av 3D stacked minne går långsam framåt. Dock har vi ju sett signifikanta skillnader genom 3D arkitekturen. Det tar bort de begränsningar som DRAM har och genom att ta vara på denna möjlighet kan vi minska hålet mellan processorer och minnet eller kanske också bryta oss fria från memory wall. I rapporten gavs en exempel på DRAM cachearkitektur genom att använda sig av 3D stacked minne. Denna arkitektur kanske inte är perfekt, men det är något som bidra till utvecklingen av 3D stacked minne och det har gett några positiva resultat. I nuläget så dominerar de vanliga DRAM marknaden, visst det är många brister och den är inte perfekt men det har fungerat i det senaste decenniet, vilket är förståeligt att man är mer bekväm med det. Genom att modifiera till exempel cacheminnen så kan vi åtminstone förlänga användningen av den traditionella DRAM. Men hur länge kommer det att hålla, med den takten prestandan ökar i processorn kommer minnet att halka efter ännu mer vilket gör att man inte kan öka på systemets prestanda genom att bara lägga till mer processorer. Detta kommer att vara ett intressant ämne framöver, om man kan utveckla 3D stacked minne så att den blir en lämplig ersättare till de traditionella DRAM.
9 Källförteckning Lien Lu, Shih, Karnik, Tanay, Srinivasa, Ganapati, Chao, Kai-Yuan, Carmean, Doug, Held, Jim (2012), Scaling the Memory Wall, Hillsboro Oregon, IEEE/ACM International Conference on Computer- Aided Design (ICCAD); 11/5/2012, sidorna Inouye, Jennifer, Molloy, Paul, Wisler, Matt (2012), Overcoming the memory wal, Oregon, Oregon State University, sidorna 3-4, 8-11, Jevdjic, Djordje, Volos, Stavros, Falsafi, Babak (2013), Die-Stacked DRAM Caches for Servers: Hit ratio, Latency, or Bandwidth? Have it All with Footprint cache, ISCA '13 Proceedings of the 40th Annual International Symposium on Computer Architecture, ACM, New York, sidorna , 414.
SVAR TILL TENTAMEN I DATORSYSTEM, VT2013
Rahim Rahmani (rahim@dsv.su.se) Division of ACT Department of Computer and Systems Sciences Stockholm University SVAR TILL TENTAMEN I DATORSYSTEM, VT2013 Tentamensdatum: 2013-03-21 Tentamen består av totalt
Läs merMESI i Intel Core 2 Duo
MESI i Intel Core 2 Duo Sammanfattning Denna rapport beskriver en processor (Intel Core 2 Duo) vars cache coherence protokoll är MESI. Rapporten beskriver hur processorn är uppbyggd, hur många kärnor den
Läs merHF0010. Introduktionskurs i datateknik 1,5 hp
HF0010 Introduktionskurs i datateknik 1,5 hp Välkommna - till KTH, Haninge, Datateknik, kursen och till första steget mot att bli programmerare! Er lärare och kursansvarig: Nicklas Brandefelt, bfelt@kth.se
Läs merHantering av hazards i pipelines
Datorarkitektur med operativsystem Hantering av hazards i pipelines Lisa Arvidsson IDA2 Inlämningsdatum: 2018-12-05 Abstract En processor som använder pipelining kan exekvera ett flertal instruktioner
Läs merMulti-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.
Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant. Sammanfattning När processorns klockhastighet ökar medför det en ökning av instruktioner vilket såklart ökar
Läs mer0.1. INTRODUKTION 1. 2. Instruktionens opcode decodas till en språknivå som är förstålig för ALUn.
0.1. INTRODUKTION 1 0.1 Introduktion Datorns klockfrekvens mäts i cykler per sekund, eller hertz. En miljon klockcykler är en megahertz, MHz. L1 cache (level 1) är den snabbaste formen av cache och sitter
Läs merDatorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)
Datorsystem 2 CPU Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur CPU Visning av Akka (för de som är intresserade) En dators arkitektur På en lägre nivå kan vi ha lite olika
Läs merCacheminne Intel Core i7
EDT621 Datorarkitekturer med operativsystem 7,5 hp 2015-12-07 Cacheminne i Intel Core i7 Författare: Adnan Karahmetovic Handledare: Erik Larsson Innehåll 1. Inledning... 1 1.1 Syfte... 1 1.2 Frågeställning...
Läs merCacheminne i en Intel Core 2 Duo-processor
Peter Hesslow EDT621 Cacheminne i en Intel Core 2 Duo-processor Abstrakt Det finns många olika sätt att bygga upp ett datorminne på, och med en flerkärnig processor så blir alternativen ännu fler. Denna
Läs merEmil Kristiansson Kurs: EDT621 Delmoment: Rapport. En introduktion till Smart cache
En introduktion till Smart cache 1 Sammanfattning Syftet med den här rapporten är att ge en introduktion till tekniken smart cache för läsaren. Smart cache är en teknik som låter de olika cacheminnena
Läs merMinnet från processorns sida Datorteknik
Minnet från processorns sida Datorteknik ERIK LARSSON Processorn ger kommandon/instruktioner med en adress och förväntar sig data. Exempel: READ(ADR) -> DATA Fysisk adress Logisk adress READ 00001000 READ
Läs merAtt köpa ny dator SeniorNet Lidingö Januari-2016
Att köpa ny dator SeniorNet Lidingö Januari-2016 Att tänka på innan du köper bärbar dator Behov/Användningsområde Om man mest ska använda datorn till epost, Internet, lagra foton och skriva dokument i
Läs merPrestandapåverkan på databashanterare av flertrådiga processorer. Jesper Dahlgren
Prestandapåverkan på databashanterare av flertrådiga processorer av Sammanfattning Behandling av information bli vanligare i dagens samhälle och för att klara denna uppgiften används ofta en databashanterare
Läs merGrundläggande datavetenskap, 4p
Grundläggande datavetenskap, 4p Kapitel 2 Datamanipulation, Processorns arbete Utgående från boken Computer Science av: J. Glenn Brookshear 2004-11-09 IT och Medier 1 Innehåll CPU ALU Kontrollenhet Register
Läs merDatorarkitekturer med Operativsystem
Lunds Tekniska Högskola Campus Helsingborg Datorarkitekturer med Operativsystem EDT621 Rapport Cacheminneshantering för ARM3-processorer 7 december 2015 Pierre Aupeix dat11pau@student.lu.se 1 Abstract
Läs merDatakommunikation med IR-ljus.
Datakommunikation med -ljus. I den här uppgiften skall du kommunicera med hjälp av infrarött () ljus. Du skall kunna sända tecken från tangentbordet samt ta emot tecken och visa dem på skärmen. Genom att
Läs merDet första steget blir att titta i Svensk MeSH för att se om vi kan hitta några bra engelska termer att ha med oss på sökresan.
Sökexempel - Hälsovägledare Hälsovägledning med inriktning mot olika folkhälsoproblem som t ex rökning, tips på hur man går tillväga för att göra en datasökning och hur man även kontrollerar om artiklarna
Läs merDigital- och datorteknik
Digital- och datorteknik Föreläsning #21 Biträdande professor Jan Jonsson Institutionen för data- och informationsteknik Chalmers tekniska högskola Teknologier och hierarkier Minnestyper Vi har hittills
Läs merCacheminne i en AMD Opteron Processor
Handledare: Erik Larsson Lunds Tekniska Högskola HT15 Cacheminne i en AMD Opteron Processor En rapport om cacheminne och dess struktur, i en 12 kärnig AMD Opteron Magny-Cours processor. Författare: Hamza
Läs merLunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:
Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60 Superscalar vs VLIW Cornelia Kloth IDA2 Inlämningsdatum: 2018-12-05 Abstract Rapporten handlar om två tekniker inom multiple issue processorer
Läs merFöreläsningsanteckningar 3. Mikroprogrammering II
Föreläsningsanteckningar 3. Mikroprogrammering II Olle Seger 2012 Anders Nilsson 2016 1 Inledning Datorn, som vi byggde i förra föreläsningen, har en stor brist. Den saknar I/O. I denna föreläsning kompletterar
Läs merHannes Larsson - IDA 2, LTH Campus Helsingborg. NEC V R 4300i. Interlock-handling EDT621
Hannes Larsson - IDA 2, LTH Campus Helsingborg NEC V R 4300i Interlock-handling EDT621 Läsperiod 2, 2017 Innehållsförteckning s.2 - Förord s.2 - Inledning s.2 - NEC VR-4305 s.3 - Pipeline s.4 - Interlocks
Läs merSYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR
SYNKRONISERING I EN SHARED MEMORY MULTIPROCESSOR EN INBLICK I HUR INTERCONNECTION OCH NUMA FUNGERAR DEN 5 DECEMBER 2016 FÖRFATTARE: NIKLAS SCHLIKER Examinator: Erik Larsson Innehåll Abstrakt:... 2 1.1
Läs merCache-koherens protokoll MESI och MOSI
Handledare: Erik Larsson Lunds Tekniska Högskola HT2016 Cache-koherens protokoll MESI och MOSI Författare: Adnan Mohamed Abstrakt Cache koherens protokoll hanterar cacheminnet i ett multiprocessor system,
Läs merSvar till tentamen den 16 december 2013 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng
Lunds Universitet LTH Ingenjörshögskolan, Helsingborg Svar till tentamen den 16 december 2013 Datorarkitekturer med operativsystem, EDT621, 7,5 poäng Skrivtid: 08.00-13.00 Tillåtna hjälpmedel: Inga. Maximalt
Läs merÖvning1 Datorteknik, HH vt12 - Talsystem, logik, minne, instruktioner, assembler
Övning1 Datorteknik, HH vt12 - Talsystem, logik, minne, instruktioner, assembler Talsystem Talsystem - binära tal F1.1) 2 n stycken tal från 0 till 2 n 1 F1.2) 9 bitar (512 kombinationer) Talsystem - 2-
Läs merEn Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär:
Lösningsförslag för 725G45-tentan 3/11-10 1. Vad menas med Von Neumann-arkitektur? (2p) En Von Neumann-arkitektur ( Von Neumann-principen i föreläsning 1) innebär: Data och instruktioner lagras i samma
Läs merHyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2
Hyper Threading Intels implementation av SMT Datorarkitekturer med operativsystem - EITF60 Felix Danielsson IDA2 Sammanfattning Simultaneous multithreading (SMT) är en teknik som används i processorer
Läs merFöreläsning 3.1: Datastrukturer, en översikt
Föreläsning.: Datastrukturer, en översikt Hittills har vi i kursen lagt mycket fokus på algoritmiskt tänkande. Vi har inte egentligen ägna så mycket uppmärksamhet åt det andra som datorprogram också består,
Läs merDesignmönster - EMW. Kent Petersson epost1: kentp@cs.chalmers.se epost2: kent.petersson@emw.ericsson.se URL: http://www.cs.chalmers.
Designmönster - EMW Kent Petersson epost1: kentp@cs.chalmers.se epost2: kent.petersson@emw.ericsson.se URL: http://www.cs.chalmers.se/~kentp arbetar på Inst. för Datavetenskap, Cth & Gu, 50% och Software
Läs merRapport (1,5 HP) Lunds Universitet HT15
Rapport (1,5 HP) Lunds Universitet HT15 Cache-koherens protokoll i Intel Core i7 En rapport om cache-koherens och protokollet som används i Intel Core i7 processorer för att hålla minnet koherent Författare:
Läs merTest: Optimerad fallprovning med Dell, Intel och Altair
Test: Optimerad fallprovning med Dell, Intel och Altair Fredrik Nordgren, M.Sc. M.E. (Master of Science in Mechanical Engineering), Applikationsingenjör, Altair Eric Lequiniou, Chef, High Performance Computing,
Läs merProgrammering av stegmotorer ett miniprojekt i samarbete med Svensk Maskinprovning
Programmering av stegmotorer ett miniprojekt i samarbete med Svensk Maskinprovning Daniel Leonardsson dale0010@student.umu.se Kajsa Persson kape0038@student.umu.se I samarbete med Svensk Maskinprovning,
Läs merHur BitTorrent fungerar
Hur BitTorrent fungerar dator8.info Introduktion till hur BitTorrent fungerar BitTorrent är ett protokoll som möjliggör snabb nedladdning av stora filer med minst Internet bandbredd. Det kostar inget att
Läs merRandom Access Memory. Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya
Random Access Memory Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya Introduktion Historia Vad är RAM? Hur fungerar RAM? Dataöverföring, tidsklocka och termer Vilka är de olika typerna av RAM? Vad
Läs merLära känna skrivbordet
Är det första gången du använder Windows 7? Den här versionen har mycket gemensamt med tidigare versioner av Windows, men du kan behöva hjälp med att få upp farten. Den här guiden innehåller praktisk information
Läs merEn överblick på cachedesignen i Intels mikroarkitektur Nehalem
En överblick på cachedesignen i Intels mikroarkitektur Nehalem Tillsammans med utvecklingen av cacheminnen förekommer det även ett flertal problem med att styra och organisera data. Trots att det sker
Läs merInstruktioner för Brf Siljans elektroniska låssystem
Erik Åman 2016-02-28 2.0 1 (6) Instruktioner för Brf Siljans elektroniska låssystem 1 Introduktion... 1 1.1 Varför nytt låssystem?... 1 1.2 Utvärderingsperiod... 2 2 Låssystemet i korthet... 2 3 Nycklar...
Läs merSIMD i Intel s P5- baserade Pentium MMX
SIMD i Intel s P5- baserade Pentium MMX Maurits Gabriel Johansson - IDA2 Datorarkitekturer med operativsystem - 4 december 2016 SIMD I INTEL S P5-BASERADE PENTIUM MMX 1 Abstrakt Moderna CPU s (Central
Läs merVad är KiselGermanium?
Vad är KiselGermanium? Kiselgermanium, eller SiGe, får nog sägas vara den nya teknologin på modet inom området integrerade kretsar för radiofrekvenser, RF-ASIC. Det kan vara på sin plats med en genomgång
Läs merLUNDS UNIVERSITET. Parallell exekvering av Float32 och INT32 operationer
LUNDS UNIVERSITET Parallell exekvering av Float32 och INT32 operationer Samuel Molin Kursansvarig: Erik Larsson Datum 2018-12-05 Referat Grafikkort utför många liknande instruktioner parallellt då typiska
Läs merHur kör vi egentligen en undersökning om trafikanters beteende och nya hastighetsgränser utifrån en bussförares perspektiv?
Hur kör vi egentligen en undersökning om trafikanters beteende och nya hastighetsgränser utifrån en bussförares perspektiv? NTF Skåne 2009 Hur kör vi egentligen en undersökning om trafikanters beteende
Läs mer32 Bitar Blir 64 Sammanfattning
32 Bitar Blir 64 Sammanfattning Syftet med rapporten är att ge en insyn i det tillvägagångssätt och problem som uppstod i utvecklingen från 32 bitars CPUs till 64 bitars CPUs samt inblick i skillnaden
Läs merFöreläsningsanteckningar 5. Cacheminnen
Föreläsningsanteckningar 5. Cacheminnen Olle Seger 2012 Anders Nilsson 2016 1 Inledning Bakgrunden till att cacheminnen behövs för nästan alla datorer är enkel. Vi kan kallt räkna med att processorn är
Läs merAtt använda pekare i. C-kod
Att använda pekare i C-kod (Bör användas av de som känner sig lite hemma med C-programmering!) Rev 1, 2005-11-23 av Ted Wolfram www.wolfram.se Syfte: Man kan tycka att det är komplicerat att använda pekare
Läs merÖka prestanda i Shared-Cache multi-core processorer
Öka prestanda i Shared-Cache multi-core processorer 1. Abstract Många processorer har nuförtiden flera kärnor. Det är även vanligt att dessa kärnor delar på högsta nivås cachen för att förbättra prestandan.
Läs merUMEÅ UNIVERSITET 26 april 2002 Instutionen för datavetenskap. Grafproblem. Laboration 4, Datastrukturer och Algoritmer VT02
UMEÅ UNIVERSITET 26 april 2002 Instutionen för datavetenskap Grafproblem Laboration 4, Datastrukturer och Algoritmer VT02 Laboration 4 - grafproblem Förpackningsdatum: Denna lab-spec är senast ändrad:
Läs merDatorsystemteknik DAV A14 Föreläsning 1
Innehåll Datorsystemteknik DAV A14 Föreläsning 1 Kursinformation Introduktion till datorsystem Programmeringsmodellen Större delen av materialet framtaget av :Jan Eric Larsson, Mats Brorsson och Mirec
Läs merHantering av begränsat antal skrivningar på Solid State diskar
LTH - LUNDS TEKNISKA HÖGSKOLA Hantering av begränsat antal skrivningar på Solid State diskar Filip Nilsson 2015-12-07 Sammanfattning På senare år har utvecklingen för SSD (Solid State Drive) enheter kommit
Läs merHur det går att minska effektutvecklingen i en processor genom att ändra pipeline
Hur det går att minska effektutvecklingen i en processor genom att ändra pipeline Linda Wapner HT2018 EITF60 Sammanfattning Effektutvecklingen i en processor har länge ökat genom att klockfrekvensen för
Läs merDigital IC konstruktion
Digital IC konstruktion Viktor Öwall Transistorn: en förstärkare Power Supply Korrekt? gate drain source En transistor kan användas på många olika sätt, t.ex. för att förstärka en elektrisk signal. Ground
Läs merIn- och Utenheter. Fö 3: In/Ut matning och kopplingsstruktur. Några exempel. Egenskaper. In- och Utenheter. Styrning.
Fö 3: In/Ut matning och kopplingsstruktur In- och Utenheter In- och Utenheter. Styrning. I/O-kanalenheter Kopplingsstruktur. Buss. Två huvudsakliga typer av I/O enheter: - Interaktiva. Exempelvis en terminal.
Läs merTentamen den 17 mars 2016 Datorteknik, EIT070
Lunds Universitet LTH Tentamen den 17 mars 2016 Datorteknik, EIT070 Skrivtid: 14.00-19.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng För betyg 4 krävs 30 poäng
Läs merF5 Introduktion till digitalteknik
George Boole och paraplyet F5 Introduktion till digitalteknik EDAA05 Roger Henriksson Jonas Wisbrant p = b! (s " r) George Boole (1815-1864) Professor i Matematik, Queens College, Cork, Irland 2 Exklusiv
Läs merStorage. Effektivare datalagring med det intelligenta informationsnätet.
Storage. Effektivare datalagring med det intelligenta informationsnätet. 2 Teknik och samverkan i en gemensam infrastruktur skapar nya möjligheter för effektivare datalagring Datalagring är en central
Läs merVästkust-trojka laddar för framtiden
Materialhantering Västkust-trojka laddar för framtiden I 30 år har barndomsvännerna och Varbergsprofilerna Rune Linderoth och Sören Strömberg fantiserat om att starta och driva ett företag tillsammans.
Läs merDigital- och datorteknik
Digital- och datorteknik Föreläsning #21 Biträdande professor Jan Jonsson Institutionen för data- och informationsteknik Chalmers tekniska högskola Teknologier och hierarkier Minnestyper Vi har hittills
Läs merDigital IC konstruktion
Digital IC konstruktion Viktor Öwall Transistorn: en förstärkare Power Supply Korrekt? gate drain source En transistor kan användas på många olika sätt, t.ex. för att förstärka en elektrisk signal. Ground
Läs merSPORTident basenheter BSM7/BSF7/BSF8 mjukvara (firmware) 5.74
2012-02-29 BSM7 / BSM7-USB BSF7 BSF8 SPORTident basenheter BSM7/BSF7/BSF8 mjukvara (firmware) 5.74 Sammanfattning BSF7 och BSM7 Samma storlek som BSF6 67% av vikten jämfört med BSF6 Litium batteri, en
Läs merBarn och trafik. en undersökning ur ett föräldraperspektiv. Genomförd av NTF Väst 2012
Barn och trafik en undersökning ur ett föräldraperspektiv Genomförd av NTF Väst 2012 Bakgrund och syfte Varje år skadas tusentals barn och ungdomar i olika trafikmiljöer. Trafikolyckor är den vanligaste
Läs merArm Cortex-A8 Pipeline
Marcus Havrell Dahl - 941206 Arm Cortex-A8 Pipeline Sammanfattning Arm Cortex-A8 processorn är en energisnål men samtidigt kraftfull enhet. Beroende på implementationen kan den ha en klockhastighet på
Läs mer4:7 Dioden och likriktning.
4:7 Dioden och likriktning. Inledning Nu skall vi se vad vi har för användning av våra kunskaper från det tidigare avsnittet om halvledare. Det är ju inget självändamål att tillverka halvledare, utan de
Läs merDatorteknik. Den digitala automaten. En dator måste kunna räkna! Register och bussanslutning
Den digitala automaten Vägen från digitaltekniken till det kompletta styrsystemet Lund University, Sweden Insignaler Sekvensnät Utsignaler Kan vi betrakta insignalmönstret som en instruktion och det som
Läs merHyper-Threading i Intelprocessorer
Lunds Tekniska Högskola Campus Helsingborg DATORARKITEKTURER MED OPERATIVSYSTEM EITF60 RAPPORT Hyper-Threading i Intelprocessorer 4 december 2017 Rasmus Hanning IDA2 Sammanfattning Det har sedan den första
Läs merDigitalteknik och Datorarkitektur 5hp
Digitalteknik och Datorarkitektur 5hp Minnes-hierarkier och Cache 12 maj 2008 karl.marklund@it.uu.se issa saker använder vi ofta Dessa saker vill vi ha nära till hands Storleken har betydelse Litet är
Läs merSKEPPISUTBILDNING 2013
SKEPPISUTBILDNING 2013 Hej medlem! Du får det här brevet eftersom du har varit deltagare på våra läger, och nu har blivit tillräckligt gammal för att söka till årets skeppisutbildning. Skeppisutbildning
Läs merOM KRITERIER av Emelie Johnson Vegh och Eva Bertilsson, publicerad i Canis 2004
OM KRITERIER av Emelie Johnson Vegh och Eva Bertilsson, publicerad i Canis 2004 Ibland dyker det upp ord som är så fantastiskt användbara och bra att man inte kan begripa hur man någonsin klarat sig utan
Läs merGenetisk variation är livsviktig för vitaliteten och ganska snabbt även en förutsättning för överlevnaden hos en art.
Naturens behov av genetisk variation Genetisk variation är livsviktig för vitaliteten och ganska snabbt även en förutsättning för överlevnaden hos en art. Då vi benämner en art i naturen som utrotningshotad
Läs merSystemkonstruktion SERIEKOMMUNIKATION
Systemkonstruktion SERIEKOMMUNIKATION Laborationsansvariga: Anders Arvidsson Utskriftsdatum: 2005-04-26 Syfte Laborationen syftar till att ge studenten tillfälle att närmare bekanta sig med RS-232-protokollet,
Läs merFöreläsning 6: Introduktion av listor
Föreläsning 6: Introduktion av listor Med hjälp av pekare kan man bygga upp datastrukturer på olika sätt. Bland annat kan man bygga upp listor bestående av någon typ av data. Begreppet lista bör förklaras.
Läs merAutomatiserade testsystem
Automatiserade testsystem Fredrik Edling, Tekn. Dr. Enea Services Stockholm fredrik.edling@enea.com Min bakgrund 2000: Civilingenjör teknisk fysik, inriktning mot tillämpad fysik 2004: Teknisk doktor,
Läs merDiagram. I detta kapitel lär du dig: m Diagrammets beståndsdelar. m Att skapa både inbäddat diagram och diagramblad. m Att ändra diagramform.
1 Diagram Med diagram kan du presentera information på ett effektivt sätt. Eftersom datan visas grafiskt så kan betraktaren ta till sig mycket information på en gång. Microsoft Excel har ett kraftfullt
Läs merInsulin för muskeluppbyggnad OCH fettförbränning
Insulin för muskeluppbyggnad OCH fettförbränning Fördelarna med insulin Hur du bygger muskler och bränner fett under samma dag Kan vi maximera muskeltillväxt och samtidigt kontrollera mängden kroppsfett?
Läs merNågra övningar att göra
Några övningar att göra Dagens kort Du ber om ett kort som kan vägleda och hjälpa dig genom dagen. Kortet beskriver hur du kan förhålla dig till dagen eller om du ska tänka på något speciellt idag. Drar
Läs merGrunderna i stegkodsprogrammering
Kapitel 1 Grunderna i stegkodsprogrammering Följande bilaga innehåller grunderna i stegkodsprogrammering i den form som används under kursen. Vi kommer att kort diskutera olika datatyper, villkor, operationer
Läs merDatorhistorik. Föreläsning 3 Datorns hårdvara EDSAC. Eniac. I think there is a world market for maybe five computers. Thomas Watson, IBM, 1943
Datorhistorik Föreläsning 3 Datorhistorik Datorns uppbyggnad, komponenter Processor, primärminne, sekundärminne Minneshierarkier Inbyggda system, stora datorer I think there is a world market for maybe
Läs merJämförelse av skrivtekniker till cacheminne
Jämförelse av skrivtekniker till cacheminne 1 Innehåll 1. Sammanfattning 2. Inledning 3. Diskussion 4. Referenslista 1. Sammanfattning En rapport innehållande jämförelser av olika skrivtekniker till minnen
Läs merAv kursplanen och betygskriterierna,
KATARINA KJELLSTRÖM Muntlig kommunikation i ett nationellt prov PRIM-gruppen ansvarar för diagnosmaterial och de nationella proven i matematik för grundskolan. Här beskrivs de muntliga delproven i ämnesprovet
Läs merHELMET -MODELLEN Helhets-Lärande genom MEntal Träning Uneståhl, 2006
HELMET -MODELLEN Helhets-Lärande genom MEntal Träning Uneståhl, 2006 Ett Helhetslärande som leder till en ökad insikt, förståelse och sammanhang MÅL OCH METODER Varje metod ska värderas utifrån metodens
Läs merSystem S. Datorarkitektur - en inledning. Organisation av datorsystem: olika abstraktionsnivåer. den mest abstrakta synen på systemet
Datorarkitektur - en inledning Organisation av datorsystem: olika abstraktionsnivåer System S den mest abstrakta synen på systemet A B C Ett högnivåperspektiv på systemet a1 b1 c1 a2 b3 b2 c2 c3 En mera
Läs merGrunderna kring helmäskning
Grunderna kring helmäskning I bryggskolans kapitel extraktbryggning och delmäskning så har vi berättat om hur du kan brygga goda öl med hjälp av dessa metoder. Vad vi också nämner är att i extraktbryggning,
Läs merBatterIaddare Smart 20 för 1-20Ah bly-syra batterier
ANVÄNDARMANUAL BatterIaddare Smart 20 för 1-20Ah bly-syra batterier Läs igenom denna manual noggrant innan du använder laddaren Använd alltid ögonskydd vid hantering av batterier INTRODUKTION Tack för
Läs merSolowheel. Namn: Jesper Edqvist. Klass: TE14A. Datum: 2015-03-09
Solowheel Namn: Jesper Edqvist Klass: TE14A Datum: 2015-03-09 Abstract We got an assignment that we should do an essay about something we wanted to dig deeper into. In my case I dug deeper into what a
Läs merTentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60)
Lunds Universitet LTH Tentamen den 9 januari 2018 Datorarkitekturer med operativsystem (EITF60) Skrivtid: 08.00-13.00 Tillåtna hjälpmedel: Inga. Maximalt antal poäng: 50 poäng För betyg 3 krävs 20 poäng
Läs merBatteriladdare Smart 50 Med inbyggd ficklampa för 6 200Ah bly-syra batterier
ANVÄNDARMANUAL Batteriladdare Smart 50 Med inbyggd ficklampa för 6 200Ah bly-syra batterier Läs igenom denna manual noggrant innan du använder laddaren Använd alltid ögonskydd vid hantering av batterier
Läs merMagiCAD El & Rör. Varför MagiCAD och varför 2D/3D? Kollisionskontroll. MagiCAD El
MagiCAD El & Rör Nu är MagiCAD El 2002.9 inom kort släppt och MagiCAD Rör 2002.5 har förbättrats rejält. Därför bad vi på Pharmadule Emtunga, CadCom att komma till oss för att visa var dessa två produkter
Läs merDigitalt festivalengagemang
VOLANTE WORKING PAPER 15:07 Digitalt festivalengagemang Festivalbesökare och platsvarumärken i sociala medier VOLANTE WORKING PAPER 15:07 Digitalt festivalengagemang Festivalbesökare och platsvarumärken
Läs merViktiga moment i kursplanen
Viktiga moment i kursplanen En process där eleverna medverkar aktivt genom att tillsammans bygga, experimentera, undersöka, ställa frågor och kommunicera ger en mängd fördelar. Flera exempel på aktiviteter
Läs mere-sense move dali Manual
e-sense move dali Manual Innehåll Moves grundläggande funktionssätt...4 5 Programmera RF-signalen...6 7 Ta bort RF-signalen...8 Förinställda scenarion...9 Alternativ för mottagande av RF-signaler...10
Läs merPipelining i Intel Pentium II
Pipelining i Intel Pentium II John Abdulnoor Lund Universitet 04/12/2017 Abstract För att en processor ska fungera måste alla komponenter inuti den samarbeta för att nå en acceptabel nivå av prestanda.
Läs merBatteriladdare Smart 100 Med inbyggd ficklampa för 6 240Ah bly-syra batterier
ANVÄNDARMANUAL Batteriladdare Smart 100 Med inbyggd ficklampa för 6 240Ah bly-syra batterier Läs igenom denna manual noggrant innan du använder laddaren Använd alltid ögonskydd vid hantering av batterier
Läs merTDDB96 Projekt: Object priming med visuell stimuli
TDDB96 Projekt: Object priming med visuell stimuli Daniel Johansson danjo133@student.liu.se Rickard Jonsson ricjo400@student.liu.se 1. Sammanfattning Vad vi ville komma fram till i denna studie var huruvida
Läs merTEKNISK BESKRIVNING UCO (Ultra Clean Oil) MODUL FÖR OLJERENING
TEKNISK BESKRIVNING UCO (Ultra Clean Oil) MODUL FÖR OLJERENING 2007-08-20 Introduktion Nedsmutsning av smörjolja Smörjoljor används i många applikationer i industrin. Gemensamt för dessa processer är att
Läs merUtvärdering av föräldrakurs hösten 2013
Utvärdering av föräldrakurs hösten 2013 - Har du verktyg för att bemöta din oroliga och nedstämda tonåring? Föräldrakursen oro/nedstämdhet är ett samarbete mellan Råd & stöd, Gamla Uppsala familjeenhet
Läs merLäs detta innan du fortsätter, eller skriv ut det, klicka runt lite och läs samtidigt.
Bruksanvisning Installera CubeBiz... 2 Välj språk... 2 När du vill köra testversionen i 15 dagar... 3 När du köper en CubeBiz-licens... 3 Registrera en giltig licensnyckel... 3 Starta ett nytt projekt...
Läs merFöreläsningsanteckningar 2. Mikroprogrammering I
Föreläsningsanteckningar 2. Mikroprogrammering I Olle Seger 2012 Anders Nilsson 2016 Innehåll 1 Inledning 2 2 En enkel dator 2 3 Komponenter 3 3.1 Register............................... 3 3.2 Universalräknare..........................
Läs merBank Switching. Att nå multipla adressrymder. Av: Drazen Mijatovic
Bank Switching Att nå multipla adressrymder Av: Drazen Mijatovic 2016-12-06 Abstrakt: Adressbussen hos processorer och mikrokontroller som används inom inbäddade applikationer utgör en begränsning för
Läs merPå jakt med geocaching
På jakt med geocaching Text: Lena Lithén & Kamilla Aspgren-Kvarnström (Publicerad i Förskoletidningen, 2014) På förskolan Uppfinnaren i Gävle geocachar barnen tillsammans med trollet Trulle. Detta efter
Läs merCache coherence hos multicoreprocessorer
Cache coherence hos multicoreprocessorer Benjamin Holmqvist, EDT621 December 5, 2016 1 Contents 1 Inledning 3 2 Syfte 3 3 Cache Coherence 3 3.1 Implementering.......................... 4 3.2 Snoop baserade..........................
Läs merMotion om säkrare gång- och cykelvägar
2007-09-24 202 442 Kommunstyrelsen 2008-01-14 6 14 Arbets- och personalutskottet 2007-12-17 276 580 Dnr 07.541-008 septkf23 Motion om säkrare gång- och cykelvägar Ärendebeskrivning Erika Josbrandt, för
Läs mer