26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 2 agens föreläsning TSE28 atorteknik (och U) Föreläsning 9 Kent Palmkvist, IS Byggblocken i en processor Hur de fungerar Grundläggande intern arkitektur Vidareutveckling av vad som visats tidigare Styrning med mikrokod Skapa styrsekvenser med minne och register TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 3 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 4 Praktiska kommentarer Laborationsanmälan startar Torsdag 7/4 kl 2.3! Laboration 4: MI 2 + 2 h precis som tidigare Simuleringslabbar => kan köras hemifrån (på ixtab) Redovisa på labbtillfälle Laboration 5: Bussar och ache Mätlabbar => Måste genomföras i labbet Förberedelser viktiga! 2 + 2 h som tidigare, mätningar bör vara klara efter de första 2 h! bstraktionshierarki atorns uppbyggnad och funktion kan beskrivas på olika nivåer Lägre abstraktionsnivå => färre personer involverade i design I denna kurs fokuserar vi på mikroarkitektur upp till lågnivåspråk pplikationer Högnivåspråk Lågnivåspråk Mikroprogrammering Mikroarkitektur Kretsar Komponenter
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 5 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 6 bstraktionshierarki, forts. Lågnivåspråk kräver kunskap om datorns uppbyggnad T ex assemblerspråk specifikt för olika klasser av datorer RM skiljer sig från M68 Mikroprogrammering kräver kunskap om datorn interna struktur T ex hur olika register i processorn är ihopkopplade Finns inte i alla datorer (och oftast inte tillgängligt) pplikationer Högnivåspråk Lågnivåspråk Mikroprogrammering Mikroarkitektur Kretsar Komponenter Motivering Prestanda på en dator (operationer per sekund) bestäms av Hur ofta en ny instruktion kan startas Hur snabbt minnet kan läsas Vilka typer av instruktioner som finns Ska under denna del av kursen titta närmare på hur prestanda kan påverkas Kräver kunskap om hur instruktioner implementeras i datorn Maskinkod är en abstraktion Flera olika strukturer kan implementera samma maskinkod med olika prestanda (8386 vs i7) TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 7 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 8 En närmare titt på datorn ator vs processor etc. Varje enskild maskinkodsinstruktion (assemblerinstruktion) motsvarar oftast en sekvens av delsteg Hämta instruktion från minnet vkoda instruktion Hämta argument från minne eller register Beräkna resultat Skriv resultat till minne eller register essa delsteg bestäms av den interna uppbyggnaden av processorn, instruktionsuppsättning, vägar att skicka data, etc. Exempel: move.l #$,$234 Läs instruktionen från minnet Skriv $ I minnescell $234 ator Komplett system med minnen och I/O (input/output) Processor (PU entral Processing Unit) Beräkningsenheten i datorn. llt utom minnen och I/O Mikroprocessor Speciell version av processor där allt sitter på ett chip Mikrokontroller Enklare processor med vissa delar av I/O och eventuellt minne på ett chip ator I/O Processor
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 9 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 atorns byggstenar minne Mer om byggblock S S Funktionsblock Beräkna eller lagra data T ex minne, Kommunikation Koppla ihop register, minnen mm Bussar In P SP Ut U För borde detta vara en repetition av digitalteknik Multiplexer Välj att skicka ut värde på från en av ingångarna Numrering motsvarar binära talet på styringång (S) Funktion beskriven med sanningstabell B 2 3 S S B Kontroll (U) Bestäm vilket data skickas vart vkodning, styrsignaler Kommer utgå från boken (Figur 7.) Finns även bilder på bokens hemsida! Z Insignal och motsvarande utsignal Komplett tabell (med bara och som insignalvärden) ger 64 kombinationer Funktion tidsmässigt Ändring på ingång ger (nästan) direkt påverkan på utgång Gäller både ingång - och S S B S S B t TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 2 ritmetisk logisk enhet () Beräkna alla funktioner, välj sedan rätt med mux Funktion väljs med : B -> -> B+ -> + -> B- -> - -> B+ -> -B -> Beräkning uppdaterar flaggvärden (ofta kallad R) B V NZ Buss, tristate-grind Ofta många bitar parallellt, ofta en 2-potens T ex 8 bitars databuss, 6 bitars addressbuss Flera sändare (Sx) kopplas till flera mottagare (Mx) Måste välja vem som får sända Om flera försöker samtidigt förstörs sändningen Jfr med att prata i mun på varandra Sköts elektriskt med en s k tristategrind S S2 S3 E E2 E3 M M M2 M3 V: overflow vid 2-komplementberäkning : ssiffra N: Negativt resultat (kopia av MSB) Z: Resultat = lla utgångar påverkas direkt av ändring på ingång Inget minne Skickar ut, eller Z Z ut betyder urkopplad sändare En eller flera mottagare kan ta emot Utpekade mottagare sparar värde som sändes E E Z, urkopplad
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 3 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 4 Laddar nytt värde varje gång klockan (LK) går från till (positiv flank) Om ingen flank behålls gamla värdet Ibland finns även E (lock Enable) Ladda registret bara om E = LK 5 Q 5 lk E Q 42 22 3 22 42 lk 22 Q t pekar ut vilken minnescell som ska läsas/ändras innehåller värde till eller från minnescell Två olika funktioner Läs: Read =, Kopiera värde i minnescell som address pekar på till Q Skriv: =, minnescell som address pekar på sätts till värde på Q Om varken skrivning eller läsning kopplas Q ifrån (värde Z) Ofta den långsammare än processorn Read Read dress 2 42 2 Q Z 5 3 Z 42 3 Skriv till adress 2, läs address 42 (innehåller värde 5) skriv värde 3 till address 42 läs address 2 ( pga skrivning tidigare) läs address 42 (3 pga skrivning tidigare) t TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 5 Enkel processorarkitektur En av många möjliga arkitekturer Figur 7. i boken Enkel processor med få generella register, Generella dataregister Övriga register inte direkt tillgängliga P Programräknare (peka på nästa instruktion) R Statusflaggor (kopierar V,,N,Z från ) Instruktioner kan arbeta register-till-register och register-till-minne MBR P MBR E MBR, P E P,B V N Z R Bus BBus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 6 Enkel processorarkitektur, forts. för att hålla address och data till/från minne Memory address register MBR Memory buffer register Ladda från minne om Read= Ladda från buss om Read= håller reda på aktuell instruktion som utförs Inklusive adressargument drivs bara av Bus B och kan drivas av olika register (en i taget) Bara en källa per gång för varje bus (via E XX,B ) MBR P MBR E MBR, P E P,B V N Z R Bus B Bus E, E,
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 7 operationer utför beräkning eller kopiering Välj funktion med,, Operation = B = = B + = + = B - = - = B + = B Uppdatera statusregistret R vid varje -beräkning V: aritmetiskt overflow (2-komplementsberäkning) : minnesbit vid operation (positiva heltal) N: negativt resultat Z: resultat noll MBR P MBR E MBR, P E P,B V N Z R Bus BBus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 8 Styrsignaler Styrsignaler definierade i arkitekturen Read Läs från minne och placera värde i Skriv värde i till minnesaddress lock XXX Spara värde i register XXX (MBR,, P,,, ) Enable E XXX, B Kopiera värde från XXX till buss B (MBR,P,,,) Enable E XXX, Kopiera värde från XXX till buss (MBR,,) Välj funktion i Varje styrsignal ges värde eller i varje steg ntag styrsignal = om den inte anges MBR P MBR E MBR, P E P,B V N Z R Bus B Bus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 9 Maskininstruktioner Exempel på maskininstruktioner som ska kunna utföras Op-code M eller T Op-code Namn Operation LO,M [] <- [M] LO,M [] <- [M] STORE M, [M] <- [] STORE M, [M] <- [], [] <- [] + [] SUB, [] <- [] - [] BR T [P] <- T BEQ T Om [Z] = då [P] <- T Mikroprogrammet beskriver för varje instruktion alla styrsignaler och steg för implementering av instruktionen Hämta instruktion (fetch) Utför instruktion (beror på vilken instruktion som hämtats) MBR P MBR E MBR, P E P,B V N Z R Bus BBus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 2 Exekvering av instruktion, del Fetch: Läs instruktion från minne till, öka P med Kopiera P till Öka P med (peka på instruktion efter) Läs minne till MBR Kopiera MBR till Motsvarande styrsignaler (en av flera möjliga lösningar, går att använda 3 steg istället...) Steg T E P,B =, =,,, T E P,B =, =,,, P T2 Read=, MBR T3 =, =,,, MBR P MBR E MBR, P E P,B V N Z R Bus B Bus E, E,
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 2 Exekvering av instruktion, del 2 Utför instruktion (STORE M,) Kopiera till MBR Kopiera till (får bara med adressdelen av instruktionen) Skriv minne från MBR Motsvarande styrsignaler (en av flera möjliga lösningar) Steg T =, =,,, MBR T =, =,,, T2 = Totalt 7 steg för instruktion MBR P MBR E MBR, P E P,B V N Z R Bus BBus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 22 Hantering av tid och ordning En sak i taget I varje klockcykel gör varje enhet (bus, etc.) bara en operation (olika för respektive enhet) T ex minnet kan inte först läsa och sedan skriva i samma klockcykel Olika saker händer på olika ställen i datorn samtidigt (parallellt) llt styrs av klockan Jfr styrdans eller militär marsch Om inte alla tar ett steg vid samma tidpunkt börjar man trampa varandra på tårna Synkron timingmodell lla enheter får klocksignalen samtidigt klocka MBR P MBR E MBR, P E P,B V N Z R Bus B Bus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 23 lla steg måste styras av kontrolleneheten (U) Kontrollenheten genererar en sekvens av styrsignaler till datorn Måste hålla ordning på i vilket steg den befinner sig lla styrsignaler ändras vid varje klockflank Olika sekvenser beroende på instruktion och flaggornas värde opcode bitar R bitar U : Read,, E XXX,B,E XXX,, XXX,,, MBR P MBR E MBR, P E P,B V N Z R Bus BBus E, E, TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 24 lla steg måste styras av kontrolleneheten (U) Varje opcode har egen instruktionssekvens Fetchdelen gemensam ( innehåller instruktionen efteråt) Efter fetch måste rätt sekvens väljas nvänd 3 vänstra bitarna i -registret opcode bitar R bitar Op-code U M eller T : Read,, E XXX,B,E XXX,, XXX,,, MBR P MBR E MBR, P E P,B V N Z R Bus B Bus E, E,
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 25 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 26 Tillståndsmaskin (Finite State Machine) Sekvens av utsignaler genereras med fast frekvens styrd av klocka Utsignal bestäms av aktuellt steg () samt eventuellt av värden på ingǻng Lösning enligt digitalteknik för aktuellt s med klocka översätter kombination insignaler och aktuellt till utsignaler och nytt kan bli väldigt stort och komplext ntal ingångar till et Behöver designas på nytt om något ska ändras ROM (minne som bara läses) kan användas Stort om många insignaler opcode bitar R bitar FSM Read,, E XXX,B,E XXX,, XXX,,, Tillståndsmaskin, exempel x= ska ge sekvensen y=34534534... och x= ska ge sekvensen y=27827827... Läsbart minne (ROM) istället för logiskt dress till ROM: x plus 3 bitar (=8x+aktuellt ) från ROM:y, nästa (8x+aktuellt) (y, nästa) 3 2 2 4 3 3 4 4 5 5-7 3 8 2 9 9 7 8 8 2-5 2 9 x a d d ROM a d t r a y TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 27 lternativ implementation av smaskin lternativ för att skapa förbestämd sekvens Räknare med minne som översätter till styrsignaler Mycket mindre hårdvara Bygg med register och en + operation Återanvänd funktion Måste lägga till styrsignal som startar om sekvens (nollställning) alternativt laddar startsignal beroende på insignal + n : TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 28 Generell mikroprogrammeringsstruktur ROM-minnet innehåller mikroprogrammet En address för varje Tre delar i ROM utdata Styrsignaler (En bit för varje styrsignal) En (eller flera) styrsignaler för val av R bitar En (eller flera) nästa address (mikro) beroende på resultat av opcode + R-bitar dress RSelect ontrol beräkning (opcode + R) + ROM n : Val av insignal alternativa addresser
26-4-4 :24 TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 29 Fördelar med mirkoprogrammerad struktur Enkel att ändra och bygga ut Öka antal adresser i ROM eller öka antal bitar per adress kan ge nya instruktioner Byt aktiv styrsignal genom att ändra enskilda bitar i minnet Eventuellt möjligt patcha processorinstruktioner! Enkel att återanvända Ändra bara minnesinnehåll Effektiv för stora smaskiner beräkning (opcode + R) Val av insignal alternativa addresser ROM TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 3 Begränsningar hos mikroprogrammerad struktur Begränsat antal olika förgreningar från varje Problem med avkodning av opcode? Går att fixa. Begränsat antal samtidiga villkorliga R flaggor testas per klockcykel beror bara på indata från föregående klockcykel igitalteknik: Mealy reagerar inom samma klockcykel beräkning (opcode + R) Val av insignal alternativa addresser ROM TSE28 atorteknik (och U), föreläsning 9, Kent Palmkvist 26-4-4 3 Generell mikroprogrammeringsstruktur, forts. vvägning mellan storlek på ROM och möjlig funktion Fler möjliga insignalskombinationer/nästa kräver fler alternativa adresser och insignalval => större ROM Få alternativa adresser => avkodning av t ex opcode tar längre tid Kräver sekvens av jämförelser, bit för bit av opcode Effektivare lösning: uppslagstabell för nästa baserat på opcode-bitarna föreläsning... beräkning (opcode + R) Val av insignal alternativa addresser ROM www.liu.se