Bortom Moore Nya drivkrafter

Relevanta dokument
LINCE. -vad kommer sedan? Linköpings Universitet

KOMPETENSNAV INTEGRERADE KRETSAR OCH SYSTEM

KOMPETENSNAV INTEGRERADE KRETSAR OCH SYSTEM

Digital elektronik och inbyggda system

Digital IC konstruktion

Digital IC konstruktion

KUNDCASE. Inovia gjorde sin AI-utveckling 10 gånger snabbare med Power-plattformen

Trådlöst. Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Digital IC konstruktion

Profilen Kommunikation för Y, Yi, D & IT. Profilansvarig: Erik G. Larsson Professor, ISY/Kommunikationssystem

Moores lag vid vägs ände efter 50 år?

Trådlös kommunikation En introduktion av Open Systems Engineering AB

Digital IC konstruktion

Profilen Kommunikation för Y, Yi, D & IT

Elektronikprofilen Y/D

Profilen Kommunikation för Y, Yi, D & IT

Digital IC konstruktion

Elektronikprofilen. Profilansvarig: Dr. J Jacob Wikner (ISY)

Profilen Kommunikation för Y, Yi, D & IT. Profilansvarig: Erik G. Larsson Professor, ISY/Kommunikationssystem

Digital IC konstruktion

Framtidens Radio för Sakernas Internet. ARM Sweden AB Lund Sverige Dr. Tobias Tired

Elektronik. MOS-transistorn. Översikt. Då och nu. MOS-teknologi. Lite historik nmosfet Arbetsområden pmosfet CMOS-inverterare NOR- och NAND-grindar

Datorsystem 2 CPU. Förra gången: Datorns historia Denna gång: Byggstenar i en dators arkitektur. Visning av Akka (för de som är intresserade)

Hur det går att minska effektutvecklingen i en processor genom att ändra pipeline

LUNDS UNIVERSITET. Parallell exekvering av Float32 och INT32 operationer

Lunds Tekniska Högskola Datorarkitektur med operativsystem EITF60. Superscalar vs VLIW. Cornelia Kloth IDA2. Inlämningsdatum:

Digital IC konstruktion

Telefoninäten. Jens A Andersson

CanCom Bluetooth BLUETOOTH V5.6. Specifikation Specification LED. transceiver

Grundkurs i 5G 5G och sedan då?

Digitaliseringssatsning tillsammans med innovativa lantbruksföretag

TOSHIBA LANSERAR NÄSTA GENERATION FÖRETAGSHÅRDDISKAR MED 4 TB

Laboration 6. A/D- och D/A-omvandling. Lunds universitet / Fakultet / Institution / Enhet / Dokument / Datum

Profilen Kommunikation för Y, Yi, D & IT. Profilansvarig: Erik G. Larsson Professor, ISY/Kommunikationssystem

Profilen Kommunikation för Y, Yi, D & IT

Mobilteknik. Begränsningar och möjligheter

Profilen Kommunikation för Y, Yi, D & IT

Det blir aldrig något

produktöversikt OptiMaster III

Digital IC konstruktion

Grundutbildning vid EIT. Lunds universitet

Toshiba lanserar tre nya Satellite-serier - Slimmad design, enastående val och prisvärd pekskärmanvändning

Som reserv i betygsnämnden föreslås Professor Petru Ion Eles, IDA, LiU. petru.eles@liu.se

Elektronik Dataomvandlare

Grundläggande datavetenskap, 4p

EITA Fördjupningsuppgiften Ämnen. Emma Fitzgerald

SeniorNet Huddinge Dagens tema: Trådlösa uppkopplingar

Processor pipelining genom historien (Intel i9-intel i7)

A/D D/A omvandling. Lars Wallman. Lunds Universitet / LTH / Institutionen för Mätteknik och Industriell Elektroteknik

Moment 2 Digital elektronik. Föreläsning Inbyggda system, introduktion

Beacon BluFi Bluzone. Givarna har mycket hög känslighet och kan mäta mycket små förändringar.

Kapitel 13: Telefoninäten. Spanning Tree. Jämförelse med OSI-modellen. Jens A Andersson (Maria Kihl)

Hur kom vi fram till 5G och vart är vi på väg? Ove Edfors, Lunds Universitet

Trendspaning Industrirobotar, Industri 4.0 och servicerobotar

MESI i Intel Core 2 Duo

ETS Fördjupningsuppgiften Ämnen. Mål för fördjupningsuppgiften. Hur kommer det att gå till? Jens A Andersson

Grunderna i. Digital kamerateknik. SM3GDT Hans Sodenkamp SK3BG

Hyper Threading Intels implementation av SMT. Datorarkitekturer med operativsystem - EITF60. Felix Danielsson IDA2

Energy KRAFTELEKTRONIK NAV. e-mobility. Transport. Mietek Bakowski Konstantin Kostov. Industry ICT

Utvecklingen från en 8 bitars till en 16 bitars mikroprocessor

Toshiba och Intel Centrino Duo mobile teknologi för professionella användare

Lär dig sälja framtidens trådlösa. idag

Nanoelektronik. FAFA10 Kvantfenomen och nanostrukturer HT Martin Magnusson.

FÖRELÄSNING 8 INTRODUKTION TILL DESIGN AV DIGITALA ELEKTRONIKSYSTEM

Multi-ported cache En rapport om några lösningar till att få flera minnesaccesser simultant.

Elektronik. Viktor Öwall, Digital ASIC Group, Dept. of Electroscience, Lund University, Sweden-

Program kan beskrivas på olika abstrak3onsnivåer. Högnivåprogram: läsbart (för människor), hög abstrak3onsnivå, enkelt a> porta (fly>a 3ll en annan ar

X Series - BLUETOOTH

Elektronik Dataomvandlare

Valinformation E2 inför E3 läsåret 2018/2019

Innovation för system integration

TENTAMEN Datorteknik (DO2005) D1/E1/Mek1/Ö1

Datorarkitekturer med operativsystem ERIK LARSSON

Arm Cortex-A8 Pipeline

Banbrytande elektronik vid LTH

Byggstenar för Software Defined Radio

Profilen Kommunikation för Y, Yi, D & IT

Internet of Things. Inom industriellt underhåll. Kontaktperson:

Tredje Vågens Automation

Elektronik. Dataomvandlare

EITA Fördjupningsuppgiften Ämnen

Nästa Konkurrenskraft! K R I T I S K A F A K T O R E R F Ö R F R A M G Å N G S R I K I N D U S T R I E L L D I G I T A L I S E R I N G

X Series - BLUETOOTH

Digital- och datorteknik, , Per Larsson-Edefors Sida 1

Läsminne Read Only Memory ROM

Intelligent Business Integration. icore Kund- och Partnerdagar 2018

Microsoft erbjudande idag. Helena Fuchs, Microsoft Per Bay, COSMO CONSULT

Kapitel 13: (Maria Kihl)

Ad-hoc-nätverk och spontana nätverk

Parallellism i NVIDIAs Fermi GPU

Hur får jag ut kraft och nytta av POWER?

Elektronik EITA35: Elektronik. Erik Lind

A/D D/A omvandling. EEM007 - Mätteknik för F 2015 CHRISTIAN ANTFOLK

Registrera din produkt och få support på. SDV7220/12. Användarhandbok

Professor och forskningschef bodahlbom.se

Snabbare nätverkshastighet

Automation - nu och framåt. Thomas Lezama

F1: Introduktion Digitalkonstruktion II, 4p. Digital IC konstruktion. Integrerad krets. System. Algorithm - Architecture. Arithmetic X 2.

TAKTIL INTERNET SÅ KOMMER TAKTIL INTERNET ATT FÖRÄNDRA BRANSCHEN FRAMÖVER

Random Access Memory. Amare Reda Jenny Holmberg Henrik Kreipke Gaylord Kaya

Transkript:

Bortom Moore Nya drivkrafter Christer Svensson Division of Integrated Circuits and Systems Department of Electrical Engineering Linköping University, Sweden

Innehåll Moores lag - och sedan? Effektförbrukning och Ledningar Mobiltelefonen - Smarttelefonen Beräkningsplattformen Ultralågeffekt IoT 5G - massiv MIMO Sammanfattning

Moores lag It went from a measure to an industry driver Moore 2015 (after 50 years) Moore 1965

Moores lag Moores lag baseras i huvudsak på minskande geometrier Enormt effektivt! Vid Dennard-skalning (konstant elektriskt fält): Beräkningskapacitet per chip ökar med L -3 vid konstant effekt Men detta måste rimligen ha ett slut t ox Minsta t ox 1.5nm (pga tunneling) electron channel electric field Minsta transistorlängd, 15nm (skydda source från drainfält) vid FINFET kanske 8nm

Moores lag Rachel Courtland, Spectrum, Sept. 2016

Moores lag och sedan? Moores lag inte längre industriell drivkraft Den nya drivkraften är hårdvarumedveten innovation Moores lag har gett oss en enormt kraftfull teknologi med genomgripande påverkan på samhället. En fortsatt utveckling baseras på innovationer inom tillämpningar, kretsteknik, arkitektur, mm., baserat på kunskap om hårdvarans möjligheter och begränsningar.

Moores lag och sedan? Möjligheter och begränsningar Effektförbrukning, digitalt Interconnect Effektförbrukning, analogt

Effektförbrukning, digitalt klockfrekvens grindkapacitans aktivitet grindantal matningsspänning P=af c NC L V dd 2 databearbetningshastighet Nedskalning ger lägre grindkapacitans, men interconnect tillkommer Nedskalning möjliggör lägre V dd Men det finns en gräns, 0.8V, kanske 0.25V * * Minima processors, Finsk startup.

Effektförbrukning, digitalt Databearbetningshastiget består av önskad beräkning + overhead Overhead kan vara kontroll, kommunikation och minne och beror starkt på systemarkitekturen. (Särskilt den klassiska CPUn har mycket overhead)

Effektförbrukning, digitalt Mark Horowitz, 2014 Jämförelse mellan mikroprocessor, mikroprocessor+grafikprocessor, generell signalprocessor, och specialiserad signalprocessor. En universell maskin består av flera processortyper anpassade för den aktuella mixen av uppgifter. Heterogen multiprocessor.

Ledningar, digitalt metalltvärsnitt V dd x swing cap/längd konstant längd klockfrekvens längd B=bA/L 2 datahastighet P=V 2 /8Z 0 ; P=f c clv 2 /4 Lång ledning Kort ledning 1-2cm, 3-10Gb/s 30cm, 10-30Gb/s C Svensson, TVLSI, december 2002

Ledningar, digitalt Hög effektkostnad för ledningar: Använd lokala beräkningar! W Dally, Celsius lecture, 2013

Effektförbrukning, analogt temperaturen samplingfrekvens Boltsmanns konstant dynamiskt område P=16kTf s D Notera Ej processberoende (ingen skalningsvinst) Ej matningsspänningsberoende C Svensson, Circuits and Systems Magazine, 3rd quarter 2015 p14

Effektförbrukning, analogt Minsta effekt AD-omvandlare Examples: SAR, 8b, 10KS/s 2nW Pipe, 12b 1GS/s 100mW C Svensson, Circuits and Systems Magazine, 3rd quarter 2015

Effektförbrukning, analogt Jämförelse analogt/digitalt Enkelt filter i analog eller digital teknik Notera att digitalt har lägre effektförbrukning vid hög dynamik Notera att analogt blir processberoende vid mycket lågt dynamiskt område C Svensson, Circuits and Systems Magazine, 3rd quarter 2015

Möjligheter och begränsningar Parallella processorer vid lägre klockfrekvens Heterogena multiprocessorer Lokala beräkningar Undvik analogt vid hög dynamik

Mobiltelefonen - Smarttelefonen Smarttelefonen En mycket kraftfull och flexibel plattform som exekverar upp till 100Gop/s inom några W Endast möjligt genom en stor mängd processorer med olika specialiseringar Telefoni, Internet, Kamera, TV LTE, WiFi, GPS, Bluetooth, NFC Virtuell/Förstärkt verklighet

Mobiltelefonen - Smarttelefonen Exempel på specialiserad processor, radiobasband LiU Coresonic Mediatek A Nilsson, JSSC, 2009 Liten kontrollenhet styr många parallella processer på flera ALUer och minnen En instruktion startar en vektoroperation som löper under många klockcykler och använder 1-2 minnen och 1 ALU.

Beräkningsplattformen Superdatorn baseras på många beräkningsplattformar K20X 2688 cores, 3.95Tflops, 235W 6GB minne, 250GB/s

Beräkningsplattformen Många nya applikationer av beräkningsplattformar Datacentra för molntjänster Avancerad bildtolkning för robotik Självkörande bilar Artificiell intelligens, Deep learning Blir en tävling mellan Standardplattormar (Heterogena multiprocessorer) och Skräddarsydda lösningar (ASIC, FPGA, etc.)

Ultralåg effekt - IoT Några exempel från LiU 2.3mW receiver A 3-nW 9.1-ENOB SAR ADC in 65nm CMOS, for medical implant devices and ultra-lowpower sensors In IEEE European Solid-State Circuits Conf., Sep. 2012 Ultra Low Power Wake-Up Radio using Envelope Detector and Transmission Line Transformer IEEE Journal on Emerging and Selected Topics in Circuits and Systems, Mar 2013

Ultralåg effekt - IoT Sakernas internet ger utrymme för mängder med innovationer Plattformar med radio/processor/io och låg effekt underlättar utvecklingen av nya tillämpningar Industriellt: Koppla upp allt Konsument: Koppla upp allt Medicinskt: Koppla upp allt Wireless

5G massiv MIMO Nästa steg i bandbreddseffektivitet: rumsuppdelning Kräver 10x fler antenner än terminaler. Mycket stor teknisk utmaning.

5G massiv MIMO Utmaningar 1 komplett tranceiver per antenn (tex 100st) Hur begränsa kostnad/effekt? Varje kanal (varje terminal, tex 10st) har en optimerad, individuell antennlob. Hur hantera total bandbredd? Hur hantera total beräkningsbehov?

Utmaningar 5G massiv MIMO Hur begränsa kostnad/effekt? Finns smarta lösningar! Sändareffekten kan reduceras 100x och den delas på 100 transceiverar mycket liten effekt i varje. Man kan ha konstant eller nästan konstant sändaramplitud, amplitudmodulation ordnas genom interaktion mellan grannar. Enkla sändare helt i CMOS, enkelt med god verkningsgrad. Massverkan gör att felen jämnar ut sig låga krav transceivrar Mottagarna får högre signalstyrka pga antennens direktivitet. Enkla mottagare, kanske 1b AD-omvandlare. Erik Larsson, IEEE Communications Magazine, February 2014.

5G massiv MIMO Utmaningar Hur hantera total bandbredd? Hur hantera total beräkningsbehov? 100 transceivrar med 2*2*2*10b I/O per styck, 250MSymb/s ska tala med basbandprocessorn. 8000pin vid 250Mb/s. Använd serdes, 2 pin per transceiver (200pin) vid 10Gb/s. Beräkningsbehov: En uppskattning antyder ca 60Top/s för all digital signalbehandling*. Kan hanteras i ett eller ett par chip (kräver minst 60W). *Dake Liu, privat, 2016.

Sammanfattning Moores lag upphör succesivt Ny drivkraft hårdvarumedveten innovation Tillämpningar, Arkitektur, Kretsteknik, Interconnect Heterogena multiprocessorplattformar Smarttelefon, Beräkningsplattform Nya utmaningar Massiv MIMO, Självkörande bilar, Sakernas internet Användning av mm-vågsbanden.

Moores lag Moores lag upphör succesivt: Vinsterna minskar eftersom man tex inte kan minska spänningen med geometrin Man hittar nya trick för lite förlängning, high k dielectric, FINFET, FDSOI, etc. Dessutom fler transistorer genom 3D-integration (särskilt minnen) Rachel Courtland, Spectrum, Sept. 2016

Ledningar, digitalt Global on-chip ledning, ~1cm, 1-10Gb/s, effekt ~ längd Ledning på kort, ~30cm, 10-30Gb/s, effekt oberoende längd Chip I/O pin begränsad (hög BW, vi behöver utnyttja 10-30Gb/s) C Svensson, TVLSI, december 2002

Beräkningsplattformen Exempel på plattform för inbäddning Kreditkortstorlek 1Tflop/s Nvidia Jetson TX1 64b ARM CPU Nvidia Maxwell GPU 4GB minne, 25GB/s 10W Video 1400Mpix/s