Data och information Grunderna i datatransmission och fysiska skiktet Bitarna möter verkligheten Sidorna 43-93 i boken Data: information i format som kan behandlas av maskiner och människor Information: betydelseinnehållet i data Kunskap (tieto): människans förståelse Definitionerna varierar inom olika vetenskapsområden Nära filosofi, det har skrivits böcker om ämnet Språkskillnader, t.ex. datatransmission = tiedonsiirto Exempel: En bild i okomprimerat TIFF- ja komprimerat GIF-format kan innehålla samma information, men datamängden i GIF-bilden är mindre I JPEG-komprimering försvinner för ögat osynlig information För TCP och IP-protokollen är tillämpningsskiktets bitar data; HTTP ser pakethuvudet som information, men HTML-filen som data; för webbläsaren är HTML information Datatransmission Media: vågledare Informationen kodas som symboler (data) Data överförs i lämpligt medium användande linjekodning Olika media har egenskaper, t.ex. bandbredd, som inverkar på transmissionen Kopparledning Tvinnad parkabel Koaxialkabel Optik ledare Media: fri utbredning Kodning av diskret information Elektromagnetisk strålning Radiovågor Satellit Mikrovågor Laser Infrarött Ljud Skriver språk består av bokstäver d.v.s. symboler som kan numreras ASCII för bokstäver a-z, siffror och specialtecken ISO-8859 -familjen för västerländska språk Unicode för alla språk Bilder kan digitaliseras, likaså ljud och annan analog data Rörlig bild (video) är en sekvens av bilder 1
Komprimering Från analog data till digital Baserar sig på Shannons informationsteori N olika alternativ kan uttryckas med log 2 N bitar Ifall datat innehåller upprepade mönster kan de uttryckas med överenskomna bitsekvenser Komprimering och dekomprimering kräver algoritmer implementerade i lämpliga program Det finns mängder av olika algoritmer och komprimeringsformat för olika datatyper Lempel-Ziv, Huffman, JPEG, MPEG-2, MPEG-1 layer 3 T.ex. tal är analog data Nästan oändligt med nyanser Nuförtiden överförs och lagras ljud oftast digitalt Telefonsamtal, musik på CD Signalen samplas Samplen kodas till en dataström Enligt samplingsteorin bör samplingsfrekvensen vara minst dubbelt signalens bandbredd Digitala telefonnätet är uppbyggt enligt samplingsfrekvensen 8 sampel/s och då kan ett ca. 4 Hz band återges Människans hörområde är ca. 2-2 Hz Sampling Digital data i en analog värld x(t) x s (nt) T t n Bitarna måste kodas på lämpligt sätt I basbandsmetoden kodas bitarna direkt till t.ex. spänningsvärden, fungerar i media med relativt lite störningar i signalens frekvensområde Med hjälp av en bärvåg kan signalen skickas på önskat frekvensområde, signalen modulerar bärvågen Amplitudmodulering Frekvensmodulering Fasmodulering För digitala signaler även mer invecklade kodningar T.ex. CDMA som används i UMTS Synkron och asynkron transmission Synkron basbandskodning Mottagaren måste kunna känna igen vad som är data I asynkron transmission identifierar mottagaren början på meddelandet (t.ex. en byte data) och samplar signalen tillräckligt ofta för att ta emot meddelandet startbit, 8 databitar, paritet och stop bit I synkron transmission har sändaren och mottagaren klockan i samma tid, mottagaren vet när en bit borde läsas Mer effektivt RZ NRZ Bipolar AMI - - 2
Klocksignal från kodningen Bärvåg och modulering Manchester AM FM Differential Manchester PM Egenskaper hos media Signalen i naturen Bandbredd (kaistanleveys, bandwidth) Användbart frekvensområde Brus (kohina, noise) Störningar i bakgrunden, får inte ändra signalen Överföringskapacitet (siirtokapasiteetti, capacity) Hur många bitar per sekund kan överföras (beror på brusförhållandena) Felfrekvens (virhetaajuus, error rate) hur många bitfel per sekund uppstår Fördröjning (viive, latency) Tiden det tar för signalen att komma fram Svävning (huojunta, jitter) Variation i fördröjningen Dämpning (vaimennus, attenuation) Signalen tappar energi under transmissionen och måste förstärkas 1 1 1 1 1 Transmissionsfel Skickad signal dämpning Rundning p.g.a. bandbredd Fördröjning Brus på linjen Mottagen signal Sampling Mottagen data Signal-brus förhållande Bandbredd och kapacitet Analoga media medför alltid brus Signalnivån i förhållandet till brusnivån är en väsentlig mätare för kanalens kvalitet SNR, Signal to Noise Ratio Uttrycks i decibel db T.ex. i ett analogt telefonnät kunde signalen vara 1 gånger starkare än bruset Då är SNR = 1 log 1 1 = 4 db Varje kanal har en frekvenskurva som beskriver hur olika frekvenser t.ex. dämpas och förskjuts. En kanals bandbredd är det frekvensområde som med tillräcklig kvalitet kan överföras Uttrycks i Hertz, Hz En kanals kapacitet uttrycker den datamängd som kan överföras Uttrycks i bit per sekund b/s Kanalens kapacitet beror på bandbredd och kodning Nyquists formel för datatransmission r max = 2 W log 2 L r max är största möjliga kapacitet W är kanalens bandbredd L är antalet signalnivåer 3
Brusets inverkan på kapaciteten Störningar i överföring Nyquists formel beaktar inte brus, med oändligt många signalnivåer för vi oändlig kapacitet Shannons formel beaktar bruset C = W log 2 (1 SNR) b/s C är kanalens kapacitet b/s W är kanalens bandbredd SNR är kanalens signal-brus förhållande Obs! Direkt förhållande, inte i db Antalet signalnivåer inverkar inte, formeln ger största möjliga överföringskapaciteten denna kapacitet kan förverkligas på olika sätt t.ex. med olika antal signalnivåer Brus Inverkar på detektering av signalen Den mottagna signalen måste vara tillräckligt stark i förhållande till bruset. Signalnivån i sig är inte så viktig. Värme-energi i komponenter Övriga radiosändningar och bakgrundsbrus i fri vågtransmission Störningsskur (purske, burst) T.ex. mobiltelefon Överhöring från närliggande ledningar Avbrott Felkorrigering Detektering av fel Fel kan korrigeras Om det på förhand har inkluderats redundans, extra information i meddelandet T.ex. Hamming-kodning, till ett 4 bits meddelande läggs 3 bitar data vilket möjliggör korrigering av alla en bits fel Jmf. RAID-skivor för datorer Genom att detektera fel och sända meddelandet på nytt Lämna okorrigerat T.ex. tal och video innehåller ofta naturligt tillräcklig redundans så att meddelandet är förståeligt trots små fel Cyclic Redundancy Check -kontrollsumma Baserar sig på polynom T.ex. CRC-CCITT detekterar up till 16 bitars felskurar Paritetsbit Vanlig i terminalförbindelser och datorers minnen Exempel: ett dataelement har alltid udda antal 1-bitar: 111 1 - > 111 1 1 Kryptografiska kontrollsummor (tiiviste, hash) skyddar mot medvetna ändringsförsök Feldetekteringsmetoden väljs enligt hurdana fel som förväntas i överföringen Termer: simplex och duplex Termer: antalet mottagare Simplex: enkelriktad transmission T.ex. radioprogram Half-duplex: turvis dubbelriktad T.ex. radiotelefon Duplex (full duplex): samtidigt dubbelriktad T.ex. telefon Internet och andra datanät byggs oftast genom att kombinera simplex-förbindelser eftersom trafiken ofta är osymmetrisk (som WWW-trafik) För användaren är tjänsten duplex Enkelsändning (täsmälähetys, unicast): sänds till en mottagare Normal Internet-trafik Rundsändning (yleislähetys, broadcast):sändning till alla mottoagare Rundradio Sökning av tjänster i lokalnät Gruppsändning (ryhmälähetys, multicast): sändning till en viss grupp (som beställt tjänsten) används t.ex. i Internet för videodistribution Anycast (jokulähetys, anycast): sänds till någon mottagare inom en grupp, mottagaren väljs på måfå kunde kanske översättas som någonsändning? 4
Sammanfattning Fysiska skiktet representerar naturvetenskaper, närmast fysik och matematik en stor mängd olika tekniker för överföring av information har definierats för detta skikt Valet av teknik sker enligt behov och resurser - ingen teknik är överlägsen jämfört med andra 5