IP-Telefoni VoIP Voice Over IP



Relevanta dokument
IP-telefoni. Velio Roumenov Stefan Rådesjö

Datakommunika,on på Internet

Tips och råd om trådlöst

Föreläsning 5. Vägval. Vägval: önskvärda egenskaper. Mål:

SIZE CONNECT, TEKNISK BESKRIVNING

Din guide till IP RFID. Intertex Nu ännu starkare säkerhet för SIP. Snom - marknadens säkraste IP-telefon. Ur innehållet TALK TELECOM

Datakursen PRO Veberöd våren 2011 internet

Grundläggande datavetenskap, 4p

IT för personligt arbete F2

KomSys Hela kursen på en föreläsning ;-) Jens A Andersson

Ver Guide. Nätverk

Brandväggar och portöppningar. Manual

Säker IP telefoni? Hakan Nohre, CISSP

Olika slags datornätverk. Föreläsning 5 Internet ARPANET, Internet började med ARPANET

DIG IN TO Nätverksteknologier

Kapitel 5: Lokala nät Ethernet o 802.x. Lokala nät. Bryggan. Jens A Andersson (Maria Kihl)

TCP/IP och Internetadressering

Voice over IP / SIP. Switching Costs SIP. Motivation for VoIP. Internet Telephony as PBX replacement. Internet Telephony Modes.

Systemkrav och tekniska förutsättningar

Hjälp! Det fungerar inte.

IP-telefoni för nybörjare

Introduktion Lync-/SfB-Infrastruktur Cellips infrastruktur Brandväggskrav Lync/SfB Server PSTN Gateway...

Mattias Wiggberg 1. Orientera på Internet. IP-adress. IP-adresserna räcker inte... Mer om IP-adresser

IP-telefoni (Voice over IP) Jonas Myhrman, , D.

DATA CIRKEL VÅREN 2014

En studie av programmet Buddyphone. Delmoment i kursen CSCW 2D1416

Kihl & Andersson: Kapitel 6 (+ introduktioner från kap 7, men följ slides) Stallings: 9.5, 14.1, 14.2, Introduktion i 14.3, 16.1

Hur gör man ett trådlöst nätverk säkert?

3) Routern kontrollerar nu om destinationen återfinns i Routingtabellen av för att se om det finns en väg (route) till denna remote ost.

Lösningar ETS052 Datorkommunikation,

Datakommunika,on på Internet

OH Slides F: Wide Area Networks

Konfigurering av Intertex SurfinBird IX78 tillsammans med IP-växlar och Telia SIP-anslutning

Rapport i Mobila systemarkitekturer. Symbian

Inlämningsuppgift 12b Router med WiFi. Här ska du: Installera och konfigurera en trådlös router i nätverket.

Föreläsning 5: Stora datanät Från användare till användare ARP

Del 1 Frågor om vad höghastighetsnät är:

Lösningar till tentan i ETS052 Datorkommunikation

Innehållsförteckning Introduktion Samtal Kvalitetsproblem Felsökning av terminal Fakturering Brandvägg

DIG IN TO Administration av nätverk- och serverutrustning

ShoreTel Mobility - Användarguide

Instuderingsfrågor ETS052 Datorkommuniktion

Christer Scheja TAC AB

Enum som en komponent i NGN. Gert Öster Ericsson

Tentamen i Datorkommunikation den 10 mars 2014

Dubbelt så mycket till halva priset. Varför IP- Kommunikation Lägre kostnad, Högre effektivitet

Foto: Björn Abelin, Plainpicture, Folio bildbyrå Illustrationer: Gandini Forma Tryck: Danagårds Grafiska, 2009

SIP är vår arena! IP-DECT provkör Gigaset PRO. Microsoft Lync Nu tre starka leverantörer. VoIP gateways - Rädda situationen när Telia stänger ISDN

5 Internet, TCP/IP och Applikationer

Karlstads universitet Institutionen för Informationsteknologi Datavetenskap

5. Internet, TCP/IP tillämpningar och säkerhet

Tentamen i datakommunikation EDA343/DIT420 Vt 2011

DA HT2011: F18. Länklagret och uppkopplingstekniker Ann-Sofi Åhn

Larmsändare sip86. Alla inställningar konfigureras enkelt upp med Windowsprogramvaran IP- Scanner. 2 Larmsändare sip22

Grundläggande nätverksteknik. F3: Kapitel 4 och 5

LABORATIONSRAPPORT Säkerhet & Sårbarhet VPN

SpeedTouch 190. Installations- och användarguide. SIP-gateway. Version R1.0

Datakommunikation. Nätskiktet. Routers & routing

Nätverk och Java, grunder Föreläsning 0: 0: Introduktion till Internet

Denna genomgång behandlar följande:

PNSPO! CP1W-CIF mars 2012 OMRON Corporation

Grundläggande nätverksteknik. F2: Kapitel 2 och 3

Modul 6 Webbsäkerhet

Trött på analogt? Byt till IP!

SIP och NAT, Brandväggar och STUN

DA 2012: F13. Nätverk 2 Ann-Sofi Åhn

Manual. Uppdaterad VAKA-CALL Master 4G. Axema Access Control AB Box Stockholm, Sweden

Att bygga VPN. Agenda. Kenneth Löfstrand, IP-Solutions AB. Olika VPN scenarios. IPsec LAN - LAN. IPsec host - host SSH

Internetdagarna Petter Claesson Systems Engineer introduktion. Ljudkvalitet

Artikelnr. P CallPilot Message Networking Användarhandbok

Denna genomgång behandlar följande: IP (v4) Nätmasken ARP Adresstilldelning och DHCP

4 Paket- och kretskopplade nät

Webbteknik II. Föreläsning 4. Watching the river flow. John Häggerud, 2011

Din guide till IP. IP-DECT Central Telefonbok i Ascom. VoIPgateways Kampanj ISDN till SIP. Snom One - IP-PBX för dig som vill ha allt på burk

F5 Exchange Elektronikcentrum i Svängsta Utbildning AB

Nätverk Hemma. Ur filmen Tre Glada Tokar m. bl.a Nils Poppe Preforbia.se 1

DIG IN TO Nätverksteknologier

Nätverksteknik A - Introduktion till VLAN

IPv6 Jonas Aronsson 3TEa

Lathund Beställningsblankett AddSecure Control

Övningar - Datorkommunikation

Kapitel 10, 11 o 12: Nätdrift, Säkerhet. Publika telenätet. Informationsöverföring. Jens A Andersson. Telenäten är digitala.

Nätverksteknik A - Introduktion till Nätverk

GUIDE FÖR TRÅDLÖST NÄTVERK

Stora datanät Från användare till användare. Jens A Andersson

Praktiska tillämpningar av QoS-teknologi

Din guide till en säkrare kommunikation

Internets historia i Sverige

Vaka Porttelefon. Manual Vaka Porttelefon

Skärmbilden i Netscape Navigator

5 Internet, TCP/IP och Tillämpningar

Datakommunikation vad är det?

Föreläsning 10 Mål Förse en översikt av mobilnätens utveckling Förstå komponenterna i ett mobilt nät. Mobila nätverk (1/5) Mobila nätverk (2/5)

QuickTime Streaming Server, en introduktion

DCS-950G SECURICAM nätverk g trådlös internetkamera med ljud.

1 Förmedlingstjänsten Bildtelefoni.net

Datasäkerhet och integritet

Guide för att välja fibertjänst

HDMI, DisplayPort och USB. Utbildningsmaterial med fokus på certifieringar

HDMI, Displayport och USB. Utbildningsmaterial med fokus på certifieringar

Transkript:

IP-Telefoni VoIP Voice Over IP Joakim Storrank, 25460 Institutionen för Informationsbehandling Åbo Akademi

ABSTRAKT VoIP gör det möjligt att ringa telefonsamtal med hjälp av ett datornätverk, t.ex Internet. VoIP konverterar röstsignalen från en analog telefon till en digital signal och sedan konverteras den tillbaka i andra ändan. För att kommunikationen skall fungera krävs det olika protokoll. Jag kommer i denna uppsats att berätta om hur VoIP fungerar, vilken utrustning som krävs samt om olika protokoll och säkerheten bakom dessa. Nyckelord: IP-telefoni, VoIP, MGCP, SIP, H.323, programvarutelefon

Innehållsförteckning Ordlista 1 Inledning... 1 2 Allmänt... 2 3 VoIP-utrustning... 3 4 Standarder/Protokoll... 4 4.1 Multimediaprotokollet H.323... 5 Terminaler... 5 Gateways... 5 Gatekeepers... 6 Multipoint Control Unit (MCU)... 7 4.2 Session Initiation Protocol (SIP)... 7 4.3 Media Gateway Control Protocol (MGCP)... 9 5 VoIP-kvalitet... 10 5.1 Röstkvalitet... 10 Röstkodning... 11 Paketeffektivitet... 11 Bortträngning av tystnad... 12 Feldöljningsmetoder... 12 Jitter buffer-implementationer... 12 Codec tandem- prestanda... 13 5.2 Eko... 13 5.3 Tester... 14 6 Säkerhet... 15 6.1 H.323-säkerhet... 15 6.2 SIP-säkerhet... 16 6.3 MGCP-säkerhet... 17 7 För- och nackdelar... 17 7.1 Fördelar... 17 7.2 Nackdelar... 18

8 Slutsatser... 19 Referenser... 20

Ordlista ATM ATM är en sorts höghastighetsnätverk som är kapabelt att överföra 150 miljoner signaler per sekund med hjälp av protokollet kallat 'asynchronous transfer mode'. Bitrate Medelmängden av bitar som en sekund av video eller ljud konsumerar. Högre bitrate betyder större filstorlek och generellt sätt bättre kvalitet, medan lägre bitrate betyder mindre filstorlek och sämre kvalitet. Ethernet En metod för att koppla samman PCs för att skapa ett lokalt nätverk (LAN). Full Duplex Dataöverföring över dataledning i två riktningar samtidigt. IETF - Internet Engineering Task Force (http://www.ietf.org/). Internet Engineering Task Force är ett stort öppet internationellt samfund av nätverksdesingers, operatörer, försäljare och forskare som är intresserade av evolutionen i Internetarkitekturen och som ser till att Internet löper utan problem. ITU - International Telecommunication Union (http://www.itu.int/home/). ITU är en internationell organisation med huvudkontor i Geneve, Schweiz. ITU är en del av United Nations System där regeringar och den privata sektorn samordnar globala telekommunikationsnätverk och tjänster. T i ITU-T står för telekommunikation. NAT - Network Address Translation. NAT är översättningen av en IP-adress som används inuti ett nätvek till en annan IP-adress som används inuti ett annat nätverk. Det ena nätverket betecknas som det inre, och det andra nätverket betecknas som det yttre. Overhead I telekommunikationssammanhang Information som är tillsatt i början och slutet av trafiken för kontroll, routing, felkontroll och andra systemfunktioner. PBX Private Branch Exchange. PBX är en privat telefonswich som erbjuder swiching i ett kontor eller gårdsområde. PBXar använder ofta privatägda digitallinjeprotokoll, dock är vissa analoga. POTS Plain Old Telephone System. Ett annat namn för den traditionella, analoga telefonin. Proxy En server placerad mellan en användares maskin och Internet. Den kan fungera som en brandmur eller som ett cacheutrymme för att snabba upp visningen av webbsidor. PSTN Public Switched Telephone Network. Synomym till POTS. RAS-protokoll (Registration, Admission and Status). RAS är protokollet mellan ändpunkter (terminaler och gateways) och gatekeepers. RAS används för registrering,

admissionskontroll, bandbreddsförändringar, status och frigör procedurer mellan ändpunkter och gatekeepers. En RAS-kanal används för att växla RAS-meddelanden. Sampla Ordet sample betyder en digital inspelning av ett ljud. Processen för att erhålla dessa samples kallas för sampling. SCTP Stream Control Transmission Protocol. SCTP är ett transport layer protocol definierat år 2000 av IETF. Det är till en del ekvivalent med TCP eller UDP. TCP är byte-orienterat, och SCTP har hand om rammeddelanden (framed messages). SDP - Session Description Protocol. Används för att beskriva typen av media. Godkända typer kan t.ex. vara ljud, video och data. Det specificerar också vilken typ av mediakodning som används. SDP erhåller också information om förbindelsen (t.ex. UDPportar). Segment En del av en kabel i ett nätverk S/MIME Secure Multipurpose Internet Mail Extensions. En specifikation för säker e- post, designad för att lägga till säkerhet till e-postmeddelanden i MIME-format via autentisering (användandes av digitala signatuer) och kryptering. Parsning Att dela upp, analysera och kategorisea individuella komponenter av ett språk till mindre enheter så att de kan användas fördelaktigt i programmering. SSL Secure Sockets Layers. Ett protokoll gjort av Netscape för att säkra data (kryptera) som sänds med webbläsaren. Switch (växel) utrustning som kan sätta en eller flera kommunikationslinjer i förbindelse med en eller flera andra kommunikationslinjer. T.120 ITU-T.120 standarden är gjord för en familj av kommunikations- och applikationprotokoll som är gjorda och godkända av internationella dator- och telekommunikationsindustrier. Genom att använda dessa protokoll, kan utvecklare göra kompatibla produkter och tjänster för realtids, flerpunkts dataförbindelser och konferenser. TCP Transmission Control Protocol. Protokollet fungerar i samband med IP för att se till så att paket förflyttar sig säkert på Internet. Den här metoden används för den flesta Internetaktiviteten. TLS Transport Layer Security. Den senaste versionen av SSL. UDP User Datagram Protocol. Protokollet är ett av standardprotokollen på Internet. Det överför datapaket utan felkontroll.

URI - Uniform Resource Identifier, adressen till en Internetresurs. URI är det unika namnet som används för tillgång till en resurs. Det behöver nödvändigtvis inte vara en specifik plats för en fil, och på grund av detta är det mer användbart än den liknande akronymen URL (Uniform Resource Locator).

1 Inledning Röst har överförts i det gamla vanliga analoga telefonsystemet (POTS - Plain Old Telephony System) sedan 1878. Många miljarder euro används årligen för att ringa dessa samtal. Det finns ett behov för både företag och privatpersoner att minska på denna kostnad. Detta gör VoIP till ett intressant alternativ. VoIP innebär överföring av röst som datapaket med hjälp av ett Internetprotokoll (Internet Protocol, IP). Användarens röst konverteras till en komprimerad digital signal, och delas in i en mängd paket. Paketen överförs sedan genom privata eller publika nätverk och konverteras tillbaka i andra ändan. Begreppet VoIP, eller IP-telefoni, har diskuterats åtminstone sedan 1970 när idén och teknologin började utvecklas. Trots denna historia, nådde VoIP inte en kommersiell nisch förrän mitten på 1990-talet. Denna gradvis kommersiella utveckling kan kännas igen genom saknandet av en IP-infrastruktur och faktot att PSTN-samtal (Public Switched Telephone Network) var, och ännu är, ett mycket mera pålitligt alternativ. Vocaltec (www.vocaltec.com) tillverkade 1995 den första kommersiellt tillgängliga VoIPprodukten, som krävde att båda parterna i ett samtal hade tillgång till både Internet och en mjukvara installerad på sin PC. Dessvärre möjliggjorde inte detta traditionella samtal via PSTN [1]. 70 procent av de europeiska konsumenterna har aldrig hört talas om termen VoIP. Dessutom använder endast en procent av de europeiska konsumenterna VoIP för samtal i hemmen. Man litar dock på en ökad VoIP-användning, eftersom 35 procent av användarna är intresserade av en bredbandstjänst som erbjuder röst-, video- och datatjänster i samma paket [5]. Det finns en mängd olika faktorer som påverkar anpassandet till VoIP-teknologin. Först och främst kan kostnaden för ett samtal bli hälften så låg mot vad den är i det vanliga analoga telefonnätet. Lägre kostnader är ett resultat av effektiv användning av bandbredd som kräver mindre långdistanskablar mellan switcharna. De traditionella analoga nätverken använder sig av en full-duplex 64 Kbps-kanal under ett samtal. VoIP-nätverken kräver maximalt 14 Kbps på grund av röstkompression, och bandbredden används endast då någonting överförs i nätverket. Mer effektiv användning av bandbredden betyder att fler samtal kan göras över samma linje. Förutom lägre kostnader så erbjuder VoIP t.ex. ringnings-id och vidarebefordring av samtal. VoIP möjliggör samtidig användning av Internet och rösttrafik över samma telefonlinje. Denna funktion eliminerar problemet med två telefonlinjer, en för data och en för röst [1]. - 1 -

2 Allmänt Ett samtal måste göras innan någon röst kan skickas. I det traditionella telefonsystemet går denna procedur till så att man ringer upp någon på basis av ett telefonnummer, vilket sedan behandlas av telefonbolagets system för att ringa till numret i fråga. Med VoIP knaprar användaren in numret som skall ringas, vilket kan vara i traditionell form med siffror, eller i form av en Universal Resource Indicator (URI). Resten av processen är mera invecklad, med en serie av komplexa paketväxlingar baserade på ett VoIPsignaleringsprotokoll. Det som gör VoIP mer invecklat än det traditionella telefonsystemet, är att datorsystem inte har något telefonnummer, utan en IP-adress. Användaren knaprar dock in ett vanligt telefonnummer eller en URI för att ringa, och telefonnumret eller URI:n måste länkas med en IP-adress för att nå mottagaren. Detta skall ske på samma sätt som med en vanlig webbadress (URL), t.ex. måste www.abo.fi länkas ihop med abo.fi webbservern. En mängd protokoll är inblandade för att få reda på vilken IP-adress som stämmer överens med motpartens telefonnummer. Protokollen behandlas mer ingående i kapitlet om protokoll. Figur1. Röstdataöverföring i ett VoIP-system. - 2 -

Figur 1 illustrerar det grundläggande flödet av röstdata i ett VoIP-system. Det första steget i denna procedur att är att konvertera den analoga röstsignalen till en digital signal med hjälp av en analog-digital konverter. Eftersom digitaliserad röst kräver en stor mängd bits (bitar), så kan en kompressionsalgoritm användas för att minska på mängden data som skall överföras. I nästa steg sätts röst in i datapaket för överföring på Internet. Protokollet som används för röstpaket är vanligtvis Real-time Transport Protocol, RTP (RFC 3550). RTP-paket har speciella huvudfält (header), som innehåller nödvändig data för att korrekt dekoda paketen till en röstsignal i andra ändan. Röstpaket överförs som en extra last för UDP-protokoll, vilket också används för traditionell datatrafik. I andra ändan är processen omsvängd: paketen avkodas och sätts i rätt ordningsföljd och digitaliserad röstdata extraheras från paketen och packas upp. Sedan behandlas den digitala rösten av en digital-analog-konverter för att göras om till analoga signaler för motpartens telefon [2]. Analoga telefoner är traditionella telefoner de som kan köpas i lokala affärer och de som förmodligen används där hemma. Dessa telefoner tar emot och skickar samtal över traditionella telefonlinjer. Oftast har de endast några enkla funktioner för standardanvändning och inte speciella knappar för t.ex. konferenssamtal. Analoga telefoner är ett bra val för människor som inte ringer så ofta, och i offentliga utrymmen som t.ex. lagerutrymmen och hallar. De är också ett bra alternativ för dem som saknar ethernetanslutningar eller tycker att det är för dyrt att installera ethernetanslutningar. [6] Digitala telefoner (IP-telefoner) levererar alla fördelar med digital teknologi: många egenskaper, automatiserade funktioner samt utmärkt prestanda med många skräddarsydda funktioner. Digitala telefoner eliminerar även problemet med två telefonlinjer, de har en gemensam data- och röstlinje. Det är också billigare att ringa med IP-telefoner än med analoga telefoner [7]. 3 VoIP-utrustning VoIP-system finns i många olika former. T.ex. erbjuder Netmeeting som kommer med Windows en del VoIP-möjligheter, likaså Apples ichat. Även Linux har en mängd olika VoIP-applikationer att välja mellan. Vanligtvis associeras dock termen VoIP med tillbehör som klarar uppringning med hjälp av telefonnummer och kommunikation med människor i andra ändan av en anslutning. Dessa har endera ett annat VoIP-system eller en traditionell analog telefon. Efterfrågan av VoIP-tjänster har resulterat i en bred skala av produkter som t.ex. traditionella mobiltelefoner, konferensenheter, trådlösa enheter och programvarutelefoner. De traditionella mobiltelefonerna har fler funktioner än de vanliga analoga telefonerna. De klarar t.ex. av webbläsning, snabbmeddelanden och telefonkataloger. Många av dessa telefoner innehåller en basstation som ger samma bekvämligheter som en traditionell trådlös analog telefon. Konferensenheter möjliggör samma typ av service som vanliga traditionella konferenstelefonsystem. Eftersom kommunikationen sköts över Internet så kan de även tillåta användare att koordinera datakommunikationstjänster, t.ex. en whiteboard som visar sig på datormonitorerna i båda ändarna av samtalet. De trådlösa VoIP-enheterna börjar bli allt mer populära, - 3 -

speciellt eftersom många organisationer redan har 802.11-möjligheter (trådlöst). Trådlösa VoIP-lösningar kan ställa till med problem om vissa säkerhetsaspekter inte är åtgärdade. WEP-säkerheten av 802.11b ger låg eller ingen säkerhet. Den nyare WiFi Protected Access (WPA) ger förbättringar av säkerheten, och kan integreras med trådlös teknologi och VoIP. Om man har hörlurar med mikrofon (headset), rätt programvara och en förmånlig uppkoppling till Internet så kan vilken dator som helst bli en VoIP-enhet, ofta en så kallad programvarutelefon (softphone). Ett exempel på en programvara är Skype (http://www.skype.com). I praktiken skall programvarutelefoner inte användas där säkerheten är låg, eftersom virus och andra skadegörande program är vanliga i dagens datorer. Dessa svagheter gör att riskerna är höga då man använder programvarutelefoner tillsammans med de flesta applikationer. Ett programvarusystem strider emot principen att separera tal- och datanätverk eftersom Pc:n nödvändigtvis fungerar i datanätverk. För att själva VoIP-systemet skall fungera och det skall vara möjligt att ringa samtal, krävs en mängd andra komponenter som t.ex. gateways, routers samt protokoll. Dessa kommer jag att behandla mera i nästa kapitel [2]. 4 Standarder/Protokoll Med hjälp av olika VoIP-protokoll kan röstkommunikationer göras på alla IP-nätverk, oavsett om det är Internet, Intranet eller LAN (Local Area Network). VoIPsignaleringsprotokoll används för att upprätta och avsluta samtal och de har hand om information för att lokalisera användare [9]. Ett VoIP-system består av ett antal olika komponenter: Gateway/Media Gateway, Gatekeeper, Call agent, Media Gateway Controller, Signaling Gateway och en Call Manager. Gatewayn konverterar media från ett nätverk till ett format som krävs av ett annat slags nätverk. Denna gateway kan behandla ljud, video och T.120 självständigt eller i vilken kombination som helst. Den klarar även av full duplex mediaöversättningar. I VoIP delas rösten in i olika segment med hjälp av en digital signalprocessor (DSP) och lagras i olika röstpaket. Dessa röstpaket överförs genom att använda IP i kombination med något av protokollen för transport av multimedia (ljud, video, fax, data) över ett nätverk t.ex. H.323, MGCP, MEGACO/H.GCP, SIP, T.38, SIGTRAN och Skinny. Kodare används för effektiv användning av bandbredden. Olika kodningstekniker för telefon- och röstpaket är standardiserade av ITU-T. Exempel på dessa är G.723.1, G.729 och G729A. Kodning-avkodning kompressionsscheman (CODECs) används i båda ändarna av förbindelsen och konversationen fortskrider med hjälp av Real-Time Transport Protocol/User Datagram Protocol/Internet Protocol (RTP/UDP/IP). Jag beskriver inte alla protokoll i detalj, utan fokuserar mig på de mest använda protokollen [10]. - 4 -

4.1 Multimediaprotokollet H.323 H.323 är ITU-T s standard som ursprungligen utvecklades för multimediakonferenser i LANs, men utvecklades sedan vidare för att stöda VoIP. Standarden omfattar både punkt till punkt förbindelser och flerpunktskonferenser. H.323 definierar fyra logiska komponenter: Terminaler, Gateways, Gatekeepers och Multipoint Control Units (MCUs). Terminaler, gateways och MCUs känns igen som ändpunkter [9]. Terminaler En H.323-terminal är en ändpunkt i ett nätverk som möjliggör realtids, två-vägskommunikation med en annan H.323 terminal, gateway, eller MCU. Kommunikationen består av kontroller, indikationer, ljud, video, eller data mellan två terminaler. En terminal kan tillhandahålla endast ljud; ljud och data; ljud och video; eller ljud, data, video. Terminalen kan vara ett datorbaserat videokonferenssystem eller en annan enhet. En gatekeeper stöder ett stort urval av H.323-terminalimplementationer från många olika försäljare. Dessa terminaler måste stöda H.323 standarden Registrering, Admission och Status (RAS) protokoll för att fungera tillsammans med gatekeepern. Gatekeepers känner igen en av två typer av terminalaliases, eller terminalnamn: H.323 IDs, som är godtyckliga text-strängar E.164-adresser, som är telefonnummer Om ett H.323-nätverk används för intern kommunikation, så borde varje terminal åtminstone ha ett e-mailnamn som sin H.323-identifikation (ID), t.ex. voipuser@abo.fi. Domännamnet av e-mail-idt borde vara det samma som det konfigurerade domännamnet på gatekeepen som den kommer att använda. I föregående exempel skulle detta vara abo.fi. Gateways En H.323-gateway är en ändpunkt i ett LAN som möjliggör realtidskommunikationer mellan H.323-terminaler i LANet och mellan andra ITU-terminaler i ett WAN eller till andra H.323-gateways. Gateways låter H.323-terminaler kommunicera med apparater som kör andra protokoll (protokollkonvertering). Figur 2 visar en gateway mellan en H.323-terminal och en icke- H.323-terminal. - 5 -

Figur 2. Gateway mellan en H.323-terminal och en icke-h.323-terminal Gatekeepers En H.323 gatekeeper är en H.323-enhet i ett LAN som tillhandahåller adressöversättningen och som kontrollerar åtkomligheten till LANet för H.323- terminaler, gateways och MCUs. Gatekeepers är valfria noder som har hand om ändpunkterna i ett H.323-nätverk. Ändpunkterna kommunicerar med gatekeepern med hjälp av RAS-protokollet. Ändpunkterna försöker registrera sig med en gatekeeper vid uppstart. När de vill kommunicera med en annan ändpunkt, frågar de tillstånd att initialisera ett samtal med hjälp av ett symboliskt alias (tillfälligt namn) för ändpunkten, t.ex. en E.164-adress eller en e-postadress. Om gatekeepern bestämmer att samtalet kan fortskrida, returnerar den en mål-ip-adress till den härstammande ändpunkten. Denna IP-adress är kanske inte den egentliga adressen för mål-ändpunkten, men det kan vara en mellanliggande adress som t.ex. en proxy-adress eller en gatekeeper som har hand om signaleringen av samtal. Figur 3. Översikt av en gatekeeper - 6 -

Multipoint Control Unit (MCU) En MCU är en ändpunkt i ett nätverk som tillåter tre eller flera ändpunkter att delta i en multipoint- (flerpunkts)konferens. Den kontrollerar och blandar video, ljud och data från ändpunkter för att göra en multimediakonferens. En MCU kan också koppla samman två ändpunkter i en point-to-point-konferens, som senare kan utvecklas till en multipointkonferens [11]. 4.2 Session Initiation Protocol (SIP) SIP anses i dagens läge vara det lämpligaste protokollet för VoIP. SIP är specificerat i IETF som det protokoll som initialiserar en två-vägskommunikation. Det anses vara mer simpelt än H.323, även om det för tillfället är det största RFC i IETF-historien. SIP är textbaserat och undviker därför parsningsproblemen som existerade i H.323- protokollserien, om S/MIME inte används som en del av SIPs ingående säkerhetsåtgärder. SIP är ett protokoll på applikationsnivå, dvs. det är avskilt från protokollnivån som det transporteras på. Det kan överföras av TCP, UDP eller SCTP. UDP kan användas för att minska overhead och öka hastigheten samt effektiviteten, och TCP kan användas om SSL/TLS är infogat för säkerhetsförbindelser. Avvikande från H.323, så används endast en port i SIP. Standardporten som används är 5060. Arkitekturen i ett SIP-nätverk skiljer sig från H.323-arkitekturen. Ett SIP-nätverk är konstruerat av ändpunkter, en proxy- och/eller omdirigeringsserver, lokaliseringsserver samt ett register. (Figur 4) Figur 4. Nätverksarkitekturen i SIP (topologisk översikt) - 7 -

I en SIP-modell är användaren inte bunden till en specifik värddator (host). Inledningsvis rapporterar användaren sin plats till ett register, som kan vara integrerat i en proxy- eller omdirigeringsserver. Denna information är i sin tur arkiverad på den externa lokaliseringsservern. Meddelanden från ändpunkterna måste dirigeras genom endera en proxy- eller omdirigeringsserver. Proxyservern hejdar meddelanden från ändpunkter eller andra tjänster, inspekterar deras Till: -fält, kontaktar lokaliseringsservern för att förvandla användarnamnet till en adress och vidarebefordrar meddelandet till en lämplig ändpunkt eller annan server. Omdirigeringsservrar sköter förvandlingen på nästan samma sätt, de får den aktuella adressen till destinationen av lokaliseringsservern och returnerar denna information till originalsändaren, som sedan måste sända sitt meddelande direkt till denna resolverade adress. Själva SIP-protokollet är upplagt av tre-stegs handskakningsmetoden som är implementerad i TCP. Processen påminner om den med omdirigeringsservrar, men med det extra steget att returnera den översatta (resolved) adressen till källändpunkten. Under installationsprocessen förhandlas kommunikationsdetaljer mellan ändpunkterna med hjälp av Session Description Protocol (SDP), som innehåller ett fält med information om vilket codec som skall användas, uppringarens namn, etc. Om Bob vill ringa ett samtal till Alice, sänder han en INVITE-begäran till proxyservern som innehåller SDPinformationen för sessionen, som sedan vidarebefordras till Alices klient av Bobs proxy, möjligen via hennes proxyserver. Slutligen, antaget att Alice vill prata med Bob, sänder Alice ett OK -meddelande tillbaka som innehåller hennes samtalspreferenser i SDPformat. Sedan svarar Bob med ett ACK. SIP förser ACK så att det innehåller SDP i stället för INVITE, så att en INVITE kan synas utan protokollspecifik information. Efter att ACK är mottaget, kan samtalet fortlöpa genom de RTP/RTCP-portar som bestämts på förhand (Figur 5). Det bör noteras att all trafik löpte genom en port i ett simpelt textformat, utan någon av de invecklade kanal-/portväxlingarna som är associerade med H.323. Dock presenterar SIP en del utmaningar för brandmurar och NAT [2]. Figur 5. Nätverksarkitekturen i SIP (protokollöversikt) - 8 -

4.3 Media Gateway Control Protocol (MGCP) Media Gateway Control Protocol (MGCP) är ett enhetskontrolleringsprotokoll som är ämnat för att kontrollera enheter, som t.ex. Media Gatewayn (MG) och Integrerade Access Enheter (Integrated Access Devices (IADs)), genom att använda meddelanden i textformat för att sätta upp, sköta om och terminera multimediasessioner i ett centraliserat kommunikationssystem. Skillnaden mellan MGCP och andra multimediaprotokollkontrollsystem är att MGCP tillåter ändpunkterna i ett nätverk att kontrollera kommunikationssessionen. MGCP är ett protokoll som fungerar mellan en Media Gateway (MG) och en Media Gateway Controller (MGC) (även kallade samtalsagenter), på så sätt att Media Gateway Controllern kontrollerar Media Gatewayn. Media Gatewayn är en standardkomponent som terminerar PSTN switchade kretsar och konverterar pulskoden till paketerad information och vice versa. Den har också hand om RTP-mediaströmmar över IP-nätverket. Media Gateway Controllern ansvarar för registrering och skötsel. Den kontrollerar funktionaliteten av resurser i Media Gatewayn och utför protokollkonvertering mellan PSTN signaleringsprotokoll och IP-telefoni. Den samlar också information om IP och kretsflöden och ger den informationen till administrationssystem. MGCP-modellen består av ändpunkter och förbindelser: Ändpunkter är källor av data och kan vara fysiska eller virtuella. Ett exempel på en virtuell ändpunkt är en ljudkälla i en audiobaserad server. Skapandet av fysiska ändpunkter kräver hårdvaruinstallationer, medan skapandet av virtuella ändpunkter kan göras med mjukvara. En förbindelse är ett samband mellan ändpunkter där data förflyttas. Punkt-tillpunkt och multipunktförbindelser är möjliga. Förbindelser kan existera i IPnätverk, ATM-nätverk eller i interna förbindelser. För punkt-till-punkt förbindelser, kan ändpunkten av en förbindelse vara i en separat gateway eller i samma gateway [8]. - 9 -

Figur 6. Överblick av MGCP 5 VoIP-kvalitet En mängd olika metoder används för att övervinna de fientliga förhållanden som finns i IP-nätverk och för att tillföra en acceptabel Quality of Service (QoS). Exempel på dessa metoder är: fördröjning, jitter, eko och paketborttappning (packet loss). Framgången av VoIP kommer till en stor del att handla om samtalskvaliteten och hur denna kvalitet jämför sig med det vanliga telefonsystemet (PSTN). Ett av de mest omtalade problemen är att VoIP aldrig kommer att leverera lämplig kvalitet. Hur som helst, att nå en högkvalitets VoIP-lösning är inte omöjligt, snarare en ingenjörsutmaning. Betydelsefulla steg har gjorts de senaste åren för att åstadkomma en högre kvalitet på systemen. De tre viktigaste faktorerna (kvalitetsmässigt) för ett VoIP-system från en användares synvinkel är: Prestandan av VoIP-enheten Prestandan i nätverket Punkt-till-punkt-fördröjningen 5.1 Röstkvalitet Det är möjligt att skapa ett högkvalitetssystem, men låg bandbreddshastighet resulterar ofta i en nedsatt röstkvalitet. Utmaningen är att leverera en tillräckligt bra röstkvalitet till en specifik bitrate. Jag kommer nu att berätta om de aspekter som betyder mest i röstkvalitetssammanhang; röstkodning, paketeffektivitet, bortträngning av tystnad, feldöljningsmetoder, jitter buffer-implementationer samt codec tandem- prestanda. - 10 -

Röstkodning De flesta PSTN-nätverken fungerar med röst samplad i 8 khz enligt ITU-T s standard G.711. Detta kodar i 64 kbit/s och introducerar endast lite hörbar störning för de flesta typer av signaler. I en stor del av applikationerna är en mycket lägre bitrate att föredra, endera för att kapaciteten är begränsad (mobil) eller för att maximera mängden av trafik som kan överföras över en anslutning. Nuvarande ITU-T-rekommendationer innehåller codecs som komprimerar till 5.3 kbit/s, dock är kvaliteten mycket lägre än det som definieras i G.711. För att maximera fungerbarheten är det vanligt för VoIP-gateways och klienter att erbjuda en eller flera standardcodecs. Valet av codec bestäms till en del av bandbredden som erbjuds. Bandbredden i sin tur bestämmer den maximala bitraten för codecen, och den maximala röstkvaliteten som systemet kommer att uppnå under ideala förhållanden. Generellt kan man säga att ju lägre bitraten är, desto lägre är också kvaliteten för lyssnaren. Codecet med den bästa kvaliteten är fortfarande G.711 i 64 kbit/s. Det inte så komplicerade G.726 codecet erbjuder endast bra prestanda i 32 kbit/s eller högre, och är jämförbart med det nyare GSM-EFR codecet i 12.2 kbit/s och G.728 (CELP) i 16 kbit/s. Eftersom det finns en efterfrågan för hög kvalitet, är det klart att det inte lönar sig att välja ett codec med en låg bitrate i dagens VoIP-marknad. På grund av detta erbjuder de flesta systemen G.711 och åtminstone ett codec med låg bitrate. Paketeffektivitet En annan sak att tänka på när man väljer ett codec är hur mycket röst som kan placeras i ett IP-paket. Detta bestäms delvis av ramstorleken (frame size) i codecet. Mängden av röst som placeras i ett paket har en direkt inverkan på den underliggande nätverkseffektiviteten. VoIP är ineffektivt för små röstpaket, medan stora röstpaket leder till långa fördröjningar som är olämpliga för realtidskommunikationer. Paketen innehåller vanligtvis 10-30 ms med röst, som ger ett lämpligt byte mellan nätverkseffektivitet och ökad fördröjning. Det är viktigt att notera att på grund av IP-protokollets ineffektivitet, är det vettigt att delvis minska bitraten i ett codec. Bitraten bör minskas på grund av IP, UDP och RTPhuvud (headers), som bidrar till ett 40-byte overhead i varje paket. När man väljer ett codec är det också viktigt att veta hur bra det kommer att koda ickeröstsignaler, t.ex. bakgrundsstörningar. När telefoner används i en högljudd omgivning, kan ett codecs egenskaper för att koda bakgrundsljud ha en betydande effekt på kvaliteten. Codecs till mobiltelefoner är gjorda för att klara av dessa störningar och är därför de lämpligaste för användning i högljudda omgivningar. - 11 -

Bortträngning av tystnad Bortträngning av tystnad, eller discontinuos transmission (DTX), beskriver processen där användaren inte pratar, med andra ord när röst inte kodas eller överflyttas. Detta gör att det totala systembandbreddsbehovet kan minskas och producera en genomsnittlig bandbreddsbesparning på 40 %. DTX är implementerat med hjälp av en voice activity detector (VAD). Det är problematiskt att veta vad som är röst och vad som inte är röst i en överföring. Ett annat problem är hur man skall skapa en signal för att fylla ut de tysta perioderna. Denna genererade signal kallas komfortljud (comfort noise). Utan komfortljud känns telefonsystemet dött för användaren, men ett fel i ljudet när användaren pratar eller inte pratar är störande och bidrar till en känsla av dålig kvalitet. Feldöljningsmetoder VoIP-system kan lida av en viss mängd paketborttappningar under normala förhållanden och det kan också finnas borttappade paket av jitter buffern (mer om jitter buffer i nästa stycke). Möjligheten för en VoIP-enhet att dölja paketborttappning har stor betydelse för dess prestanda. Vissa standardiserade codecs (t.ex. G.729, GSM-EFR), innehåller egna feldöljningsmetoder. Användandet av pantentskyddade feldöljningsmetoder kan erbjuda en förbättring av kvaliteten jämfört med standardmetoderna och de är användbara även med andra codecs. Ett alternativ till feldöljningsmetoder är insättandet av en tystnad i stället för paketborttappning detta ger en klicknings-effekt som användare anser störande. Vid medelmåttliga paketborttappningar, kan en G.711-implementation utan feldöljningsmetod leda till en lägre kvalitet än ett codec med en låg bitrate som har en feldöljningsmetod. Jitter buffer-implementationer Ett jitter buffer behövs för att jämna ut distribueringen av paketfördröjningar som karakteriseras av IP. Det är viktigt att notera att en gateways jitter buffer har en betydelse för systemets fördröjning och röstkvalitet. Det är nödvändigt att ha en omsorgsfull balans mellan tillsättandet av för mycket fördröjning, som försämrar konversationen, och mellan pakettappning, som reducerar röstkvaliteten. Jitter buffrar är kategoriserade i två typer statiska och dynamiska. Statiska buffrar använder en fastslagen längd av buffer och är de lättaste att implementera och sköta om. De paket som anländer för sent förstörs helt enkelt. Jitter bufferstorleken kan vanligen konfigureras, men generellt sätt så kräver en statisk buffer ett välskött underliggande nätverk för att hålla jittret inom bufferstorleken. Den mera sofistikerade dynamiska jitter buffern justerar buffern på basis av anländande paketjitter. Detta lämpar sig bra för ett nätverk med en mer oregelbunden jitterprofil, men kan också vara till nytta i ett välskött nätverk. Om nätverket fungerar bättre än väntat, t.ex. under 10 ms av jitter i stället för under det planerade 30 ms, kan buffern justeras för - 12 -

att minska helhetsfördröjningen i förbindelsen. Från kundernas synvinkel, förbättrar denna minskning i fördröjning samtalskvaliteten. Codec tandem- prestanda Om ursprungssystemet har röst kodad i ett annat format än mottagarens, måste en avkodning göras. Detta resulterar i en transkodning (transcoding) eller tandemering (tandeming) av röstcodecs. Generellt sätt kan inte kvaliteten av en kombination vara bättre än den sämsta länken och kvaliteten kan vara ännu sämre om två eller flera codecs med låg bitrate används. Ordningen är också viktig. För att dessa system förvränger röst på ett icke-linjärt sätt, så producerar G.729 efterföljt av EFR inte exakt samma kvalitet som EFR efterföljt av G.729. Fördröjningen höjs också signifikant med tandeming, t.ex. mobila nätverk presenterar fördröjningar på ca 100 ms båda vägarna. Dessa problem kan undvikas med tandemfria operationer, där systemen förhandlar om en gemensam codec används punkt-till-punkt. 5.2 Eko Ett stort arbete har gjorts för att avgöra de kombinerade effekterna av rösteko med fördröjning. Fördröjningen som introducerades genom att paketera rösten och ta bort jittret, resulterade i fördröjningar som var långa nog för att göra ett system känsligt för ekoproblem. Borttagning av eko (echo cancellation) är därmed ett måste i de flesta VoIPsystem. Detta som en kontrast till PSTN-systemet, där borttagning av eko endast är nödvändigt med långdistanssamtal. Kortvariga ekon kännetecknas sällan av sidotoner, om inte round-trip fördröjningen överstiger 30 ms eller ekonivån är extremt hög. På grund av detta är borttagning av eko inte nödvändigt i PSTN-system. Å andra sidan så kommer round-trip fördröjningarna i VoIP-system troligen inte att vara mindre än 30 ms. Detta försäkrar att någon form av ekoborttagning är nödvändig. Om ett VoIP-system kopplar upp sig till det lokala PSTN, är borttagandet av eko högst troligt nödvändigt för att minska på de lokala blandsignalerna. Om systemet inte kopplar upp sig till ett lokalt PSTN, borde borttagning av eko ändå vara aktivt för att ta bort akustiskt eko. - 13 -