Perspektiv och bildförvrängning v olik slg Bkgrund Tidig vbildningr i mänsklighetens histori vr pltt i betydelsen tt llt mn ritde/målde v såg ut tt vr på smm vstånd från betrktren. Frm till och med medeltid kyrkomåleri sknde mn i västerlndet ett systemtiskt sätt tt i målningr beskriv tt föremål låg på olik vstånd. Att lik stor objekt ser mindre ut om de är vlägsn är förmodligen en stenåldersobservtion. Men hur de sk minsk i bildstorlek för tt vi v en bild sk dr rätt slutsts om ders vstånd vr länge okänt. Ett ännu värre problem vr hur mn skulle få vståndet melln en rk rd v lyktstolpr utmed en väg som går rkt ut från betrktren tt se konstnt ut (i ett tänkt medeltid konstverk med telefonstolpr). Av uppenbr skäl vr de först nstsern till lösning på problemet gjord v konstnärer, vilk vägde in de värderingr och känslor mn ville förmedl i bilden. Ett stort ntl konstnärsperspektiv (från olik åldrr) finns beskrivn: Fursteperspektivet där föremål eller främst personer vbilds större ju högre rng eller betydelse de hr. Polycentrisk perspektiv som är det mn skulle få om mn stte fler fotogrfier, tgn i olik vinkel bredvid vrndr och på olik sätt gjorde övergången melln dem kontinuerlig. Dett är bsolut inte smm sk som om mn toge ett foto med en vidvinkellins (om nu någon trodde det) vilket vi kommer tt se. Grodperspektiv, kvljersperspektiv och militärperspektiv är ndr. Tekniskt nvänds oft isometriskt perspektiv som bevrr förhållnden melln längder på ett sätt som är br i exempelvis ritningr och plttformsspel. Wikipedi (svensk) hr en br översiktrtikel över dess under rubriken perspektiv, men de är inte temt för denn lill skrift. För tt ge helt korrekt vståndskänsl i en bild sk den nturligtvis egentligen vr det vi idg kllr 3D, dvs bilden sk ge korrekt stimuli till betrktrens ög med vseende på ckommodtion, konvergens och stereoseende. Dett täcks emellertid v en nnn föreläsning (3d-seende) och vi nvänder här en enögd person med oändligt skärpedjup som utgångspunkt för tt slipp dess problem. Frm till introduktionen v hålkmern, cmer obscur, vr fältet öppet för tycknde och känslomässig tolkningr v begreppet perspektiv, men i och med denns entré på scenen fick mn ett fcit på vd som vr rätt. Mn klkerde v den bild som projicerdes inuti hålkmern och nu hde ju nturen vist hur det skulle se ut. När mn sedn kunde förse hålkmern med en lins och dessutom registrer bilden fotogrfiskt vr ju sken klr. Ett kvrstående problem vr tt vståndet till objekten spelde roll på fler sätt än det uppenbr. En bild tgen med hålkmer på c 10 m vstånd från en grupp objekt /(som ligger lite olik långt bort exvis 9, 10 och 11 m) är inte br dubbelt så stor bilden v smm objektgrupp registrerd på 0 m vstånd, och det är blnd nnt dess skillnder vi sk försök red ut.
Vrför känn till perspektiv Att mn behöver känn till grundern i perspektivlärn för tt bli en br (klssisk) konstnär är gnsk uppenbrt. Förlängningen därifrån till skpndet v nimerd film eller scener i dtspel är också lätt tt inse. I ett ingenjörsperspektiv är omvändningen också viktig: Hur kn mn ur en given vnlig pltt bild återskp så mycket informtion som möjligt om den tredimensionell förlgn? Mtemtiken kommer tt vis tt den bild mn får på ett gnsk intrikt sätt beror på smbnd melln fokllängden på det vbildnde systemet och objektsvståndet. I mång system kommer sedn berrtioner i optiken tt komm in. En persons ögon hr ju en given fokllängd på c 0 5 mm och för tt återskp vd denn person ser måste det optisk systemet ien (tänkt) kmer vpsss efter dett. En pinne på mrken Vi tänker oss situtionen tt vi betrktr en lång, rk väg och fixerr vår ögon eller mitten på kmerns synfält, mot vägens slut, långt bort. Vi måste då börj med tt inse tt den punkt vi tittr på är vårt vbildnde systems optisk symmetrixels skärningspunkt med vägslutet. De linjer som utgörs v trottorknter, diken och eventuell husfsders över- och underknt vid sidn v vägen konvergerr mot denn punkt som brukr klls centrlpunkt, oändlighetspunkt eller perspektivpunkt. injern brukr klls perspektivlinjer. Någon gång på högstdiet brukr mn i bildundervisningen upptäck dett och mång inser tt de fktiskt kn rit ett hus så tt det ser perspektivistiskt korrekt ut. Men vd händer om vi lägger en pinne, med känd längd Δ på vägen (jfr fig där proportionern melln och f inte är rimlig)? Pinnen börjr på vståndet från betrktren och är prllell med vägen. Till tt börj med kn vi konstter tt pinnen (om den är rk) syns i bilden och ser ut som en rk pinne (dett är vetenskp på hög nivå). Hölle mn däremot pinnen på betrktrens höjd äver mrken dvs pinnen ligger utmed den optisk xeln (röd streckd), så syns den inte i bilden. Möjligen syns pinnens ändyt om det inte är en mtemtiskt oändligt tunn pinne. Frågn är nu hur lång bilden blir v pinnen på chipet inuti kmern om h inte är noll? Om vi nvänder kmer-pproximtionen och lltså säger tt bildvståndet är f så kommer pinnens närmst punkt tt vbilds på vståndet
( 1) M T ( ) h f h från bildens mittpunkt där MT är kmern trnsversell förstoring för objektsvståndet. Pinnens borterst punkt ligger också på vståndet h från symmetrixeln och vbilds på vståndet ( ) + Δ M ( + Δ) T f h + Δ Subtrherr vi dess från vrndr får vi (3) 1 1 Δ hf + Δ hfδ Den mtemtiskt väl bevndrde inser knske tt vi skulle kunnt differentier (1) och direkt få (3). Grttis i så fll. Minustecknet betyder tt pinnens borterst punkt ligger närmre bildens mittpunkt än den närmst. Vidre ser vi tt bildstorleken är proportionell mot fokllängden precis som vid vnlig objekt. En vlägsen pinne kn lltså fås tt se större ut om mn nvänder ett teleobjektiv. Det som möjligen är lite överrsknde är tt pinnens längd minskr med kvdrten på 1/vståndet. En pinne på dubbl vståndet ger lltså en bild som är en fjärdedel så stor. Hde pinnen legt tvärs över vägen hde bildstorleken minskt med 1/vståndet. Dett innebär tt förhållndet melln längd och bredd inte bevrs. ägger mn v outgrundlig nledning ut kvdrtisk plttor på vägen i rd bort ifrån betrktren kommer visserligen bredden på dem tt minsk när de ligger långt bort med längden kommer tt minsk snbbre. Avlägsn plttor kommer lltså tt se ut som brädor. Vidre ser vi ur formeln, som väntt, tt om h 0 så syns inte pinnen. Prktiskt innebär dett till exempel tt om mn fotgrferr en husrd i stdsmiljö och står intill husen syns vlägns hus dåligt. Går mn över gtn och fotogrferr längs gtn syns vlägsn hus bättre. h hr ju blivit större. Vd händer i dett vseende om mn jämför inzoomning med tt gå närmre objektet? Tänk tt vi jämför fotogrfering på 60 m vstånd med fokllängd 300 mm (motsvrr inzoomt läge i ett gnsk br zoomobjektiv) med 10 m vstånd och 50 mm fokllängd (gnsk utzoomt). Den vnlig kmerförstoringen blir ju då lik i bägge fllen dvs -1/00. Bilden v upprättstående objekt blir lltså lik stor. Men om vi tittr på den ständigt återkommnde pinnen i ovnstående exempel, får vi tt förhållndet melln bildstorlekrn blir med hjälp v ekv (3) Δ inzoomt f inut ( 4) Δ f utzoomt ut in ut in 1 6 Den inzoomde bilden hr lltså en pinne som br är en sjättedel så lång. Bortsett från vårt perverterde intresse för pinnr på mrken, innebär ju dett tt ll sträckor i djupled i bilden blir
kortre. Den inzoomde bilden upplevs lltså som pltt. Ett vnligt trick vid nimeringr är tt överdriv djupleds-sträckor eftersom dett v betrktren tolks som tt mn är mycket när. Resonemnget om zoomning kn nturligtvis översätts till skillnden melln tt titt på ett sceneri med kikre jämfört med tt minsk vståndet en fktor lik med kikrförstoringen. Jämför gärn bildern till höger. Den en är inzoomd x den ndr inte. Förhållndet melln längd och bredd på stenplttorn är i verkligheten lik stort överllt Stor femåringr En nnn skillnd som beror på betrktningsvstånd är reltiv trnversell storlekr. Tänk er scenen med en ppp med höjden H och ett brn med höjden h, där brnet befinner sig en sträck Δ 3 m frmför pppn. Det hel fotogrfers mer eller mindre rkt frmifrån (inte så tt brnet skymmer pppn men nästn) på vståndet 3m, från brnet. ( 5) brn h f ppp f H + Δ brn ppp h ( + Δ) Om pppn är 1,80m och femåringen 1,0m blir kvoten 1,33, dvs brnet blir 33% större än pppn. Dett upplevs möjligen som självklrt (tt föremål i förgrunden får överdriven storlek), men även i dett fll finns en skillnd melln zoomde och icke-zoomde bilder. Om mn i stället fotogrferr på 18 m vstånd och zoomr så tt bilden blir lik stor blir ovnstående kvot 0,77, dvs brnet ser 3% mindre ut än pppn. Dett närmr sig det riktig värdet på 0,67, men frågn är vilken bild vi upplever som riktigst? Svret är nog tt vår förväntde storlek på bilden v ett objekt är väldigt när knuten till vår vståndsbedömning så tt om Δ/ inte är lltför stor behöver vi oft mät med linjl i bilden för tt inse tt bilden v femåringen är större. Om det då v övrig detljer i bilden frmgår tt det är ett vstånd melln fr och dotter kommer hjärnn tt försök få ihop de motstridig synintrycken, med resulttet tt den inzoomde bilden även i dett vseende upplevs som pltt. Dett trots tt fokllängden inte ingår i slututtrycket i ekvtion 5. H
Vänster bild inzoomd och höger bild norml. Bildern är tgn från smm höjd. Mät med linjl storleken på pllen reltivt bordsbenen. Vilket ser mest nturligt ut, vilket är rätt och vilket ger mest djup i bilden? Observer tt vid inzoomning händer två sker: ängsgående sträckor ser kortre ut vid inzoomning och reltiv höjdskillnder minskr. Bägge påverkr emellertid synitrycket på smm sätt. Bilden ser plttre ut vid inzoomning.
Grodperspektiv och von Oben-perspektiv Grodperspektiv innebär tt mn från mrknivå tittr upp mot någonting stort. Von Obenperspektiv innebär det omvänd, dvs tt mn tittr ner på sitt objekt. Bägge hr identisk mtemtisk beskrivning. Vi väljer tt titt på grodperspektivet. åt vståndet utefter mrken mot det (vertikl) objektet vr och den punkt mot vilken mn tittr vr belägen H över mrken. Inför vidre en vertikl z-xel (grön) utefter objektet med nollpunkt vid mrken. Betrktr vi figuren och nvänder den vnlig förstoringsformlen h hf/ för en punkt som inte ligger i bildmitten dvs inte på höjden H över mrken, så får vi med ( 6) + H sinα ( z ) sinα ( 7) h H ( z ) ett uttryck för vr bilden i kmern hmnr i förhållnde till mittpunkten (8) ( z H ) ( z H ) sin α f + sinα ( z H ) ( H + ) + ( z H )H Det sist ledet fick vi genom tt nvänd sinα och + H H + H
Av dess kn vi nu dr ett ntl hlvrolig slutstser: Perspektivpunktens läge i bildplnet (i eller utnför bilden) fås ur (8) genom tt låt z gå mot oändligheten. Dett ger (9) lim z / z + ( 1 H / z) sin α f f tnα ( 1 H / z) sinα H persppunkt f Observer lltså tt perspektivpunkten inte ligger på symmetrixeln längre. Ur (6) får vi tt den trnsversell förstoringen som funktion v z blir (10) M T + f sinα ( z H ) sinα Förstoringen v sträckor utmed det vertikl objektet fås genom tt differentier h med vseende på z (11) M vert d dz ( tungt rbete) fsin α ( + ( z H ) sinα ) Det intressnt för perspektivet är nu kvoten melln trnsversell förstoring och det vi kllr vertikl förstoring (1) K M M T vert + ( z H ) sinα sinα + zh + H För given kmerplts (ges v ) och given kmerriktning (ges v H) ökr lltså kvoten melln bredd och höjd med stignde z. Om objektet vore ett höghus, skulle fönstren högt upp se förhållndevis mindre hög ut. Noter tt både bredd 1 och höjd minskr men höjd minskr snbbre. Vi gör ett numeriskt exempel med ett höghus som är 50 m högt. 10 8 Blått: 5 m, H 5 m Rött: 5 m, H 5 m Grönt: 5 m, H 5 m Kvot 6 4 0 0 5 10 15 0 5 30 35 40 45 50 Höjd räknt utefter höghuset
Någr bilder Den högr bilden är tgen med en vinkel på c 45 mot husväggen (motsvrr blå kurv på förr sidn). I den vänstr bilden hr jg krupit närmre och hr en vinkel på c 0. Mn ser bl tt förhållndet längd/ bredd ändrr sig mycket mer drmtiskt i den vänstr. All fönster är lik stor. Jg hr i bildern också lgt in det mn brukr kll perspektivlinjer som konvergerr mot oändlighetspunkten, dvs den som ges v ekvtion (9). I det vänstr fllet sk den ligg f tn 0 från bildmitten och i det högr fllet f tn 45 vilket ju i ll fll ser rimligt ut. Att perspektivlinjern inte följer fönsterkntern exkt beror inte på byggslrv utn på distorsion i kmern. Jg hr nvänt en enkel mobilkmer. Dett är en berrtion.