Legitimacy of newness and smallness - En studie i överlevnad för små och nya företag

Storlek: px
Starta visningen från sidan:

Download "Legitimacy of newness and smallness - En studie i överlevnad för små och nya företag"

Transkript

1 Legitimacy of newness and smallness - En studie i överlevnad för små och nya företag Cecilia Söderberg Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics

2 Kandidatuppsats 2015:11 Matematisk statistik Juni Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Matematiska institutionen

3 Matematisk statistik Stockholms universitet Kandidatuppsats 2015:11 Legitimacy of newness and smallness - En studie i överlevnad för små och nya företag Cecilia Söderberg Juni 2015 Sammanfattning I denna uppsats har vi undersökt hur ett företags ålder och storlek påverkat dess risk för att gå i konkurs. Speciellt har vi undersökt om små företag är mer benägna att gå i konkurs än stora företag och om yngre företag har en större benägenhet att gå i konkurs än äldre. För att undersöka dessa frågeställningar har vi använt oss av logistik regression och överlevnadsanalys. Metoder inom överlevnadsanalys som har använts är Kaplan-Meier skattning och Log-rank test. Data som har använts för att göra den statistiska analysen är ett 10% urval från databasen Serrano. Serrano är en registerdatabas om svenska företag som bland annat innehåller information från företagens bokslut. I detta register finns information om företag som har lämnat in ett bokslut under tidsperioden 1998 till Det visar sig av den statistiska analysen ett företags storlek har en inverkan på företagets benägenhet att gå i konkurs. Från båda analysmetoderna visar det sig att företag av storlek 1-9 anställda är de företag som har störst risk att gå i konkurs. Då det upptäcktes att det förekommer vänstertrunkering för företagens ålder kan det inte göras några tolkningar om företagens ålder har en påverkan på benägenheten att gå i konkurs i den här uppsatsen. Postadress: Matematisk statistik, Stockholms universitet, , Sverige. E-post: cissi_soderberg@hotmail.com. Handledare: Jan-Olov Persson, Martin Sköld.

4 Acknowledgments Jag vill rikta ett stort tack till Per Weidenman på Bisnode för att jag har fått tillgång till data och för att jag fått bolla idéer med honom. Jag vill även tacka min handledare Jan-Olov Persson för bra litteraturtips och bra feedback som fört arbetet framåt. Även Martin Sköld har varit till en stor hjälp för att sammanställa detta arbete. Slutligen vill jag tacka mina kurskamrater för ett otroligt stöd och bollplank. ii

5 Innehåll Sammanfattning Acknowledgments i ii 1 Inledning 2 2 Data Information om data Olika typer av bolag Beskrivning av data Bearbetning av data Metod Censur Trunkering Begrepp och samband inom överlevnadsanalys Kaplan-Meier skattning Log rank test och Wilcoxon test Cox-regression Logistisk regression Tolka statistikor Resultat från statistisk analys och diskussion Kaplan Meier Log rank test och Wilcoxon test Cox proportional hazard modell Logistisk regression Enmansföretagen Slutsats 25 A Appendix 27 A.1 Definition av aktivt företag A.2 Juridisk form Litteraturförteckning 28 1

6 1. Inledning Har små företag en större risk för att gå i konkurs än stora och har nystartade företag en större risk att gå i konkurs än äldre? I denna uppsats kommer vi försöka besvara dessa frågor. Som bakgrund till uppsatsen är kända begrepp inom organisationsteorin, legitimacy of newness och legitimacy of smallness. Legitimacy of newness innebär att äldre företag har större chanser att överleva än nystartade företag och legitimacy of smallness innebär att stora företag har en större chans att överleva än små företag. Enligt dessa teorier finns det flera möjliga förklaringar till varför det går bättre för äldre och stora företag. Ett nystartat företag stöter på många nya utmaningar. De måste skapa nya rutiner och relationer med intressenter. Eftersom de är nya måste de även skapa ett förtroende då intressenter inte kan bedöma företaget på grund av hur det har skött sig i tidigare samarbeten. En förklaring till varför stora företag klarar sig bättre på marknaden kan vara att stora företag anses vara mera pålitliga. Att de är stora kan av intressenter anses som att de tidigare varit framgångsrika och därmed är de mer pålitliga (Clegg et al., 2003). Vi ska i den här uppsatsen undersöka om teorierna i föregående stycke går att applicera på svenska företag. Har ett företags storlek och ålder påverkan på dess överlevnad? Som överlevnad i den här uppsatsen menas att ett företag inte går i konkurs. Frågeställningarna som ska undersökas i detta arbete är om små företag är mer benägna att gå i konkurs än stora och om företagets ålder påverkar benägenheten att gå i konkurs. Vi använder Sveriges domstolar definition för att definiera vad det innebär att gå i konkurs. Konkurs innebär att en person eller ett företags tillgångar tas hand om för att användas för att betala av skulder som företaget eller personen har. En person eller ett företag sätts i konkurs om personen eller företaget inte kan betala sina skulder i tid och inte kommer kunna betala dem under en överskådlig framtid. Det är tingsrätten som fattar beslutet att ett företag eller en person ska gå i konkurs. Om det är ett företag som går i konkurs så kommer det efter avslutad konkurs bli upplöst (Sveriges domstolar). För att undersöka företagens överlevnad kommer metoderna logistisk regression och överlevnadsanalys användas. De metoder som kommer användas inom överlevnadsanalysen är Kaplan-Meier skattning, Log rank test eller Wilcoxons test och om vissa antaganden är uppfyllda, Cox proportional hazard modell. Samtliga analyser kommer göras i den statistiska programvaran SAS. Data som har använts kommer från databasen Serrano som innehåller information om svenska företag. Uppsatsen har följande upplägg; I kapitel 2 kommer data som har använts för 2

7 att göra analysen beskrivas, i kapitel 3 kommer teorin för hur man gör överlevnadsanalys och logistisk regression beskrivas samt hur resultaten tolkas, i kapitel 4 kommer resultaten från den statistiska analysen redovisas och tolkas. Slutligen kommer resultaten sammanfattas och diskuteras i kapitel 5. 3

8 2. Data 2.1 Information om data För att undersöka hur överlevnaden för företag ser ut har data från databasen Serrano använts. Databasen Serrano är skapad av senior analytikern Per Weidenman på Bisnode och innehåller registerdata om företag. Databasen innehåller bland annat all information som finns i bokslut för svenska bolag och uppdateras i december och maj varje år. Informationen hämtas från Bolagsverket, SCBs företagsregister och från företaget Bisnodes register. Registret innehåller en post med information för varje år ett företag lämnar in ett bokslut från 1998 till och med det senaste bokslutet fram till år Detta innebär att om ett företag har blivit inregistrerat år N och avregistrerat år N + i finns det en rad med information för var och en av de åren. Databasen har anpassats så att det alltid går att ta informationen årsvis vilket underlättar analysen om till exempel ett företag har ett brutet räkenskapsår, då har informationen räknats om till motsvarande värden för ett helår. Ett urval på ca 10% av alla bolag i Serrano har valts ut till den här uppsatsen. Då datamängden i Serrano är väldigt stor har ett stickprov valts ut för att göra den statistiska analysen. Företag har valts ut genom att de organisationsnummer som är jämnt delbara med 10 har valts ut. Detta stickprov resulterar i företag vilket motsvarar ca 10% av alla bolag i Sverige. Totalt finns det 177 olika variabler i Serrano. Då alla inte är väsentliga för detta arbete beskriver vi endast följande variabler: Konkurs, indikator - Antar värde 1 om ett företag har gått i konkurs det året och 0 annars. Det finns ett värde för variabeln för varje år som ett företag har bokslut för mellan åren 1998 och Om ett företag har gått i konkurs år n kommer denna variabel anta värde 0 fram till år n, då antar den värde 1. Juridisk form - Anger vilken bolagsform ett företag tillhör. Se Appendix A för de olika bolagsformerna. Aktiv - Anger om ett företag är aktivt eller inaktivt. Se Appendix A för definition av ett aktivt företag. Registreringsdatum - Det datum då företaget registrerades hos Bolagsverket. Bokslutsår - En värde för varje år mellan 1998 och 2013 som ett företag har lämnat in ett bokslut. Datum för bokslut är den sista december varje år. Ålder - Ett företags ålder räknas som: Senaste bokslutsdatumet för företaget - registreringsdatumet. Storleksklass - Antalet anställda på ett företag är sekretessbelagt. Därför anges antalet anställda i intervall. Se Tabell För att förtydliga hur variablerna kan se ut för två företag, se Tabell

9 För varje år ett bolag har lämnat in ett bokslut under tidsperioden 1998 till 2013 finns en rad med information om bolaget. Organisationsnumret, ålder och registreringsdatumet är konstanta och förändras inte för de olika åren medan de andra variablerna kan förändras. Åldern har räknats fram som skillnaden mellan registreringsdatumet och 31/12 det sista året som det finns ett bokslutet för företaget. Vi ser att det första företaget, med organisationsnummer , bara har information till år Anledningen till detta är för att det fusionerades upp i ett annat bolag år Det andra bolaget, som har organisationsnummer , har gått i konkurs. Vi ser att bolaget har en nolla för varje år fram tills det år då det går i konkurs. Då visas istället en etta i konkursfältet. Tabell 2.1.1: Exempel på hur de olika variablerna ser ut för två bolag. Org.nr. Bolagsform Bokslutsår Konkurs Storleksklass Registreringsdatum Aktiv Ålder Olika typer av bolag I Serrano finns data för flera olika bolagsformer men inte för bolagsformen enskilda firmor. Detta är på grund utav att ekonomin för privatpersonen och företaget inte är åtskild. I denna typ av bolag är ägaren personligt ansvarig för ett företags ekonomi och sätts i personlig konkurs om företaget går i konkurs. Denna typ av information är känslig och enligt Kreditupplysningslagen får vi inte ta ut den information om vi inte har ett legitimt skäl. Av alla de olika bolagsformerna som finns i Serrano har vi i denna uppsats bara utfört analysen på aktiebolag och handelsbolag. Detta eftersom andra typer av företag har andra förutsättningar än aktiebolag eller handelsbolag som påverkar deras benägenhet att gå i konkurs. Till exempel kan kommuner inte gå i konkurs och bankaktiebolag kan bli räddade av staten om de skulle riskera att gå i konkurs. Då de övriga bolagsformerna tas bort återstår 9774 bolag. 5

10 Följande definitioner av aktiebolag och handelsbolag är tagna från Bolagsverket. Enligt Bolagsverket definieras ett aktiebolag som ett företag där ägarna inte har något personligt ansvar för företagets skulder. För att starta ett aktiebolag behövs en kapitalinsats. Ett handelsbolag definieras som ett bolag som ägs av två eller fler personer och där ägarna är ansvariga för företagets skulder. Ett handelsbolag räknas som en juridisk person vilket innebär att det kan teckna avtal och anställa personer. Ett kommanditbolag är en form av handelsbolag och ingår i samma kategori som handelsbolag i Serrano. Skillnaden mellan handelsbolag och komanditbolag är hur ägandet är uppdelat. Mer information om detta finns på Bolagsverkets hemsida (Bolagsverket). 2.2 Beskrivning av data Hur många företag som finns i varje storleksklass, hur många av dessa som har gått i konkurs samt vilken procentandel det utgör av företagen i den kategorin ses i Tabell När vi har bearbetat data, se kapitel 2.3, finns det totalt 6427 olika företag och av dessa har 660 gått i konkurs. Vi ser att de flesta företagen tillhör de mindre storleksklasserna, 0 och 1. Procentandelen som går i konkurs är störst för de företag som tillhör storleksklasserna 1, 2 och 3. Vi noterar även att inga företag har gått i konkurs i storleksklass 7. Tabell 2.2.1: Hur många företag som finns i varje storleksklass och hur många som gått i konkurs per storleksklass. Storleksklass Antal anställda Antal företag Antal som gått Procent som i konkurs gått i konkurs Data saknas Vi studerar företag under en tidsperiod, mellan år 1998 och Alla bolag registrerades inte under denna period utan år 1998 kommer det in företag som redan varit registrerade i ett visst antal år. Innan 1998 har det även funnits företag som inte varit framgångsrika och gått i konkurs. Vi märker inte av dessa företag utan de företag som vi börjar observera 1998 är de som redan varit framgångsrika nog att klara sig till början av år Detta innebär att det blir svårt att tolka åldern på företagen som en variabel som har en påverkan på konkurs. 6

11 2.3 Bearbetning av data Då det finns en observation för varje år för varje företag från det är registrerat tills det går i konkurs eller tills det senaste bokslutet slås data ihop. Då data slås ihop uppstår problemet att data för olika år kan skilja sig åt. Ett exempel på detta är storleksklasserna som från ett år till ett annat kan vara olika. För enkelhetens skull tas medelvärdet av antal anställda under de åren ett företag har varit aktiv. En del korrigeringar av data har gjorts i arbetet för att underlätta den statistiska analysen; företag som saknar information som är väsentlig för analysen tas bort och några av storleksklasserna har slagits ihop. Företag som har försvunnit på andra sätt än genom att ha gått i konkurs tas bort. Detta innebär att företag som fusionerats, aldrig varit aktiva eller har avvecklats under perioden 1998 till 2013 tas bort. Fusionerade bolag tas bort då det inte går att säga något om överlevnaden för dessa, det kan finnas flera möjliga skäl till varför bolaget har fusionerats. Bolag som aldrig varit aktiva är inte intressanta för analysen och tas därför bort. Avvecklade företag tas bort då den inte behöver betyda att företaget går dåligt utan kan även betyda att ägarna för bolaget inte vill bedriva verksamheten av något annat skäl. De 27 företag som tillhör storleksklass 9 tas bort. Storleksklass 9 innebär att det inte finns någon information om hur många anställda ett företag har. Då vi i denna uppsats vill undersöka just hur ett företags storlek påverkar dess benägenhet att gå i konkurs tas dessa bolag bort. Då det finns få observationer i de större storleksklasserna sammanfogar vi några av storleksklasserna. Som utgångspunkt för de nya kategorierna tar vi följande definitioner från Ekonomifakta och Bolagsverket: Ett enmansföretag har 0 anställda Ett mikroföretag har 1 till 9 anställda Små företag är de företag som har 10 till 49 anställda Ett företag räknas som ett större företag om de har mer än 50 anställda. Hur många företag som finns i varje storlekskategori och vilken procentandel som har gått i konkurs när vi har bildat de nya kategorierna ses i Tabell

12 Tabell 2.3.1: Hur många företag som tillhör de nya storleksklasserna och procentandel som har gått i konkurs per storlekskategori. Kategori Antal anställda Antal företag Procent som gått i konkurs Enmansföretag Mikroföretag Små företag Stora företag

13 3. Metod I den här uppsatsen kommer analys av hur ett företags storlek och ålder påverkar företagets benägenhet att gå i konkurs göras med logistisk regression och överlevnadsanalys. Metoder som kommer användas inom överlevnadsanalys är Kaplan-Meier skattning, Log rank test och Wilcoxon test och Cox proportional hazard modell, om antagandet om proportional hazard är uppfyllt. Det finns en skillnad på hur vi ser på företag som går i konkurs när vi gör logistisk regression mot hur vi ser på dem när vi gör överlevnadsanalys. Inom logistisk regression ser vi sannolikheten för att ett företag ska gå i konkurs och inom överlevnadsanalysen ser vi det som tiden till en händelse. Låt oss anta att det finns totalt n företag som vi observerar under en bestämd tidsperiod. Av dessa n företag har x gått i konkurs. Inom logistisk regression ser vi då det som att x företag har gått i konkurs och sannolikheten att ett företag ska gå i konkurs är p. De resterande n x företagen har inte gått i konkurs och sannolikheten att ett företag inte kommer att gå i konkurs är 1 p. I överlevnadsanalysen å andra sidan ser vi det som att vi inte har observerat dessa n x företag gå i konkurs ännu. Dessa företag är högercensurerade. Innan mer detaljerade beskrivningar av hur modellerna ser ut ska vissa begrepp och samband inom överlevnadsanalys förklaras. Inom överlevnadsanalys studerar vi och observerar om en viss händelse har inträffat inom ett tidsintervall. Då överlevnadsanalys har sitt ursprung från biostatistik är den vanliga händelsen att en patient dör, därav namnet överlevnadsanalys. Dock behöver inte händelsen vara att en individ dör utan i den här uppsatsen är händelsen att ett företag går i konkurs. Tiden till en händelse i överlevnadsanalys har oftast inte en symmetrisk fördelning, ofta har fördelningen en längre svans till höger. Detta innebär att data inte kan approximeras med en normalfördelning. Ett annat problem som kan uppstå i överlevnadsanalys är censurering, att vi inte har fullständig information om hur det kommer att gå för alla individer som vi studerar (Collett, 2003). Vi börjar med att förklara vad censur och trunkering innebär innan vi går igenom begrepp och samband inom överlevnadsanalys. Vi kommer sedan beskriva metoden bakom Kaplan-Meier skattning, Cox proportional hazard modell och logistisk regression. Såvida inte någon annan källa nämns kommer informationen i metoddelen vara hämtad från (Collett, 2003). 9

14 3.1 Censur Ett problem som ofta uppstår inom överlevnadsanalys är censurering. Censur innebär att vi inte ännu har observerat en händelse inträffa för alla de individer som vi observerar. Vi observerar om en händelse inträffar under ett tidsintervall men vi vet inte hur det ser ut efter tidsintervallet tagit slut. Ett företag som är aktivt vid slutet av tidsintervallet kan gå i konkurs dagen efter. Detta kallas högercensurering (Collett, 2003). I figur är företag C och D censurerade, vi har inte observerat slutpunkten för dessa företag. 3.2 Trunkering Trunkering innebär att vi bara observerar de individer som dör inom ett tidsintervall och vi har ingen information om de individer som ligger utanför det intervallet. Vi studerar ett begränsat tidsintervall, När studien börjar 1998 finns det företag som har startat flera år innan. Vi observerar dessa företag men inte de som startade samtidigt men som gick i konkurs innan Detta innebär att vi har vänstertrunkering (Klein and Moeschberger, 2003). I Figur är företag A och C vänstertrunkerade, de startade innan vi började observera dem. Under samma tidperiod som de startade, startade även andra företag som har hunnit gå i konkurs innan Figur 3.2.1: Censurerade och trunkerade företag. C och D är censurerade, A och C är trunkerade företag. 3.3 Begrepp och samband inom överlevnadsanalys Det finns tre grundläggande begrepp inom överlevnadsanalys som måste definieras; livstid, överlevnadstid och hazard rate. Genom metoddelen används vi följande termer; de som har utsättas för en viss typ av händelse dör och de som ännu inte blivit utsatta för händelsen lever. 10

15 Vi betecknar överlevnadstiden för en individ som t. Där t är ett utfall av T som är en stokastisk variabel som kan anta positiva tal. Sannolikheten att en individ lever mindre än till tidpunkten t är definierad som: F (t) = P (T < t) = Där f(t) är täthetsfunktionen för T. t 0 f(u)du, t 0 (3.3.1) Överlevnadsfunktionen är sannolikheten att en individ överlever längre än till tidpunkten t och är definerad som: S(t) = P (T t) = 1 F (t) (3.3.2) Hazard funnktionen, h(t), är den momentana risken att en individ dör vid tidpunkten t betingat på att individen har överlevt tiden fram till t. Formellt definieras den momentana risken som: h(t) = lim δt 0 P (t T t + δt T t) δt (3.3.3) Där täljaren är sannolikheten att en individ dör mellan t och δt givet att T > t (Collett, 2003). Från kan vi härleda samband mellan överlevnadsfunktionen och hazard funktionen. För att visa detta måste vi använda följande samband: P (B A) = P (A B) P (A). Som i ord kan uttryckas som sannolikheten att händelsen B inträffar givet att händelsen A har inträffat är lika med sannolikheten att både A och B inträffar dividerat med sannolikheten att händelse A inträffar (Alm and Brittton, 2008). Vi utnyttjar detta samband: P (t T t + δt T t) = P (t T t + δt) P (T t) (3.3.4) Vi utnyttjar och och kan därmed skriva om till: F (t + δt) F (t) S(t) (3.3.5) När vi sätter in i får vi följande : F (t + δt) F (t) 1 h(t) = lim δt 0 δt S(t) = f(t) S(t) (3.3.6) Den momentana risken att en individ dör vid tidpunkt t är täthetsfunktionen för livstid dividerat med överlevnadsfunktionen. 11

16 Det följer även att: h(t) = d dt {log(s(t))} S(t) = e H(t) (3.3.7) Där H(t) = t h(u)du och benämns kumulativ hazard (Collett, 2003) Kaplan-Meier skattning Kaplan-Meier skattaren är en icke-parametrisk metod som används för att skatta överlevnadsfunktionen S(t). Vi skapar k olika tidsintervall där t 1 < t < t k. Mellan tidpunkterna t j och t j+1 finns det n j individer som lever vid början av tidpunkt t j och som riskerar att dö. De individer som dör mellan tidpunkterna t j och t j+1 betecknas d j. Sannolikheten att överleva tidsintervallet mellan t j och t j+1 ges utav nj dj n j. Vi antar att dödsfall mellan individer sker oberoende av varandra vilket gör det möjligt att multiplicera sannolikheter med varandra. Då är Kaplan-Meier skattaren definierad som: Ŝ(t) = k j=i ( 1 d ) j. (3.4.1) n j I ord kan vi beskriva som: nj dj n j kan tolkas som den betingade sannolikheten att överleva fram tills tiden t j+1 givet att man har överlevt fram tills t j. Denna sannolikhet beräknas för var och en av tidpunkterna fram till tidpunkt t. Vi multiplicerar sedan ihop sannolikheterna (Collett, 2003). Eftersom vi har vänstertrunkerad data uppstår ett problem med att beräkna ålder på företagen. Det finns två olika sätt att hantera vänstertrunkerad data när vi ska skatta Kaplan-Meier. Vi kan antingen räkna ålder på de företag som startade innan 1998 som år från studien har börjat tills de har gått i konkurs eller blivit censurerade, eller så kan vi hantera ålder genom att säga att vi ser de individer som har funnits innan studiens början inte befinner sig i risk för att dö förrän vi börjar observera dem. Det sistnämnda är vårt valda alternativ och det innebär att de företag som startade innan 1998 inte var i risk för att gå i konkurs förrän år Detta innebär att vi i har kvar samma antal observerade dödsfall, d j, men de individer som riskerar att dö vid tidpunkten,n j, måste anpassas. Vi definerar L j som ålder när studien börjar, i vårt fall hur gammlt ett företag var år 1998, och T j som tidpunkten då individen antingen dör eller blir censurerad. Nu är n j antalet individer som har L j < t j < T j (Klein and Moeschberger, 2003). Skattningen av överlevnadsfunktionen presenteras grafiskt med Kaplan-Meier kurvor. Där kommer tiden visas på x-axeln och Ŝ(t) på y-axeln. Kurvan skär y-axeln i 1, i det första tidsintervallet har inga individer hunnit dö, för att sedan stegvis röra sig nedåt för varje nytt tidsintervall. I varje tidsintervall antas den 12

17 skattade överlevnadsfunktionen vara konstant och vid varje nytt tidsintervall kommer kurvan hoppa nedåt till det nya värdet på Ŝ(t). Inom överlevnadsanalys är det ofta intressant att veta när en viss andel av det totala antalet individer som observerades beräknats ha dött. Vanliga mått är då medianen eller andra percentiler. Vi betecknar percentilen p(t) och Ŝ(ˆt(p)) = 1 p 100. Eftersom funktionen är stegvis går det inte alltid att få exakta värden utan vi tar den lägsta observerade överlevnadstiden sådan att 1 p är uppfyllt vilket innebär att vi kan skriva Ŝ(ˆt(p)) < 1 även räkna ut konfidensintervall. p Runt percentilerna kan vi För att bilda ett konfidensintervall för det sanna värdet av överlevnadsfunktionen vid en given tidpunkt t antas det skattade värdet för överlevnadsfunktionen vara normalfördelat med väntevärde S(t) och varians Ŝ(t)2 k d j j=1 n. Se j(n j d j) s. 24 Collett (2003) för detaljer. Vi använder oss utav normalfördelningens kvantiler för att bilda ett konfidensintervall. Ett 100(1 α)% konfidensintervall för överlevnadstiden ges av: Ŝ(t) ± z α/2 se(ŝ(t)) (Collett, 2003) Log rank test och Wilcoxon test För att testa om det finns en skillnad mellan överlevnadskurvor för olika grupper kan vi använda Log rank test eller Wilcoxon test. Eftersom Wilcoxon test är en viktad form av Log rank test börjar vi med att beskriva hur Log rank test utförs. Vi beskriver hur testen utförs för att jämföra två grupper. Det fall då fler än två grupper jämförs bygger på samma princip men är lite mer komplicerat och då grundidén för hur testen utförs fås i för jämförelse av två grupper väljer vi att beskriva det. Den intresserade läsaren hänvisas till s. 48 (Collett, 2003) för beskrivning av hur testen utförs när 3 eller fler grupper jämförs. För att använda Log rank testet för att testa skillnader mellan överlevnadsfunktioner för två grupper delas data först in i två grupper. För grupp 1: U LR = r (d 1j e 1j ) (3.4.2) j=1 Där d 1j är det observerade antalet dödsfall i grupp 1 vid tid j och e 1j är det förväntade antalet dödsfall vid tid j för grupp 1. e 1j = n 1jd j n j (3.4.3) Där n j är totala antalet som riskerar att dö vid tid j, d j är det totala antalet som dör vid tidpunkt j för båda grupperna (Allison, 2010). 13

18 För att få fram själva teststatistikan utnyttjar vi det faktum att U LR är approximativt normalfördelad om stickprovet är stort och att en normalfördelad variabel dividerat med sin varians är standard normalfördelad. Vilket innebär att kvadraten på denna är χ 2 fördelad. Detta innebär att Log rank teststatistikan ges av: där V ar(u LR ) = U 2 LR V ar(u LR ) χ2 1 r j=1 n 1j n 2j d j (n j d j ) n 2 j (n. j 1) Detta innebär att om vi får ett värde på teststatisikan som överstiger värdet vi får från tabell över χ 2 fördelningen förkastar vi nollhypotesen. För signifikansnivå 5% är χ 2 statistikan Om värdet på Log Rank testet är större än förkastar vi nollhypotesen att överlevnadskurvorna ser likadana ut för alla kategorier. Om överlevnadskurvorna som ges av Kaplan-Meier korsar varandra är antagandet om proportional hazard inte är uppfyllt och då är det inte lämpligt att använda Log rank test. Då bör vi istället använda oss utav Wilcoxon test. Wilcoxon test testar precis som Log rank testet om det är skillnad mellan överlevnadstider för två olika grupper. Skillnaden mot Log rank testet är att Wilcoxon viktar skillnaden mellan de som dör mot det förväntade antalet som skulle dö, med det totala antalet som riskerade att dö vid tillfället. Detta skrivs som: Variansen för U W ges av U W = V ar(u W ) = r n j (d 1j e 1j ) (3.4.4) j=1 r j=1 n 1j n 2j d j (n j d j ). (n j 1) Återigen använder vi oss utav att kvadraten av en standard normalfördelad variabel är χ 2 fördelad och får teststatistikan: (Collett, 2003). U 2 W V ar(u W ) χ2 1 14

19 3.5 Cox-regression Cox proportional hazard modellen används för att bestämma hazard, den momentana risken, för en individ samt hazard ratio, hur den momentana risken förhåller sig mellan två grupper, förutsatt att allt annat hålls konstant. I denna typ av regression är den momenatana risken, h i (t) responsvariabel. Den momentana risken för individ i vid tidpunkt t ges av: h i (t) = h 0 (t)e β1xi1+...+β kx ik (3.5.1) där h 0 (t) kallas baseline hazard funktionen. När alla k kovariater är 0 blir den momentana risken detta värde. Om vi logaritmerar får vi: där α(t) = log(h 0 (t)). log(h i (t)) = α(t) + β 1 x i β k x ik (3.5.2) Den momentana risken för en individ i Cox-regression är en fix proportion av den momentana risken för vilken som helst annan individ, det vill säga om log av den momentana risken plottas mot tiden kommer hazard funktionerna vara parallella med varandra. Att förklaringsvariablerna inte samspelar med tiden är ett viktigt antagande i modeller med proportional hazard. Detta är en egenskap som måste kontrolleras för i analysen. Detta ses genom att ta kvoten mellan individ i och individ j: Som vi ser ej beror på tiden. h i (t) h j (t) = eβ1(xi1 xj1)+...+βp(x ik x jk ) (3.5.3) För att skatta β värdena i Cox-regression används maximum partial likelihood. När vi skattar värdena behöver vi inte skatta baseline hazard-funktionen utan maximum partial likelihoodfunktionen skattas bara för β värdena. Maximum partial likelihood för k betecknas L k och definieras som sannolikheten att det var just individ k som dog vid tiden t och inte någon av de andra n individerna. Vi dividerar den momentana risken för individ k vid tidpunkten t med summan av de momentana riskerna för alla de individer som riskerade att dö vid tidpunkt t: h k (t) L k = (3.5.4) h k (t) + h k+1 (t) h n (t) Vi behöver inte ta med baseline-funktionen då den förekommer i både täljare och nämnare i likelihoodfunktionen i och därför divideras bort. Vid varje ny tidpunkt tas de momentana riskerna som tillhör individer som dött eller blivit censurerade i föregående tidpunkter bort från nämnaren (Allison, 2010). I SAS görs Cox-regression med hjälp av Proc Phreg. 15

20 3.6 Logistisk regression Logistisk regression används när responsvariabeln, Y, är binär. Vi vill räkna ut sannolikheten för att en viss händelse ska inträffa givet våra förklaringsvariabler: P (Y = 1 x). Då det är svårt anpassa en regression för sannolikheten att en händelse ska inträffa då den bara antar värden mellan 0 och 1 anpassar vi istället kurvan efter logaritmen av oddsen för att en händelse ska inträffa. Oddsen för p 1 p att en händelse ska inträffa ges utav. Där p är sannolikheten att en händelse inträffar och 1 p sannolikheten att den inte inträffar. Vi antar att vi har k förklaringsvariabler, x 1, x 2.., x k. För att kunna utföra regression används logit(p) som definieras som: log Där β 1..β k är logoddsen för skattningen. Om vi löser ut p ur får vi: p 1 p = α + β 1x β k x k. (3.6.1) p = eα+β1x1+..+β kx k 1 + e α+β1x1+..+β kx k. (3.6.2) e β värdena i kallas oddskvoter. Oddskvoten säger hur oddsen mellan två grupper skiljer sig åt. Oddskvot för två olika grupper i och j definieras som: Odds för händelse för grupp i Odds för händelse för grupp j. Om kvoten är lika med 1 så har båda grupperna lika stora odds för att en händelse ska inträffa. Om oddskvoten är större än 1 så har grupp i större odds för att en händelse ska inträffa och om kvoten är mindre än 1 så har grupp j större odds för att en händelse ska inträffa. Om ett konfidensintervall för oddskvoten innehåller 1 innebär det att oddsen är densamma för de båda grupperna. För att räkna ut en konfidensintervall för oddskvoten behöver vi först räkna ut konfidensintervallet för logoddsen, ˆβ. Vi utnyttjar Wald-statistikan och det faktum att den är χ 2 fördelad. En χ 2 fördelad variabel med k frihetsgrader är en summa av kvadrater av k stycken standardiserade normalfördelade variabler. Wald statistikan ges utav: ( ( ˆβ ) 2 β 0 ) λ 2 α/2 (3.6.3) SE Där ˆβ är skattningen som vi har räknat ut för logoddset och β 0 är det värde som logoddsen antar under nollhypotesen, här vill vi testa om β 0 = 0. SE är standardavvikelsen för logoddset. Från får vi konfidensintervallet för β: 16

21 ˆβ ± λ α/2 SE = (LL, UL) (3.6.4) Där är LL den undre gränsen och UL den övre gränsen för konfidensintervallet. För att få fram konfidensintervallets gränser för oddskvoten tar vi exponenten av övre och undre gränsen: (e LL, e UL ). Om intervallet inte innehåller 1 är skattningen för oddskvoten signifikant (Agresti, 2002) Tolka statistikor Det finns tre teststatistikor som brukar användas för att bedöma om förklaringsvariablerna bidrar till att förklara responsvariabeln; Likelihoodkvot, Waldtest och Score-test. Wald test, Score test och likelihoodkvot test ger asymptotiskt samma resultat och då vi har ett relativt stort stickprov väljer vi att endast använda likelihoodkvoten. I arbetet kommer signifikansnivån 5 % användas om inget annat anges. Likelihoodkvottest Likelihoodkvottestet mäter bland annat till vilken grad en modell passar in med data. Vi säger att vi vill testa en nollhypotes: H 0 : θ = θ 0. Där θ 0 är skattningen under nollhypotesen. Vi räknar ut en skattning av θ med hjälp utav Maximum-likelihood. Likelihoodfunktionen, L(θ; x), defineras som n i=1 f(x i; θ) i det kontinuerliga fallet och som n i=1 p(x i; θ) i det diskreta fallet. Då är θ ML det värde där L(θ; x) antar sitt största värde (Alm and Brittton, 2008). Likelihoodkvotstatistikan är definierad som: T LR (x) = 2 log L(θ 0; x) L(ˆθ ML ; x) χ2 1 Där L(θ 0 ; x) är likelihoodfunktionen med θ 0 och L(ˆθ ML ; x) är Likelihoodfunktionen med θ ML. Vi kan utvigda till det flerdimensionella fallet till en modell med q parametrar. ˆβ är maximum likelihood skattningen som kan anta värden över hela parameterrummet medan β 0 begränsas av värdena under nollhypotesen. Teststatistikan blir då 2 log L(β 0) L(ˆβ) χ2 q (Agresti, 2002). 17

22 4. Resultat från statistisk analys och diskussion Vi kommer att börja den statistiska analysen med överlevnadsanalys genom Kaplan-Meier skattning och test av om överlevnadskurvorna är likadana för de olika företagsstorlekarna. Om antagandet om proportional hazard är uppfyllt kommer vi även att göra regression med Cox proportional hazard. Vi kommer att avsluta den statistiska analysen med att göra logistisk regression. Analysen kommer att göras på de 6400 företag som är kvar efter att vi har modifierat data. Vi kommer undersöka hur överlevnaden påverkas av företagens storlek men inte hur den påverkas av dess ålder. Då vi har problem med vänstertrunkering kommer vi inte att kunna göra någon analys av hur överlevnaden påverkas av ålder. 4.1 Kaplan Meier Med hjälp utav Kaplan-Meier får vi skattningar av hur lång tid det tar innan ett företag har gått i konkurs, överlevnadstiden för ett företag. För vårt data är n j de företag som ej gått i konkurs vid början av år j och d j de företag som gått i konkurs mellan år j och år j + 1. I och med vänstertrunkeringen ser vi att företag inte befinner sig i risk för att gå i konkurs innan 1998 även om de har startat flera år innan. Vi börjar med att undersöka hur överlevnaden ser ut för alla företag. Vi får då skattningen av överlevnadskurvan med hjälp utav Kaplan-Meier enligt Figur

23 Figur 4.1.1: Kaplan-Meier kurva för alla bolag För att undersöka hur överlevnaden ser ut använder vi oss utav percentiler. 25% percentilen är den tidpunkt då 25% av alla företag beräknats ha gått i konkurs. Från SAS får vi att 25% percentilen är 27 år med skattad sannolikhet 0.7 och konfidensintervall (0.69,0.73). Detta innebär att drygt 25% av alla företag beräknats ha gått i konkurs vid 27 års ålder. Medianvärdet, den tidpunkt då 50% av förtagen beräknats ha gått i konkurs, är vid 96 år. Då är sannolikheten för att överleva till den åldern eller längre 0.46 med konfidensintervall (0.32, ). Vi vill nu testa om överlevnadskurvorna ser likadana ut för de olika företagsstorlekarna. Vi delar nu upp överlevnadskurvorna per storlekskategori och får Kaplan-Meier-kurvor enligt Figur

24 Figur 4.1.2: Kaplan-Meier uppdelat per storlekskategori Vi studerar kurvorna uppdelade efter storlek. I Figur svarar den blå kurvan mot enmansföretag, den ljusbruna mot mikroföretag, den gröna mot små företag och den mörkbruna mot stora företag. Vi ser sannolikheten för överlevnad är minst för mikroföretag och högst för stora företag. Vi noterar att överlevnadskurvorna för enmansföretag och små företag korsar varandra. När kurvan gör lite större hopp nedåt som den gör för mikroföretagen när de är äldre än 90 år, betyder det att det finns få företag som är äldre än 90 år och därmed blir hoppen större. Hoppen blir större eftersom det finns färre företag kvar, för varje nytt företag som går i konkurs då påverkar det sannolikheten för överlevnad mer än då det finns fler företag. Vi undersöker hur lång tid det tar tills 25% av de företagen i de olika storlekskategorierna har gått i konkurs, se Tabell Från kurvorna i Kaplan-Meier kunde vi se att mikroföretag en är den typ av företag som det går sämst för. Vi ser även att 25% percentilen är vid 16 år för dessa företag. Detta innebär att det tar 16 år innan 25% av företagen i denna storleksklass beräknas ha gått i konkurs. För enmansföretagen tar det 46 år innan 25% av företagen uppskattas ha gått i konkurs. 25% percentilen för små företag är 25 år vilket innebär att det tar ca 25 år innan 25% av bolagen i den kategorin beräknas ha gått i konkurs. För kategorin stora företag finns det ingen 25% percentil. 20

25 Tabell 4.1.1: 25 % percentilen för de olika företagsstorlekarna Företagsstorlek Ålder Ŝ(t) 95% konfidensintervall Enmansföretag (0.64, 0.87) Mikroföretag (0.72, 0.77) Små företag (0.67, 0.82) Stora företag Då vi inte kunde jämföra 25% percentilen för alla de olika företagsstorlekarna väljer vi istället att jämföra när sannolikheten att ett företag inte gått i konkurs vid en viss tidpunkt eller längre är ungefär 0.9. Det vill säga den tidpunkt då ungefär 10% av alla företag beräknats ha gått i konkurs, Se Tabell Tabell 4.1.2: 10% percentilen för de olika företagsstorlekarna Företagsstorlek Ålder Ŝ(t) 95% konfidensintervall Enmansföretag (0.88, 0.92 ) Mikroföretag (0.88, 0.91) Små företag (0.84, 0.94) Stora företag (0.73, 1) Vi ser att det tar ca 11 år innan 10% av enmansföretagen beräknas ha gått i konkurs, 6 år för mikroföretagen och 12 år för de små företagen. Nu får vi även en skattning för de stora företagen. Det beräknas ta ca 23 år innan 10% av de företagen beräknats ha gått i konkurs. Vi kan dra slutsatsen från analys med Kaplan-Meier skattning att företagens storlek har en inverkan på sannolikheten att gå i konkurs. Vi kan också dra slutsatsen att den storlek på företagen som har störst benägenhet att gå i konkurs är mikroföretagen Log rank test och Wilcoxon test För att testa om överlevnadskurvorna för de olika företagsstorlekarna inte skiljer sig åt kan vi använda oss utav någon av teststatistikorna Log rank eller Wilcoxon. Då överlevnadskurvorna i Kaplan-Meier korsar varandra blir teststatistikan för Log rank testet ej giltigt. Då är det mer lämpligt att använda Wilcoxon test. Då vi använder en alternativ metod för att räkna ut överlevnaden för företag då det förekommer vänstertrunkering, ges ett score test som är asymptotiskt lika med log rank testet. Detta ger värdet med p-värde < Testet pekar på att det finns en signifikant skillnad mellan överlevnaden för de olika företagsstorlekarna men då överlevnadskurvorna korsar varandra är det osäkert hur giltigt detta test är. 21

26 4.2 Cox proportional hazard modell Om vi vill fortsätta vår överlevnadsanalys med Cox-regression måste proportional hazard gälla, att hazardkvoten är oberoende av tiden. Detta innebär att överlevnadskurvor inte kan korsa varandra för då skulle det innebära att överlevnaden för de olika grupperna inte är proportionella mot varandra utan förändras med tiden. Vi ser att överlevnadskurvorna för mikroföretagen och den kurvan som representerar kategorin små företag korsar varandra och därför bryter mot antagandet om proportional hazard. Vi kan därmed inte göra regression genom Cox proportional hazard. 4.3 Logistisk regression Inom logistisk regression betraktar vi konkurs som ett utfall, antingen går ett företag i konkurs eller inte. Vi betecknar denna variabel Y. { 1 om om företaget har gått i konkurs, Y = 0 om ett företag inte har gått i konkurs. Vi är intresserade av att veta hur sambandet mellan sannolikheten att ett företag går i konkurs och företagsstorlekarna ser ut. Vi kan inte använda logistisk regression för att avgöra om ålder har en påverkan på benägenheten att gå i konkurs då åldern är vänstertrunkerad. Vi får ekvation enligt Där: P (Y = 1 x) = eα+β1x1+β2x2+β3x3 1 + e α+β1x1+β2x2+β3x3 (4.3.1) { 1 om ett företag tillhör kategorin mikroföretag, X 1 = 0 annars. { 1 om ett företag tillhör kategorin små företag, X 2 = 0 annars. { 1 om företaget tillhör kategorin stora företag, X 3 = 0 annars. Referenskategori är enmansföretag. Vi skriver nu om så att vi har logodds för att ett företag ska gå i konkurs som responsvariabel och som förklaringsvariabler har vi indikatorvariablerna för företagsstorlekarna: log(oddsförkonkurs) = α + β 1 x 1 + β 2 x 2 + β 3 x 3. 22

27 Odds för att ett företag ska gå i konkurs ges av: P (Y = 1 x) P (Y = 0 x) Den logistiska regressionen ger resultatet i Tabell Tabell 4.3.1: Resultat från logistisk regression Variablel Skattning p-värde Oddskvot 95% Konfidensintervall Intercept < Enmansföretag Mikroföretag < (2.618, 3.978) Små företag < (1.719, 3.635) Stora företag (0.306,3.207) Från Tabell kan vi avläsa skattningar för logodds (under Skattning ) och oddskvoter. Logoddsen och oddskvoterna för de olika företagsstorlekarna är i jämförelse med kategorin enmansföretag. Oddskvoterna säger hur oddsen för de olika storlekskategorierna förhåller sig till storlekskategorin enmansföretag. Det finns två sätt att kontrolera om en skattning är signifikant. Antingen kontrollera att konfidensintervallet inte innehåller 1 eller att se om p-värdet för skattningen av logoddset är mindre än Den skattade oddskvoten för ett företag som är ett mikroföretag, 3.227, säger att oddsen att gå i konkurs är gånger högre för ett mikroföretag än oddsen för ett företag som är ett enmansföretag att gå i konkurs. Då p-värdet för skattningen av logoddset är signifikant är även skattningen för oddskvoten signifikant. För små företag skattas oddskvoten till 2.5. Vilket innebär att oddsen att gå i konkurs är 2.5 större om ett företag tillhör kategorin små företag än om ett företag tillhör kategorin enmansföretag. Även för denna skattning är skattningen för logoddset signifikant som är skattningen för oddskvoten för företag som tillhör kategorin stora företag säger att oddsen att gå i konkurs är 8.9% lägre för ett företag som tillhör den kategorin än ett företag som är ett enmansföretag. Dock framgår det att denna skillnad inte är signifikant, p-värdet för skattningen av logoddset är större än För att testa om benägenheten att gå i konkurs påverkas av hur stort företaget är använder vi likelihoodkvottest. Resultatet av detta test är med p-värde < Detta innebär att testet är signifikant och därmed kan det konstateras att ett företags storlek har en effekt på benägenheten för att ett företag går i konkurs. Från den logistiska regressionen kan vi dra slutsatsen att vilken storlek ett företag tillhör har en påverkan på företagets benägenhet att gå i konkurs. Oddskvo- 23

28 terna för storleken för ett företag anger att oddsen att ett företag går i konkurs är störst för mikroföretag i jämförelse med enmansföretag och verkar minska med ökad storlek. Det går dock inte att uttala sig om den största företagsstorleken, stora företag, då resultatet för den skattningen inte var signifikant. 4.4 Enmansföretagen Från analysen med Kaplan-Meier skattning såg vi att antagandet om proportional hazard bröts eftersom överlevnadskurvan för enmansföretagen korsade överlevnadskurvan för små företag. Vi kunde även se i analysen att den här typen av företag skiljde sig åt genom att den tid det tar innan 25% av alla företag hade gått i konkurs var högre än för mikroföretagen och kategorin små företag. Även i den logistiska regressionen såg vi att den här typen av företag betedde sig annorlunda mot de övriga kategorierna då alla andra kategorier av företagsstorlekar hade större odds att gå i konkurs än denna. Frågan är om denna typ av företag skiljer sig så markant att den inte borde jämföras med de andra företagen. Storleksklassen 0 anställda innebär att företagets ägare är den enda som jobbar i företaget. Det kan hända att denna kategori skiljer sig mot de övriga kategorierna av företagsstorlekar. Om ett företag har anställda kommer det med ökade kostnader. Dels för att ett företag måste betala ut löner och sociala avgifter varje månad men det kan även dyka upp oväntade extra utgifter då de kan behöva ta in en vikarie eller rekrytera ny personal vid föräldraledighet och sjukskrivning. I ett företag som inte har några anställda kan ägaren ta ut vinst vid de tidpunkter som det går bra för företaget och låta bli att ta ut pengar de månader då det går sämre. Det finns även skillnader i vad som händer i ett större bolag om ägaren går i pension eller slutar. Det är mer troligt att någon annan tar över bolaget när ägaren går i pension eller vill avsluta sitt engagemang i företaget av någon annan anledning i ett större bolag än i ett där ägaren är den enda anställda. Detta gör att det kanske är svårare att tolka Kaplan-Meier kurvan efter till exempel 50 år. 24

29 5. Slutsats Syftet med den här uppsatsen var att ta reda på om företagens ålder och storlek påverkar deras överlevnad. Vi kunde konstatera att ett företags storlek påverkar benägenheten att gå i konkurs men upptäckte även ett problem i analysen då vi har en vänstertrunkering för företagets ålder och vi kunde inte med metoder som användes i detta arbete undersöka hur benägenheten att gå i konkurs påverkas av ett företags åldder. Från den logistiska regressionen såg vi att företagens storlek har en signifikant effekt på benägenheten att gå i konkurs. Vi såg att mikroföretag och små företag hade större odds att gå i konkurs än enmansföretag. Att företagens storlek hade en effekt på överlevnaden bekräftades även genom överlevnadsanalysen där Wilcoxon test visade på att överlevnaden för de olika företagsstorlekarna skiljer sig åt. Kaplan-Meier kurvorna visade även de att de olika överlevnadskurvorna för företagsstorlekarna skiljde sig åt och att den grupp som har störst benägenhet att gå i konkurs är mikroföretagen. Där visade det sig till skillnad mot den logistiska regressionen att de företag som tillhör kategorin stora företag var den kategori som hade störst sannolikhet att överleva. Vi kunde observera att kategorin enmansföretagen skiljer sig från de övriga storlekarna på företagen. Denna kategori har en högre överlevnad än mikroföretagen och de företagen som tillhör kategorin små företag. Överlevnadskurvan för denna kategori skar överlevnadskurvan för små företag två gånger i analysen med Kaplan-Meier kurvor. Om denna grupp skulle ha analyserats för sig själv och inte i jämförelse med de andra företagen, då andra förhållanden och regler kan gälla för den här typen av företag, är en fråga som lämnas öppen i detta arbete. Om vi bortser från enmansföretagen skulle vi kunna bekräfta att teorin legitimacy of smallness även gäller för svenska företag. Vi skulle behöva andra typer av analyser för att undersöka vår andra frågeställning, om teorin legitimacy of newness är giltig för svenska företag. Det finns flera möjliga felkällor i denna analys, de främsta är approximationer av de olika variablerna och bias när det gäller företagens ålder. När vi slog ihop data så att vi fick en observation per företag istället för en observation per företag och år var vi tvungna att approximera de variabler som kunde förändras mellan de olika åren. Till exempel approximerade vi storleksklasen med medelvärdet. Denna approximation kan säkert i vissa fall ha gett en missvisande bild. Den andra felkällan, att data är snedvridet är ett allvarligare fel. Vi studerar företag under en tidsperiod, mellan år 1998 och I början av 1998 kommer företag in i studien som redan har varit registrerade och aktiva. Innan 1998 har 25

30 det även funnits företag som inte varit framgångsrika och gått i konkurs. Vi märker inte av dessa företag utan de företag som vi börjar observera 1998 är de som redan varit framgångsrika nog att klara sig till början av år Detta innebär att det blir svårt att tolka åldern på företagen som en variabel som har en påverkan på konkurs. För att komma runt detta skulle åtgärder behöva vidtas, till exempel skulle vi kunna välja att bara studera åldern på de företag som har blivit nystartade under tidsperioden eller använda någon annan typ av modell. Enligt rapporten Smått om små företag från Svenskt näringsliv finns det flera faktorer som påverkar hur de små företagen klarar sig. Enligt rapporten kan möjliga hinder för små företag vara; krångliga regelverk, marknadens efterfrågan, höga personalkostnader samt höga avgifter och skatter. Troligen innebär de flesta av dessa hinder mest ett hinder för att ett företag ska expandera och anställa fler personer än en avgörande faktor för om ett företag kommer att gå i konkurs men det är möjligt att dessa anledningar är bidragande orsaker till konkurs som inte fångas upp i den här uppsatsen. Förutom det som nämns i studien i stycket ovan kan det kan finnas fler anledningar till varför företag går i konkurs som inte fångas upp i den här uppsatsen. Små företag kanske inte samma resurser som stora företag att lägga på marknadsföring eller för att locka och rekrytera personal. För att fånga upp andra möjliga orsaker skulle man behöva enkäter eller andra sätt för att undersöka de egentliga orsakerna till varför ett företag gick i konkurs. Det är även möjligt att konjunkturen påverkar överlevnaden för företag. Det kan tänkas att små företag är mer känsliga för om det är lågkonjunktur eller högkonjunktur. För att fånga upp om detta har en påverkan på företagens benägenhet att gå i konkurs skulle en studie med konkurser per år och även uppdelat per företagsstorlek vara en intressant studie. En annan möjlig faktor som kan påverka benägenheten att gå i konkurs är vilken bransch företagen tillhör. Enligt Svenskt näringsliv studie är ungefär hälften av alla små företag tjänsteföretag. Denna bransch är kanske mer känslig för svängningar i konjunkturen och skiftande regelverk, till exempel har den fått ett uppsving med RUT-avdraget. Tänkbara utvidgningar av denna studie vore alltså att undersöka hur konkurser skiljer sig åt mellan år, speciellt kontrollera mot de år som det har varit högkonjunktur och lågkonjunktur samt att undersöka hur benägenheten att gå i konkurs ser ut för de olika branscherna. 26

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)

Innehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL) Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3

Läs mer

Tenta i Statistisk analys, 15 december 2004

Tenta i Statistisk analys, 15 december 2004 STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Exempel på tentamensuppgifter

Exempel på tentamensuppgifter STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

8 Inferens om väntevärdet (och variansen) av en fördelning

8 Inferens om väntevärdet (och variansen) av en fördelning 8 Inferens om väntevärdet (och variansen) av en fördelning 8. Skattning av µ och Students T-fördelning Om σ är känd, kan man använda statistikan X µ σ/ n för att hitta konfidensintervall för µ. Om σ inte

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Överlevnadsanalys. Överlevnadsanalys med tidsberoende kovariater. Tid till en händelse: observationer i kalendertid och som tid från start.

Överlevnadsanalys. Överlevnadsanalys med tidsberoende kovariater. Tid till en händelse: observationer i kalendertid och som tid från start. Överlevnadsanalys Överlevnadsanalys med tidsberoende kovariater Peter Höglund USiL 10 februari 2010 Kaplan-Meier Logrank test Cox-regression Tidsberoende kovariater (Tidsuppdaterade kovariater tas inte

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

TMS136. Föreläsning 10

TMS136. Föreläsning 10 TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis

Läs mer

Statistiska metoder för säkerhetsanalys

Statistiska metoder för säkerhetsanalys F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formelsamling i matematisk statistik Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på

Läs mer

Tentamen MVE302 Sannolikhet och statistik

Tentamen MVE302 Sannolikhet och statistik Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Thomas Önskog 28/

Thomas Önskog 28/ Föreläsning 0 Thomas Önskog 8/ 07 Konfidensintervall På förra föreläsningen undersökte vi hur vi från ett stickprov x,, x n från en fördelning med okända parametrar kan uppskatta parametrarnas värden Detta

Läs mer

Föreläsning 12: Repetition

Föreläsning 12: Repetition Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

TMS136. Föreläsning 13

TMS136. Föreläsning 13 TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra

Läs mer

Till ampad statistik (A5) Förläsning 13: Logistisk regression

Till ampad statistik (A5) Förläsning 13: Logistisk regression Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Föreläsning 8: Konfidensintervall

Föreläsning 8: Konfidensintervall Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga

Läs mer

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p) Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 27:E OKTOBER 2014 KL 08.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66, Björn-Olof Skytt, 08-790 86 49.

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:... Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 8:E JANUARI 2018 KL 14.00 19.00. Examinator: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg.

1. En kortlek består av 52 kort, med fyra färger och 13 valörer i varje färg. Tentamenskrivning för TMS63, Matematisk Statistik. Onsdag fm den 1 juni, 16, Eklandagatan 86. Examinator: Marina Axelson-Fisk. Tel: 7-88113. Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte

Läs mer

TMS136. Föreläsning 11

TMS136. Föreläsning 11 TMS136 Föreläsning 11 Andra intervallskattningar Vi har sett att vi givet ett stickprov och under vissa antaganden kan göra intervallskattningar för väntevärden Man kan även gör intervallskattningar för

Läs mer

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 4: Konfidensintervall (forts.) Föreläsning 4: Konfidensintervall forts. Johan Thim johan.thim@liu.se 3 september 8 Skillnad mellan parametrar Vi kommer nu fortsätta med att konstruera konfidensintervall och vi kommer betrakta lite olika

Läs mer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data

Överlevnadsanalys. 732G34 Statistisk analys av komplexa data Överlevnadsanalys 732G34 Statistisk analys av komplexa data 1 Tvärsnittsstudie Prospektiv Kohortstudie Observationsstudie Tvärsnittsstudie Retrospektiv Experimentell studie (alltid prospektiv) Klinisk

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 22 december, 2016 Examinatorer: Kerstin Wiklander och Erik Broman.

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.

Läs mer

FÖRELÄSNING 7:

FÖRELÄSNING 7: FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla

Läs mer

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p) Avd. Matematisk statistik TENTAMEN I SF1920 och SF1921 SANNOLIKHETSTEORI OCH STATISTIK, FREDAGEN DEN 8:E JUNI 2018 KL 14.00 19.00. Examinator: Björn-Olof Skytt, 08 790 86 49. Tillåtna hjälpmedel: Formel-

Läs mer

0 om x < 0, F X (x) = c x. 1 om x 2.

0 om x < 0, F X (x) = c x. 1 om x 2. Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.

Läs mer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning? När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-08-31 Tid:

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 29 oktober, 2016 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Kapitel 10 Hypotesprövning

Kapitel 10 Hypotesprövning Sannolikhetslära och inferens II Kapitel 10 Hypotesprövning 1 Vad innebär hypotesprövning? Statistisk inferens kan utföras genom att ställa upp hypoteser angående en eller flera av populationens parametrar.

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =

Läs mer

Hur man tolkar statistiska resultat

Hur man tolkar statistiska resultat Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Varför använder vi oss av statistiska tester?

Läs mer

Uppgift a b c d e Vet inte Poäng

Uppgift a b c d e Vet inte Poäng TENTAMEN: Dataanalys och statistik för I2, TMS135 Fredagen den 12 mars kl. 8:45-11:45 på V. Jour: Jenny Andersson, ankn 8294 (mobil:070 3597858) Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på

Läs mer

Matematisk statistik TMS064/TMS063 Tentamen

Matematisk statistik TMS064/TMS063 Tentamen Matematisk statistik TMS64/TMS63 Tentamen 29-8-2 Tid: 4:-8: Tentamensplats: SB Hjälpmedel: Bifogad formelsamling och tabell samt Chalmersgodkänd räknare. Kursansvarig: Olof Elias Telefonvakt/jour: Olof

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE31 Sannolikhet, statistik och risk 218-1-12 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

Hypotestestning och repetition

Hypotestestning och repetition Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

, för 0 < x < θ; Uppgift 2

, för 0 < x < θ; Uppgift 2 TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN FREDAG 1/4 2016 KL 08.00-12.00. Examinator och jourhavande lärare: Torkel Erhardsson, tel. 28 14 78. Tillåtna hjälpmedel: Formelsamling i matematisk statistik utgiven

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten Agenda Statistik Termin 11, Läkarprogrammet, VT14 I: Grundläggande begrepp och beskrivande statistik II: Exempel på typisk forskning III. Frågestund Martin Cernvall martin.cernvall@pubcare.uu.se Grundläggande

Läs mer

Formler och tabeller till kursen MSG830

Formler och tabeller till kursen MSG830 Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)

Läs mer

Lufttorkat trä Ugnstorkat trä

Lufttorkat trä Ugnstorkat trä Avd. Matematisk statistik TENTAMEN I SF1901 och SF1905 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 18:E OKTOBER 2012 KL 14.00 19.00. Examinator: Tatjana Pavlenko, tel 790 8466. Tillåtna hjälpmedel:

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.

Läs mer

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs.

(a) sannolikheten för att läkaren ställer rätt diagnos. (b) sannolikheten för att en person med diagnosen ej sjukdom S ändå har sjukdomen, dvs. Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 31:E MAJ 2012 KL 08.00 13.00. Examinator: Tobias Rydén, tel 790 8469. Kursledare: Tatjana Pavlenko, tel 790 8466.

Läs mer

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5

1. För tiden mellan två besök gäller. V(X i ) = 1 λ 2 = 25. X i Exp (λ) E(X i ) = 1 λ = 5s λ = 1 5 LÖSNINGAR TILL Matematisk statistik Tentamen: 29 7 kl 8 3 Matematikcentrum FMSF45 Matematisk statistik AK för D,I,Pi,F, 9 h Lunds universitet MASB3 Matematisk statistik AK för fysiker, 9 h. För tiden mellan

Läs mer

Föreläsning 5: Hypotesprövningar

Föreläsning 5: Hypotesprövningar Föreläsning 5: Hypotesprövningar Johan Thim (johan.thim@liu.se) 24 november 2018 Vi har nu studerat metoder för hur man hittar lämpliga skattningar av okända parametrar och även stängt in dessa skattningar

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:...

Del I. Uppgift 1 Låt A och B vara två oberoende händelser. Det gäller att P (A) = 0.4 och att P (B) = 0.3. Bestäm P (B A ). Svar:... Avd. Matematisk statistik EXEMPELTENTAMEN I SANNOLIKHETSTEORI OCH STATISTIK, Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk statistik (utdelas vid tentamen). Tentamen består av två delar,

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0 Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski

FACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski FACIT för Förberedelseuppgifter: SF9 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 206 KL 4.00 9.00. Examinator: Timo Koski - - - - - - - - - - - - - - - - - - - - - - - - 0. FACIT Problem

Läs mer

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p) Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel-

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1 Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas

Läs mer

1. INLEDNING Problemformulering Syfte Avgränsningar 4 2. TIDIGARE STUDIER 5 3. METOD Överlevnadsanalys 6 3.

1. INLEDNING Problemformulering Syfte Avgränsningar 4 2. TIDIGARE STUDIER 5 3. METOD Överlevnadsanalys 6 3. Sammanfattning Denna uppsats använder sig av SCB:s registerdata som omfattar samtliga par som gifte sig för första gången under 1998, dessa par studeras under cirka elva år fram till den 31 december 2008.

Läs mer

f(x) = 2 x2, 1 < x < 2.

f(x) = 2 x2, 1 < x < 2. Avd. Matematisk statistik TENTAMEN I SF90,SF907,SF908,SF9 SANNOLIKHETSTEORI OCH STATISTIK TORSDAGEN DEN 7:E JUNI 0 KL 4.00 9.00. Examinator: Gunnar Englund, tel. 07 7 45 Tillåtna hjälpmedel: Formel- och

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Föreläsning 11: Mer om jämförelser och inferens

Föreläsning 11: Mer om jämförelser och inferens Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer

Läs mer

TMS136: Dataanalys och statistik Tentamen

TMS136: Dataanalys och statistik Tentamen TMS136: Dataanalys och statistik Tentamen 013-08-7 Examinator och jour: Mattias Sunden, tel. 0730 79 9 79 Hjälpmedel: Chalmersgodkänd räknare och formelsamling (formelsamling delas ut med tentan). Betygsgränser:

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1913 MATEMATISK STATISTIK FÖR IT OCH ME ONSDAGEN DEN 12 JANUARI 2011 KL 14.00 19.00. Examinator: Camilla Landén, tel. 7908466. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I STATISTIKENS GRUNDER 2 STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-20 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Konfidensintervall, Hypotestest

Konfidensintervall, Hypotestest Föreläsning 8 (Kap. 8, 9): Konfidensintervall, Hypotestest Marina Axelson-Fisk 11 maj, 2016 Konfidensintervall För i (, ). Hypotestest Idag: Signifikansnivå och p-värde Test av i (, ) när är känd Test

Läs mer

Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor

Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Survival analysis (Dag 1) Upplägg Dag 1 Tid till händelse Censurering Livslängdstabeller Överlevnadsfunktionen Kaplan-Meier Parametrisk skattning Jämföra överlevnadskurvor Henrik Källberg, 2012 Survival

Läs mer