Lite mer siffror och tankar Vad finns i databasen? Det som matats in vid bordet med BM-dosorna är det enkla svaret på den frågan, varken mer eller mindre. Så det finns felaktigheter, detta gäller speciellt utspelskortet då det inte är avgörande för resultatberäkningen, men helt klart finns andra fel som ingen observerat. Exempelvis hittade jag en giv. Sen finns en del datortekniska fel då programmen som använts för att skapa databasen är nyskrivna och därmed har en del brister. Så läs alltid alla siffror med detta i åtanke. Klubb Lomma Lund Lomma Bjärred Bjärred Lund Lund Totalt Veckodag Måndag Måndag Tisdag Onsdag Torsdag Torsdag On,Sö Startdatum 11-01-10 10-02-08 11-01-11 10-03-31 10-01-14 10-06-03 10-02 Ant. tävl. 52 148 68 94 106 127 123 718 Mv hcp 44,4 29,4 35,6 42,8 34,8 Par/tävl. mv 36 25 25 25 36 19 19 Antal midnr 144 361 207 157 177 348 894 Antal par 240 562 276 195 442 495 300 Par >10 tävl. 48 84 36 46 65 54 39 Antal givar 1828 4112 1940 2393 3848 2863 3226 20210 Ant. result. 40426 100516 42360 45310 97266 54280 67142 447300 Från Bjärred finns också några resultat från barometertävlingar under 2009. Tisdagar i Lomma innefattar även sommarbridgen med mer mixat deltagande, exkluderas dessa är hcp i Lomma 30,4, antalet tävlingar 55 och par/tävl. 22. I Bjärred är det lottad partner 2ggr per år, därför det höga antalet olika par. Ant. resultat vid varje giv är två, dels vårt resultat dels motståndarnas. Vad ska inkluderas vad ska exkluderas i analyserna? Matrisen att analysera består just nu av 435 480 rader och 31 kolumner. Lägger man ut det på en fotbollsplan (100x50m) blir cellerna 2,2 mm höga och 1,6 m breda. Kan det bland så mycket siffror finnas någon sanning om bridge som inte är känd? Siffror & tankar 1 2013-01-19
Sammanfattning. Min tro har efterhand blivit att konkurrensbudgivningen i par-tävlingar är en av de viktigaste delarna att behärska för att enklast avancera i prislistan. Till erfarenhet och rutin finns inga genvägar, tekniskt kunnande kan man komma åt via litteratur, webb och tidskrifter. Så min initiala analys-ansträngning är riktad mot dessa situationer som infinner sig i 40% av brickorna, de där honnörerna är jämt fördelade 18-22 hp vardera åt paren, vilket gör att båda sidor ger sig in i budgivningen. Att bjuda 4sp med 26hp där motståndarna passar är något de flesta behärskar, så dessa brickor blir ofta föga utslagsgivande när det gäller slutbudet. Det som ger utdelning i dessa situationer är tekniskt kunnande och erfarenhet som skapar möjlighet för lönsamma övertrick. Samma gäller i motspelssituationen. För närvarande finns två mätvärden (KPI:er) som går att beräkna ned på lägsta nivå i databasen Utf% och hp/s. Med ett högt medelvärde på Utf% ökar chansen att hamna högt upp i prislistan. Vill man maximera antalet vinster måste man också öka på variansen av Utf%, vilket innebär ett högre risktagande. Hp/s är ett mått på hur riskbenägen man är i budgivningen och hur ofta man tar de chanser som dyker upp, som kan innebära avvikelser från en alltför strikt budgivningsmodell. Hp är ett viktigt mått på vad som kan åstadkommas med de 26 gemensamma korten, men användbarheten är starkt begränsad när fördelningen avviker från den balanserade. Ju fler korta och långa färger desto sämre är det att bara lita på hp-modellen, i databasen finns också initiala spelstick beräknade på varje hand. I många sammanhang är antalet observationer som siffrorna är beräknade på en viktig sidoinformation då vi hela tiden arbetar med siffror som till syvende och sist kommer från en ren slumpvis dragning av kort från en kortlek. Vi tror ju gärna mer på siffrorna om de är baserade på ett större antal observation där slumpen jämnat ut sig, ett alternativ vore att använda ett statistiskt spridnings-mått, men gemene man saknar ofta känsla för standard avvikelse. En viktig faktor när det gäller att bygga en statistik modell är hur man väljer att gruppera sitt siffermaterial, beroende på hur väl dessa dimensioner sammanfaller med situationerna vid bordet gör modellen mer eller mindre användbar. Vi har vissa givna grupperingar (dimensioner): Spelargrupp (Klubb+veckodag) med olika fördelning på spelskicklighet. Tiden finns ju alltid med dvs år, månad, vecka. Given och hur korten sitter fokus är här på parets gemensamma resurser Slutbudet delkontrakt, utgång eller slam, NT, HF eller LF. Motståndarna egen skicklighet, deras skicklighet, respekt? Vi har Utf% för att få grepp om det de flesta skulle kalla för skicklighet i bridge. Vad är då det i verkliga livet? Vad jag hittills lärt är det en kombination av tekniska kunskaper och taktisk disposition. Tekniska kunskaper kan bara fås med teoretiska studier och erfarenhet, något som är jobbigt att skaffa sig. Att göra rätt när det gäller taktik är något som intresserat mig mer och mer, och dessutom finns väldigt lite dokumenterat. Mätvärdet hp/s innehåller helt klart mycket information om detta, så då är frågan i vilka dimensioner ska man analysera denna KPI? Det är lite detta jag spekulerat i, var finns sanningarna om mig och hur ska vi ändra oss för att plocka mer MP? Vilka är duktiga, vilka ska vi försöka efterlikna? Det är om och hur man kan hitta svaret på dessa frågor dessa tankar gäller. Siffror & tankar 2 2013-01-19
Varför 18-22? Tittar man på fördelning bland de 20 brickor som finns i databasen ser man att med indelningen: 0-9, 10-17, 18-22 får man en ganska trevlig gruppindelning att analysera. 30-40-30. 31-gränsen kan diskuteras för slam-zonen, och 23-gränsen för utgångar och dominans Någonstans måste ju gränsen sättas. Hur som 18-22 är 40% av brickorna och det är min bestämda uppfattning att det är i denna zon som par-tävlingar avgörs. 19-21 känns för trångt för denna zon av krig och 17-23 känns lite för vid. Det är med andra ord dessa brickor som ska analyseras om man vill skaffa MP. Rätt eller fel? Åtminstone när det gäller de taktiska färdigheterna, när det gäller spelskicklighet kan naturligtvis inte denna slutsats dras. Man kan ju jämföra med de teoretiska värden (http://www.durangobill.com/brptcntstats.html) som ger följande resultat: Det verkar som det är hyfsat blandat i databasen. Mer om det en annan gång. Längsta färg? Även om fp är förbjudna enligt MS, så lite spelvärde finns det ju alltid i en gemensam färg. Hur ska man då indela givarna efter denna parameter? Ska den vara användbar i budsituationen måste den gå att uppskatta med bra approximation där. Den ska helst vara enkelt mätbar i datorn och sedan får det finnas invändningar från teoretiker. Förra julen läste jag om lagen i boken To bid or not to bid av Larry Cohen. Hårt kritiserad av vår egen Anders Wirgren och Mike Lawrence. Med försvar av Cohen. I min värld står det 2-1 till Cohen Lagen och Cohen har hjälpt mig till mer aggressiv budgivning i konkurens-situationer, sen må den vara fel ibland, vem vet allt när man ska ta beslutet? Den kan ju funka i Bjärred även om teoretikerna är oense?? I alla fal mot vissa par Kan man då kolla lagen i databasen? En tanke jag grunnat på en del... Med DD-analys kan man ju fånga totala antalet stick och genom att följa lagen kan man ju räkna ut vilket slutbud den rekommenderar om vi använder den i vår budgivning, sen kan man se efter vad utfallet skulle blivit och Siffror & tankar 3 2013-01-19
därefter om det är bättre än vad vi fick. Det får väl bli en senare uppgift Lite programmering behövs nog! Men en kul simuleringsövning kanske. Så, en enkel och mätbar storhet är längsta färg, som indikation på fördelningen. Är den då tillräcklig? Nej naturligtvis inte, men är den en tillräckligt bra storhet för att bygga en modell på? Jag har mer eller mindre hamnat där, då det dels är relativt enkelt att uppskatta värdet utgående från budgivningen och dels att det finns en teori ( lagen ) att binda upp den kring. Så hur indelar man då givar efter denna parameter? Även här finns tips att hämta från statistiken och Durango Bill. Rätt stor tabell som om man mekar lite med den blir hanterbar. Hur ser fördelningarna ut vad är en vettig indelning? För summan av längd för två händer ser fördelningen i teorin ut så här: Om vi tittar i databasen gäller följande: Lite mindre svitat, men både Lomma och Bjärred är ju handblandat. Dvs vi kan bortse från längre gemensam längd än 11 och får då i princip 26 grupper för en uppdelning. Men hur ser det ut i verkliga livet med 7-7, 7-8, 8-7 etc? Det kanske ändå är färre grupper än så att beakta. Om vi har en lång färg måste ju andra sidan också ha en lång färg. Då det inte rör sig om oberoende fördelningar kan inte den vanliga multiplikationsformeln användas för att räkna ut sannolikheten för 7-7 (0,15*0,15). Vi får helt enkelt lita på fördelningarna som finns i vår databas, då Durango Bill inte provade att lösa den uppgiften med kombinatorik. Siffror & tankar 4 2013-01-19
Förslag på gruppindelning av givar baserat på färglängder Vi-De. 10 grupper är väl många men kanske nödvändiga? Får vara en startpunkt, ger 7 grupper med lagen -ögon: 16-17 står för hälften och med antagandet att färglängd är oberoende av hp (ok lite tveksamt) får vi att (0,4*0,5) = 20% av alla givar är 18-22hp med 16-17 i totala antalet trumf. Är det här par-tävlingarna avgörs? Handtyper. En annan ansats att kategorisera fördelningar är att typa händerna i balanserad, en färgs, tvåfärgs etc. Problemen med en sådan kategorisering är att den säger ingeting om hur färgerna passar ihop, vilket ju är högst väsentligt när det gäller spelvärdet. Sedan kan man ju använda fördelningen som en undergruppering, som exempelvis: B med 5332, 4432 och 4333; 1F. ; 3F 5440, 4441. Fördelen med en sådan gruppering är ju att den är vanlig och därmed kanske enklare att relatera till. Den ingår till viss del i många budgivningsmodeller och är därför möjlig att hantera och använda som underlag i budgivningssituationen. Siffror & tankar 5 2013-01-19
Man kan se att nästan hälften är balanserade och en dryg tredjedel är tvåfärgshänder. Där vi ser att vi har den förväntade övervikten på balanserade händer pga av att givarna inte är datorgenererade mer än i Lund. Möjligen är avvikelserna ok? Väljer man ut bal, 5431 och 5422 täcker man nästan in 75% av händerna. Vill man att de tre vanligaste 6-kortshänderna 6322, 6331 och 6421 ska ingå tillkommer 13,4% och summan är då 85%. Kombinerar man ihop två händer blir det 10 grupper med följande fördelning: Siffror & tankar 6 2013-01-19
Där det verkar finns 5 grupper som är av praktiskt intresse. 2F+B där naturligtvis anpassningen mellan färgerna är av störst intresse för att bedöma spelvärdet på en sådan kombination så för denna kombination man skall kombinera med längden på längsta färg. B+B har ju samma anpassningsaspekt finns en trumffärg eller ej? 2F+2F kan ju när det gäller anpassning vara allt eller inget. 1F+B där finns ju alltid en 8-korts färg åtminstone. Så då återstår frågan vilken kombination som tillsammans med honnörspoäng utgör en bra värdemätare av spelvärdet. Är det handtyper eller är det längsta färg? Eller en kombination? När jag sitter vid bridgebordet och bjuder finns ju båda aspekterna med i mina val av bud. Spelskicklighet. Rankinglistorna i BridgeFacts kategoriserar de deltagande paren i kategorierna A-E beroende på placeringen som räknas fram som rullande medelvärde av procentuellt utfall under 12 månader för de par som deltagit med än 10 tävlingar under perioden i en spelargrupp. Grupperingen i A-E görs så att grupperna i görligaste mån är lika stora. Ska man analysera över spelfält på flera klubbar och med olika spelar-kvalité faller en sådan kategorisering. Ekelunds är båda A och B beroende på var. Det nationella handikappet med alla dess fel och brister utgör då en bättre indikator. Om man försöker indela paren i 5 grupper där antalet resultat är någorlunda rimligt fördelat får det utgöra en första rimlig ansats. Var man än sätter dessa gränser finns alltid invändningar. Rimligen har gruppen med sämre spelare lite fler resultat registrerade? Följande tabell styr kategorisering i nuläget: Med denna tabell blir fördelningen av olika resultat, dvs över alla rader på lägsta nivå TILL är inklusive angiven gräns.. Tittar man på antalet par i varje grupp får man följande bild: Något överraskande är det många par i kategorin A trots det förhållandevis låga antalet resultat. Troligen beror detta på att i denna grupp är man mer benägen att spela med olika partners, vilket ju gör att antalet olika par blir fler. Att E- gruppen uppvisar samma samband beror troligen på att spelfrekvensen i denna grupp är lägre, man spelar en gång i veckan och inte varje vecka. Andra orsaker? Siffror & tankar 7 2013-01-19
Tester av grupperingarna. Vid användning av statistiska modeller krävs alltid en genomgång av analyser där man känner att man kan relatera till siffror som modellen levererar. Saknas denna förankring blir det alltid problematiskt att presentera okända sanningar. Man sitter och teoretiskt försöker komma fram till bra dimensioner att starta med, det enda man vet med säkerhet att man under resans gång inser så mycket mer, men någonstans måste ju resan börja. Är det så att duktiga par är mer aggressiva i sin budgivning mot sämre motståndare? Dvs att hp/s är beroende av vem man möter. Tittar man lite på detta ser man följande (flik vikatdekat): Tittar man på dessa tabeller ser man att den teorin inte verkar stämma, möjligtvis en liten tendens i Lomma. Däremot verkar det som att man plockar rejält med sitt utfalla i denna grupp. Totalt sett verkar hp/s vara lite högre i Bjärred vilket delvis kan förklaras med att snitthcp är högre där??intressant? Siffror & tankar 8 2013-01-19
Siffror & tankar 9 2013-01-19
Bilaga. Upptäckta fel i databasen. I en del fall saknas kortsitsen, orsakat av att det missats av något par alternativt att något program havererat (2010 BBK). Detta innebär att dessa brickor inte kan analyseras i Analys-delen utan utgår från denna. Det innebär bland annat att om man summerar utfallet för en tävling i Analysdelen så skiljer den sig mot om motsvarande summering görs i resultatdelen. En annan avvikelse är protokoll med domslut (syns i resultatet som att kontraktet saknas eller har ett ogiltigt värde). Sådana resultatrader ingår ej i analyserna. Detta innebär att man kan få avvikelser på resultatet av en tävling om man summerar poängen på alla ingående rader. Rätt resultat för tävlingen finns i tabellen Deltagare, där summeringarna från Ruter är lagrade. Förvirrande begrepp. Då databasen vuxit fram med långa pauser emellan finns en del inkonsekvenser i begreppen. Typ1 är en typning av kontrakten i följande gruppering ( DHF,DLF,DNT, UHF,ULF,UNT, där U står för utgång och D för delkontrakt) I denna gruppering är D och U valda utgående från kontraktet oberoende av om det är odubblat eller dubblat, dvs 3Kx är ett delkontrakt i denna indelning. Sedan finns ett äldre begrepp BrickTyp med en indelning (D+,D=,D- och U+,U=,U- där U och de har samma betydelse som ovan), men i denna indelning betraktas 3Kx som ett utgångskontrakt då det ger utgångspremie. Siffror & tankar 10 2013-01-19
Siffror & tankar 11 2013-01-19