Övervakning med GnilronEye



Relevanta dokument
1 Översikt. 1.1 Koncept 1 (19) Tomas Rook Dokument typ Rev. Manual

Användarmanual Pagero Connect 2.0

Så här gör du för att lägga till nytt e-postkonto i Windows 8. Öppna E-post från startskärmen.

Novell Filr 1.2 skrivbordsprogram för Mac snabbstart

AVCAD 4.0 for MS SQL-SERVER

Manual Invånaradministratör

Artiklar via UB:s sö ktja nst

Det finns möjlighet att skicka SMS från ett flertal ställen i Rebus-systemet, detta dokument går igenom alla ställen där det fungerar.

LATHUND FÖR MALVIN. 1 Registrera ny användare Logga In Glömt lösenord Annonsering Skapa annons...

ZACI är den programvara som är navet i kommunikationen när det gäller kortbetalningar.

Domarassistenten.com. - en introduktion för domare

Ajax TruClient. Erfarenheter, tips och trix från Swedbank IT. Christian Gerdes Performance Engineer, LIGHTS IN LINE AB

Din manual MCAFEE TOTAL PROTECTION

En liten introduktion till SLI Community

Användarmanual CallPad och VoicePad

Så här fungerar registreringen i Malmö stads Odlingsslottskö

Instruktion för att slutföra registreringen

Användarhandbok OE/OSSpeaker V.10.3

Att komma igång med FirstClass (FC)!

VIDA ADMIN LATHUND INNEHÅLL

Linuxadministration I 1DV417 - Laboration 4 Nätverk, DHCP, säkerhetskopiering, processhantering, Samba och NFS

Elektroniskt informationsutbyte mellan arbetsgivare och Försäkringskassan. Information om filöverföring

KOMMUNLEDNINGSKONTORET / IT-AVDELNINGEN. Office 365. Lathund

SafetyMOB. Installations och användarmanual för. trådlöst nödstopp - dödmansgrepp. SafePort Marine. Dokument: SM_UM_sv Version:

Kom igång med LUPP 6.1

SAST Örebro Välkomna!

Om du vill hitta tillbaka till din sektion klicka på fliken i huvudmenyn som heter organisation.

Inspektion Användarmanuel

Delegering i Procapita

Java och Javascript. Krishna Tateneni Översättare: Stefan Asserhäll

Installationsanvisningar

Kom igång med Telia Touchpoint App. Din guide till installation och användning av de viktigaste funktionerna. TSP-3963_2-1505

Installationsguide. För att installera mjukvara och hårdvara, följ nedanstående anvisningar.

MANUAL NETALERT FÖR IPHONE VERSION 1.0

Bruksanvisning för hjälpbegäran

Installations- och bruksanvisning för Gree Smart app: Hansol -seriens luftvärmepump med WiFi

DATATAL FLEXI CALL CENTER AGENT. Erik Kalström - Datatal AB. Copyright Datatal AB. All rights reserved. 1

Lumbago - Förord. Välkommen till Journalprogrammet Lumbago.

Kom igång med LUPP 6.0

IdrottOnline-appen Du kan installera appen från Google Play store för Android och Appstore för iphone. Sök på IdrottOnline så bör den komma fram.

19. Skriva ut statistik

Installationsmanual för Tyfon ADSL

Manual. Danfoss termostat

Bruksanvisning. Applikationsplats

Guide för Google Cloud Print

Lathund. Fakturering via fil i Tandvårdsfönster

Användarmanual till AD OnLine

Hitta kunder som frilansare

1 Skapa Tabell Skapa Relationer Redigera Relationer Redigera Fält i Tabell Lägga till Poster i Tabell...

Program för skrivarhantering

Referensgruppsmöte Kista. Uppdragstagare - Resurs Birgit Wahlström april 2014

Beställnings- och installationsguide av Dubbelskydd

Jag rek. starkt att alla uppgraderar sin TomTom till version 5 eller högre då massor av nya funktioner och en betydande prestandaskillnad finns.

Komma igång med Eventor

Introduktion. Markera den gröna bocken. Skriv in URL:en Klicka på knappen Platser.

Installationsanvisning Boss delad databas

Installation av. Vitec Online

Installationsguide för FAR Komplett Offline 2.1.2

LABORATIONSRAPPORT Säkerhet och Sårbarhet Laboration 1 Brandväggar

TEKNISK SPECIFIKATION. för TIDOMAT Portal version 1.3.1

En liten introduktion till Community på GR-SLI

ASSA RX. Webbaserat passersystem för dig som jobbar med annat. ASSA ABLOY, the global leader in door opening solutions. 1

Användarmanual Phoniro App 3.4 för Android

Manual Utgåva 1.2. Sidan 1

Evodev AB web epost Telefon Fax

ISY Case Schakt Trafikanordning Markuppla telse, Trafikfo reskrift

Guide till hur jag ansöker i Idrottslyftet 2014 till projekt: Damhockeysymposium

ELMIA WLAN (INTERNET)

Översikt. Installation av EasyPHP 1. Ladda ner från Jag använder Release Installera EasyPHP.

KOM IGÅNG MED EN LATHUND TILL DE VANLIGASTE FUNKTIONERNA

ANVÄNDARMANUAL. Inrapportering av utförda vaccinationer får/get. för

Anmälan till Swedbanks kontoregister via e-legitimation

Manual för version V2

Konfigurationsmanual FlexTime 1.2

MBX Mobilapp. Inloggning. Mobilapplikationens huvudmeny. MBX Mobilapp

SDC Violweb Kom-igång-guide. En instruktion för användare version 2.5 (mars 2016)

SÅindex 5 i Microsoft Excel 2010

Manual C3 BMS för Android-telefoner

Snabbguide till CtrlPrint

Info till IT - dioevidence Nationell uppföljning inom sociala områden

Roth Touchline + app till Android och ios

FileCentral Desktop. Användarhandledning Version

MANUAL NETALERT FÖR ANDROID VERSION 3.3

Android-app Användarmanual 1.0

FIBER. Installationshandbok. Rev

Årsskiftesrutiner i HogiaLön Plus SQL

Mobil lagerhantering med streckkodsskanner

Piff och Puffs Chatsystem

Användarmanual HOIF.org

Operativsystem. Informationsteknologi sommarkurs 5p, Agenda. Slideset 7. Exempel på operativsystem. Operativsystem

Metodstöd 2

Manual Behörighetsadministratör

B2C för Svensk Elitfotboll Urval

Manual till Genomförandewebben. Treserva

INFORMATION FRÅN VITEC. Nyhetsbrev Vitec Marknad/Webbplats/Kundservice

The Pirate Bay-rättegången, dag 6 Fritt nedtecknat

GSM-RELÄ MED 2 INGÅNGAR, 2 UTGÅNGAR. 850/900/1800/1900 MHz. GSMS-SW22 Manual

edwise Uppdateringsinformation vecka 04

Din manual MCAFEE VIRUSSCAN PLUS

Transkript:

Övervakning med GnilronEye Av Torben Norling - Gnilron AB - 2007-11-25 Denna artikel beskriver hur övervakningsplatformen GnilronEye kan hjälpa till att hålla koll på ditt distribuerade system. Artikeln ger en kort introduktion till vad GnilronEye är och dess primära styrkor. Vad är GnilronEye? GnilronEye är en freeware övervakningsplatform som är 100% javabaserad. Systemet består av en central serverdel som i praktiken består av ett stycke webapplikation deployad i Tomcat 5.5+ med en tillhörande MySQL-databas. Själva övervakningen hanteras av agenter (en per maskin (host) med övervakningsbehov). En agent är konkret en java-console-applikation, dvs en java-applikation utan GUI. Dessa agenter kommunicerar över http(s) med den centrala servern för att dels få sin "attövervaka-lista" samt för att skicka händelser som sedan den centrala serverdelen informerar vidare till slutanvändaren. Den centrala serverdelen tillhandahåller förutom agent-kommunikation ett web-gränssnitt för slutanvändarna. Via detta gränssnitt definieras vad som ska övervakas, när och hur det ska övervakas. Vilka som ska få information om något går snett osv. All konfiguration av vad som ska övervakas sker alltså via detta webgränssnitt och agenterna blir automatiskt medveten om ev. förändringar. Man måste alltså inte manuellt starta om agenter "för att det ska ta skruv". De operativsystem som stöds för agent-övervakning är i dagsläget: Linux, Solaris, HP-UX och Windows (2003/XP/Vista). Givetvis erbjuds en AJAX-baserad dashboard där man kan få en "online-vy" av ett distribuerat systems ingående delar med övervakningspunkter m.m. Denna dashboard-vy förklaras mer nedan. Här är ett exempel från den "live-demo" som snurrar på GnilronEye's hemsida. Logga in själv för att se det hela "in action". Se URL'er i slutet av artikeln

Övervakning - Hålla koll på total CPU-last för en maskin GnilronEye kan bevaka hur mycket "CPU Idle percentage" som en maskin har. Det går att sätta tröskelvärden för när man anser att nu är det så hög totallast i maskinen CPU-mässigt att jag måste skicka ett larm. Övervakning - Hålla koll på processer och dess CPU-last GnilronEye håller koll på att en process lever samt kan dessutom hålla koll på en process CPU-last. En viktig del är att identifiera en process. Processer identifieras på två olika sätt. PID-file: För de processer som tillhandahåller en PID (Process ID) fil så kan GnilronEye läsa denna och hitta processen via denna mekanism. Finder expression: Ofta saknas en PID-fil och här erbjuder GnilronEye en avancerad mekanism med dynamiska uttryck för att hitta en process. Man kan t.ex. säga att "Processen jag söker ska köras av user xyzzy, kommandoraden ska innehålla texten java och processen ska förbruka mer än 200MB minne. På ren GnilronEye'ska skulle detta heta: proc.user == 'xyzzy' && proc.memmega>200 && proc.cmdcontains('java')

När man definierar själva övervakningspunkten för t.ex. att en process lever så talar man om hur ofta kontrollen ska ske, t.ex. var 10'e sekund. Man kan även ange en "inkubationstid" vilken kan används för att filtrera bort kortvariga störningar. T.ex. man kanske kan leva med att en process lastar mer än 80% CPU last om det pågår max 30 sekunder. Pågår det mer än 30 sekunder så ska det larma. Det är rätt så vanligt att ett system kortvarigt peakar CPU-mässigt men återhämtar sig snabbt. Då är det viktigt att ett övervakningssystem är med i matchen och inte "spottar ur sig" en massa brus-alarm. Det är illa om man sitter med en vardag fylld med larm som man ignorerar "för att det ska vara så" och sedan kanske missar något viktigt! Övervakning - Hålla koll på diskutrymmen Diskar övervakas enkelt genom att man sätter en tröskelnivå för när larm ska aktiveras. Av liknande anledning som inkubationstiden så sätter man förutom en nedre tröskelnivå en övre nivå för när "tillbaka till normal status" inträffar. Anledningen till detta är att slippa att en skur av larm skickas om diskutrymmet studsar fram och tillbaka kring tröskelnivån. T.ex. sätter man kanske tröskelnivån till att larma om det är mindre än 4 GB data ledigt, sedan sätter man lämpligtvis "normalnivån" till 5GB. Se nedan hur detta konfigureras i GnilronEye samt själva poängen i "graf-form".

Övervakning - Hålla koll på logfiler Många system loggar en massa bra information som ofta enbart används först när något går snett för att felsöka just "vad som gick snett i torsdags natt". GnilronEye kan "tail'a" en logfil och dessutom kan man deklarera regular-expressions som matchas mot logfilens rader en efter en allt eftersom det skrivs i loggen. Givetvis hanteras logg-rullningar, dvs när systemet börjar logga på en ny fil och döper om den gamla. Är man en fena på reg-exp kan man göra en massa skoj. Förutom själva regexp matchningen kan man ange hur många matchningar som måste ske under hur lång tidsrymd för att ett alarm ska triggas. Sedan anger man regler för hur normalläget ska återinträda. Web-GUI't tillhandahåller dessutom ett "regexp-test-gui" där man kan labba fram ett lämpligt regularexpression utifrån eget logfils-innehåll.

Övervakning - Hålla koll på http(s)-baserade tjänster Vi har nu behandlat en massa "lågnivå-övervakning" som processer, diskar och logfiler. Förutom allt detta så kan GnilronEye simulera webläsar-trafik inkl. alla teknikaliteter som https, cookies för sessionshantering, diverse säkerhetsmekanismer som "basic, digest och NTLM (Windows NT) authentication schemes". Detta gör att GnilronEye ska kunna övervaka de flesta typer av webapplikationer. För att hantera detta så definerar man upp ett körschema i det web-baserade admingränssnittet med de http-requests som ska genomföras i vilken ordning. Det går sedan att tilldela ett skript till en eller flera agenter för att t.ex. täcka in olika regional-kontor eller olika ISP'er beroende på övervakningsbehoven. De konkreta övervakningspunkterna som sedan finns att påföra är följande:

http responskoder, dvs 200 (ok) och liknande Svarstider. Dvs tiden för svar inkl. nerladdning av "http-response". Innehålls-kontroll: Här kan man definera ett regular-expression som matchas mot nerladdat innehåll för relevant http-request. På ren svenska kan man med denna övervakningspunkt verifiera att en webapplikation funkar som den ska, dvs inte bara returnerar "något innehåll" utan dessutom "önskat innehåll". Övervakning - Styrning Vi har nu kikat på en massa detaljer kring vad man kan övervaka men vi har inte ännu kikat på när övervakning ska ske. Övervakningspunkter eller Monitors som de heter i GnilronEye grupperas ihop i vad som kallas en MonitorView. Denna MonitorView håller förutom listan med Monitors (övervakningspunkter) ett körschema (Schedule) som talar om när övervakningen ska vara aktiv eller ej. Man kan vrida och vända en hel del på detta körschema för att det ska passa. Det är t.ex. väldigt enkelt att lägga till ett stopp i övervakningen för t.ex. en planerad systemuppgradering. Givetvis blir alla agenter som påverkas av en körschemaändring medveten om den nya stoptiden. Se nedan exempel som inkluderar alla dagar men sedan undantar 23:30-23:45 lördagar, då en backup kör och systemet har "planerad downtime". Larm - När, hur och koll på läget Finfint, nu har vi en massa bra övervakning på plats. Men hur får jag reda på när något går snett? Även om GnilronEye är kul så kanske jag inte nöjes-åker i GnilronEye hela dagarna :-) GnilronEye delger larm eller "events" som det heter i GnilronEye på två olika sätt. e-mail: SMTP utan krussiduller. RSS 2.0 / ATOM: Newsfeed. Antingen på global GnilronEye nivå eller på specifik MonitorView nivå. Förutom att GnilronEye informerar om larm (events) så håller GnilronEye koll på vilka som inne i GnilronEye har kikat på detaljvyn för ett problem. Detta är klart underskattat och enligt mig en av

GnilronEye's huvudpoänger. Just vetskapen kring vilka andra som vet om något som gått snett underlättar / driver på processen att åtgärda problemet. Det vanliga utan denna feature är att de inblandade måste ringa runt till varandra kors och tvärs för att få en bild av vilka som vet om problemet och vem som "tar på sig" att lösa problemet. Det sistnämnda hanterar GnilronEye via en mini-process kring varje larm. Denna process drivs både av manuella ingrepp (Jag tar på mig, tilldelar till X osv) samt av att problemet är identifierat som löst (Dvs resolved på GnilronEye'ska), här är det agenten som indikerar problemet som löst. Ajax-Dashboard - Realtidsvy GnilronEye tillhandahåller en s.k. dashboard som konkret innebär en centraliserad realtidsvy av ditt distribuerade system. Denna dashboard använder AJAX-teknologi för att hålla gränssnittet uppdaterat vilket tekniskt sker var 5:e sekund. Det finns ett antal färdiga layouter att välja mellan i vilka du sedan placerar ut information du vill se i layouternas "place-holders".på detta sätt kan du enkelt bygga upp en vy som passar just ditt system. Det finns tre olika objekt-typer som du kan placera in i en "placeholder": En applikationsvy där applikationsinstanserna framgår med "jag-lever-status" samt CPU last. En lista med en MonitorViews alla Monitors, dvs alla övervakningspunkter och dess värden. En "live-vy" av en övervakad logfil inkl. ett filter som du definerar via regular expression. Detta är i princip en: tail -f minlogfil grep mittfilter En "messenger-liknande" lista över inloggade användare samt agenter online, båda med information kring när användaren / agenten loggade in.

Statistik Givetvis tillhandahåller webapplikationen en möjlighet att ta ut rapporter kring "övervakningspunkternas läge i tiden". Installation Jag tänkte inte gå in på detalj hur man installerar GnilronEye men det är inte svårare än att installera en forum-applikation eller motsvarande. Kika i referensguidens installations-avsnitt för detaljer. Robusthet GnilronEye är designat från botten med robusthet i åtanke. Detta innebär att det t.ex. inte spelar någon roll om du startar agenterna före servern eller om du måste ta ner agenterna eller servern temporärt. Ifall en agent inte lyckas koppla upp sig mot servern av någon anledning köas ev. event och när servern blir online igen så delges de events som inträffade under serverns downtime. Skulle du ta ner en agent med en eller flera uppköade events så kommer dessa events att sparas på disk så agenten kommer ihåg de events som inte lyckats skickas till servern. Dvs när agenten startar igen så återetableras event-kön igen.

Sammanfattning För att sammanfatta det hela så kan man säga att: GnilronEye erbjuder en hel del övervakningsmöjligheter på låg nivå och applikationsnivå i form av loggfiler samt http-övervakning. Övervakar Linux, Solaris, HP-UX och Windows 2003/XP/Vista Har en Ajax-baserad dashboard som erbjuder en kraftfull realtidsvy av ditt distribuerade system. Är enkelt att installera. Är robust och okänsligt för hur du startar/startar om de ingående delarna Freeware. Referenser Hemsida - http://gnilron.se/eye Refguide - http://gnilron.se/eye/docs.shtml Live-demo - http://gnilron.se/eyedemo/