Test: Optimerad fallprovning med Dell, Intel och Altair Fredrik Nordgren, M.Sc. M.E. (Master of Science in Mechanical Engineering), Applikationsingenjör, Altair Eric Lequiniou, Chef, High Performance Computing, Altair Martin Hilgeman, HPC-konsult, Dell 1
Introduktion Kollisionsanalys eller fallprovning är ett av de viktigaste inslagen i produktutformning och -utveckling. Med programvara för exakt simulering av sådana tester kan kostnaderna sänkas väsentligt och produkten nå marknaden mycket snabbare för tillverkaren. Dell, Intel och Altair har tillsammans analyserat en virtuell fallprovslösning med integrerad simulerings- och optimeringsanalys, vilket ger bevisat bättre hastighet och precision. Med den här lösningen kan ingenjörerna utforska fler olika konstruktioner, för tåligare och mer tillförlitliga produkter. Följaktligen kan tillverkarna utveckla högprestandakonstruktioner långt snabbare, vilket ger bättre produktkvalitet och minimerad leveranstid. Utmaning: Göra fallprovningen snabbare och mer exakt Alla produkter, från smarttelefoner till bildelar, måste kollisionstestas innan de går i produktion. Det är tillverkarens ansvar att utforma och utveckla produkter som på bästa möjliga sätt klarar av att bli tappade, krossas, skadas permanent eller utsättas för andra faror. Med program för simulering av fallprov kan tillverkarna testa sina produkter snabbare, vilket ger högre kvalitet på konstruktionen och minskar behovet av fysiska tester. Med sådan programvara återskapar man komplexiteten i den fysiska miljön och de fysiska materialen. Man simulerar även själva fallet eller krocken samt får detaljerad teknisk information om hur produkten klarar påfrestningen. De här programmen är i regel väl utvecklade, eftersom kraven på fallprovning och relaterade lösningar har sitt upphov i modellering av bilkrockar. Men fallprovning av telefoner medför unika utmaningar, såsom fler inblandade delar med många olika material och monteringsmetoder, som alla måste modelleras noggrant för en god utvärdering av potentiella skadeverkningar vid en kollision. Dessutom måste ingenjörerna konfigurera modellen och efterbehandlingen manuellt, vilket är tidsödande. Målet är att ta fram en robust produkt som klarar alla fallvinklar och belastningar (fönstertryck, böjning, vridning etc.). Det kräver flera samtidiga simuleringar med en snabb, skalbar lösning och en programvarumiljö där ingenjörerna kan testa fler olika konstruktioner för att få en bättre förståelse av hur produkten svarar fysiskt vid kollisionen. Ingenjörerna behöver också kunna effektivisera processer och minska risken för fel med hjälp av integrerade, automatiserade lösningar där bärande inslag som optimering ligger inbäddade. 2
Lösning: Snabbare simulering av fallprover med Dell, Intel och Altair I den här studien har Dell, Intel och Altair tillsammans testat Altairs programvara för simulering av fallprov på ett kluster från Dell som drivs av processorer från Intel. Med infrastrukturen från Dell och Intel kunde simuleringen påskyndas genom att öka prestandan hos kollisionstestlösaren, RADIOSS, som kördes på ett avancerat kluster från Dell med de senaste Intel E5 v2 processorerna. Den här lösaren (lösningsprogrammet), som är den avgörande avancerade komponenten i Altairs fallprovslösning, används till alla komplexa simuleringar där det krävs högeffektiv maskinvara och snabba processorer... Altairs fallprovslösning Altairs automatiserade fallprovslösning består av flera integrerade programverktyg avsedda att optimera prestanda, kapacitet och användbarhet: I HyperWorks programpaket för modellering, analys och optimering har man integrerat följande komponenter för en komplett fallprovslösning: o Högpresterande "finita element"-förbehandlingsprodukt (HyperMesh) för att förbereda också de största modeller, med en komplett uppsättning verktyg för geometrisk redigering för effektiv förberedelse av modeller för så kallad meshning o Strukturell analyslösare (RADIOSS), branschens standardlösare i över 20 år, används vid kollisionstester för bilar, ger högsta möjliga kvalitet, tålighet och skalbarhet. Med tekniken Advanced Mass Scaling (AMS) i RADIOSS får användarna ännu bättre prestanda. o Förstklassig utforskning, approximation och optimering av konstruktioner: inbäddad programvara (HyperStudy) med optimering av figurer, direktparameterisering, informationsutvinning och direktläsare av resultat via RADIOSS PBS Professional programvara för hantering av arbetsbelastning med så kallad high-performance computing-jobbplanering (HPC) samt hög skalbarhet och användbarhet, använd i över 20 år i tusentals kundmiljöer. I tidigare tester har Altair visat att den här lösningen, med aktiverad AMS via RADIOSS, kan minska körtiderna för fallprovning från 65 till 36 minuter (45 % förbättring), jämfört med 64 minuters körtid vid användning av en annan ledande lösare. Dell HPC lösningar baserat på teknik från Intel Dell tillhandahåller byggstenar och nyckelfärdiga lösningar kring HPC för att organisationer ska få dra nytta av teknik med HPC när de optimerar sin produktutveckling och -innovation. Genom samarbetet med Intel och Altair kan man lansera beprövade lösningar för produktutveckling, för bättre produktivitet, minskade kostnader och enklare hantering av komplexa klustermiljöer. I den här fallprovsanalysen valdes Dell PowerEdge M620 bladservrar som bygger på processorfamiljen Intel Xeon E5-2600v2. Med de här kraftfulla och strömsnåla processorerna får man 50 % mer i kärnor och cache än med förra generationen, samt snabbare minne och bättre maskinvara än med förra generationens Intel Xeon processorbaserade servrar. Det går att få högre prestanda för program med HPC genom Intel Advanced Vector Extensions (Intel AVX). Via Intel AVX går vektor- och flyttalsberäkningar fortare, med stöd för 256-bitars vektorer och snabbare 32-/64-bitars datakonvertering. Med processorfamiljen Intel Xeon E5 v2 får man ett brett utbud av processorspecifikationer, från antal kärnor/kärnrankning till frekvensoptimerade modeller allt för att möta användarens programbehov. 3
Översikt av testprojektet Infogning av en packning mellan PC-kortet och LCD-modulen för att reducera deformering i händelse av ett fall två olika dämningsformer visas på höger sida. Ingenjörerna bedömde prestandan hos lösningen från Dell-Intel-Altair i ett användningsexempel där de testade om påfrestningen på en telefonkonstruktion minskade om man lade till stötdämpande packning. I det scenariot leder glappet mellan telefonskölden och bärplåten till böjning och hög påfrestning på LCDmodulen vid ett baksidesfallprov. Målet var att få fram en optimerad packningskonstruktion med idealiska egenskaper (tjocklek, storlek, flexibilitet etc.) för minimal filtrerad påfrestning längs LCD-modulens hörn. 1. Konstruktion: I projektets inledande fas modellerades konceptet i HyperMesh, och konstruktionens variabler genererades med morfningsteknik och parameterisering av indatafilen. 2. Optimera: Ett så kallat design-of-experiment (DOE) utfördes för att generera en responsyta. Därefter utfördes optimeringen på responsytan i stället för den finita-element-modellen. 3. Verifiera: Den optimerade konstruktionen utvärderades/simulerades med finit elementanalys (FEA), och prestandaresultaten verifierades. Simuleringarna kördes på system med följande komponenter: 16x Dell PowerEdge M620 bladservrar med Intel Xeon E5-2680v2, E5-2667v2 och E5-2697v2 processorer, 128 GB minne per nod, med stöd av Mellanox FDR Inifiniband förbindelser. Resultatyta för LCD-påfrestningsbelastning som en funktion av dämpningsområde och tjocklek. 4
Prestandaresultat Med programvaran RADIOSS från Altair på ett Dell PowerEdge M620 bladsystem kunde ingenjörerna köra de 21 fallprovssimuleringar som krävdes för den här optimeringsstudien, varvid de testade tre olika Intel processorer (Intel Xeon E5-2690v2, E5-2667v2 och E5-2697v2 processorer) i konfigurationer med två noder, med följande kärn- och råprestandadata: PROCESSOR Totalt antal kärnor för två noder Rå FP-prestanda, GFLOP/s Enkel körning Genomsnittlig tid (s) Tid totalt För 21 körningar (s) E5-2680v2 40 896 719 15110 E5-2667v2 32 845 742 15598 E5-2697v2 48 1037 660 13868 Bild 1. Prestanda: översikt Klart bästa processor sett till förbrukad tid är E5-2697v2 den hade lägre frekvens men högre kärnrankning. Dessa prestanda är möjliga tack vare den enastående skalbarheten hos RADIOSS, eftersom den lägre frekvensen eller inbyggda prestandan i varje enskild kärna inte påverkar prestandan negativt i alla de många kärnorna som helhet. 900 800 700 600 Total tid (s) 500 400 300 200 100 E5-2680v2 E5-2667v2 E5-2697v2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Körningsnummer Bild 2. Detaljerad information om prestandan 5
Jämfört med den referenstid på 65 minuter (3 900 sekunder) som uppnåddes på en enda nods Intel Xeon X5570@2,93 GHz (med totalt 8 kärnor), är två noder med E5-2697 v2 cirka 6 gånger snabbare (endast 660 sekunder för en enkel körning). Det innebär att man kan slutföra hela optimeringsstudien (21 simuleringar) på under 4 timmar (13 868 sekunder). Dessutom kan användarna dra nytta av alternativet Advanced Mass Scaling (AMS) via RADIOSS för ännu snabbare lösningar med samma exakta resultat. Med AMS får användarna en avancerad lösning för kvasi-statiska problem samt ett alternativ till implicita icke-linjära simuleringar där det ibland blir svårt att uppnå konvergens på grund av exempelvis hög icke-linjäritet i kontakterna, komplext materialbeteende eller brottmodellering. Med AMS kan man få 1,7 gånger högre hastigheter, med en avslutstid på under 2,5 timmar (under 400 sekunder för en körning) i den snabbaste konfigurationen på Intel E5-2697v2. Värt att tänka på när man optimerar konfigurationer är att skalbarhet inte bara är en funktion av Intel Xeon processorn och valt antal kärnor antalet noder spelar också in. Simuleringarna löper parallellt, så man kan anta att om man utför runt hälften av de 21 körningarna på de första två noderna och resten på en andra grupp med två noder, kan man påskynda simuleringen med en faktor på (nästan) 2. Med den logiken kan man extrapolera resultat för verkliga förhållanden, genom att uppnå önskad simuleringstid med fler noder till exempel i ett simuleringskluster med 8 noder. En sådan metod kan man sedan förenkla med ett verktyg som PBS Professional, där man automatiskt distribuerar simuleringsjobben mellan tillgängliga resurser för att behandla data och använda resurser på ett optimalt sätt. Energieffektivitet och prestanda I dagens strategiska affärsprocesser är ström och kylning avgörande när man väljer mellan olika inköpsalternativ. Hur strömsnål en simuleringskonfiguration är kan därför vara helt avgörande för organisationer där man söker både optimal prestanda och energianvändning. Elförbrukningen mättes i totalt antal Watt för varje simulering medan simuleringstesterna utfördes i Dell PowerEdge bladsystemet (se tabellen nedan). Den övergripande elförbrukningen hos Intel Xeon E5-2667v2 och E5-2697v2 ligger på ungefär samma nivå, medan Xeon E5-2680v2 drar klart mindre ström när man kör de 21 simuleringar som ingår i det här testfallet. Sett från en annan vinkel: i en produktionsmiljö med arbetsbelastning dygnet runt drar Xeon E5-2680v2 21,3 % mindre ström per nod än Xeon E5-2697v2, vilket är mer än TDP-mellanskillnaden på 115 W gentemot 135 W (17 %). 6
Rekommenderade konfigurationer Tittar tanke på allmänna prestanda, energieffektivitet samt pris i förhållande till prestanda, kan följande rekommenderas om vilka noder som krävs för att konfigurera en simuleringsmiljö utifrån fallprovningen. Antalet noder skiftar beroende på den övergripande arbetsbelastningen. Maximala prestanda: Dell PowerEdge databehandlingsnod med Intel Xeon E5-2697v2 processorer (24 kärnor totalt per nod), 64 GB minne och Mellanox ConnectIB kort Minimumkonfiguration: 2 noder Avancerade prestanda, maximal energieffektivitet: Dell PowerEdge R720 databehandlingsnod med Intel Xeon E5-2680v2 processorer (20 kärnor totalt per nod), 64 GB minne och Mellanox ConnectIB kort Minimumkonfiguration: 2 noder Enkelt system: Dell PowerEdge R620 databehandlingsnod med Intel Xeon E5-2667v2 processorer (16 kärnor totalt per nod), 32 GB minne och Intel NetEffect X520 iwarp kort Minimumkonfiguration: 2 noder 7
Sammanfattning av resultaten Sammanfattningsvis finner man följande centrala resultat i den här studien: Med klustret från Dell-Intel erhölls 6 gånger högre hastighet vid fallprovssimuleringen via RADIOSS jämfört med referensfallet o Intel Xeon E5-2697v2 gav bästa hastighetsökningen av de tre testade processorerna: o Under 4 timmars avslutstid för 21 simuleringskörningar Med RADIOSS Advanced Mass Scaling (AMS) kan man få 1,7 gånger extra hastighet o Uppskattningsvis 1,7 gånger snabbare med AMS o Avslutstid på under 2,5 timmar (under 400 sekunder för en enkel körning) Med Intel Xeon E5-2680v2 får man optimal energieffektivitet o Med Xeon E5-2680v2 krävs mindre ström när man kör de 21 simuleringarna i det här testfallet o I en produktionsmiljö som körs dygnet runt drar Xeon E5-2680v2 21,3 % mindre ström än Xeon E5-2697v2, vilket är mer än TDP-mellanskillnaden på 115 W gentemot 135 W (17 %). Med Altairs fallprovslösning på Dell/Intel system kan konstruktionsingenjörer optimera telefonernas prestanda vid kollision samt tillgodose både garantikraven och kundernas förväntningar. Ingenjörerna kan även förbättra konstruktionens kvalitet genom att utforska vilka effekter olika ändringar får och genom ökad insikt i dynamiken vid fysisk fallprovning, med detaljerad information om de olika produktkomponenternas prestanda. Med snabbare och billigare produktutveckling kan tillverkarna lägga mer tid på att förbättra konstruktionen och det ger en bättre slutprodukt. Förutom vid fallprovning kan man optimera en rad program för teknisk databehandling i Altair HyperWorks simuleringspaketet genom förstklassiga kluster från Dell med de senaste Intel processorerna. Simuleringstillämpningarna är många: stansning, NVH (noise, vibration and harshness), datormodellering av strömningslära etc. Om du vill veta mer Mer information om Altair programvara: o HyperWorks serien: www.altairhyperworks.com o PBS Works serien: www.pbsworks.com Begär en demo: www.altair.com/dell-intel-drop-test Mer information om Dell: www.dell.com och www.dell.co.uk/hpc Läs mer om Intel: o newsroom.intel.com o blogs.intel.com. o www.intel.com/products/server/processor/xeone5/index.htm Kontakta oss: o Altair: www.altair.com/pagealllocations.aspx o Dell: www.dell.com och www.dell.com/hpc o Intel: www.intel.com 8