項目介紹

    AMET(應用機電工程和技術)成立於 1999 年,其前身為都靈理工大學的機電實驗室。如今,這家位於都靈的公司 (www.amet.it) 擁有廣泛的客戶群,涵蓋全球眾多行業內的很多知名公司,其中包括航空航太、鐵道機車以及汽車等行業。該公司的產品全部基於高性能的計算模擬,從人體模型到房門檢驗器,涵蓋各種工程和流程設計服務,技術堪稱一流。

 

挑戰

    AMET的客戶數量與日俱增,這使得對於 HPC週期的需求激增,公司只好借助外部 HPC服務來處理超負荷的工作。首席技術官 Paolo Cavallo和他的 HPC團隊對此解決方案進行了成本分析。

   “我們發現,購買服務的成本非常高——甚至遠遠高出了購買新的、速度更快的集群以及額外軟體許可的費用,”Cavallo這樣說道,“我們決定購買更多的集群,但是更需要的是擴展性好、能靈活處理工作載荷並滿足用戶需求的解決方案。因此,我們採用了PBS Professional。”

 


 

 

解決方案

目前,AMET已經將單核和多核系統集成到了一個異構72 Linux 集群中,其硬體製造商為HPSGI以及一家當地的原始設備製造商。它包括一個具有8Itanium2處理器的SGI Prism系統、四個SGI Altix XE系統(總共使用了8個雙核 Xeon處理器)以及48AMD64處理器(位於一個小型系統集群中)。從 Altair HyperWorks LS-DYNAAbaqus 以及 NASTRAN 軟體均可在其上運行。而 PBS Professional 是確保其正常運行的有力保證。

“它是一個單集群,我們通過組織提交過程,使使用者可以將他們的作業交由最合適的平臺進行處理,”AMET系統管理員Dario Dorella這樣說道,“例如,我們通常會在8SGI Itanium2 Altix系統上運行Altair OptiStruct,因為該系統的磁片運行速度非常快。而在另外兩個集群上運行RADIOSS。”

PBS Professional可以輕鬆地應對此類複雜問題,因此 AMET一直在使用它。四年前,公司在其舊集群上同時運行了LSF PlatformOpen PBS。目前公司最終統一使用了 PBS Professional

由於公司在斯洛伐克和土耳其設有分支機搆,同時工程師們又需要在遠端客戶網站工作,因此,AMET 需要採用一種簡單的方式來遠端存取其HPC集群。PBS Workse-Compute(注:Computer Manager的前身)便成為了解決該問題的不二選擇。

Cavallo說道:我們使用 e-Compute是出於兩個目的,首先是為了與在客戶方現場辦公的同事保持聯繫。他們可能會離開公司長達幾天甚至數周。另外一個目的是便於從其它 AMET辦公室的工作站進行訪問。這樣也便於使用我們的軟體許可;所有的軟體許可都安裝在本地,但可以通過 e-Compute 遠端使用。這樣,我們就不必在其它位置安裝許可了。

“使用e-Compute後,我們的使用者通過普通的Web介面就可以在都靈使用當地的計算資源。”Dorella 這樣說道,工程師甚至可以在網吧查看計算進度。我非常喜歡該軟體,因為通過它可以隨時隨地地查看進度並進行相應的修正。

    大約有30AMET的員工要使用集群,而對於他們當中的大多數或全部人員來說,其各自任務的截止日期已近在咫尺或排程非常緊張。他們需要定期訪問集群,且不能出現任何的延遲。如果有人越權使用了過多的機時,便會出現問題。Cavallo 使用 PBS Professional 來管理和解決此問題。

Cavallo 說道:“我們需要一個能真正靈活安排任務的解決方案,確保應用公平的使用策略,有了 PBS Professional,用戶之間的大部分衝突得以順利解決。”

AMET還可通過 PBS Professional來分析處理器和外部計算資源的使用情況,以獲得最具成本效益的解決方案。以前,當處於使用高峰期,AMET不得不從外部購買機時。現在,CavalloDorellaPBS帳戶日誌進行研究,這樣一來,通過改變任務的提交方式並修改任務安排策略,AMET可以提高其 CPU利用率,也不再需要外包任何工作,同時一年內無需購買額外集群來擴展資源。從而極大地節約了成本。

 

結論

Dorella說道:“我們也使用 PBS Professional 來幫助我們的用戶更好地利用他們的軟體許可,通過在 PBS日誌檔中查看許可的使用情況,我們注意到,以前整個週末都在運行的一些程式在出現錯誤時通常還會佔用軟體的許可但未執行任何操作。現在大家已意識到對他們的狀態進行監控的必要性了。”

arrow
arrow

    Altair Taiwan 發表在 痞客邦 留言(0) 人氣()