行業背景及現狀
異常檢測(或離群值檢測),是從事件或觀察結果中識別出罕見現象,這些事件由於與大多數數據有著顯著差異而被懷疑為異常。
通常,異常數據會與某些問題或罕見事件關聯,例如銀行欺詐、醫療問題、結構缺陷、設備故障等。因為從業務角度來看,識別這些事件通常非常有趣,所以這種關聯讓人們有興趣找出哪些數據點可以視為異常。
實施狀態監測最常見方法是監控機器上的每個傳感器測量值,並對其施加最小和最大值限制。如果當前值在範圍之內,則機器運行狀況良好。如果當前值超出範圍,則機器運行不正常,並發送警報。
在行業應用裡面,基於先知經驗的模型還在繼續使用,但是基於機器學習的模型也開始得到應用和推廣。
應用示例
本例以某一項目異常檢測為例,說明如何利用機器學習工具Altair ® Knowledge Studio ®和實時可視化工具Altair Panopticon™結合,幫助用戶實現異常檢測目的。
示例講解
● 數據準備
首先進行數據準備工作,包括預覽數據,了解各統計量,同時,對數據集的缺失值進行填充,繪製特徵變量,觀察趨勢等。
● 數據分析
然後利用不同的異常值檢測方法分析數據,分析報告中包括使用的檢測方法、有異常值的變量信息等。
另外,用戶可以根據業務需要,編寫Python代碼進行異常值檢測。
● 實時可視化
最後,把訓練好的異常檢測模型輸出Python 代碼並導入到Panopticon 中,以實時可視化的方式進行在線異常檢測狀態顯示。
免費軟件試用
歡迎申請試用體驗
無需代碼的實時流數據可視化↓↓↓
點擊下方鏈接即刻免費申請試用:
文章標籤
全站熱搜
留言列表