本期文章將跟大家介紹數據準備的重要性,進行數據分析之前為什麼需要預先進行數據準備呢??本期文章將詳細解說其重要性,以及其應用案例分享。

 

 

 

1. 為什麼要有專門的資料準備工具

 

研究發現,沒有合適的工具,資料準備將是耗時而又昂貴的,而且手工操作極易出錯,下­­面是一些公司在此方面的回饋

 

分析師花費80%的時間來查找和清理資料,每年每個分析師花費公司22000美元 — Blue Hill

88%手動創建的試算表包含重大錯誤 — Forbes

2016年,糟糕的資料品質使得美國損失3.1萬億美元 — IBM

大多數企業單位使用小於50%的結構化資料和小於1%的非結構化資料進行業務決策 — Harvard Business Review

 

因此,資料準備方案不再是一個可選項任務,它已經變成了資料分析流程中的必選項

 

企業單位花費大量的時間和金錢來做出基於不可信資料的分析決策,隨著資料來源和數字檔數量的快速增長,這個問題將會越來越嚴重

 

企業單位需要一個使用簡單但功能強大的解決方案,可以增加資料的訪問,自動執行重複性的工作,提高資料品質和可信度

 

2. Altair Monarch™專業的資料準備工具

 

Altair Monarch™可從任何來源的資料中快速,簡單地提取需要的資料,包括將非結構化資料,如pdf、文本、網頁等,轉化為行與列的結構化資料,提取資料後,使用者可以在無需編碼和基於滑鼠點擊的方法下進行資料的清理、轉換、合併、去重等工作,並且可以匯出到任何的資料分析平臺或者BI工具進行進一步的操作

 

使用Monarch,任何人都可以做到:

 

  • 從多源異構中提取資料,如pdf、文本、網頁等;
  • 將非結構化、半結構化和多結構化的資料轉換為行與列;
  • 使用預先構建的功能進行資料清理,不需要任何編碼;
  • 記錄資料處理的每一步操作,形成命令流檔,對後續同類的檔做到自動化處理,無需手工重複操作;
  • 對轉換好的行與列資料,進行合併、去重、轉置等操作;
  • 匯出結構化檔到各種資料分析,視覺化工具進行下一步的操作

 

 

3. Altair Monarch™ 應用案例——報帳單

 

企業員工每月報帳單,包含細節內容都按照統一的範本保存在PDF檔中,財務人員希望能夠把每個員工的報帳單總計起來,並與其工資單和個人資訊整理到同一個檔中,這樣就能自動地把報帳金額加入到下一次的工資發放中,同時,財務人員對報帳單內容進行統計分析,瞭解公司的財務和業務情況

 

PDF格式的報帳單樣本

 

利用Monarch提取形成的行與列表格

 

Monarch的解決方案

 

  1. 首先將各員工每月的PDF報帳單導入Monarch,並轉化為類Excel的行與列格式;
  2. 針對具體需求,調整資料內容,並作出適當累加操作;
  3. 將各員工當月Excel格式的工資單導入Monarch,與報帳單完成基於姓名的合併;
  4. 將合併整合後的檔匯出;
  5. 基於業務邏輯以及檔儲存方式,設置調度器,完成自動化處理。

 

Monarch 操作介面示意圖

 

 

 

圖片1.png

2.png

3.png

 

 

點擊下方視頻,瞭解更多Monarch相關資訊:

 

 

更多應用案例,歡迎關注Altair Knowledge Works

 

點我申請Altair Knowledge Works試用

 

 

arrow
arrow

    Altair Taiwan 發表在 痞客邦 留言(0) 人氣()