資料解析

資料解析,Data Analytics,

資料解析並不只有單純的資料處理與傳統的資料分析,當前最熱門的資料科學(Data Scientist)即是立基於資料解析的基礎上,除了對現有歷史資料進行分析外,也包含在於建立一套模型以預測未來協助做出正確決策。

目前全球有許多工程師及IT人員正使用MATLAB進行大數據資料解析的工作,範圍包含進行廠房或設備的維修預測、分析遠程的訊息資料處理、先進駕駛輔助系統到物聯網及感測器的資料解析等,選擇MATLAB原因在於它所提供的功能是現有商業智慧系統、或者是其他資料分析與開放式語言所無法提供的,包含:

處理真實世界實體資料:MATLAB 本身即無縫支援感測器、影像、影片、遙測(telemetry)、二進制以及其他即時格式的資料,還能透過MATLAB MapReduce的函式探索Hadoop的大數據資料,並透過連結介面連接ODBC/JDBC資料庫。

機器學習、類神經網路、統計以及更多資料分析的方法:MATLAB提供完整的統計以及機器學習功能,並提供更進階的方法如非線性優化、系統辨識以及數千種已內建好影像及影片處理、財務建模、訊號及控制系統等演算法。

大量數據資料的快速處理能力:MATLAB的數值運算不僅能處理大數據資料,還可擴充至叢集電腦以雲端架構上進行平行處理。

線上與即時的應用佈建能力:MATLAB不僅可整合企業系統、叢集電腦以及雲端,還可以轉檔、執行及應用到即時的目標嵌入式硬體上執行。

相關資源與成功範例

資料存取與探索

執行資料解析的第一步即為存取豐富的可用數據來探索其模式並發展出更深入的見解。MATLAB提供整合式單一環境,幫助您存取各種來源及格式的資料,包含:
  • 資料庫(符合ODBC與JDBC)、資料倉儲(data warehouse)、及分散式檔案系統(Hadoop)
  • 存取金融市場即時及歷史資料的財務資料伺服器
  • 物聯網(Internet of Things)裝置
  • 存取工廠即時與歷史資料的OPC伺服器
  • 整理I/O,包含文字、試算表、XML、CDF/HDF、影像、音訊、影片、地理空間、網站內容等。
相關應用支援及成功範例

前處理(Preprocessing)與資料清理(Data Munging)

在工程師及科學家利用不同來源及存放處而來的資料開發預測模型之前,資料必須先經過前處理或一些準備。舉例來說,資料可能含有缺漏值或錯誤,或者時間戳記格式可能不一致。MATLAB可以幫助您簡化一些耗時的任務,像是:
  • 清理錯誤、異常、重複資料
  • 以排除、過濾、或插補的方式來處理缺漏資料
  • 透過先進的訊號處理技巧來移除感測器資料的雜訊
  • 對取樣頻率不同的資料進行合併與時間校準
  • 利用特徵選取來減少高維資料、提升模型預測能力
  • 特徵萃取及轉換以降低資料維度
  • 訊號、影像、影片處理等的領域分析
相關應用支援及成功範例

開發預測模型

原型化及直接從資料建立預測模型來預測未來可能的結果。您可以比較不同機器學習方法,像是邏輯式迴歸、分類樹、支援向量機、群體學習法等等,並且使用模型精鍊及歸納工具來建立一個對該資料具備最佳預測能力的精確模型。在相同的開發環境中靈活地運用工具於處理財務、訊號、影像、影片等資料,並映射資料來建立各種領域的解析。

相關應用支援及成功範例

企業系統整合

在MATLAB開發的解析可以與生產IT環境整合,不需要再重新編寫程式碼或建立客製化結構。MATLAB解析可以被封包為可以轉檔佈署於多種開發環境的元件,像是Java、Microsoft.NET、Excel、Python、及C/C++。您可以分享單獨的MATLAB應用程式,或者將MATLAB解析作為網站、資料庫、桌上型裝置、企業應用程式…等的一部分來執行,並且將MATLAB解析作為可被各個應用程式調用的集中服務。

相關應用支援及成功範例