terasoft

深度學習於電腦視覺

語義分割、目標檢測和影像識別。整合深度學習的電腦視覺應用可借助深度學習提升演算法的準確度。在 MATLAB® 中,您可以設計和建立深度學習模型,並將其與電腦視覺應用整合。

您可以透過以下專為電腦視覺設計的功能,輕鬆上手使用:

  • 影像和影片標記應用程式
  • 儲存影像資料,可處理大量資料以用於訓練、測試和驗證
  • 專門針對影像和電腦視覺的預處理技術
  • 支援從 TensorFlow™-Keras 和 PyTorch 匯入深度學習模型以進行影像識別

數據準備

存取

使用 ImageDatastore 輕鬆快速存取並管理大量資料。

合成

深度學習中所做的各種處理均為了獲取綜合且全面的資料來建構精確的模型。透過數據增強,工程師能夠增加訓練演算法時可用的樣本和樣本變異數量。借助影像數據增強技術,您可以在訓練影像中納入旋轉和縮放變量,以此獲得更多訓練影像,從而實現穩健分類。

標記和預處理

影像和影片標記包括像素標記和目標感興趣區域 (ROI),比起手工標記可節省大量時間。在訓練網路之前,您可先使用影像處理工具對影像進行剪裁、去模糊、調亮和增強。

瞭解更多

網路設計、訓練和評估

互動式設計網路,利用 NVIDIA® GPU 加速訓練,更快獲得理想的結果。

設計

使用 ONNX™ 匯入預訓練的模型,然後使用 Deep Network Designer APP增加、刪除或重新組織層級。

訓練

無論您是使用單個 GPU、多個 GPU、雲端還是 NVIDIA DGX,只需一行 MATLAB 程式碼,即可支援多 GPU 訓練。

評估

在任意時間點都能對您的網路表現瞭若指掌。

  • 訓練前:使用網路分析器分析網路各層並確保層輸入/輸出相容性。
  • 訓練中:在網路訓練時利用視覺化顯示驗證準確度,並可隨時停止訓練。
  • 訓練後:使用控制、訊號處理和感測器融合元件在 Simulink 中模擬深度學習網路,以評估深度學習模型對系統級效能的影響
網路設計、訓練和評估
瞭解更多

部署

將深度學習模型部署到各式平臺 -- 自動轉出的程式碼可以在 ARM® 和 Intel® MKL-DNN 上直接執行。可匯入深度學習模型,並針對 TensorRT 和 CuDNN 函式庫轉出 CUDA® 程式碼。

部署
瞭解更多

深度學習用於電腦視覺範例

MATLAB 提供專門針對特定深度學習應用場景的工具,例如

外觀檢查和瑕疵偵測

對於生產系統中的高通量品質控制,自動檢查和瑕疵偵測至關重要。利用 MATLAB,您可以開發以深度學習為基礎的方法來檢測和定位不同類型的異常。

範例自動外觀檢查
電子書利用深度學習實現自動光學檢查

外觀檢查和瑕疵偵測

語義分割

語義分割的作用是將每個像素都標記到一個類別。這是自動駕駛和醫學影像處理中的關鍵技術。

影片語義分割概述

語義分割

目標偵測

目標偵測使用如 YOLO v2 和 Faster-RCNN的分類技術辨識場景中的物體。

部落格文章深度學習於自動駕駛應用(第1部分)-車輛偵測

目標偵測

影像和影片分類

使用最新的研究模型和遷移學習技術辨別影像和影片中的物體。

範例Classifying Video Sequences

影像和影片分類

3D 數據

MATLAB 支援稀疏和密集3D數據技術,進而協助實現3D數據處理。具體應用包括光達分類和醫學影像3D堆疊。

範例3D 數據

3D 數據