深度學習於電腦視覺
語義分割、目標檢測和影像識別。整合深度學習的電腦視覺應用可借助深度學習提升演算法的準確度。在 MATLAB® 中,您可以設計和建立深度學習模型,並將其與電腦視覺應用整合。
您可以透過以下專為電腦視覺設計的功能,輕鬆上手使用:
- 影像和影片標記應用程式
- 儲存影像資料,可處理大量資料以用於訓練、測試和驗證
- 專門針對影像和電腦視覺的預處理技術
- 支援從 TensorFlow™-Keras 和 PyTorch 匯入深度學習模型以進行影像識別
語義分割、目標檢測和影像識別。整合深度學習的電腦視覺應用可借助深度學習提升演算法的準確度。在 MATLAB® 中,您可以設計和建立深度學習模型,並將其與電腦視覺應用整合。
您可以透過以下專為電腦視覺設計的功能,輕鬆上手使用:
使用 ImageDatastore 輕鬆快速存取並管理大量資料。
深度學習中所做的各種處理均為了獲取綜合且全面的資料來建構精確的模型。透過數據增強,工程師能夠增加訓練演算法時可用的樣本和樣本變異數量。借助影像數據增強技術,您可以在訓練影像中納入旋轉和縮放變量,以此獲得更多訓練影像,從而實現穩健分類。
影像和影片標記包括像素標記和目標感興趣區域 (ROI),比起手工標記可節省大量時間。在訓練網路之前,您可先使用影像處理工具對影像進行剪裁、去模糊、調亮和增強。
互動式設計網路,利用 NVIDIA® GPU 加速訓練,更快獲得理想的結果。
使用 ONNX™ 匯入預訓練的模型,然後使用 Deep Network Designer APP增加、刪除或重新組織層級。
無論您是使用單個 GPU、多個 GPU、雲端還是 NVIDIA DGX,只需一行 MATLAB 程式碼,即可支援多 GPU 訓練。
在任意時間點都能對您的網路表現瞭若指掌。
將深度學習模型部署到各式平臺 -- 自動轉出的程式碼可以在 ARM® 和 Intel® MKL-DNN 上直接執行。可匯入深度學習模型,並針對 TensorRT 和 CuDNN 函式庫轉出 CUDA® 程式碼。
MATLAB 提供專門針對特定深度學習應用場景的工具,例如
對於生產系統中的高通量品質控制,自動檢查和瑕疵偵測至關重要。利用 MATLAB,您可以開發以深度學習為基礎的方法來檢測和定位不同類型的異常。
語義分割的作用是將每個像素都標記到一個類別。這是自動駕駛和醫學影像處理中的關鍵技術。
目標偵測使用如 YOLO v2 和 Faster-RCNN的分類技術辨識場景中的物體。
使用最新的研究模型和遷移學習技術辨別影像和影片中的物體。
MATLAB 支援稀疏和密集3D數據技術,進而協助實現3D數據處理。具體應用包括光達分類和醫學影像3D堆疊。