MATLAB AI 人才培育計畫MATLAB深度學習競賽
(MATLAB Deep Learning Competition-Accelerate the Power of AI) #用 MATLAB 駕馭 AI #學 AI 從 MATLAB 開始
競賽細節
您曾經在結帳台大排長龍,但前方結帳速度慢如牛步?無人商店該如何結帳? 除了刷條碼,影像辨識也是一個快速又精準的方式!消費者將欲購的商品放在黑色的結帳平台上,藉由平台正上方裝置的相機,自動辨識檯面上的商品並進行自動結帳。
參賽者須開發相機中的辨識演算法,限使用MATLAB針對競賽題目進行物體辨識的深度學習模型,辨識對象分為分離的商品(單項或多項)以及相接觸的兩項商品,並繳交獨立執行程式(.exe)及設計說明報告(500字內)
此競賽需要辨識105項零售商品,平台上會有兩種情境,第一種是平台上只有一種商品,主辦方會提供3078張影像,第二種則是平台上同時有兩種不同的商品,會有3611張。訓練影像加起來共有6689張。
以下說明這兩種情境:
情境1:商品的同一面會放在平台上9個不同的位置點以進行拍攝(圖一),商品翻轉後,會再拍攝9張照片。一項商品會有9至45張照片,端看商品擁有的平面數。總共有3078張照片。
情境2:從105項商品中挑兩項放在平台上,這兩項商品會有三種相對關係(圖二)。此部分會提供3611張照片。
評分準則
準確度! 準確度! 準確度!
主辦方準備測試影像集,影像集會混雜這兩種的影像(單項、兩項商品),測試影像中商品的擺放位置與角度會比較多元(圖三),以模擬實際狀況中,顧客自動結帳的情境。
- 由主辦方驗證辨識準確率,準確率最高者為優勝。
- 準確率=正確預測張數 / 測試影像總張數
- 影像中若有兩個商品,需兩個商品都辨識正確,才算辨識成功。
- 若準確率相差1%以內,以辨識時間短的為優勝。
比賽評審
鈦思科技將以同一硬體環境進行測試,準確度最高者勝出。
- Windows 7
- Intel® Xeon® CPU E5-2640
- NVIDIA® Tesla® V100D-8Q (8GB Memory)
評測硬體環境:
本次評測硬體環境使用晉泰科技贊助之「3D VDI」桌面虛擬化技術架構,參賽者繳交之模型應用程式可利用在伺服器中搭載NVIDIA GPU 顯示卡執行,複賽入圍之參賽者可使用相同環境進行模型修改及訓練。更多3D VDI介紹>
模型與設計說明報告繳交方法
參賽者需要在Windows作業系統,使用MATLAB R2018b,將程式編譯成獨立應用程式(.exe),連同報告一同,上傳至指定空間,供主辦方進行評審,缺一即無法獲得審查資格。若評審期間發現繳交模型無法執行,會個別通知參賽者,參賽者需在48小時內進行修正,若逾時或未繳回視同放棄參賽
- 長度: 500 字內(不含封面,圖說)
- 中英文不限,排版不限
- 內容包含:
- 摘要: 簡述解決問題的想法與方法流程
- 方法: 詳述使用的分析手法與程式內容
報告格式:
編譯獨立應用程式
將程式撰寫成MATLAB函式,透過MATLAB Compiler進行編譯,獨立應用程式檔名請使用隊伍編號命名(e.g. G001.exe)。編譯方法請見相關資源。下方說明MATLAB函式的格式:
- MATLAB函式的輸入為影像路徑位置。
- 可使用函式imageDatastore讀取此路徑的所有影像。
- Deep Learning Model需事先儲存成MATLAB binary file (MAT-file)。在程式中匯入Model以做預測。
- 預測結果需寫出成文字檔,檔名請使用隊伍編號,文字檔內容為:
- ImageID,ObjectNumber,Label1,Label2
- 1,1,B1,
- 2,1,B1,
- 3,2,B1,B3
- ImageID: 測試影像的檔名,測試影像會以阿拉伯數字命名(e.g. 1.jpg, 2.jpg)。如上方範例,請依序寫出結果。
- ObjectNumber: 影像中辨識到的商品數量。
- Label1, Label2: 辨識出來的標籤名稱(e.g. B1, B2)。若只有一項商品,請寫在Label1的欄位; 若是兩項商品,此兩個標籤不需特別排序。
文字檔程式碼下載: https://goo.gl/qudCUY