回上層

MATLAB AI 人才培育計畫MATLAB深度學習競賽
(MATLAB Deep Learning Competition-Accelerate the Power of AI) #用 MATLAB 駕馭 AI #學 AI 從 MATLAB 開始

競賽細節

您曾經在結帳台大排長龍,但前方結帳速度慢如牛步?無人商店該如何結帳? 除了刷條碼,影像辨識也是一個快速又精準的方式!消費者將欲購的商品放在黑色的結帳平台上,藉由平台正上方裝置的相機,自動辨識檯面上的商品並進行自動結帳。

參賽者須開發相機中的辨識演算法,限使用MATLAB針對競賽題目進行物體辨識的深度學習模型,辨識對象分為分離的商品(單項或多項)以及相接觸的兩項商品,並繳交獨立執行程式(.exe)及設計說明報告(500字內)

此競賽需要辨識105項零售商品,平台上會有兩種情境,第一種是平台上只有一種商品,主辦方會提供3078張影像,第二種則是平台上同時有兩種不同的商品,會有3611張。訓練影像加起來共有6689張。

以下說明這兩種情境:

情境1:商品的同一面會放在平台上9個不同的位置點以進行拍攝(圖一),商品翻轉後,會再拍攝9張照片。一項商品會有9至45張照片,端看商品擁有的平面數。總共有3078張照片。

情境2:從105項商品中挑兩項放在平台上,這兩項商品會有三種相對關係(圖二)。此部分會提供3611張照片。

評分準則
準確度! 準確度! 準確度!

主辦方準備測試影像集,影像集會混雜這兩種的影像(單項、兩項商品),測試影像中商品的擺放位置與角度會比較多元(圖三),以模擬實際狀況中,顧客自動結帳的情境。

  • 由主辦方驗證辨識準確率,準確率最高者為優勝。
  • 準確率=正確預測張數 / 測試影像總張數
  • 影像中若有兩個商品,需兩個商品都辨識正確,才算辨識成功。
  • 若準確率相差1%以內,以辨識時間短的為優勝。
比賽評審

鈦思科技將以同一硬體環境進行測試,準確度最高者勝出。

    評測硬體環境:
  • Windows 7
  • Intel® Xeon® CPU E5-2640
  • NVIDIA® Tesla® V100D-8Q (8GB Memory)

本次評測硬體環境使用晉泰科技贊助之「3D VDI」桌面虛擬化技術架構,參賽者繳交之模型應用程式可利用在伺服器中搭載NVIDIA GPU 顯示卡執行,複賽入圍之參賽者可使用相同環境進行模型修改及訓練。更多3D VDI介紹>

模型與設計說明報告繳交方法

參賽者需要在Windows作業系統,使用MATLAB R2018b,將程式編譯成獨立應用程式(.exe),連同報告一同,上傳至指定空間,供主辦方進行評審,缺一即無法獲得審查資格。若評審期間發現繳交模型無法執行,會個別通知參賽者,參賽者需在48小時內進行修正,若逾時或未繳回視同放棄參賽

    報告格式:
  • 長度: 500 字內(不含封面,圖說)
  • 中英文不限,排版不限
  • 內容包含:
    • 摘要: 簡述解決問題的想法與方法流程
    • 方法: 詳述使用的分析手法與程式內容
編譯獨立應用程式

將程式撰寫成MATLAB函式,透過MATLAB Compiler進行編譯,獨立應用程式檔名請使用隊伍編號命名(e.g. G001.exe)。編譯方法請見相關資源。下方說明MATLAB函式的格式:

  1. MATLAB函式的輸入為影像路徑位置。
  2. 可使用函式imageDatastore讀取此路徑的所有影像。
  3. Deep Learning Model需事先儲存成MATLAB binary file (MAT-file)。在程式中匯入Model以做預測。
  4. 預測結果需寫出成文字檔,檔名請使用隊伍編號,文字檔內容為:
    • ImageID,ObjectNumber,Label1,Label2
    • 1,1,B1,
    • 2,1,B1,
    • 3,2,B1,B3
    • ImageID: 測試影像的檔名,測試影像會以阿拉伯數字命名(e.g. 1.jpg, 2.jpg)。如上方範例,請依序寫出結果。
    • ObjectNumber: 影像中辨識到的商品數量。
    • Label1, Label2: 辨識出來的標籤名稱(e.g. B1, B2)。若只有一項商品,請寫在Label1的欄位; 若是兩項商品,此兩個標籤不需特別排序。

    文字檔程式碼下載: https://goo.gl/qudCUY

主辦單位: 協辦單位: 贊助單位: