是次影像辨識以機械學習進行,將影像分類為'sky', 'birds'以及'broken'三大類。首先以TensorFlow建立卷積神經網絡(Convolutional Neural Network, CNN),再於之前已分類的影像中隨機抽取7,165幀影像建立training set。神經網絡會抽取其中5,732幀影像為標準答案學習辨識規則,再利用餘下的1,433幀影像核對結果以修正神經網絡模型參數,整個步驟重覆6次。模型訓練結果如下:
由於是次辨識任務屬於比較簡單,因此訓練於第三次循環準確率已快速到達99.5%。利用已訓練完成的神經網絡辨識由今年二月中至六月的全新186,976幀影像,有雀鳥的影像全數成功辨識,而破損影像的正確辨識率為99.4%,即2,890幀破損影像中有16幀誤判為'sky'。日後要提升辨識正確率可透過調整卷積神經網絡模型中的結構組合與及超參數(hyperparameters)等;另外,由於三個分類非為互斥,辨識結果亦會受影響。
|