Ishigame65

AIでカメを検出する

はじめに(予備知識)

物体検出AIモデルの準備

  • 物体検出を行うAI深層学習モデル「YOLO」を準備する。
  • YOLOはカメを学習していない脳(神経回路網)モデルのため、カメを初めて見る赤ちゃんと同じでそれを「カメ」と認識することができない。

YOLO v8のインストール方法

学習データの準備

  • どれがカメであるかを学習するためのデータ(画像とラベル)を準備する。
  • 撮影した一枚一枚の画像に対して、画像中のどこにカメが映っているかを指定して、ラベルデータを作成する。この作業をアノテーションと呼ぶ。

画像とラベルを準備する方法

学習(訓練)

  • 用意したデータ(画像+ラベル)を使って脳(神経回路網)モデルを繰り返し訓練(学習)する。
  • 繰り返し訓練することにより、神経回路網のシナプス結合の強さ(重み)が徐々に調整され、入力画像のどこにカメが映っているかを認識し出力できるようになる。

用意したデータを使って訓練する方法

検出(推論)

  • 学習した脳(神経回路網)モデルを使用してカメを検出(推論)する。
  • すでに入力画像のどこにカメが映っているかを認識し出力できる神経回路網になっているため、カメを検出(入力画像のどこにカメがいるかを推論)できる。

映像からカメを検出する方法

画像からカメを検出する方法

検出性能の比較

2時間25分7秒の撮影映像(1920x1980画素、29.97fps)から5秒おきに抽出したフレーム画像の中でカメが映り込んでいる880画像に対して、 複数の学習モデルで検出を行った結果を比較する。

Epoch数(学習回数)による性能比較

モデルサイズによる性能比較

関連記事