ESJ73 poster P2-274

日本生態学会第73回全国大会 (2026年3月、京都) 講演要旨
ESJ73 Abstract

一般講演（ポスター発表） P2-274 （Poster presentation）

深層学習を用いた動物画像分類におけるデータ構成の影響
Effects of data composition on deep learning-based wildlife image classification

*安藤正規（岐阜大学）
*Masaki ANDO（Gifu Univ.）

カメラトラップは非侵襲的かつ長期的な野生動物モニタリングを可能にし、近年広く利用されている。その結果画像データ量は膨大となり、これに応じて深層学習を用いた判読技術が使用され始めている。動物検出にはMegaDetector（現PyTorch-Wildlife）などが用いられるが、検出後の種判別には地域の動物相に応じたローカルモデルの構築が必要である。一方、カメラトラップ画像には特有の構造的課題がある。1回のトリガーで類似画像が連写取得されるため、トリガー単位を考慮せずに学習・検証・評価へ分割すると精度が過大評価される可能性がある。さらに種間の画像枚数の大きな不均衡も学習結果に影響しうる。本研究では、こうしたデータ構造が種判別モデルの精度に与える影響を検討した。
岐阜大学位山演習林で取得された画像からMegaDetectorで切り出した主要哺乳類14種のcrop画像を用い、種判別モデル（ResNet50）を構築した。3年分（2014–2016、約3.2万枚）のbase、これに4年分（2020–2023）を追加したexpand（約12.1万枚）、expandの上位3種を各5000枚に削減したcapped（約3.0万枚）の3データセットを作成し、トリガー単位を考慮する場合としない場合でデータを3:1:1に分割し計6モデルを構築した。さらに2024年（約2.5万枚）の画像を共通の外部評価データとした。
その結果、いずれのデータセットでもトリガー考慮の有無による全体accuracyの差は小さく、本研究条件下では過大評価は確認されなかった。データ量が最も多かったexpandが最も高い全体accuracyを示した。データ量に大きな差のないbaseとcappedでは全体accuracyに差はないが、cappedでは種間のaccuracy差が縮小し、種毎のデータ不均衡を調整した効果が示唆された。

深層学習を用いた動物画像分類におけるデータ構成の影響 Effects of data composition on deep learning-based wildlife image classification

深層学習を用いた動物画像分類におけるデータ構成の影響
Effects of data composition on deep learning-based wildlife image classification