| 要旨トップ | 目次 | 日本生態学会第73回全国大会 (2026年3月、京都) 講演要旨
ESJ73 Abstract


一般講演(ポスター発表) P1-123  (Poster presentation)

RAGを利用した植物種同定手法の開発【A】
Development of a Plant Species Identification Method Using RAG【A】

*根本琉以(東京電機大学大学院), 武信柚希(東京電機大学大学院), 根本航(東京電機大学大学院), 上原歩(玉川大学)
*Ryu NEMOTO(Tokyo Denki Univ.), Yuzuki TAKENOBU(Tokyo Denki Univ.), Wataru NEMOTO(Tokyo Denki Univ.), Ayumi UEHARA(Tamagawa Univ.)

 検索表(identification key)は植物種を同定する際に広く利用されている。近年は、二者択一形式の検索表だけでなく、マルチアクセス型の検索表の開発も進められている。マルチアクセス型の検索表の作成は、対象となる分類群について特徴を共通の基準で整理する必要があり、整備に労力を要することが指摘されている。また、同定はあらかじめ定義された特徴と検索表に含まれる情報に基づき、利用者が特徴を選択することで候補種を除外する。同定に用いられる特徴や判断基準が事前に定義されており、静的な同定手法と考えられる。
 植物種同定において重要となる形態情報は、自然言語によって記述されているものが多い。近年、大規模言語モデル(Large Language Model:LLM)を用いて、自然文の情報を表形式などのデータに構造化する研究が報告されている。しかし、これらの研究例は未だ少なく、対象とする情報源についても検討の余地が残されている。さらに、LLMにより得られた構造化データを、種の同定といった実務的タスクへ適用する手法については、十分な検討がなされていない。
 本研究では、Flora of Chinaに記載された植物の形態情報を対象とし、LLMを用いて情報の構造化を行い、種ごとの形態情報を整理した。さらに、Retrieval-Augmented Generation(RAG)を導入し、構造化された形態情報に基づいて植物種の同定を行う手法を考案した。同定に際しては、植物の特徴に関する語彙を入力として受け取り、ベクトル検索によって関連する形態情報を抽出する。その後、抽出された情報と語彙をLLMに与えることで、種の同定を行う。提案手法の有効性については、タデ属(Polygonum)を対象として検証を行った。さらに、機械学習を用いた評価により、手法の精度に影響を与える特徴について検討を行った。


日本生態学会