| | 要旨トップ | 目次 | | 日本生態学会第73回全国大会 (2026年3月、京都) 講演要旨 ESJ73 Abstract |
一般講演(ポスター発表) P2-044 (Poster presentation)
全ゲノム配列を用いた系統樹の構築において、全てのサンプルに1つしか存在しないシングルコピー遺伝子の利用は極めて有効である。しかし、既存の解析ツールでは、サンプル数の増加に伴い相同性検索に要する計算時間が指数関数的に増大してしまう課題があった。本発表では、このボトルネックを解消し、大規模な系統解析を短時間で実行可能にした新規パイプライン「CUSCO(CUrator of Single-Copy Orthologs)」を紹介する。CUSCOの主要な特徴は、以下の4点に集約される。
1. 圧倒的な解析スピード:サンプルの全対全の相同性検索を避け、リファレンス配列を各ゲノムにマッピングする手法を採用することで、計算時間の増加を種数に対して線形的に抑えた。ベンチマークでは、最大15種のデータセットにおいて既存ツールの約7倍の速度で解析を完了しつつ、同等の系統樹トポロジーを再現した。
2. お手軽な追加解析:全ゲノムデータから種系統樹を正確に再現する「マーカー遺伝子」を特定・抽出する機能を実装した。これにより、ゲノム未解読の新規サンプルに対しても、数個のマーカー遺伝子のサンガーシーケンス等により、低コストかつ迅速に信頼度の高い系統関係が推定できる。
3. 入力データの汎用性:解析に必要なインプットは、アノテーション未整備のゲノムや、倍数体のゲノムへも対応した。サブゲノムごとのシングルコピー遺伝子の抽出や、倍数化の歴史を反映した系統ネットワークの推定が可能である。
4. 簡単な操作性:上記のワークフローを一度のコマンド入力で行うことが可能。
CUSCOは、急速に増大するゲノムデータを系統推定の知見へと迅速に変換するツールである。これらのユーザーフレンドリーな特徴は、生態学における系統ゲノミクス解析の飛躍的な加速を期待させる。