東京大学大学院農学生命科学研究科と次世代アグリイノベーション研究センターで構成される研究グループが、作物のゲノムデータを大幅に圧縮しながら、収量や草丈などの性質を高精度に予測できる新しい深層学習手法を開発しました。
【本研究成果のポイント】
数百万〜1,000万以上の遺伝マーカーを含むゲノムデータを、最大98%圧縮しても高い予測精度を維持する手法を
開発しました。
データ圧縮により、計算時間とデータ保存コストを大幅に削減しました。
イネおよびトウモロコシのデータで、従来手法よりも高い予測精度を達成しました。
DNA情報から有望な品種を効率的に選びだす技術として、品種改良の加速に貢献します。
【概要】
東京大学大学院農学生命科学研究科の雷帆タンジラ特任助教と岩田洋佳教授、次世代アグリイノベーション研究センターで構成される研究グループは、作物のゲノムデータを大幅に圧縮しながら、収量や草丈などの性質を高精度に予測できる新しい深層学習手法「ConvCGP」を開発しました。
近年の品種改良では、数百万から1,000万以上の遺伝マーカーを含むゲノムデータを用いて、作物の性質を予測する「ゲノミック予測」が活用されています。しかし、データの大規模化により、計算時間やデータ保存の負担が大きな課題となっていました。
本研究では、重要な遺伝情報を保ったままデータを圧縮し、その圧縮データから作物の性質を予測する手法を開発しました。その結果、元のデータのわずか2%程度に圧縮しても高い予測精度を維持できることを示しました。
詳細については、こちらを参照願います。