画像によるコムギ穂自動検出のための大規模なデータベースを作成 〜農業および研究現場に使えるAIツールの開発に期待〜
- 発表者
- 郭 威(東京大学大学院農学生命科学研究科付属生態調和農学機構 助教)
石川 吾郎(国立研究開発法人農業・食品産業技術総合研究機構 次世代作物開発研究センター 基盤研究領域 上級研究員)
長澤 幸一(国立研究開発法人農業・食品産業技術総合研究機構 北海道農業研究センター 畑作物開発利用研究領域 主任研
究員)
発表のポイント
- 国際協力のもと、7か国、9研究機関の十数名の研究者が汎用性を高めた画像による穂の自動検出のための大規模なデータベースを作成しました。
- コムギのAI研究のための国際的な画像収集プラットフォームおよび認識基準を構築しました。
- 本データを契機にして、コムギの穂認識を目的とした世界的な画像認識コンペティションが開かれました。これから農学分野におけるAI研究の加速化が期待されます。
発表概要
東京大学大学院農学生命科学研究科附属生態調和農学機構の郭威助教らは、国際共同研究により、Global Wheat Head Detection(GWHD)データセットを構築しました。これは、大規模で多様性に富み、ラベル付けされたコムギの穂画像のデータセットを納めた世界初のデータセットです。コムギの栽培や研究現場では、単位面積あたりの穂数など、穂に関わる調査は主に目視により行ってきました。そのような労力の軽減を目的に、画像解析や深層学習で自動化させる技術の開発が進められています。しかしながら、これまでの取り組みでは一般的に限られたデータセットを用いて穂の検出モデルを作成しているため、汎用性のないモデルしか作ることができていません。そこで発表者らは、世界各国の研究者と協力し、7か国9機関から、さまざまな品種、生育段階、栽培条件を持つ約19万のコムギ穂の高解像度画像を収集しました。さらに、画像取得のガイドライン、データ共有の基準としてのFAIR原則(注1)に従った最低限のメタデータの関連付け、一貫したムギ穂ラベル付け方法も提案しました。GWHDデータセットは(http://www.global-wheat.com/)で公開されており、世界中の研究者のムギ穂認識手法の開発とベンチマーク利用が可能になっています。
発表内容
図1 圃場での画像取得には様々な方法が世界中で開発されており、手動による低コストな方法(A)、ロボット(B)、ガントリー(C)、懸垂ケーブル式(D)などがある。
図2 様々な研究機関で撮影された画像を決められた基準で整合する手法。
図3 整備されたGWHDデータセットの一例。各国の担当研究機関名の略称で命名していた。
図4 “Global Wheat Head Detection Challenge”のイベント ポスター。
ここ数年、最新の情報科学を駆使して作物の高速・高精度な表現型解析(以下、フェノタイピング)に関する研究開発が、世界中で盛んに行われています。その中でも、画像センシングと機械学習を活用した高速フェノタイピングへの期待は高く、例えば、コムギの主な収量構成要素の一つである単位面積当たりの穂数の調査も、従来の複数の調査者による肉眼計数から深層学習による自動計数に移行すべく数々の研究成果が挙げられています。しかしながら、既存の研究成果の多くは、それぞれの少ない実験データを対象として穂検出モデルを作成しており、異なる栽培条件、品種に対する汎用性がないため、スケールアップすることが難しいのが現状です。また、穂の認識はコンピュータビジョンの研究分野でも難しい課題になっています。なぜならば、観察条件、品種の違い、生育ステージ、穂の向きなどにばらつきがあるだけでなく、風によるぼやけの可能性や、密集した個体群による重なりなど、正確な認識を阻害する要因が多数存在するためです。
そこで発表者らは、汎用性のある穂検出モデルの作成を可能にするため、世界各国の研究者と協力することで、大規模で多様性に富み、ラベル付けされたコムギの穂画像データセットの構築を目標にしました。日本の東京大学と国立研究開発法人農業・食品産業技術総合研究機構(以下、農研機構)、フランスの作物研究所 Arvalisと国立農学研究所、カナダのサスカチュワン大学、イギリスのロザムステッド試験場、スイスの連邦工科大学チューリッヒ校、中国の南京農業大学、オーストラリアの連邦科学産業研究機構とクイーンズランド大学の研究者が、それぞれの国のコムギ栽培現場から、さまざまな手段で合計11のサブデータセットを収集しました(図1)。収集した画像は、撮影手段と機材が異なるため、初めにデータの整合化(図2)を行い、最終的に合計4,698枚の標準となる画像データを作成しました。これら画像のサイズは1024×1024ピクセルに揃えてあり、一枚の画像当り約20~70個のコムギ穂が含まれています(図3)。その後、コムギ穂の有無について、人間の判断が必要なところをコンピュータに提案させる新しい解析技術を用いることにより、従来よりも極めて効率良く機械学習のための学習データの選抜とコムギ穂の位置座標を収集する作業(アノテーション作業)を行うことができました。さらに、それぞれのアノテーション結果に対して、複数名による再検討および手動修正を行い、最終的に約19万のコムギ穂画像を格納したGlobal Wheat Head Detection(GWHD)データセットを構築しました。
構築したGWHDデータセットを使って、2020年5月4日からIPPN(注2)組織のイベントであるCVPPP 2020 (注3)Challenge at ECCV2020(注4)に“Global Wheat Head Detection Challenge”を企画し、Kaggle(注5)で開催され、世界中から2245チームが集まりました(https://www.kaggle.com/c/global-wheat-detection)。当チャレンジでは、ヨーロッパと北米で収集した3,422枚の画像データをトレーニングデータとして、オーストラリア、日本および中国の1,276枚の画像データを検証データとして公開されています。また、カナダのGIFS、日本のクボタ、フランスのDigitAG、Hiphenからの協賛により総額15,000ドルの賞金を懸けています。本データセットの公開および世界レベルのチャレンジ大会の開催により、農業および研究現場のフェノタイピング研究や人工知能(AI)ツールの開発が加速化することが期待されます。
<研究チームの構成>
E. David(Arvalis, Institut du végétal,France 博士学生)
S. Madec(Arvalis, Institut du végétal,France ポスドク研究員)
P. Sadeghi-Tehran(Plant Sciences Department,Rothamsted Research,United Kingdomコンピュータサイエンティスト)
H. Aasen(Institute of Agricultural Sciences,ETH Zurich,Switzerland 研究員)
B. Zheng(CSIRO Agriculture and Food,Australia データサイエンティスト)
S. Liu(Plant Phenomics Research Center,Nanjing Agricultural University,China 教授)
N. Kirchgessner(Institute of Agricultural Sciences,ETH Zurich,Switzerland 研究員)
石川 吾郎(農研機構 次世代作物開発研究センター 基盤研究領域 上級研究員)
長澤 幸一(農研機構 北海道農業研究センター 畑作物開発利用研究領域 主任研究員)
M.A. Badhon(Department of Computer Science,University of Saskatchewan,Canada 修士学生)
C. Pozniak(Department of Plant Sciences,University of Saskatchewan,Canada,教授)
B. de Solan(Arvalis, Institut du végétal,France 研究エンジニア)
A. Hund(Institute of Agricultural Sciences,ETH Zurich,Switzerland 講師)
S.C. Chapman(School of Food and Agricultural Sciences,The University of Queensland, Australia 教授)
F. Baret(INRAE,France 研究ディレクター)
I. Stavness(Department of Computer Science, University of Saskatchewan,Canada 准教授)
郭 威 (東京大学大学院農学生命科学研究科附属生態調和農学機構 助教)
発表雑誌
- 雑誌名
- Plant Phenomics(8月20日オンライン出版)
- 論文タイトル
- Global Wheat Head Detection (GWHD) dataset: a large and diverse dataset of high resolution RGB labelled images to develop and benchmark wheat head detection methods.
- 著者
- David,E., Madec,S., Sadeghi-Tehran, P., Aasen,H., Zheng,B., Liu,S., Kirchgessner, N., Ishikawa, G., Nagasawa, K., Badhon,M.A., Pozniak, C., Solan, B., Hund, A., Chapman, S.C., Baret, F., Stavness, I.*, Guo, W.*(*責任著者)
- DOI番号
- https://doi.org/10.34133/2020/3521852
- 論文URL
- https://doi.org/10.34133/2020/3521852
問い合わせ先
東京大学大学院農学生命科学研究科附属生態調和農学機構
助教 郭 威(カク イ)
〒188-0002 東京都西東京市緑町1-1-1
Tel:070-6442-9530
E-mail:guowei<アット>g.ecc.u-tokyo.ac.jp <アット>を@に変えてください。
用語解説
- 注1 FAIR原則
FAIRは、Findable(見つけられる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)の略で、データ公開の適切な実施方法を表現しており、データ共有の原則として国際コミュニティが提唱された。 - 注2 IPPN
国際植物フェノタイピングネットワーク。 - 注3 CVPPP
Computer Vision Problems in Plant Phenotyping。コンピュータビジョン分野における植物フェノタイピングの課題を解決するワークショップ。 - 注4 ECCV
European Conference on Computer Vision。コンピュータビジョン分野のトップカンファレンスのひとつ。 - 注5 Kaggle
企業や政府などの組織とデータ分析のプロであるデータサイエンティスト/機械学習エンジニアを繋げるプラットフォーム。