発表のポイント

  • 木材腐朽菌が全ゲノム配列中に持つ糖関連酵素(CAZy)遺伝子の数を、ランダムフォレストという機械学習のアルゴリズムに供し、一般的に目視で判断される白色腐朽菌と褐色腐朽菌を98%以上の精度で見分けることに成功しました。
  • ランダムフォレストを用いることで、分類に大きな影響を与えたCAZyファミリーを同定することが可能となり、修飾活性(AA)ファミリー9に属する溶解性多糖モノオキシゲナーゼ(LPMO)の遺伝子数が、白色腐朽菌と褐色腐朽菌を分ける最も大きな要因となっていることが明らかとなりました。
  • 一般的に、白色腐朽菌と褐色腐朽菌の違いは芳香族ポリマーであるリグニンの分解性によって区別されていますが、今回の結果は、多糖に反応すると考えられているLPMOがリグニン分解に関与する可能性が考えられ、より高度なバイオマス利用法の開発に繋がると考えられました。

発表概要

 一般的に「きのこ」と総称される糸状菌の大部分は「木材腐朽菌」と呼ばれる担子菌類に分類されますが、木材腐朽菌はさらに腐朽した後の木材の色の違いによって「白色腐朽菌」と「褐色腐朽菌」とに大別されます。白色腐朽菌は、木材の三大成分であるセルロース、ヘミセルロース、リグニンを一様に分解するのに対して、褐色腐朽菌は主に多糖(セルロースとヘミセルロース)を選択的に分解することから、これまで両者の違いはリグニンの分解性の違いによって説明されてきました。そこで本研究では、232種類の木材腐朽菌ゲノムに含まれる11万4千の糖関連酵素遺伝子の数を、ランダムフォレストという機械学習アルゴリズムを用いて学習させ、それらの遺伝子数の違いが腐朽様式の違いに与える影響を調べました。その結果、糖加水分解酵素(GH)ファミリー7に属するセロビオヒドロラーゼ(Cel7)やリグニン分解酵素として代表的なAAファミリー2のペルオキシダーゼも両腐朽様式を見分けるために重要とされましたが、もっとも重要であったのがセルロースの表面を酸化して他のセルロース分解酵素の働きを助けるLPMOであることが分かりました。この発見は、昨今多糖の分解での機能が注目されてきたLPMOが、リグニンの分解にも関与している可能性を示唆するとともに、人間が見つけることができない両腐朽様式での違いを、機械学習で発見できることを明らかにしました。木材腐朽菌は地球上で唯一木材を単独で分解できる生き物であることから、このような生物種によって木の成分がどのように利用されているかを知ることで、より高度なバイオマスの利用法が期待できます。

発表内容

 木材は地球上で最も多くの二酸化炭素を貯めて(炭素貯留をして)いますが、その木材を唯一単独で分解することができる生き物が、「木材腐朽菌」と呼ばれる担子菌の一群です。木材腐朽菌の多くは次世代に遺伝情報を残すために子実体という器官を作りますが、それは一般的に「きのこ」と呼ばれるため、「きのこは木を食べて生きている生物」と言われます。光合成によって多糖であるセルロースとヘミセルロース、芳香族のリグニン等の木材の主成分として森林に蓄積したポリマーは、木材腐朽菌によって他の生物に利用されやすい成分へと変換されて、二酸化炭素に戻っていくというのが、陸上で最も大きな炭素循環のプロセスとなります。

図1 自然界で見られる白色腐朽菌(左)と褐色腐朽菌(右)
原因となる菌の分類は、サンプリングした時の腐朽材の色によって経験的に決められている。

 森林を注意深く歩くと分かると思いますが、木材腐朽菌によって腐った木材には白いものと茶色いものが存在します(図1)。これらはそれぞれ「白色腐朽菌」と「褐色腐朽菌」と呼ばれる異なる木材腐朽菌によって分解された結果で、それぞれ原因となる菌は主に人間による目視で選別されています。これらの腐朽様式がどのような化学成分の違いをもたらしているのかは、20世紀にはすでに明らかにされており、白色腐朽菌の場合は木材の三大成分が均一に減っていくのに対して、褐色腐朽菌では非晶性セルロースとヘミセルロースの多糖成分が主に分解されることから、結晶性セルロースとリグニンの分解の差異によって白色腐朽菌と褐色腐朽菌は区別できることが分かりました。2000年代になると様々な木材腐朽菌の全ゲノム配列情報が明らかとなり、白色腐朽菌では三大成分を分解する酵素系が充実しているのに対して、褐色腐朽菌では結晶性セルロースの分解やリグニン分解に関わる酵素系が弱いことが特徴であるということが知られるようになりました。一方で、200種を超える木材腐朽菌のゲノム情報が明らかにされており、各菌で500ほどのCAZy(注1)を持つことが知られていますが、これほどの数になってくると各CAZyファミリーに属する酵素数を人間が比べたり、主成分分析のような線形解析では扱えない数字となってきています。
 そこで、当研究科生物材料科学専攻森林化学研究室の長谷川夏樹修士過程学生(当時)と五十嵐圭日子教授は、新領域創成科学研究科の杉山将教授との共同研究で、機械学習を用いて白色腐朽菌と褐色腐朽菌の違いを与える要因を調べることにしました。一般的には、機械学習をこのような解析に用いても解析過程がブラックボックスとなってしまい、精度が高く分類ができたとしても「どうやって分類したのか」が分からないため、本研究では「ランダムフォレスト」と呼ばれる決定プロセスにおける各因子の影響度を明らかにできる機械学習アルゴリズム(注2、図2)を用いて、CAZyの遺伝子数と腐朽様式の違いの関係を調べました。232種類の腐朽菌の中で白色腐朽菌が183種、褐色腐朽菌が49種と不均衡であったため、オーバーサンプリング(注3)して機械学習を行った結果、各菌におけるCAZyの各ファミリーに属する遺伝子数のリストがあれば、98%以上の確率で白色腐朽菌か褐色腐朽菌かを言い当てることが可能であることがわかりました(図3)。さらに、上述のような分類の決定プロセスにおける各因子の影響度を読み解くことができるランダムフォレストアルゴリズムの特徴を活かし、分類結果に与える影響の大きなCAZyファミリーを調べたところ(図4)、結晶性セルロースの分解に用いられるGHファミリー7のセロビオヒドロラーゼや、AAファミリー2に属する過酸化水素を用いてリグニンを構成する芳香族化合物を分解するペルオキシダーゼ類の影響が示唆されました。これらのファミリーは、白色腐朽菌では複数の酵素遺伝子があるのに対して、褐色腐朽菌はこれらの酵素遺伝子を持っていないことはこれまでもよく知られていることでした(参考文献1)が、これまで腐朽様式の分類にあまり注目されていなかったAAファミリー9に属するLPMOをコードする遺伝子数が、機械学習による分類で最も影響があるという結果となりました。「溶解性多糖モノオキシゲナーゼ」という名前からも分かるように、本酵素がセルロースやヘミセルロースなどの多糖類の分解に関与していることは明らかでした(参考文献2)が、両腐朽様式の最も大きな違いがリグニンの分解ができるかできないかであることから、LPMOが多糖だけでなくリグニンの分解にも関与する可能性が考えられました。

図2 ランダムフォレストによる白色腐朽菌と褐色腐朽菌の分類
ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を使用し、それぞれから推測された結果を多数決によって白色か褐色か決める。

図3 木材腐朽菌の進化系統樹と白色腐朽菌と褐色腐朽菌の分布
ランダムフォレスト(一列目)、Linear Discriminant Analysis(二列目)、目視(三列目)による白色腐朽菌か褐色腐朽菌かの分類を比較している。

図4 白色腐朽菌と褐色腐朽菌の分類に対する各酵素の重要度
左:重要度を順位順にファミリーを並べたグラフ
右:白色腐朽菌と褐色腐朽菌における各ファミリー酵素遺伝子数の分布

 上述のように、木材腐朽菌は地球上で最も多くの炭素を循環させている生き物ですが、その木材腐朽菌がいかに木の成分を分解しているかを知ることで、人類がどのように地球上のバイオマスを利用していくべきかを考えることができるようになります。今回の研究結果から、木質バイオマスをより温和な条件でバイオ燃料やバイオプラスチックに変える方法を開発できるようになるだけでなく、木材腐朽菌は木造建築物の倒壊を起こす原因でもあることから、木造の構造物をより長く使うための保存法の開発にも繋がります。本研究結果は、米国微生物学会(American Society for Microbiology)が1953年に創刊した由緒正しい学会誌「Applied and Environmental Microbiology誌」に掲載されます。本研究は、科学研究費補助金基盤研究(A)「木材腐朽現象の現代的理解」(研究代表者:五十嵐圭日子)の補助を受けたものです。

発表者

長谷川夏樹(東京大学大学院農学生命科学研究科生物材料科学専攻 修士課程学生(当時))
杉山 将(東京大学大学院新領域創成科学研究科 教授/理化学研究所革新知能統合研究センター チームリーダー/UT7東京大学 次世代生命概念創出研究グループ)
五十嵐圭日子(東京大学大学院農学生命科学研究科生物材料科学専攻 教授/UT7東京大学 次世代生命概念創出研究グループ)

発表雑誌

雑誌
Applied and Environmental Microbiology
題名
Random forest machine-learning algorithm classifies white- and brown-rot fungi according to the number of the genes encoding Carbohydrate-Active enZyme families
著者
Natsuki Hasegawa, Masashi Sugiyama, and *Kiyohiko Igarashi(*責任著者)
DOI
10.1128/aem.00482-24
URL
https://doi.org/10.1128/aem.00482-24

用語解説

  • 注1 糖関連酵素(Carbohydrate-Active enZymes)
     糖加水分解酵素(GH)、糖転移酵素(GT)、多糖リアーゼ(PL)、糖エステラーゼ(CE)、修飾活性(AA)、糖結合モジュール(CBM)等の糖に活性を持つ酵素を、アミノ酸配列に基づいてファミリー毎に分類している。1998年よりCAZyデータベースとして公開されており、様々な生物種由来の糖関連酵素が登録されている。
  • 注2 ランダムフォレスト
     2001年にレオ・ブレイマンによって提案された機械学習のアルゴリズムで、分類や回帰、クラスタリング等に用いられる。ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を弱学習器とするアンサンブル学習アルゴリズムであり、本研究では説明変数(本研究では各ファミリー)の重要度を算出可能であるために用いられた。
  • 注3 オーバーサンプリング
     機械学習ではしばしば比較するデータ数の違い(不均衡)によって予測精度が落ちてしまうことが起こる。本研究では、白色腐朽菌と褐色腐朽菌のサンプル数に4倍近い差があったために、褐色腐朽菌をオーバーサンプリングすることで、精度の向上を図った。

参考文献

  • 1) Floudas, D. et al. The paleozoic origin of enzymatic lignin decomposition reconstructed from 31 fungal genomes, Science, 336 (6089): 1715-1719 (2012)
  • 2) Uchiyama, T., Uchihashi, T., Ishida, T., Nakamura, A., Vermaas, J. V., Crowley, M. F., Samejima, M., Beckham, G. T., and Igarashi, K. Lytic polysaccharide monooxygenase increases cellobiohydrolases activity by promoting decrystallization of cellulose surface, Science Adv., 8: eade5155 (2022)

問い合わせ先

(研究内容については発表者にお問合せください)
東京大学 大学院農学生命科学研究科 生物材料科学専攻
 教授 五十嵐 圭日子(いがらしきよひこ)
 Email: aquarius [at] mail.ecc.u-tokyo.ac.jp

東京大学大学院農学生命科学研究科・農学部
 事務部 総務課総務チーム 広報情報担当
 Tel:03-5841-8179, 5484 E-mail:koho.a[at]gs.mail.u-tokyo.ac.jp

※上記の[at]は@に置き換えてください。

関連教員

五十嵐 圭日子