武藤/修論研究(22.04-24.03)
化学反応に最適なEC番号予測モデルの開発
卒論後半手法 & 学会論文の拡張
EC番号予測分野のエッセンス
類似性の概念
原著は1990年の書籍 *1 の模様
類似性に関する論文の多くがこの書籍を参考にしている →原著(有料で閲覧難)
卒論でやったこと
- Self-Organizing Map(SOM)を用いたEC3の4桁目(EC 3.1.1)の予測モデル開発
- Random Forests(RF)を用いたEC3の2,3桁目の予測モデル開発
研究背景
- 有機合成=化合物を合成して目的の有機化合物を生成する(反応の設計)
- 有機合成では効率性や環境面から化学反応の設計に生体触媒(酵素)が利用される機会が増加
- 酵素は化学触媒よりも環境に優しく,特定の反応物に強く作用して化学反応を早く進める
- 酵素は4桁のEC番号で分類されている
- EC番号を機械学習で予測することで,酵素分析(以下)を行う実験コストや時間の削減になる
- 代謝経路の解析で得られた未知の酵素の性質の特定
- 特定の化学反応を触媒する酵素の探索
目的
- 反応物から生成物に変化する化学反応に用いるべき最適な酵素候補をEC番号として提示する機械学習モデル(EC番号予測システム)の開発
- 最適な酵素の探索は合成実験などで行われるが,探索範囲を予測されたEC番号内の酵素製品に絞り込むことができ,実験時間・コストの短縮になる.