400~450 nmに発光波長を有する発光分子を探索する例を示します。
東京化成工業株式会社とMerck社のカタログデータをデータベースとして用いて機械学習を行い、発生させた分子構造の発光波長を推定しました。このとき計算時間は、1万分子の探索に30分間でした。分子構造とスコアと発光波長を次に示します。
グループ分けした構造毎に色分けして示しますと、次のような分布図になります。短時間で多様な構造を探索できました。
上記の1番目(左上)の構造についてReaxysで調べて見ますと、実際の合成例がありました。
Jang et al., Org. Biomol. Chem., 10, 843-847 (2012).
発光波長の記載はありませんでしたが、CAS No. 59803-33-7 (Life Chemicals Inc. Canada 50mg 160USD) と市販されていますので、すぐに購入して物性をチェックすることができます。一方、2, 3, 5番目の化合物についてはReaxysでは見つからず、新規化合物の可能性があります。これらを合成し、狙った物性が発現すれば、特許出願もできると考えられます。
屈折率1.95以上の分子構造をベイズ最適化により探索する例を示します。
一般的には、自分の頭の中にある分子群の中から構造が遠いN個の分子を選び、合成し・物性を測定します。このN個のデータから回帰モデルを作成し、次のn個を選び実験する、ということを繰り返します。
例として、最初に30分子を選んだ場合の探索例を示します。今回は、特許やMerckインデックスから集めた281分子のSMILESのみのデータベースを作りました。この時点では、屈折率は記載していません。先ず、乱数で分子構造が遠い30分子を選びます。その30個の1部をここに示します。
これらを合成し屈折率を測定したとします。ここでは、実験したとして、文献値を入力しました。
M-EVO🄬はここから回帰モデルを作成し、次に実験すべき10分子を選択します。
M-EVO🄬により選択された10分子を次に示します。実際に合成・測定したとして文献値を示しました。青文字が1.95以上の屈折率と予測された分子です。赤文字で示した右上の分子が最も大きな屈折率の分子でした。
M-EVO🄬で、この10個のデータも加えた新たな回帰モデルを使って、残りの241分子の中から高屈折率分子を探索させました。2回目では次のような分子が提案されてきました。この中で出てきた屈折率は最大1.894で、2回目では1.95以上のものは見つかりませんでした。
1回の10構造の中で1.989というチャンピオンを見つけることができました。
まだもっと良いものがあるかも知れないと実験をするのではなく、スケールアップ・使いこなし等の研究ステージへ移行する判断が合理的にできます。
平日9:30~17:30 (土曜日、日曜日、祝祭日、年末年始、夏期休暇は、休日とさせていただきます。)