Expansion of bond dissociation prediction with machine learning to medicinally and environmentally relevant chemical space

文献情報

出版日 2023-10-17
DOI 10.1039/D3DD00169E
インパクトファクター 0
著者

Shree Sowndarya S. V., Yeonjoon Kim, Seonah Kim, Peter C. St. John, Robert S. Paton


原文を見る

要旨

Bond dissociation energetics underpin the thermodynamics of chemical transformations where bonds are broken or formed and can also be used to predict reaction rates and selectivities. Current machine learning (ML) models to predict bond dissociation energy (BDE) are largely limited in their elemental coverage to hydrogen and the second-row elements. This has restricted the applicability of ML-derived BDE predictions, particularly for molecules of medicinal relevance, since the heteroatoms S, Cl, F, P, Br, and I are commonly found in approved pharmaceuticals. Atmospherically and environmentally relevant molecules containing multiple halogen atoms have been similarly inaccessible. In this study, we considerably expand the size, elemental composition, and bond types of an extensive BDE database and train a new ML BDE model that includes C, H, N, O, S, Cl, F, P, Br, and I. We curate a new quantum chemical dataset of 531 244 unique zero-point energy inclusive homolytic dissociations of organic compounds. We investigate accuracy for out-of-sample molecules and implement iterative training and testing cycles during model development to improve the model accuracy. Improvements in predictive accuracy were achieved for datasets of pharmaceutically relevant molecules containing multiple C(sp2)–halogen bonds from 5.7 to 0.8 kcal mol−1 and polyhaloalkyl compounds with multiple C(sp3)–halogen bonds from 2.7 to 1.2 kcal mol−1 through the targeted augmentation of training data by as little as eight additional molecules. Our updated and expanded model (ALFABET) achieves a mean absolute error of 0.6 kcal mol−1 for both enthalpies and free energies compared to the quantum chemical ground truth. The graph-based representations utilized here outperform traditional cheminformatics features such as radial fingerprints, and there is no discernible improvement in accuracy by including more expensive QM-derived parameters, such as optimized bond lengths. Finally, we illustrate high accuracy in external prediction tasks for large halogenated natural products, pharmaceutically relevant halogenated molecules, atmospherically important halocarbons, and polyfluoroalkyl substances related to environmental toxicity.

関連文献

Hexagonally ordered mesoporous ternary Li2O–TiO2–P2O5 oxides with high lithium content

Donglin Li, Haoshen Zhou, Itaru Honma, Masaki Ichihara

2005-09-20 Communication

DOI: 10.1039/B509028H

Three-dimensional motion and transformation of a photoelectrochemical actuator

Kazutake Takada, Taichi Miyazaki, Nobutaka Tanaka, Tetsu Tatsuma

2006-04-11 Communication

DOI: 10.1039/B600442C

Platinum–acetylide polymer based solar cells: involvement of the triplet state for energy conversion

Fengqi Guo, Young-Gi Kim, John R. Reynolds, Kirk S. Schanze

2006-03-21 Communication

DOI: 10.1039/B516086C

Fabrication of bismuth subcarbonate nanotube arrays from bismuth citrate

Rong Chen, Man Ho So, Jun Yang, Feng Deng, Chi-Ming Che, Hongzhe Sun

2006-04-25 Communication

DOI: 10.1039/B601764A

Base-catalysed asymmetric hydroamination/cyclisation of aminoalkenes utilising a dimeric chiral diamidobinaphthyl dilithium salt

Patricia Horrillo Martínez, Kai C. Hultzsch, Frank Hampel

2006-04-11 Communication

DOI: 10.1039/B518360J

Samarium diiodide-induced intramolecular pinacol coupling of dinitrones: synthesis of cyclic cis-vicinal diamines

Jean-Philippe Ebran, Rita G. Hazell, Troels Skrydstrup

2005-09-30 Communication

DOI: 10.1039/B511491H

Inside front cover

Front/Back Matter

DOI: 10.1039/B606514G

Switching a molecular shuttle on and off: simple, pH-controlled pseudorotaxanes based on cucurbit[7]uril

Vladimir Sindelar, Serena Silvi, Angel E. Kaifer

2006-03-31 Communication

DOI: 10.1039/B601959E

Hosomi–Sakurai reactions of silacyclic allyl silanes

Jonathan D. Sellars, Patrick G. Steel, Michael J. Turner

2006-05-02 Communication

DOI: 10.1039/B602642G

こちらもおすすめ

化合物よくある質問

S-(甲硅烷基丙基)異硫酰氯を取り扱う際の実験室安全事項は何ですか?

取り扱う際にはPPE(防護具)が必要です。特に手袋と面マスクは必須です。ドラフトチャンバーを使用して漏洩処理を行い、温度は常温、湿度は乾燥状態、容器はガラス容器...

84682-36-02-Amino-7,7-dimethox...
化合物よくある質問

8-硝基-咪唑并[1,2-a]吡啶とは何ですか?

8-硝基-咪唑并[1,2-a]吡啶は、CAS番号52310-46-0の化合物で、8-位に硝基を有する咪唑並みの结构をもつ吡啶の化合物です。この化合物は、酸化還元...

52310-46-08-Nitroimidazo[1,2-a...
化合物よくある質問

4-ブロモ-5-メトキシピリジン-2-甲醇の代替品はありますか?

4-ブロモ-5-メトキシピリジン-2-甲醇の代替品には、類似構造を持つ化合物や機能性に等しい代替試薬があります。例えば、4-クロロ-5-メトキシピリジン-2-甲...

1454849-84-3(4-Bromo-5-methoxy-2...
化合物よくある質問

全氟-1,2-二甲基環己烷を含む廃棄物はどのように処理すべきですか?

全氟-1,2-二甲基環己烷(CAS番号:306-98-9)の廃棄物は、特別な処理が必要です。まず、廃棄物を密閉容器に収集し、適切な防漏容器に保管します。次に、専...

306-98-91,1,2,2,3,3,4,4,5,6-...
化合物よくある質問

3-(溴甲基)苯乙酸の主な用途は何ですか?

3-(溴甲基)苯乙酸は主に研究用化学薬品として利用され、有機合成や医薬品の開発に用いられます。また、特定の化合物の合成中間体としても使用されることがあります。

118647-53-32-(3-(Bromomethyl)ph...
化合物よくある質問

5-イドキド-4-メチオキシ-6-メチルピリミジニン-2-アミンはどのように保存すればよいですか?

5-イドキド-4-メチオキシ-6-メチルピリミジニン-2-アミンは冷暗所で密栓の容器に保存し、直射日光を避けて保管することをお勧めします。温度は常温とし、湿気を...

23368-84-55-Iodo-4-methoxy-6-m...
化合物よくある質問

1-(2-溴-6-甲氧基苯基)乙酮を取り扱う際の実験室安全事項は何ですか?

実験室では、1-(2- Bromo-6-methoxyphenyl)ethanoneを取り扱う際には、ゴーグルや面具、手袋などのPPEを使用することが推奨されま...

380225-68-31-(2-Bromo-6-methoxy...
化合物よくある質問

5-(4,4,5,5-テトラメチル-1,3,2-ダイオキサボラロール-2-イル)-1,3-ジヒドロ-2-ベンゾフランは安全ですか?

5-(4,4,5,5-テトラメチル-1,3,2-ダイオキサボラロール-2-イル)-1,3-ジヒドロ-2-ベンゾフランは一般に安全ですが、取扱いには注意が必要です...

1352037-60-55-(4,4,5,5-Tetrameth...
化合物よくある質問

4-溴萘-1-甲酸の代替品はありますか?

4-溴萘-1-甲酸は比較的稀な化合物ですが、類似物としては、4-クロロ-1-ナフホリック酸やその他のブロモ置換ナフホリック酸が挙げられます。ただし、これらの代替...

16650-55-84-Bromo-1-naphthoic ...
化合物よくある質問

ε-白藜芦醇脱氢二聚体の代替品はありますか?

ε-白藜芦醇脱氢二聚体の代替品としては、ε-白藜芦醇、ポリフェノール類、フラボノイド類が挙げられます。これらは類似の化学構造と生物学的活性を持っています。ただし...

62218-08-05-{(2R,3R)-6-Hydroxy...
免責事項
このページに表示される学術雑誌情報は、参考および研究目的のみを目的としています。当社は雑誌出版社とは提携しておらず、投稿の取り扱いも行っておりません。出版に関するお問い合わせは、各雑誌出版社に直接ご連絡ください。
表示されている情報に誤りがある場合は、support@chemtradehub.com までご連絡ください。迅速に確認し、対応いたします。