如何将人工智能技术与有机化学合成结合?人工智能将对有机化学发展产生怎样的冲击?

有机化学发展几百年来,亟待大发展与突破。有机化学研究的试错成本高,反馈慢,大量科研工作者每日在做重复简单的工作。未来有机化学如果可以和人工智能结合,会…
关注者
113
被浏览
35,093

13 个回答

谢邀。

针对提问者的观点以及原文经行回复,没有个人意淫和衍生。

21世纪人类所面对的主题大体上认为是两个。一是生命,二是能源。科学家不断关注生命的质量的提高,绝症的治愈以及新型清洁能源的开发。尤其是癌症和艾滋病,是一直困扰人类的事情。虽然致病机制较为复杂,但是我们有一个直观的想法,比如将癌细胞杀死,就可以去治愈癌症。所以我们可以培育多种多样的癌细胞,然后将不同的物质与其作用,有一天科学家发现如果将可乐和癌细胞作用可以将癌细胞杀死,于是发表了“可乐可将某癌细胞杀死,或成为人类消灭癌症新途径”。媒体就带领着人类看到了曙光,都感觉癌症可以消灭了。几十年中,科学家提出了无数种“可乐”,可是临床上治疗癌症的也始终就是紫杉醇等等三四种药物,而且效果还不乐观。

问题出在哪里?不是说可乐可以杀死癌细胞么?是的可乐可以杀死癌细胞,但是脱离了人体的癌细胞毫无意义。我们体系出来问题,我们要解决的重点出了问题,我要杀死活体内癌细胞,而不是培养皿中的癌细胞。


回到有机化学。

正如题主所问的“如何将人工智能技术与有机化学合成结合?人工智能将对有机化学发展产生怎样的冲击?”

我先回答第二个问题,按照该报道所阐述的事情,对有机化学基本上没有任何影响。可以理解他的过程,他将数以万计的反应类型输入,这里对于AI叫做“学习”,然后我们将未知结果的反应底物录入,他可以告诉我可能发生的反应产物和位置。这看起来是很棒的工作,但是事实上毫无意义,不是说预测本身没有意义,而是需要AI预测没有意义。对于有机反应来讲,经验上认为主要收到电子效应和空间效应两种影响,对于任何一个学习者来说,一个月的对于基础有机化学的集中学习,是可以完全掌握的,我们看到不同的官能团自然知道他有怎样的性质,容易与哪些试剂反应。只是需要随时查找数据确定需要什么条件可以转化,但是这与预测本身没有关系了。

第二,AI对于合成路线的设计。有机化学巨匠 E.J.Corey教授(1990年诺贝尔化学奖得主)就提出过逆合成分析,顾名思义,就是通过产物来逆推原料,产物有双键,那原料就可以用醛/酮通过Wittig/HWE 或者通过CM等等反应进行,产物有6-圆环,那底物就可以设计为 4+2的前体,这是非常非常基础而且有效的方式,对于AI来讲,可能对于人类学习和记忆的反应类型更多,更广,这是值得肯定一点,但是很多创造性的天然产物的全合成,需要更多思维性的工作。

第三,AI的对于有机化学的预测可实现性。按照报道中的说法,是对已知反应的学习然后进行预测(然而很多文献本身的数据并非准确的),有机反应和下棋是不同的,下棋的棋盘是固定的格数,当你走出第一步的时候,只要你不把棋盘掀翻,之后的可能性是有限的,所以是可预测的,但是对于有机化学来讲,现在所发现的反应类型和个数,可能是所有反应的千万分之一,在这点上,人工学习的优越性就体现出来了,对于现有的反应,人工会提出更有创造性的改进和发展。

第四,预测结果不是有机化学的目的。文章重点是说AI可以预测有机反应结果,可是预测结果有什么意义么?没有。有机化学的重点是达到我们的目的,完成某种转化,研究某种机理,得到相应化合物。还是那句话,一个月集中学习完基础有机化学的人都会进行预测。预测不是有机化学的目的,仅仅是做实验之前的参考,证明这个实验这么做,我可能得到目标产物,如此而已。

第五,有机合成的重点不是反应本身,而是操作。“大量科研工作者每日在做重复简单的工作。”这句话是十分十分十分不正确的,基本上没有做过实验的人会有这种理解,认为每天工作是过柱子,搭反应。重点是实验操作,这个是习惯性和经验性质的东西,也是保障有机反应顺利进行的根本。一个反应100个人做,可能就是100种结果。2014年Bruce C. Gibb 教授在Nature Chemistry 上发表题目 Reproducibility 的论文,讲述了一个故事。组内的一个经典反应,突然一个人就没办法重复了,这是很糟糕的事情,最好的结果就是可以迅速的重复出来,最坏的结果就是以前的实验事实涉及造假。很不幸,那个人没有重复出来,后来找了组里的一个副教授和face to face 的做实验,结果副教授做出来了,他还是做不出来,后来有一天他跑过去找Bruce C. Gibb教授说我做出来了,教授问他怎么回事呢,他说不知道。紧紧是一个加料过程就有很多讲究,5个组分,我先加什么?在什么温度下加?什么时候彻底的除氧?什么时候需要降温?什么时候需要先降温再升温再降温的加料,这些复杂仔细的操作,是确保有机合成顺利进行的保障,而不是预测反应本身。相对于智能预测反应,最近几年Natuer和Science上陆陆续续发表程序化合成更加吸引人,因为从加料到反应,到后处理到分离都是仪器在进行,人们只需要做的就是开关仪器和收集产物就可以了。大大提高了实验的准确度和稳定程度。但是装置造假较为昂贵,效率低下以及适用范围受限等因素,使得他还有很多进步的空间。

最后想说,如何将AI和有机合成的结合。我更希望在文献检索上进行精密的整合,当我们需要一个反应的参考模型的时候,我们可以通过更加便捷的得到准确的参考。

希望和更多人讨论,最后声明我的讨论是基于原文观点。如果要讨论,也请不要天马行空。

謝邀,第一次寫科學類的回答,可能層次條理不是很清晰,而且答主不是專業研究有機,所以有些地方不是很準確,也歡迎大家多指出。

[此外手機網頁端無法引用加粗等深入編輯,等有機會用電腦後再繼續編輯,大體意思已經表達出了]

有機化學最大的特點,就是高度可逆性及產物多樣性,這決定了其反應是極其複雜的。化學本身是實驗為基礎的自然科學,機理、原理、各種分類別概括都只是對其做一定的解釋、歸納,使本來雜亂無章的實驗現象看起來稍微有些規律和普遍性,只是人的一種理性認識。機理是解釋反應現象的,而不是規定反應的。我們看到很多這樣的例子:在一套體系下,一系列反應都能得到完美的解釋,但是總有幾個特例不符合,這個時候人們又得用別的方面找出新的機理。[答主有些偏向不可知論 ]

研究新的有機物的性質,人做的是歸納總結,總結的對象是實驗現象,人工智能也是如此。雖然從電性、構型、位阻等微觀方面,人可以對一系列現象做一定的歸納,但終究他們各對結果貢獻多少,還是要依靠實驗結果。繁雜的實驗可以說是一種比較「必要」的研究過程。人工智能能做的也許是稍稍簡化這部分過程,但是僅僅依靠計算機理論演算必然會出現不少的偏差。假設人工智能有一定的偏差分析能力並且學習之,這部分規律可能又不適用於另外一些。普遍性是歸納的,有限的。而正是因為機理不是來規定只是一種解釋,用機理推斷新的產物,如果是很冷門的一些反應或者新的反應而不是一些常見的官能團反應(事實上那些常見官能團反應都有很多意料之外的產物),其成功率會比較低下,最終還是依靠實驗來論證。

AI的整個認識機制當然可以不斷改進,他的整套思維邏輯系統也可以和人的思維不同,但是化學,尤其是有機化學這類實驗性很強的學科,僅憑理論計算誰都無法下定論。學過有機化學的應該都有體會,每次實驗條件控制地再好、副產物預測做得再好總有一些出乎意料的副產物。

上文講述到了副產物,這當然也是制約AI完全取代人類進行有機研究的一方面。人類對於化學的研究在真正本質上能做的很少,不是做的很少。即使理論再發達也很難。機理不是數學定理,讓AI完全綜合幾種不同的機理、綜合各種化合物的本性、外界條件等進行推算,80%的自信率過於自負。何況化學的目的還是實驗,還是要做出這種東西。產物的分離最終還是得人來完成。或許將來會有智能蒸餾儀、智能分液機器人、智能分子式測定機器等高科技的輔助產品,他們做的也最多是「簡化繁雜的重複性實驗手段」--這些人類也已經很熟練的步驟。人工智能在勞動,或者說是純勞動領域的確表現十分出色,這也正是其最大的優勢,也是答主對於「如何將AI和有機化學結合」的一個觀點。目前實驗太過冗長,非單相反應的幾個小時的時間和低產率大大降低了有機實驗的效率,這個方面AI可以使實驗更省力(如果技術足夠,如AI可以製造高溫高壓、告訴人應該加入什麼催化劑,然後用機器人自動化實驗),但是關鍵步驟把控以及結果分析等,恐怕還是不能完全取代。

再繼續談上文提到的「新反應」。化學的目的就是得到新物質。已有的物質或者已有的物質類別的合成只是工業勞動,不是化學。在已有的反映類型中找「新材料」--即某一特定分子具有的特性,例如各類偶氮染料的不同顏色和揮發度等,也只是較低層的有機研究。尤其地,目前對常見官能團的已知反應來說,科研人員只需要做幾乎重複的實驗方法就可以得到目標化合物。目前最需要最迫切的研究是發現新的反應,一些沒有現有機理解釋的反應。有機與生化在過去有過一定程度的「重疊」,即研究並模仿植物體合成物質的機理來化學地合成一些複雜物質。以前的甾族化合物的最初化學合成研究也是用植物體的一些重要反應作為參考的。那些反應用當時已有的機理都是不能直接推導的。這麼說:如果把有機化學比做一個數學的分支,他的目標是發現新的公式定理,而不是依靠現有的公式定理證明更多的命題及大的結論。黃鳴龍反應大家都很熟悉,他當時找減小回流時間以及沸點材料催化劑,並不是依靠現有的機理,而是一種理性佔少數實驗佔多數的研究。他之前的沃爾夫和凱希那對於羰基鹼性還原的研究已經有過一套機理,但是他卻突破了這個機理找到了更高效的方法。還是那句話,機理不是來規定反應的,而是解釋反應的。機理的這個性質,決定了AI很難獨立地進行反應物推測以及反應研究。題主的例子看得不是很清楚,是酸和那個化合物形成酯嗎?那麼不能保證芳環上不被取代。好吧暫且不論這個。假設這個能實現,那麼大部分目前的知識已經能夠推出這個。AI應用於科研,絕不僅僅是告訴他諸如RCOCl+NH3—>RCONH2+HCl之類的道理,讓他能推導出所有酰鹵的氨解,抑或是獨立推斷出別的親核取代--那頂多是基於現有機理--的反應。然而他無法推出RA+HA=RH+A2之類的(打個比方,A沒有實際含義)之類的反應。即使那套機理綜合一下、各種量子學數據綜合一下,它是不成立的,但是實驗如果能得出它的成立性呢?

綜上,答主有機並不是專業研究,只能靠個人的認識得出這麼幾點:化學來源是實驗不是機理,化學本質是創造不是模板照套,化學目的在於操作不是理論計算。

歡迎大家一起討論!