在過去的幾十年里,生物學發生了巨大的變化,其中很大程度上來源于“基因組革命”,能夠大規模低成本地讀取細胞中的遺傳信息。
合成生物學也受益于基因組革命,此后一系列突破性成果帶來進展。
因此,從實踐的角度來看,合成生物學(synbio)專注于為特定任務定制生物系統,例如使細胞產生一定量的生物燃料或對外部觸發做出反應。
Synbio 從工程學中汲取靈感,利用其可預測的方法來管理復雜的生物學。這種方法的關鍵是使用一致的遺傳成分并遵循四個步驟:
設計:概念化 DNA 序列或細胞變化以實現目標。
構建:將設計付諸實踐,通常是創建 DNA 片段并將其引入細胞。
測試:收集和分析數據以查看新設計是否按預期運行,并記錄任何意外結果或副作用。
學習:使用數據來完善和改進流程。人工智能可以在這里發揮作用,幫助指導未來的設計并使流程更加高效。
合成生物學的核心是在 DNA 水平上進行改變,以使細胞產生特定的物質或以預定的方式發揮作用。對于DNA層面的編碼行為,AI能夠發揮重要的作用。
基于 CRISPR 的基因編輯
人工智能在利用 CRISPR-Cas9 技術增強基因編輯方面發揮著重要作用。CRISPR-Cas9 是一種強大的基因編輯工具,允許研究人員通過添加、刪除或改變 DNA 序列的部分來對基因組進行精確編輯。
然而,CRISPR-Cas9技術的挑戰之一是預測和最小化脫靶效應,脫靶效應是與預期靶位點相似的DNA序列的意外修改。
人工智能可以通過分析大量基因組數據來幫助解決這個問題,以預測潛在的脫靶效應及其可能性,從而引導研究人員進行更準確、更高效的基因編輯。
機器學習算法可以在基因組序列和 CRISPR-Cas9 切割圖譜的大型數據集上進行訓練,以根據靶序列和脫靶序列之間的相似性以及染色質可及性等其他因素來預測脫靶效應。
此外,人工智能可以通過分析基因組背景、功能注釋和潛在的脫靶位點,協助識別 CRISPR-Cas9 編輯的最佳靶位點。這使得研究人員能夠以最小的脫靶風險和更高的編輯效率來選擇目標位點。
人工智能可以為 CRISPR-Cas9 技術做出貢獻的另一個方面是引導 RNA (gRNA) 設計的優化。gRNA是CRISPR-Cas9系統中的重要組成部分,負責引導Cas9核酸酶到達目標DNA序列。AI算法可用于分析序列特征,預測gRNA結合效率,并針對特定靶標建議最佳gRNA序列,提高整體基因編輯效率和特異性。
在這種背景下,一家有趣的公司是 Synthego,它是 CRISPR 基因組工程解決方案的提供商,利用機器學習算法來分析和預測最佳向導 RNA (gRNA) 設計,最大限度地減少脫靶效應并最大限度地提高編輯效率。
基因序列優化
基因序列優化利用人工智能算法,特別是機器學習和深度學習模型,分析大量遺傳數據并確定目標生物功能的理想基因序列。通過這樣做,研究人員可以提高效率和穩定性來設計合成基因。
Benchling是該領域的一家著名公司 ,它為生命科學研究提供基于云的平臺,使科學家能夠使用機器學習算法設計、編輯和模擬基因序列。另一個例子是 ATUM,它使用其專有的 GeneGPS技術來設計針對在任何宿主生物體中表達進行優化的基因。Twist Bioscience 還處于基因序列優化的前沿,利用硅基 DNA 合成來生成適合各種應用的優化的高質量基因。
蛋白質設計
蛋白質設計和工程利用人工智能根據氨基酸序列預測蛋白質的結構和功能,使科學家能夠創造具有特定特征的創新蛋白質。這個過程可以產生新的酶、療法和生物材料。
該領域的關鍵參與者是 DeepMind,它是 AlphaFold 背后的公司,這是一個人工智能系統,可以根據氨基酸序列準確預測蛋白質結構,徹底改變蛋白質結構預測。
華盛頓蛋白質研究所的 Rosetta 是另一種用于蛋白質結構預測和設計的強大計算工具,可以創建定制蛋白質。此外, Zymergen 采用人工智能驅動的技術來設計和工程新型蛋白質,并應用于農業、醫療保健和材料科學等行業。
最后,Facebook 和 Instagram 背后的公司 Meta 公布了 ESM 宏基因組圖譜,其中包含超過 6 億個假定蛋白質的結構。
盡管 Meta AI 算法 ESMFold 可能不如 DeepMind 的 AlphaFold 精確,但它擁有更快的處理時間。這種速度的提高源于該算法的蛋白質結構預測方法,該方法采用根據序列數據或構成蛋白質的線性鏈中氨基酸的順序訓練的語言模型。
代謝途徑工程
代謝途徑工程利用人工智能來查明和增強代謝途徑,以生成特定化合物,包括生物燃料、藥品和各種化學品。通過檢查基因、酶和代謝物之間的相互作用,人工智能算法可以預測合成目標分子的最有效路線。
Ginkgo Bioworks是這一領域的先驅公司之一 ,該公司利用人工智能驅動的技術來改造微生物,以生產具有工業應用價值的化合物。
另一個值得注意的例子是 Inscripta,它提供了 Onyx™ 平臺,用于設計和改造微生物菌株,以優化目標分子生產的代謝途徑。此外, Zymergen 利用人工智能和自動化來設計微生物并優化代謝途徑,其應用涵蓋農業、醫療保健和材料科學。
自動化實驗設計
人工智能可以幫助優化合成生物學的實驗設計,預測哪些實驗最有可能產生有價值的結果,并指導研究人員做出更明智的決策。
該領域的領導者是 Synthace,它提供 Antha 平臺、基于云的軟件,用于使用機器學習算法設計、模擬和執行生物研究工作流程。另一個重要參與者是 Arzeda,一家利用人工智能和計算蛋白質設計為各種工業應用構建定制基因電路的公司。
TeselaGen 正在部署第一個解決方案,該解決方案將最先進的人工智能信息技術用于生物技術,作為安全的企業操作系統。TeselaGen 由 Synthetic Evolution® 機器學習引擎提供支持,可對各種來源的數據進行標準化、分析和集成,并允許設計高通量、高內容的實驗。
總而言之,人工智能有能力給合成生物學帶來重大變化,幫助我們解決當今一些最緊迫的問題。生物系統的復雜性、我們擁有的數據的局限性、驗證模型的困難以及各個領域之間合作的需要,所有這些都存在需要克服的障礙。
