Trí tuệ nhân tạo và cuộc phục hưng mới của khoa học các hợp chất thiên nhiên

Khoa học và Công nghệ 26/06/2026 08:16

Trong lịch sử phát triển của y học và dược phẩm, thiên nhiên luôn là “phòng thí nghiệm” vĩ đại nhất của nhân loại. Tuy nhiên, phải đến khi trí tuệ nhân tạo, dữ liệu lớn và sinh học tính toán bùng nổ, con người mới thực sự bước vào một giai đoạn mới: giai đoạn mà những bí mật hóa học ẩn sâu trong tự nhiên có thể được giải mã với tốc độ và chiều sâu chưa từng có. Từ việc khai phá tri thức y học cổ truyền, phân tích hàng tỷ dữ liệu phổ khối đến thiết kế thuốc mới lấy cảm hứng từ tự nhiên, AI đang tạo ra một cuộc phục hưng mạnh mẽ của khoa học các hợp chất thiên nhiên – lĩnh vực từng được xem là nền tảng của nhiều thành tựu y dược quan trọng nhất trong lịch sử nhân loại.

1. Khi “thiên nhiên” gặp “máy học” trong cuộc đua tìm kiếm dược phẩm thế hệ mới

Trong nhiều thế kỷ, thiên nhiên luôn là kho tàng vô giá của y học nhân loại. Từ những bài thuốc dân gian cổ truyền đến các loại thuốc hiện đại điều trị ung thư, sốt rét hay giảm đau, dấu ấn của các hợp chất tự nhiên hiện diện gần như ở mọi giai đoạn phát triển của ngành dược phẩm. Tuy nhiên, bước sang thế kỷ XXI, lĩnh vực nghiên cứu hợp chất thiên nhiên từng có thời điểm chững lại do chi phí cao, quá trình sàng lọc kéo dài và sự phức tạp của các cấu trúc hóa học tự nhiên.

Ngày nay, với sự phát triển bùng nổ của trí tuệ nhân tạo (AI), khoa học dữ liệu và sinh học tính toán, lĩnh vực này đang chứng kiến một “cuộc phục hưng” mạnh mẽ. AI không chỉ giúp các nhà khoa học đọc nhanh hàng triệu tài liệu, phân tích hàng tỷ phổ khối hay giải mã gene sinh tổng hợp hoạt chất, mà còn có thể đề xuất cấu trúc thuốc mới lấy cảm hứng từ tự nhiên. Một bài tổng quan khoa học đăng trên tạp chí Natural Products and Bioprospecting năm 2026 đã gọi đây là “AI renaissance in natural product drug discovery” – cuộc phục hưng của khoa học hợp chất thiên nhiên dưới tác động của trí tuệ nhân tạo.

a1_1782309871.jpg

2. Hợp chất thiên nhiên – nền tảng của nhiều loại thuốc hiện đại

Trong lịch sử phát triển dược phẩm, nhiều hoạt chất nổi tiếng nhất đều bắt nguồn từ tự nhiên. Thuốc chống ung thư paclitaxel được phát hiện từ cây thủy tùng Thái Bình Dương; artemisinin chống sốt rét được tách từ thanh hao hoa vàng; morphine từ thuốc phiện hay vincristine từ cây dừa cạn là những ví dụ điển hình.

Theo các thống kê được công bố, từ năm 1946–1980, hơn 50% thuốc chống ung thư có nguồn gốc trực tiếp từ thiên nhiên. Giai đoạn từ năm 1981 trở đi, khoảng hai phần ba các thuốc phân tử nhỏ điều trị ung thư vẫn mang “khung cấu trúc tự nhiên” hoặc được phát triển dựa trên cảm hứng từ các hợp chất thiên nhiên.

Điều này cho thấy thiên nhiên không chỉ là nguồn nguyên liệu truyền thống mà còn là “thư viện hóa học” lớn nhất mà con người từng biết đến. Các phân tử tự nhiên thường sở hữu cấu trúc ba chiều phức tạp, nhiều carbon bất đối và khả năng tác động đồng thời lên nhiều cơ chế sinh học khác nhau. Chính sự đa dạng này tạo nên tiềm năng dược học to lớn mà các thư viện hóa học tổng hợp khó có thể tái tạo hoàn toàn.

a2_1782309928.png

3. Vì sao ngành hợp chất thiên nhiên từng chững lại?

Mặc dù giàu tiềm năng, nghiên cứu hợp chất thiên nhiên lại gặp rất nhiều rào cản trong thực tế. Một trong những khó khăn lớn nhất là cấu trúc hóa học quá phức tạp. Nhiều hoạt chất chứa hàng chục carbon bất đối, nhiều vòng ngưng tụ và hệ stereochemistry khó xác định. Việc phân tích cấu trúc thường đòi hỏi thời gian dài cùng các thiết bị hiện đại như NMR, LC-MS/MS hay X-ray crystallography .

Ngoài ra, hàm lượng hoạt chất trong nguyên liệu tự nhiên thường rất thấp. Có những hợp chất chỉ tồn tại ở mức vài microgram trên mỗi gram dược liệu, khiến quá trình chiết tách và tinh sạch trở nên tốn kém.

Một vấn đề khác được gọi là “rediscovery” – tái phát hiện hợp chất cũ. Nhiều phòng thí nghiệm mất hàng tháng nghiên cứu, cuối cùng lại phát hiện ra một chất đã được công bố trước đó nhiều năm. Điều này gây lãng phí lớn về thời gian, kinh phí và nguồn lực nghiên cứu .

Bên cạnh đó, dữ liệu nghiên cứu hợp chất thiên nhiên vốn phân tán ở nhiều cơ sở dữ liệu khác nhau, thiếu chuẩn hóa và khó liên thông. Chính những “nút thắt” này đã khiến nhiều tập đoàn dược phẩm lớn từng giảm đầu tư vào lĩnh vực hợp chất thiên nhiên trong giai đoạn đầu những năm 2000.

4. AI đang thay đổi toàn bộ quy trình nghiên cứu hợp chất thiên nhiên

Sự xuất hiện của AI đã tạo ra bước ngoặt quan trọng. Nếu trước đây việc nghiên cứu hợp chất thiên nhiên chủ yếu dựa trên kinh nghiệm và thử nghiệm thủ công, thì hiện nay AI có thể tham gia ở hầu hết các khâu của chuỗi nghiên cứu – từ khai phá tri thức y học cổ truyền đến thiết kế thuốc mới.

AI khai thác kho tri thức y học cổ truyền

a3_1782310046.png

Một trong những ứng dụng nổi bật nhất là xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP). Các mô hình AI hiện đại như BERT, BioBERT hay GPT có khả năng đọc và phân tích hàng triệu trang tài liệu y học, bao gồm cả các văn bản cổ truyền .

Điều này đặc biệt có ý nghĩa đối với các hệ thống y học truyền thống như: Y học cổ truyền Trung Quốc (TCM), Ayurveda của Ấn Độ, Siddha, Unani, hay tri thức bản địa ở nhiều quốc gia.

Các mô hình AI có thể tự động nhận diện: tên dược liệu, công dụng chữa bệnh, cơ chế tác dụng, thành phần hoạt chất, mối liên hệ giữa dược liệu và bệnh lý.

Một ví dụ điển hình là mô hình TCM-GPT-7B được huấn luyện trên khoảng 1 tỷ token dữ liệu y học cổ truyền Trung Quốc. Hệ thống này cho phép truy xuất và phân tích các mối quan hệ giữa dược liệu, bài thuốc và bệnh lý với độ chính xác cao .

Điều đáng chú ý là AI không chỉ “đọc hiểu” văn bản mà còn có khả năng kết nối tri thức truyền thống với dữ liệu sinh học hiện đại. Đây được xem là bước tiến quan trọng giúp biến tri thức kinh nghiệm hàng nghìn năm thành dữ liệu khoa học có thể khai thác bằng công nghệ số.

5. “Dereplication 2.0” – tránh tái phát hiện hợp chất cũ

Trong nghiên cứu hợp chất thiên nhiên, dereplication là quá trình xác định nhanh xem hợp chất thu được đã từng được công bố hay chưa. Đây là khâu rất quan trọng nhằm tránh lãng phí nguồn lực.

Ngày nay, AI đang thúc đẩy một thế hệ mới gọi là “Dereplication 2.0” .

Các hệ thống AI có thể: phân tích phổ NMR, phân tích phổ khối MS/MS, xây dựng mạng lưới phân tử (molecular networking), so khớp dữ liệu phổ với các cơ sở dữ liệu toàn cầu.

Nền tảng GNPS (Global Natural Products Social Molecular Networking) hiện là một trong những hệ thống nổi bật nhất. Tính đến năm 2021, GNPS đã lưu trữ hơn 1,2 tỷ phổ MS/MS và gần nửa triệu file phổ từ hơn 160 quốc gia . Hệ thống này cho phép các nhà khoa học tự động nhóm các hợp chất có cấu trúc tương tự, từ đó phát hiện nhanh các chất mới hoặc các dẫn xuất chưa từng được mô tả.

Trong khi đó, các công cụ như SMART 2.0 hay DP4-AI sử dụng deep learning để phân tích dữ liệu NMR và hỗ trợ xác định cấu trúc hợp chất với tốc độ nhanh hơn nhiều lần so với phương pháp truyền thống .

6. AI thiết kế thuốc mới lấy cảm hứng từ thiên nhiên

Một xu hướng rất đáng chú ý là AI không chỉ giúp phát hiện hợp chất tự nhiên mà còn có thể “sáng tạo” ra các cấu trúc mới.

Thông qua các mô hình học sâu như: Graph Neural Networks (GNN), Variational Autoencoders (VAE), Transformer architectures, AI có thể học “ngôn ngữ hóa học” của các hợp chất tự nhiên . Từ đó, hệ thống sẽ dự đoán: hoạt tính sinh học, độc tính, độ tan, khả năng hấp thu,

hoặc thiết kế các cấu trúc tương tự nhưng tối ưu hơn.

Điều này mở ra khả năng tạo ra các “natural-product-inspired drugs” – thuốc lấy cảm hứng từ thiên nhiên nhưng được tối ưu bằng AI và hóa học tính toán.

Trong tương lai, AI có thể đề xuất: các dẫn xuất mới của flavonoid, alkaloid chống ung thư, terpenoid kháng viêm, peptide sinh học, hoặc các phytopharmaceuticals thế hệ mới.

a4_1782310122.jpg

7. Khai phá “genomic dark matter” – kho gene bí ẩn của tự nhiên

Các nhà khoa học nhận thấy rằng trong genome của vi sinh vật, nấm và thực vật tồn tại rất nhiều cụm gene sinh tổng hợp hoạt chất (biosynthetic gene clusters – BGCs) nhưng ở trạng thái “im lặng”, không biểu hiện trong điều kiện nuôi cấy thông thường.

AI hiện đang được sử dụng để: phát hiện các BGC tiềm năng, dự đoán cấu trúc hợp chất mà gene có thể tạo ra, xác định các con đường sinh tổng hợp mới.

Các công cụ như antiSMASH hay DeepBGC sử dụng machine learning để phân tích hàng trăm nghìn bộ gene và tìm kiếm các cụm gene liên quan đến sản xuất hoạt chất thiên nhiên .

Điều này đồng nghĩa với việc nhân loại có thể đang sở hữu một “mỏ vàng hóa học” khổng lồ chưa từng được khai phá.

8. AI và tương lai của sinh học tổng hợp

Một xu hướng lớn khác là sự kết hợp giữa AI và sinh học tổng hợp (synthetic biology). Thay vì phụ thuộc hoàn toàn vào cây thuốc tự nhiên, các nhà khoa học đang hướng đến việc “lập trình” vi sinh vật để sản xuất hoạt chất.

AI hỗ trợ: tối ưu enzyme, thiết kế đường chuyển hóa, dự đoán hiệu suất lên men, xây dựng “cell factory” sản xuất hoạt chất.

Xu hướng này đặc biệt quan trọng với các hoạt chất quý hiếm có hàm lượng thấp trong tự nhiên. Trong tương lai, nhiều loại hoạt chất thiên nhiên có thể được sản xuất bằng: nấm men biến đổi gene, vi khuẩn engineered, hoặc hệ enzyme nhân tạo.

Điều đó có thể thay đổi hoàn toàn ngành công nghiệp dược liệu và thực phẩm bảo vệ sức khỏe.

a5_1782310172.png

9. Cơ hội của Việt Nam trong làn sóng phục hưng khoa học các hợp chất thiên nhiên

Việt Nam là một trong những quốc gia có tính đa dạng sinh học cao của khu vực châu Á – Thái Bình Dương, với hàng nghìn loài cây dược liệu cùng kho tri thức y học cổ truyền phong phú được tích lũy qua nhiều thế hệ. Tuy nhiên, phần lớn nguồn tài nguyên này vẫn chủ yếu được khai thác dưới dạng nguyên liệu thô, trong khi dữ liệu về hoạt chất, hoạt tính sinh học và tri thức bản địa còn phân tán, thiếu hệ thống và chưa được số hóa đầy đủ.

a6_1782310211.png

Trong bối cảnh trí tuệ nhân tạo, dữ liệu lớn và công nghệ omics đang làm thay đổi toàn bộ ngành hợp chất thiên nhiên, Việt Nam đứng trước cơ hội quan trọng để tham gia sâu hơn vào chuỗi giá trị toàn cầu của ngành dược phẩm và công nghệ sinh học thế hệ mới. Việc xây dựng cơ sở dữ liệu quốc gia về hợp chất thiên nhiên, số hóa tri thức y học cổ truyền, phát triển metabolomics, genomics và ứng dụng AI trong sàng lọc hoạt tính sinh học có thể tạo nền tảng cho một hệ sinh thái nghiên cứu – phát triển hiện đại dựa trên tài nguyên bản địa.

Bên cạnh đó, việc thúc đẩy các mô hình nghiên cứu liên ngành giữa hóa học, sinh học, công nghệ enzyme, khoa học dữ liệu và AI sẽ trở thành xu hướng tất yếu. Trong điều kiện nguồn lực còn hạn chế, Việt Nam có thể ưu tiên một số hướng có khả năng thương mại hóa nhanh như:

- Hoạt chất thiên nhiên cho thực phẩm bảo vệ sức khỏe;

- Peptide sinh học từ nguồn nguyên liệu biển;

- Nano phytomedicine;

- Tinh dầu và hoạt chất chức năng chuẩn hóa;

- Phytopharmaceuticals cho các bệnh không lây nhiễm.

Về dài hạn, lợi thế cạnh tranh sẽ không chỉ nằm ở việc sở hữu nhiều cây thuốc, mà ở khả năng chuyển hóa đa dạng sinh học thành dữ liệu, công nghệ và sở hữu trí tuệ. Giá trị lớn nhất của tài nguyên sinh học trong tương lai có thể nằm ở các thư viện hoạt chất số, nền tảng AI chuyên biệt, công nghệ tinh chế, sinh tổng hợp và các sản phẩm có hàm lượng khoa học cao.

Trong bối cảnh cuộc cạnh tranh toàn cầu đang dịch chuyển từ khai thác tài nguyên sang khai thác dữ liệu và tri thức, sự hội tụ giữa AI và hợp chất thiên nhiên có thể trở thành cơ hội quan trọng để Việt Nam rút ngắn khoảng cách công nghệ, từng bước chuyển từ vai trò cung cấp nguyên liệu sang phát triển các sản phẩm và công nghệ sinh học mang giá trị gia tăng cao.

Kết luận

Sự hội tụ giữa trí tuệ nhân tạo, khoa học dữ liệu và hợp chất thiên nhiên đang mở ra một giai đoạn phát triển hoàn toàn mới cho ngành khoa học sự sống. Nếu trước đây việc tìm kiếm hoạt chất mới giống như “mò kim đáy biển”, thì ngày nay AI đang giúp con người định vị chính xác hơn những phân tử tiềm năng trong “đại dương hóa học” của tự nhiên.

Trong tương lai gần, những tiến bộ của AI có thể giúp rút ngắn đáng kể thời gian phát triển thuốc, giảm chi phí nghiên cứu và thúc đẩy sự ra đời của các liệu pháp điều trị mới có nguồn gốc thiên nhiên. Đây không chỉ là cuộc cách mạng của ngành dược phẩm, mà còn là sự chuyển dịch chiến lược của toàn bộ lĩnh vực khoa học hợp chất thiên nhiên trong kỷ nguyên số.

Tài liệu tham khảo

[1]. Muthuraj R., Chandrasekaran J. Nature meets machine: the AI renaissance in natural product drug discovery. Natural Products and Bioprospecting, 2026, 16:37.

[2]. GNPS – Global Natural Products Social Molecular Networking, University of California San Diego.

[3]. Sorokina M. et al. COCONUT database – Collection of Open Natural Products.

[4]. NPASS – Natural Product Activity and Species Source Database.

[5]. antiSMASH platform for biosynthetic gene cluster analysis.

[6]. DeepBGC: Deep learning for biosynthetic gene cluster prediction.

PGS.TS. Trần Quốc Toàn: Giám đốc Trung tâm Phát triển các Sản phẩm thiên nhiên và Công nghệ - Thiết bị/ Viện Hóa học – Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Tin đáng đọc