As climate change becomes increasingly evident and complex, the demand for accurate, high-resolution weather and climate forecasts at regional scales has never been more urgent. Traditional Earth System Models (ESMs), despite decades of advancement, still face prohibitive computational costs and struggle to deliver the fine detail required for local decision-making.
Artificial Intelligence (AI) and Machine Learning (ML) now offer a powerful complement-especially through Physics-Informed Machine Learning (PIML) - but must be integrated wisely rather than used in isolation.
1. Bridging Data Power and Physical Principles
PIML is an emerging field that embeds physical laws and expert knowledge directly into ML models. Its goals are to build predictors that are physically consistent, data-efficient, faster to train, better at generalizing, and more transparent. Standard ML models can learn complex patterns from data but may violate fundamental physical constraints and fail to generalize to novel scenarios. PIML addresses this by:
- Custom Loss Functions: Adding physics-based terms to the loss function to enforce conservation laws (e.g., energy balance) during training.
- Specialized Neural Architectures: Designing layers or network modules that strictly enforce physical constraints even in unseen conditions.
- Embedding Physical Properties: Incorporating symmetries, invariances, and covariances so models require less data and deliver more accurate predictions.
- Modeling Uncertainty: Using Bayesian neural networks or generative models to capture chaotic dynamics and quantify forecast uncertainty.
- Ensuring Stability: Structuring models to prevent long-term drift or unphysical behavior in extended forecasts.
2. Foundation Models and Kilometer-Scale Resolution: Harnessing Exascale
Recent breakthroughs highlight several advances:
- Foundation Models: ClimaX is a versatile, pre-trained AI model for weather and climate science, trained on CMIP6 datasets. It can be fine-tuned for diverse tasks across unprecedented spatiotemporal scales, and its code is open source.
- Km-Scale Physics Models: High-resolution physics-based models solve dynamical equations at kilometer scales, capturing deep convection, ocean eddies, and terrain interactions. The UK Met Office’s LFRic system is exascale-ready, simulating 1 km global scenarios on Frontier in weeks.
- AI-Driven Emulators: Hybrid AI emulators deliver exceptional inference speed on modest GPU/TPU resources, enabling weather modeling on a student’s laptop rather than a supercomputer. A new exascale emulator trained on hundreds of billions of temperature datapoints achieves ~3.5 km resolution and scales efficiently-0.976 EFlop/s on 36,100 AMD MI250X GPUs.
3. Top Strategic Applications of PIML
PIML is critical in three high-impact areas:
- Simulating Complex Physical Processes: Building efficient emulators for multiscale dynamics-e.g., Rayleigh–Bénard convection, lake temperature dynamics, or conservation-enforcing neural climate models-achieving up to 250× speed-ups.
- High-Resolution Downscaling/Super-Resolution: Generating high-fidelity, fine-scale data (e.g., wind fields, precipitation, spatiotemporal turbulence) from coarse inputs, with emulators reaching 3.5 km resolution.
- Spatiotemporal Forecasting: Combining physics-informed convolutions (e.g., TurbulentFlowNet) and equivariant architectures to predict evolving weather and climate phenomena stably over long horizons.
4. The Road Ahead: Integration and Multidisciplinary Collaboration
Past successes in weather and climate forecasting emerged from combining higher resolution, improved physical parameterizations, ensemble increases, and enhanced observations. Likewise, AI/ML must complement physics-based data.
Key strategic recommendations:
- Invest in PIML R&D: Prioritize projects that tightly integrate physics with AI/balancing computational efficiency, physical fidelity, and generalization for reliable models in a changing climate.
- Leverage Open-Source Foundation Models: Embrace and contribute to models like ClimaX to accelerate innovation, reduce upfront costs, and build a robust research community.
- Focus on High Resolution and Instant Emulation: Fund kilometer-scale downscaling and AI emulators to deliver detailed, timely local insights-critical for risk management and adaptation.
- Build Multidisciplinary Teams: Foster collaboration between computer scientists, AI experts, mathematicians, statisticians, and climate scientists to tackle complex challenges.
- Ensure Transparency and Quantified Uncertainty: Demand AI models that are not only accurate but also explainable and capable of quantifying forecast uncertainty-essential for trust and life-critical decisions.
Tương Lai Mô Hình Khí Hậu: Tối Ưu Hóa Dự Báo Bằng AI Lai Ghép Vật Lý (PIML) cho Lãnh Đạo Cấp Cao
Nhu Cầu Cấp Bách về Thông Tin Khí Hậu Chính Xác trong bối cảnh biến đổi khí hậu ngày càng trở nên rõ rệt và phức tạp, nhu cầu về các dự báo thời tiết và khí hậu chính xác, chi tiết ở cấp độ khu vực chưa bao giờ cấp bách đến thế. Các mô hình hệ thống Trái đất (ESM) truyền thống, dù đã phát triển vượt bậc qua nhiều thập kỷ, vẫn phải đối mặt với những hạn chế về chi phí tính toán khổng lồ và khả năng cung cấp thông tin ở độ phân giải cao cần thiết cho việc ra quyết định tại địa phương.
Đây là lúc Trí tuệ Nhân tạo (AI) và Học máy (ML) xuất hiện như một công cụ mạnh mẽ, mang đến tiềm năng cách mạng hóa lĩnh vực này. Tuy nhiên, điều quan trọng là không nên coi AI là giải pháp độc lập mà là một phần của chiến lược tích hợp, đặc biệt là thông qua cách tiếp cận Học máy có thông tin vật lý (Physics-Informed Machine Learning - PIML).
1. Cầu Nối Giữa Sức Mạnh Dữ Liệu và Nguyên Lý Vật Lý
PIML là một lĩnh vực đang phát triển nhanh chóng, tìm cách kết hợp các nguyên tắc vật lý, định luật chi phối và kiến thức chuyên môn vào các mô hình ML. Mục tiêu chính của PIML là xây dựng các mô hình dự đoán nhất quán về mặt vật lý, hiệu quả về dữ liệu, nhanh hơn trong huấn luyện, có khả năng tổng quát hóa tốt hơn và minh bạch hơn.
Các mô hình ML "thông thường" có thể học các mối quan hệ phức tạp từ dữ liệu, nhưng chúng không phải lúc nào cũng tuân thủ các nguyên tắc vật lý cơ bản của hệ thống và có thể không tổng quát hóa tốt cho các kịch bản chưa được huấn luyện. PIML khắc phục điều này bằng cách:
• Thiết kế hàm mất mát tùy chỉnh: Bổ sung các thuật ngữ dựa trên vật lý vào hàm mất mát để điều chỉnh quá trình tối ưu hóa của mô hình ML, ví dụ: để ngăn chặn vi phạm định luật bảo toàn.
• Kiến trúc mạng nơ-ron tùy chỉnh: Thiết kế các lớp hoặc khối mạng nơ-ron để thực thi nghiêm ngặt các ràng buộc vật lý, đảm bảo chúng được thỏa mãn ngay cả trong các kịch bản mới.
• Nhúng các thuộc tính vật lý: Tích hợp các đối xứng, bất biến và hiệp biến để tạo ra các mô hình đơn giản hơn, yêu cầu dữ liệu ít hơn và độ chính xác dự đoán cao hơn.
• Mô hình hóa tính ngẫu nhiên và bất định: Sử dụng các mô hình xác suất như Mạng nơ-ron Bayes (Bayesian NNs) hoặc mô hình sinh (generative models) để nắm bắt bản chất hỗn loạn của hệ thống thời tiết và khí hậu, cũng như định lượng các bất định.
• Đảm bảo tính ổn định: Thiết kế các mô hình PIML để tránh sự trôi dạt dài hạn hoặc hành vi phi vật lý, đặc biệt khi được sử dụng để dự báo.
2. Mô Hình Nền Tảng và Độ Phân Giải Km-scale: Khai Thác Tiềm Năng Exascale
Các nguồn tài liệu mới nhất đã nêu bật một số tiến bộ quan trọng:
• Mô hình Nền tảng (Foundation Models): ClimaX được giới thiệu là một mô hình nền tảng AI linh hoạt và tổng quát hóa cho khoa học thời tiết và khí hậu. Nó được huấn luyện trước trên các bộ dữ liệu khí hậu từ CMIP6 và có thể được tinh chỉnh cho nhiều nhiệm vụ khác nhau, bao gồm các biến khí quyển và quy mô không gian-thời gian chưa từng thấy trong quá trình huấn luyện ban đầu. Mã nguồn của ClimaX cũng được công khai.
• Mô hình Vật lý Km-scale: Các mô hình dựa trên vật lý ở quy mô kilomet (km-scale models) trực tiếp giải các phương trình động lực học với độ phân giải cao, giúp biểu diễn rõ ràng hơn các quá trình quan trọng như đối lưu sâu, xoáy đại dương và tương tác địa hình. Hệ thống LFRic của UK Met Office là một ví dụ, được thiết kế cho tính toán exascale, có khả năng chạy các kịch bản toàn cầu 1 km trong vài tuần trên các siêu máy tính như Frontier.
• Trình giả lập do AI điều khiển (AI-driven Emulators): Đây là các mô hình lai ghép AI mạnh mẽ, mang lại tốc độ suy luận vượt trội và yêu cầu tài nguyên GPU/TPU vừa phải, cho phép chạy các mô hình thời tiết trên laptop của sinh viên thay vì siêu máy tính. Một trình giả lập khí hậu exascale mới được huấn luyện trên hàng trăm tỷ điểm dữ liệu nhiệt độ và đạt được độ phân giải không gian cực cao khoảng 3.5 km. Mô hình này cho thấy khả năng mở rộng hiệu quả trên các hệ thống GPU lớn, đạt 0.976 EFlop/s trên 36,100 GPU AMD MI250X của Frontier.
3. Các Ứng Dụng Chiến Lược Hàng Đầu của PIML
PIML đang trở nên quan trọng trong ba ứng dụng chính, mang lại tác động trực tiếp và đáng kể cho việc ra quyết định:
• Giả lập các quá trình vật lý phức tạp: PIML cho phép xây dựng các trình giả lập hiệu quả cho các quá trình vật lý đa quy mô, phức tạp mà các mô hình hiện có còn gặp khó khăn hoặc không thể giải thích đầy đủ. Ví dụ, giả lập đối lưu Rayleigh–Bénard, mô hình hóa nhiệt độ hồ, hoặc thực thi định luật bảo toàn trong mạng nơ-ron cho mô hình khí hậu. Các trình giả lập này có thể giảm chi phí tính toán đáng kể (ví dụ: tăng tốc 250 lần cho mô hình tuyết).
• Tăng độ phân giải (Downscaling/Super-resolving) dữ liệu thô: PIML có thể tạo ra dữ liệu độ phân giải cao, độ trung thực cao từ dữ liệu thô, cung cấp thông tin chi tiết hơn cho các khu vực cụ thể. Ví dụ, nâng cao độ phân giải của trường gió, dữ liệu lượng mưa, hoặc thậm chí siêu phân giải không gian-thời gian của các dòng chảy rối. Một trình giả lập khí hậu exascale đã đạt được độ phân giải không gian lên tới 3.5 km.
• Dự báo không gian-thời gian: PIML hỗ trợ dự đoán sự tiến hóa không gian-thời gian của các hiện tượng thời tiết và khí hậu một cách hiệu quả hơn. Các mô hình như TurbulentFlowNet (TFNet) kết hợp cấu trúc vật lý với các lớp tích chập có thể huấn luyện để dự báo động lực học dòng chảy rối. Các mô hình bảo toàn tính biến đổi (equivariant models) có thể tổng quát hóa tốt hơn và hiệu quả dữ liệu hơn, cho phép dự báo ổn định trong thời gian dài cho dòng chảy địa vật lý.
4. Con Đường Tương Lai: Tích Hợp và Cộng Tác Đa Ngành
Thành công của dự báo thời tiết và khí hậu trong quá khứ không đến từ một bước đột phá duy nhất mà là sự tổng hợp của nhiều phương pháp: tăng độ phân giải, cải thiện các tham số hóa vật lý, tăng kích thước tập hợp và tăng cường quan sát. Tương tự, AI/ML trong dự báo thời tiết vẫn yêu cầu dữ liệu huấn luyện từ các mô hình dựa trên vật lý.
Do đó, con đường phía trước đòi hỏi một chiến lược tích hợp, khai thác sức mạnh tổng hợp giữa các phương pháp đa dạng:
• Tích hợp đa phương pháp: Kết hợp thế mạnh của mô hình dựa trên vật lý, mô hình AI/ML, và các phương pháp hiệu chỉnh tham số. Ví dụ, AI có thể giảm chi phí tính toán và đẩy nhanh việc khám phá các tham số hóa mới.
• Thúc đẩy cộng tác đa ngành: Thành công của PIML phụ thuộc vào sự hợp tác chặt chẽ giữa các nhà khoa học máy tính, chuyên gia AI, nhà toán học, nhà thống kê và các nhà khoa học khí hậu.
• Tiêu chuẩn hóa và chẩn đoán: Phát triển các tiêu chuẩn thử nghiệm và đánh giá có hệ thống cho các mô hình AI/ML trong khí hậu, tương tự như các dự án so sánh mô hình.
• Mở rộng quy mô hiệu quả: Đảm bảo khả năng mở rộng của việc huấn luyện, thử nghiệm và triển khai các mô hình PIML phức tạp trên các tập dữ liệu lớn và kiến trúc tính toán đang thay đổi nhanh chóng.
Để tối đa hóa tác động và đạt được những bước tiến vượt bậc trong dự báo thời tiết và khí hậu, chúng tôi đề xuất các khuyến nghị chiến lược sau:
1. Đầu tư vào Nghiên cứu & Phát triển PIML: Ưu tiên các dự án kết hợp nguyên tắc vật lý sâu sắc với AI/ML. Cách tiếp cận này mang lại sự cân bằng tối ưu giữa hiệu quả tính toán, độ chính xác vật lý và khả năng tổng quát hóa, là chìa khóa để xây dựng các mô hình đáng tin cậy cho một khí hậu đang thay đổi.
2. Khai thác Mô hình Nền tảng và Mã nguồn mở: Khuyến khích việc sử dụng và đóng góp vào các mô hình nền tảng mã nguồn mở như ClimaX. Điều này thúc đẩy đổi mới, tăng tốc độ phát triển và giảm chi phí ban đầu, đồng thời tạo ra một cộng đồng nghiên cứu và phát triển mạnh mẽ.
3. Tập trung vào Độ phân giải Cao và Giả lập Tức thì: Đầu tư vào khả năng tăng độ phân giải (downscaling) đến cấp độ kilomet (ví dụ: 3.5 km) và các trình giả lập do AI điều khiển. Những khả năng này sẽ cung cấp thông tin khí hậu cục bộ, chi tiết và kịp thời, trực tiếp hỗ trợ các quyết định về quản lý rủi ro và thích ứng biến đổi khí hậu ở cấp địa phương và khu vực.
4. Xây dựng Năng lực Cộng tác Đa ngành: Thiết lập và hỗ trợ các nhóm nghiên cứu liên ngành, bao gồm các chuyên gia từ vật lý, toán học, khoa học máy tính và khoa học khí hậu. Sự hợp tác này là nền tảng để giải quyết những thách thức phức tạp nhất và tận dụng tối đa tiềm năng của các công nghệ mới.
5. Đảm bảo Tính Minh bạch và Định lượng Bất định: Yêu cầu các mô hình AI không chỉ chính xác mà còn ổn định, có thể giải thích được và định lượng được sự bất định trong dự báo. Điều này cực kỳ quan trọng để xây dựng lòng tin và hỗ trợ việc ra quyết định mang tính sống còn.
Source / Nguồn tham khảo :
- Adams, et al. “LFRic: Meeting the challenges of scalability and performance portability in Weather and Climate models.” Philosophical Transactions of the Royal Society A arXiv
- Abdulah, et al. “Boosting Earth System Model Outputs and Saving PetaBytes in their Storage Using Exascale Climate Emulators.” arXiv, Aug 2024 arXiv
- Nguyen, et al. “ClimaX: A foundation model for weather and climate.” arXiv, Jan 2023 arXiv
- López-Gómez, et al. “Dynamical-generative downscaling of climate model outputs.” PNAS, 2025 pnas.org
- Bordoni, S. “The futures of climate modeling.” npj Climate, 2025 Nature
- Phys.org. “Climate research should integrate multiple approaches.” Mar 2025 phys.org
- Kashinath, et al. “Physics-informed machine learning: case studies for weather & climate processes.” RSPA, 2021 royalsocietypublishing.org