Thử nghiệm ứng dụng trí tuệ nhân tạo AI để xây dựng mô hình dự báo sóng

Đăng ngày: 31-01-2023 | Lượt xem: 2067
Những năm gần đây, trí tuệ nhân tạo (AI - Artificial Intelligence) đã được ứng dụng trong mọi lĩnh vực của đời sống, xã hội trong đó có lĩnh vực dự báo khí tượng thủy văn biển. Nhóm nghiên cứu của Trung tâm Dự báo KTTV quốc gia đã sử dụng mạng bộ nhớ ngắn dài (LSTM – Long Short Term Memory) một phiên bản cải tiến của mạng nơ-ron hồi quy (RNN – Recurrent Neural Network) để xây dựng mô hình dự báo sóng tại trạm hải văn Cồn Cỏ theo các hạn dự báo 06, 12, 18 và 24 giờ.

Các thông tin về dự báo sóng có ý nghĩa đặc biệt quan trọng công tác phòng tránh thiên tai mà còn với các hoạt động kinh tế - xã hội ven bờ và trên biển, nó ảnh hưởng trực tiếp đến việc lên kế hoạch xây dựng lịch trình di chuyển của tàu thuyền trên biển, xây dựng các cảng/để biển, hoạt động đánh bắt hải sản và tìm kiếm cứu nạn…. Các thông tin về dự báo sóng càng có ý nghĩa hơn trong điều kiện thời tiết nguy hiểm như bão, áp thấp nhiệt đới và gió mùa mạnh. Hiện nay dự báo sóng được thực hiện chủ yếu bởi các mô hình số trị thế hệ thứ 3 như WAM, WAVEWATCH III và SWAN. Cả 3 mô hình này đều dựa trên việc giải phương trình cân bằng tác động sóng. Mặc các mô hình đều cho kết quả dự báo tương đối tốt, tuy nhiên vẫn còn hạn chế bởi các nhân tố sau: (1) Sự phát triển của sóng gió chủ yếu dựa trên các tham số thực nghiệm; (2) Đầu vào của mô hình chủ yếu là trường gió dự báo từ các mô hình khí tượng; (3) Độ phân không gian còn hạn chế do bởi thiếu năng lực tính toán.

Ngoài ra, việc sử dụng các mô hình số trị còn có nhược điểm là yêu cầu dung lượng lưu trữ và năng lực tính toán lớn để có thể cho dự báo chi tiết. Chi phí tính toán cao này là nguyên nhân giới hạn độ phân giải về không gian và thời gian tính toán của các mô hình.

Ma trận hệ số tương quan Pearson giữa các biến

Ở Việt Nam dự báo sóng chủ yếu dựa trên kết quả của mô hình số trị. Các kết quả dự báo của mô hình SWAN được thiết lập tại Trung tâm Dự báo khí tượng thủy văn quốc gia là nguồn tham khảo chính để đưa ra các bản tin dự báo sóng hằng ngày tại Việt Nam. Mô hình SWAN hiện tại được thiết lập chạy trên hệ thống máy tính hiệu năng cao (HPC) của Tổng cục khí tượng thủy văn với độ phân giải xấp xỉ 4km × 4km với thời gian dự báo là 10 ngày, bước thời gian dự báo là 03 giờ với thời gian tính toán khoảng 30–40 phút. Mặc dù đã được thiết lập trên HPC nhưng do tài nguyên tính toán vẫn còn hạn chế nên chưa thể chi tiết hơn cho các khu vực ven bờ, quanh đảo. Chưa có khả năng đáp ứng dự báo phục vụ chi tiết cho các khu vực kinh tế trọng điểm như: bãi tắm, tuyến hàng hải, đảo du lịch, giàn khoan …

Vì vậy, việc nghiên cứu và xây dựng được một chương trình dự báo sóng sử dụng phương pháp máy học sẽ là một giải pháp tích cực trong việc khắc phục các vấn đề về tài nguyên tính toán cũng như thiếu hụt số liệu quan trắc sóng biển tại Việt Nam.

Trong nghiên cứu này, 02 mô hình sử dụng mạng bộ nhớ ngắn dài – LSTM sẽ được xây dựng để dự báo độ cao sóng có nghĩa tại trạm Cồn Cỏ là: 1) Mô hình đơn biến: Tức là chỉ sử dụng chuỗi số liệu quan trắc độ cao sóng có nghĩa làm đầu vào để huấn luyện mô hình. 2) Mô hình 02 biến: Sử dụng chuỗi số liệu quan trắc độ cao sóng có nghĩa và vận tốc gió tại độ cao 10m làm đầu vào để huấn luyện mô hình. Các mô hình sau khi được huấn luyện sẽ được thử nghiệm dự báo theo các hạn dự báo 06, 12, 18 và 24 giờ. Các giá trị dự báo của mô hình sau đó sẽ được so sánh lại với các giá trị thực đo để đánh giá khả năng ứng dụng của các mô hình trong thực tế.

Trong nghiên cứu này, các mô hình sử dụng mạng LSTM đã được xây dựng để dự báo độ cao sóng có nghĩa tại trạm Cồn Cỏ, Quảng Trị, Việt Nam theo các hạn dự báo 06, 12, 18 và 24 giờ. Khả năng dự báo của các mô hình được xây dựng dựa vào các yếu tố đầu vào và bộ siêu tham số thích hợp đã được lựa chọn, đánh giá bằng cách so sánh các giá trị dự báo của mô hình với quan trắc. Từ các kết quả so sánh, đánh giá, các kết luận chính của nghiên cứu được đưa ra như sau:

Độ chính xác của mô hình dự báo phụ thuộc rất lớn và chất lượng của chuỗi số liệu và các yếu tố được lựa chọn làm đầu vào. Mô hình sử dụng chuỗi số liệu 02 biến (độ cao sóng và vận tốc gió) cho độ tin cậy lớn hơn với mô hình 1 biến (chỉ sử dụng độ cao sóng), tuy nhiên độ chính xác được cải thiện không nhiều, có nghĩa là khi xem xét tới vận tốc gió độ tin cậy tăng không đáng kể với hệ số tương quan cho mô hình 1 biến và 2 biến.

Hầu hết các kịch bản dự báo đều cho độ tin cậy của các mô hình dự báo cao nhất là ở thời hạn 06 giờ, sai số tăng dần khi hạn dự báo càng xa. Do vậy, để có thể dự báo tốt cho các thời hạn xa hơn cần sử dụng kết hợp giữa số liệu quan trắc và kết quả dự báo từ mô hình số trị như là các biến đầu vào cho mô hình học máy như các nghiên cứu trước đã đề cập.

Các giá trị cực trị trong chuỗi số liệu cũng ảnh hưởng tới độ chính xác của mô hình dự báo. Nghiên cứu đã chỉ ra rằng trong quá trình huấn luyện mô hình, các điểm cực trị đã không được dự báo lại một cách chính xác hay nói cách khác mô hình đã không học được hoặc tìm ra được các trọng số tại các điểm cực trị này. Các điểm cực trị là các giá trị không thường xuyên xảy ra, chúng thường xuất hiện khi có các điều kiện thời tiết bất thường như bão, áp thấp nhiệt hay gió mùa mạnh. Do đó, trong bước phân tích và xử lý số liệu đầu vào cần phân tách riêng rẽ các cực trị này thành các sóng thành phần từ chuỗi số liệu ban đầu và coi các sóng thành phần này như là một biến đầu vào để tham gia vào quá trình huấn luyện mô hình.

Qua đánh giá độ tin cậy của mô hình cho thấy nếu có chuỗi số liệu quan trắc đủ dài và tin cậy để đảm bảo xác định các đặc tính thống kê sâu hơn thì hoàn toàn có thể xây dựng được mô hình dự báo sóng ứng dụng phương pháp học máy áp dụng được trong thực tế.

Tạp chí KTTV

  Ý kiến bạn đọc

Tin tức liên quan: