Các bước tiền xử lý yêu cầu: Thu thập dữ liệu từ các nguồn khác nhau; Lọc dữ liệu bất thường; Chuyển đổi sang dữ liệu được định dạng phổ biến sử dụng làm đầu vào NWP; Hỗ trợ các loại dữ liệu mới; Xử lý số lượng lớn dữ liệu quan trắc một cách nhanh chóng. Hiện nay, một lượng lớn dữ liệu quan trắc được đồng hóa trong hệ thống NWP hoạt động tại KMA. Các loại dữ liệu được sử dụng bao gồm: Surface, upper air, aircraft, Satellite: Radiance, Scatterometer (sea surface wind), Atmospheric Motion Wind, Radio Occultation, Ground based GNSS,… chúng được thu thập từ các nguồn: KMA, GTS, MetOffice, NOAA; EUMETSAT, CIMSS, KNMI…
Hình 1: Sơ đồ tổng quan hệ thống xử lý dữ liệu trong NWP
Hệ thống xử lý dữ liệu quan trắc (Observation Processing System) bao gồm 2 giai đoạn: Giai đoạn xử lý ban đầu (BUFR files (OPS)) bao gồm thu thập tất các các nguồn dữ liệu chuyển đổi thành BUFR files, kiểm tra file và giá trị lỗi sau đó đưa vào cơ sở dữ liệu. Giai đoạn xử lý sau OPS(observation QC) tiến hành trích xuất dữ liệu từ cơ sở dữ liệu, hiểu chỉnh và lọc các dữ liệu chất lượng thấp… (kiểm soát chất lượng dữ liệu -quality control) nhằm tạo ra bộ dữ liệu tốt nhất trước khi đưa vào đồng hóa trong mô hình. (hình 1).
Dữ liệu sau kiểm soát sẽ được đưa vào hệ thống đồng hóa trong NWP. Tuy nhiên, thông thường dữ liệu thu thập được bao gồm các nguồn khác nhau nên thời gian thu nhận dữ liệu sẽ khác nhau và cần nhiều thời gian hơn để thu thập đủ loại dữ liệu. Tại KMA, vòng erly cycle với thời gian cut-of time là 2hr40min với mục đích sử dụng dữ liệu quan trắc vừa phải (khoảng hơn 70% dữ liệu quan trắc thu nhận được) và đáp ứng kịp thời các sản phẩm cho dự báo viên; vòng late cycle với thời gian cut-of time là 6hr25min nhằm mục đích thu thập số lượng lớn dữ liệu quan trắc (100%) và tạo ra trường phân tích chính xác hơn cho chu kì tiếp theo. (hình 2)
Hình 2: Sơ đồ phân bố dữ liệu quan trắc trong hệ thống đồng hóa NWP (KMA)
Theo đánh giá, dữ liệu vệ tính đóng góp 64% trong việc giảm sai số dự báo hạn ngắn, 36% còn lại đến bởi số liệu bề mặt. Trong đó, tác động chính của dữ liệu vệ tinh đến từ LEOs (bao gồm Metop và NOAA) đóng góp khoảng 58%.
Việc kiểm soát chất lượng dữ liệu tốt đem lại lợi ích không nhỏ cho các sản phẩm đầu ra của mô hình. Sai sót trong dữ liệu đầu vào sẽ làm tăng sai số trong chất lượng dự báo của NWP. Thống kê chất lượng dự báo của ECMWF, UK, JMA, KMA trong 2 tháng 10, 11/2011 cho thấy sự gia tăng đột biến sai số dự báo của JMA và KMA. Nguyên nhân này được bắt nguồn từ nhầm lẫn trong đầu vào của dữ liệu bề mặt (số liệu thiếu từ -999 được chuyển thành giá trị O) (hình 3).
Hình 3: Đồ thị biểu diễn sai số bình phương trung bình RMSE (a) đối với biến độ cao địa thế vị từ ECMWF, JMA, KMA(UM,GDAPS), UK với các hạn 72h, 120h và NWP index (b)
Vai trò của các loại dữ liệu quan trắc cũng như kiểm soát chất lượng dữ liệu trong hệ thống NWP ngày càng được quan tâm trong xu thế hiện nay. Do vậy, kết hợp việc thu thập dữ liệu quan trắc cần xây dựng đồng bộ quá trình kiểm soát chất lượng dữ liệu đầu vào trong đồng hóa dữ liệu để đạt hiệu quả tốt nhất.
Nguồn:
1. Changhwan Kim 2019 (KMA); Observation Data processing
2. Eunhee Lee 2019 (NMC/KMA); Quality control of NWP data
Tin biên dịch: Tôn Thị Thảo - Đài Khí tượng Thủy văn khu vực Trung Trung Bộ
Tổng hợp: Vụ KHQT