Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương

Đã có rất nhiều mô hình giải pháp được đề xuất và ứng dụng

trong dự báo thông số khí tượng, tuy nhiên cho tới thời điểm

này vẫn chưa có một mô hình nào được coi là chuẩn và áp

dụng hiệu quả cho mọi đối tượng. Một trong những nguyên

nhân chính của vấn đề này là do ở mỗi vùng, mỗi khu vực các

thông số khí tượng phụ thuộc khác nhau vào các số liệu trong

quá khứ. Sự khác nhau này đòi hỏi phải điều chỉnh lại các

thông số của một mô hình đã được lựa chọn nào đó hoặc đến

mức độ phải xây dựng một mô hình hoàn toàn mới. Cũng vì lý

do đó, nên nếu ta sử dụng các giải pháp hoặc phần mềm có sẵn

của nước ngoài thì sẽ gặp một số hạn chế như sau:

− Không được chủ động về công nghệ, thuật toán, giải pháp,

các hạ tầng kèm theo;

− Các phần mềm của nước ngoài thường có yêu cầu phức

tạp về thông tin đầu vào (ảnh vệ tinh, hệ thống đo trên nhiều

tầng khí quyển, ), chi phí thu thập thông tin đầu vào cao, các

hệ thống tính toán cấu hình lớn (yêu cầu máy chủ mạnh hoặc

mạng nhiều máy tính chạy song song), sử dụng phức tạp;

− Không chủ động trong việc điều chỉnh các thông số, điều

chỉnh các yêu cầu của người sử dụng tại địa phương,.

pdf 27 trang dienloan 5020
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương

Luận án Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh Hải Dương
- 1 - 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI 
ĐỖ VĂN ĐỈNH 
XÂY DỰNG MÔ HÌNH DỰ BÁO 
MỘT SỐ THÔNG SỐ KHÍ TƯỢNG CHO ĐỊA BÀN 
TỈNH HẢI DƯƠNG 
Ngành : Kỹ thuật điều khiển và tự động hóa 
Mã số : 9520216 
TÓM TẮT LUẬN ÁN TIẾN SĨ 
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA 
Hà Nội - 2018 
 - 2 - 
 Công trình được hoàn thành tại: 
Trường Đại học Bách khoa Hà Nội 
Người hướng dẫn khoa học: 
1. PGS.TSKH. Trần Hoài Linh 
2. TS. Đinh Văn Nhượng 
Phản biện 1: GS. TSKH. Thân Ngọc Hoàn 
Phản biện 2: PGS. TS. Phạm Trung Dũng 
Phản biện 3: PGS. TS. Nguyễn Viết Lành 
Luận án được bảo vệ trước Hội đồng đánh giá luận án tiến sĩ 
cấp Trường họp tại Trường Đại học Bách khoa Hà Nội 
 Vào hồi .. giờ, ngày .. tháng .. năm  
Có thể tìm hiểu luận án tại thư viện: 
 1. Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội 
 2. Thư viện Quốc gia Việt Nam 
- 1 - 
MỞ ĐẦU 
1. Tính cấp thiết của đề tài 
Đã có rất nhiều mô hình giải pháp được đề xuất và ứng dụng 
trong dự báo thông số khí tượng, tuy nhiên cho tới thời điểm 
này vẫn chưa có một mô hình nào được coi là chuẩn và áp 
dụng hiệu quả cho mọi đối tượng. Một trong những nguyên 
nhân chính của vấn đề này là do ở mỗi vùng, mỗi khu vực các 
thông số khí tượng phụ thuộc khác nhau vào các số liệu trong 
quá khứ. Sự khác nhau này đòi hỏi phải điều chỉnh lại các 
thông số của một mô hình đã được lựa chọn nào đó hoặc đến 
mức độ phải xây dựng một mô hình hoàn toàn mới. Cũng vì lý 
do đó, nên nếu ta sử dụng các giải pháp hoặc phần mềm có sẵn 
của nước ngoài thì sẽ gặp một số hạn chế như sau: 
− Không được chủ động về công nghệ, thuật toán, giải pháp, 
các hạ tầng kèm theo; 
− Các phần mềm của nước ngoài thường có yêu cầu phức 
tạp về thông tin đầu vào (ảnh vệ tinh, hệ thống đo trên nhiều 
tầng khí quyển,), chi phí thu thập thông tin đầu vào cao, các 
hệ thống tính toán cấu hình lớn (yêu cầu máy chủ mạnh hoặc 
mạng nhiều máy tính chạy song song), sử dụng phức tạp; 
− Không chủ động trong việc điều chỉnh các thông số, điều 
chỉnh các yêu cầu của người sử dụng tại địa phương,... 
Để khắc phục những tồn tại trên, luận án đề xuất: 
− Xây dựng giải pháp cho hai bài toán dự báo và ước lượng 
thông số khí tượng phổ biến là: mô hình dự báo ngắn hạn thông 
số khí tượng dựa vào kết quả đo trong quá khứ và mô hình ước 
lượng thông số khí tượng dựa trên kết quả đo của các trạm 
quan trắc lân cận; 
− Các giải pháp đạt hướng đến mục tiêu: thông tin đầu vào 
ít, dễ thu thập ở điều kiện Việt Nam nhưng vẫn đảm bảo được 
độ chính xác phù hợp, chủ động trong thuật toán để thuận tiện 
cho các việc điều chỉnh mô hình nhằm tối ưu hóa theo số liệu 
địa phương. 
- 2 - 
2. Mục đích nghiên cứu 
1. Xây dựng mô hình dự báo ngắn hạn thông số khí tượng 
(thử nghiệm với hai thông số là nhiệt độ và độ ẩm) dựa trên các 
kết quả đo quá khứ, 
2. Xây dựng mô hình ước lượng thông số khí tượng dựa trên 
các kết quả đo cùng thời điểm tại các điểm đo lân cận. 
Các mô hình dự báo hướng tới mục tiêu và đạt yêu cầu: 
− Dự báo được thông số khí tượng cho nhiều địa điểm; 
− Thu thập số liệu không quá phức tạp; 
− Hạ tầng tính toán không cần quá cao; 
− Làm chủ được công nghệ xây dựng mô hình dự báo và 
ước lượng thông số khí tượng. 
3. Đối tượng và phạm vi nghiên cứu 
3.1. Đối tượng nghiên cứu 
− Các mô hình ước lượng phi tuyến để ứng dụng trong bài 
toán dự báo và bài toán ước lượng; 
− Bộ số liệu do Đài Khí tượng và Thủy văn Khu vực Đồng 
bằng Bắc Bộ cung cấp: 8 thông số quan trắc (nhiệt độ lớn nhất, 
nhỏ nhất; độ ẩm lớn nhất, nhỏ nhất; tốc độ gió lớn nhất, nhỏ 
nhất; lượng mưa trung bình và số giờ nắng trong ngày); 7 địa 
điểm quan trắc (tỉnh Thái Bình, Hưng Yên, Bắc Ninh, Quảng 
Ninh, thị xã Chí Linh, thành phố Hải Phòng và thành phố Hải 
Dương); thời gian quan trắc từ 01/01/2010 đến 31/12/2015. 
− Phần mềm mô phỏng sử dụng trong luận án: Matlab 7.11 
(R2010b) và thư viện LS-SVM1.8; 
3.2. Phạm vi nghiên cứu 
− Nghiên cứu về lý thuyết và các mô hình dự báo thông số 
khí tượng; các mô hình ứng dụng mạng nơ-rôn nhân tạo trong 
bài toán ước lượng, dự báo thông số khí tượng; 
− Xây dựng mô hình mạng nơ-rôn dự báo, ước lượng thông 
số khí tượng (nhiệt độ, độ ẩm lớn nhất và nhỏ nhất trong ngày) 
cho địa bàn tỉnh Hải Dương dựa trên kết quả đo trong quá khứ 
và các điểm quan trắc lân cận. 
- 3 - 
4. Phương pháp nghiên cứu 
− Thu thập số liệu: các bộ số liệu đo như đã nêu trên. 
− Thực nghiệm: đánh giá sai số của các mô hình trên cùng 
bộ mẫu số liệu, lựa chọn mô hình có sai số kiểm tra nhỏ nhất. 
5. Ý nghĩa khoa học và thực tiễn của đề tài 
5.1. Ý nghĩa khoa học 
Đề xuất phương pháp ứng dụng kỹ thuật SVM trong mô 
hình lai để phân tích, xử lý và dự báo một số thông số khí 
tượng điển hình là nhiệt độ và độ ẩm: 
− Xây dựng mô hình dự báo nhiệt độ, độ ẩm lớn nhất và nhỏ 
nhất dựa trên các kết quả đo trong quá khứ; 
− Xây dựng mô hình ước lượng nhiệt độ, độ ẩm lớn nhất và 
nhỏ nhất dựa trên các kết quả đo của các khu vực lân cận. 
5.2. Ý nghĩa thực tiễn của đề tài 
Góp phần bổ sung số lượng các giải pháp để tạo điều kiện 
cho việc lựa chọn ứng dụng thực tế được dễ dàng hơn. Phương 
pháp chỉ yêu cầu sử dụng số liệu đo quan trắc trong quá khứ 
hoặc kết quả đo quan trắc ở các khu vực lân cận để dự báo, ước 
lượng thông số khí tượng nên việc thu thập số liệu cũng khá đơn 
giản, tính kinh tế cao. 
6. Những đóng góp của luận án 
Luận án có đóng góp sau: 
− Đã đề xuất mô hình lai gồm khối tuyến tính và SVM để áp 
dụng cho các bài toán ước lượng phi tuyến. Mô hình lai này có 
độ chính xác cao hơn mô hình SVM và một số mô hình phi 
tuyến khác; 
− Sử dụng mô hình lai đề xuất để xây dựng giải pháp có độ 
chính xác cao cho bài toán dự báo thông số khí tượng dựa trên 
kết quả đo trong quá khứ; 
− Sử dụng mô hình lai đề xuất để xây dựng giải pháp có độ 
chính xác cao cho bài toán ước lượng thông số khí tượng dựa 
trên kết quả đo của các trạm quan trắc lân cận. 
- 4 - 
7. Bố cục của luận án 
Mở đầu: Trình bày các vấn đề chung của luận án, tóm tắt 
nội dung nghiên cứu, những đóng góp và bố cục của luận án. 
Chương 1. Tổng quan về các mô hình dự báo thông số khí 
tượng: Trong chương này sẽ trình bày tóm tắt một số mô hình 
dự báo khí tượng đã được áp dụng trong điều kiện thực tế hiện 
nay. Từ đó định hướng nghiên cứu của luận án và mô tả khái 
quát các bộ số liệu sử dụng trong luận án. 
Chương 2. Mô hình lai và ứng dụng trong các vấn đề mô 
hình hóa phi tuyến: Luận án trình bày về mô hình lai gồm cơ 
chế làm việc của mô hình, phương pháp xây dựng mô hình phù 
hợp cho các bộ thông số và ứng dụng nó trong mô hình phi 
tuyến. Ngoài ra, luận án trình bày một số ví dụ ứng dụng mô 
hình lai để ước lượng hàm phi tuyến đã được trình bày để minh 
họa cho khả năng tốt của mô hình lai trong các vấn đề này. 
Chương 3. Xây dựng các giải pháp dự báo, ước lượng sử 
dụng mô hình lai: luận án trình bày cách xây dựng mô hình lai. 
Chương 4. Các kết quả tính toán và mô phỏng: Trình bày 
các kết quả nghiên cứu đã được đề xuất ở chương 3, đánh giá 
độ chính xác của các mô hình đã đề xuất. 
Tiếp theo các kết luận và kiến nghị của luận án với những 
vấn đề cần nghiên cứu tiếp, tài tài liệu tham khảo, các công trình 
đã công bố quan đến luận án và phần phụ lục. 
Chương 1: TỔNG QUAN VỀ CÁC MÔ HÌNH DỰ BÁO 
THÔNG SỐ KHÍ TƯỢNG 
1.1. Đặt vấn đề 
Trình bày tổng quan về các mô hình dự báo thông số khí 
tượng, các phương pháp dự báo khí tượng, các mô hình dự báo 
đang được ứng dụng trên thế giới, ở Việt Nam và một số đề 
xuất nghiên cứu của luận án. 
- 5 - 
1.2. Một số phương pháp dự báo thông số khí tượng 
Với sự phát triển của khoa học kĩ thuật, rất nhiều mô hình dự 
báo thông số khí tượng đã ra đời [12, 15, 16, 19, 24, 27] và được 
đưa vào ứng dụng trong dự báo nghiệp vụ tại nhiều trung tâm dự 
báo khí tượng trên thế giới. Hiện nay, trên thế giới có rất nhiều 
nghiên cứu về phương pháp dự báo thông số khí tượng, các 
nghiên cứu này được chia làm một số nhóm phương pháp chính 
như sau: Phương pháp synopse [27]; Phương pháp thống kê 
(Statistical methods) [22, 65, 79]; Phương pháp số trị 
(Numerical methods) [10, 27, 36]. 
− Phương pháp dự báo phối kết hợp (Ensemble forecast 
methods) [61, 83]. 
 1.3. Các mô hình dự báo thông số khí tượng được ứng dụng 
trên thế giới 
Những nghiên cứu trên thế giới từ trước tới nay đã cho thấy 
tính ưu việt của các mô hình số trị, các mô hình này được chia 
thành bốn nhóm nhưng chủ yếu được chia làm hai loại cơ bản: 
các mô hình số trị toàn cầu và các mô hình số trị khu vực. Sau 
đây là một số mô hình số trị toàn cầu và khu vực đã được 
nghiên cứu, phát triển ở trong và ngoài nước. 
1.3.1. Một số mô hình số trị toàn cầu 
Mô hình dự báo các trường số trị toàn cầu RHMC [95] do 
cơ quan Khí tượng Thuỷ văn Liên bang Nga xây dựng và đưa 
vào dự báo nghiệp vụ với các hạn dự báo cách nhau 6h một lần 
từ 12h đến 240h (10 ngày). Mô hình có ký hiệu T85L31. 
Mô hình GME [53] (Global Model for Europe) được Cơ quan 
Khí tượng Cộng hòa Liên bang Đức (DWD) đưa vào dự báo 
nghiệp vụ từ cuối năm 1999 (độ phân giải khoảng 60 km). GME 
là mô hình được xây dựng cho 06 biến là nhiệt độ, khí áp, hơi 
nước, nước lỏng trong mây và hai thành phần gió ngang. 
Mô hình AVN của Trung tâm Quốc gia Dự báo Môi trường 
Mỹ (National Centers for Environmental Prediction - NCEP) 
[92] là mô hình phổ dự báo hạn ngắn toàn cầu. Mô hình dự báo 
hạn vừa MRF (Medium Range Forecast Model) của NCEP 
- 6 - 
(Mỹ) là mô hình phổ sử dụng hệ toạ độ theo phương thẳng 
đứng. Đây là một trong những mô hình dự báo với hạn dự báo 
lớn hơn 48h đầu tiên trên thế giới. Mô hình MRF có độ phân 
giải ngang khoảng 150 km và đã được đưa vào dự báo nghiệp 
vụ tại Mỹ từ năm 1995. Hiện nay, NCEP thực hiện dự báo hạn 
vừa và dài (đến 384h hay 16 ngày) bằng mô hình MRF. 
Mô hình GFS (Global Forecasting System) [92] cũng của 
NCEP là mô hình phổ toàn cầu, bắt đầu được đưa vào sử dụng 
nghiệp vụ tại Trung tâm Khí tượng quốc gia NMC (National 
Meteorological Centre), tiền thân của NCEP từ năm 1988. 
Mô hình GSM (Global Spectral Model) [93] là mô hình phổ 
toàn cầu của Cơ quan Khí tượng Nhật Bản (JMA). GSM bắt 
đầu được đưa vào sử dụng nghiệp vụ tại JMA từ năm 1988. 
1.3.2. Mô hình số trị khu vực 
a. Mô hình ETA [59, 66] 
Mô hình khu vực hạn chế ETA do Trường Đại học Belgrade 
và Viện Khí tượng Thuỷ văn Belgrade cùng với Trung tâm Khí 
tượng quốc tế Mỹ xây dựng và được áp dụng cho đối tượng đặc 
biệt là khu vực có địa hình núi. 
b. Mô hình RAMS (Regional Atmospheric Modeling System) [67] 
Phiên bản đầu tiên của mô hình RAMS ra đời vào năm 
1993, là kết quả kết hợp của hai mô hình có những tính chất 
giống nhau: mô hình mây quy mô vừa của Tripoli và Cotton và 
mô hình mây thuỷ tĩnh của Tremback. 
c. Mô hình HRM (High Resolution Regional Model) [90] 
HRM là một mô hình số thuỷ tĩnh cho dự báo thời tiết khu 
vực hạn chế quy mô vừa, sử dụng hệ phương trình bao gồm 
nhiều đối tượng vật lý như: bức xạ, mô hình đất, các quá trình 
rối trong lớp biên, tạo mưa theo lưới, đối lưu nông/sâu,... 
d. Mô hình WRF (Weather Research and Forecasting) [97] 
Mô hình WRF được hình thành bởi Trung tâm quốc gia 
Nghiên cứu Khí quyển Mỹ (National Center of Atmospheric 
Research-NCAR) với đóng góp của nhiều cơ quan khí tượng và 
đại học ở Hoa Kỳ cũng như trên thế giới. 
- 7 - 
e. Mô hình MM5 [94] 
Mô hình khí tượng động lực quy mô vừa MM5 là một trong 
những mô hình thế hệ mới của NCAR và Trường Đại học Tổng 
hợp Pennsylvania Mỹ (PSU). MM5 đang được nhiều cơ quan 
chính phủ (như Nha Khí Tượng Hoa Kỳ và NASA) cũng như 
nhiều trường đại học danh tiếng ở Hoa Kỳ và các quốc gia khác 
trên thế giới như tại Âu Châu, Hồng Kông và Đài Loan dùng 
để làm dự báo thời tiết. 
1.4. Các mô hình dự báo khí tượng được ứng dụng ở Việt Nam 
Qua nghiên cứu và tìm hiểu, hiện nay 100% các mô hình dự 
báo thời tiết đang nghiên cứu và khai thác ứng dụng tại Việt 
Nam đều được nhập ngoại, chủ yếu là sử dụng các mô hình số 
trị khu vực như đã tóm tắt ở trên. 
1.5. Một số mô hình dự báo thông số khí tượng dùng mạng nơ rôn 
Mạng nơ-rôn nhân tạo (Artificial Neural Networks-ANN) là 
một trong những công cụ mô hình hóa phi tuyến được sử dụng 
phổ biến hiện nay do nhiều ưu điểm nổi bật như: có thuật toán 
học để điều chỉnh tự động các thông số của mạng để giảm sai 
số trên bộ số liệu mẫu, có thể lựa chọn cấu trúc đơn giản hoặc 
phức tạp để phù hợp với đối tượng mô phỏng [38,48,51,60,75]. 
Có nhiều dạng mạng đã được đề xuất và ứng dụng như mạng 
MLP (Multi Layer Perceptron), mạng Hopfield, mạng Elman, 
mạng RBF (Radial Basis Function), mạng lô-gic mờ [49,50, 
63,77,78]... Gần đây là các mạng Deep Learning [57]. Các ứng 
dụng trong mô hình phi tuyến nói chung và trong các bài toán 
dự báo thông số thời tiết, khí tượng, môi trường của các mạng 
nói riêng cũng rất phong phú. 
Nội dung chương I đề cập tới 2 nhóm giải pháp: một là 
nhóm các giải pháp thương mại đang được sử dụng trong thực 
tế, hai là nhóm các giải pháp (đang ở mức độ nghiên cứu, mô 
phỏng) được giới thiệu trong các tài liệu tham khảo. Đối với 
các giải pháp thương mại, do đều là các phần mềm mã nguồn 
đóng nên không có đầy đủ các thông tin về giải pháp ứng dụng 
bên trong. Nhược điểm chung của các giải pháp này là yêu cầu 
- 8 - 
cao về thông số đầu vào và hạ tầng tính toán, giá thành đắt, khó 
chủ động cập nhật hay điều chỉnh theo yêu cầu của địa phương. 
Đối với các giải pháp tổng hợp từ các bài báo khoa học, NCS 
đã tìm hiểu và trình bày nhiều hơn về các mô hình toán học 
cũng như một số thông số được các tác giả đưa ra. Tuy nhiên 
khó khăn chung khi so sánh đó là mỗi mô hình được sử dụng 
cho các địa điểm khác nhau, thông số đầu vào và đầu ra cũng 
khác nhau. Vì vậy các so sánh mới dừng ở mức độ nhất định. 
1.6. Đề xuất của luận án 
Hiện nay, việc áp dụng các mô hình dự báo thông số khí 
tượng tiên tiến hiện nay không phù hợp với điều kiện ở Hải 
Dương do: 
− Kinh phí thu thập số liệu quá lớn. 
− Hạ tầng máy tính và công nghệ thông tin không đáp ứng. 
− Không chủ động về công nghệ nên khó điều chỉnh các 
thông số của mô hình cho phù hợp với tỉnh Hải Dương. 
Để khắc phục những tồn tại trên luận án đề xuất giải pháp 
thực hiện các nhiệm vụ sau: 
− Dự báo thông số khí tượng cho nhiều địa điểm; 
− Thu thập số liệu không quá phức tạp; 
− Hạ tầng máy tính không cần quá cao; 
− Xây dựng các mô hình ước lượng và dự báo phù hợp với 
thực tế tại Hải Dương. 
Chương 2: MÔ HÌNH LAI VÀ ỨNG DỤNG TRONG CÁC 
VẤN ĐỀ MÔ HÌNH HÓA PHI TUYẾN 
2.1. Giới thiệu chung 
Đã có nhiều công trình nghiên cứu chứng minh rằng công cụ 
mạng véc-tơ hỗ trợ SVM (Support Vector Machines) có khả 
năng tốt hơn không chỉ trong các bài toán nhận dạng và phân 
loại các mẫu rời rạc mà còn trong cả các bài toán ước lượng 
các hàm phi tuyến [70, 76, 85]. Trong luận án này NCS đề xuất 
tiếp tục cải thiện chất lượng sử dụng của SVM bằng việc tách 
- 9 - 
riêng thành phần tuyến  ...  các đầu vào được sử dụng cho từng mô 
hình sẽ được xác định độc lập (và danh sách đầu vào cũng sẽ 
khác nhau cho từng mô hình). Trước tiên thành phần quan hệ 
tuyến tính giữa thông số iT của ngày d với chính thông số iT 
đó của các ngày quá khứ được biểu diễn và xác định từ hệ 
phương trình ước lượng xấp xỉ như trong công thức (3.1) và 
(3.2). Từ (3.2) ta cần xác định véc-tơ  1 2, , ,
T
Ka a a=a để đạt 
cực tiểu của hàm sai số ước lượng. Trong thực tế áp dụng, ta 
xác định xem các đầu vào cho mô hình dự báo sẽ là các số liệu 
- 14 - 
gì trong quá khứ: 
( )
( )
( )
1
2
( )( 1) ( 2)
( 1)( 2) ( 3) 1
( 1)( ) ( 1) 1
ii i i
ii i i
ii i i K
T dT d T d T d K a
T dT d T d T d K a
T d pT d p T d p T d p K a
− − − 
 −− − − −  =
− +− − − − − − 
(3.1) 
Trước tiên danh sách các đầu vào quá khứ sẽ được tìm kiếm 
theo ý tưởng đã được trình bày ở Chương 2 trong một khoảng 
thời gian đủ xa (Luận án chọn K=60 - tương đương 2 tháng 
trong quá khứ) để thử nghiệm. 
Ví dụ, nếu sử dụng phương pháp đánh giá theo hệ số khai 
triển tuyến tính, ta sẽ xét với K đầu vào quá khứ với bộ số liệu 
nhiều mẫu đã có, ta xác định véc-tơ  1, ,
T
Ka a=a của hàm 
ước lượng tuyến tính ( )
1
( )
p
i j ij
T d a T d j
=
  −  bằng 
phương pháp khai triển ma trận dùng SVD. Tiếp theo xác định 
thành phần có giá trị tuyệt đối nhỏ nhất trong véc-tơ a. Thành 
phần này sẽ tương ứng với ngày trong quá khứ có ảnh hưởng ít 
nhất tới ngày dự báo tiếp theo. Ta loại bỏ ngày này khỏi bộ số 
liệu trong quá khứ, giảm K=K-1, và quay lại bước 2 nếu K > 
Kmin chọn trước. Quá trình lặp các bước 2-3 sẽ được tiếp tục 
cho đến khi K giảm xuống một giá trị đủ nhỏ có thể chấp nhận 
được để mô hình không quá phức tạp, khó sử dụng trong thực 
tế. Cụ thể trong luận án ta chọn Kmin<5. 
Tương tự như vậy, ta xây dựng hàm quan hệ tuyến tính giữa 
iT của ngày d với các thông số kT khác ( )1, , ;k N k i= của 
các ngày trong quá khứ ta được phương trình như trong công 
thức sau: ( ) ( ) ( )1i j i jk k
j k i j
T d a T d j a T d j
  − +  − 
   
Sau khi đã xác định được mối quan hệ tuyến tính giữa ( )iT d 
của ngày d với các ngày trong quá khứ, ta tính sai số lệch giữa 
- 15 - 
số liệu thực tế và số liệu ước lượng trong phương trình: 
( ) ( ) ( )1( ) i j i jk k
j k i j
NL d T d a T d j a T d j
  
= −  − +  − 
 
   
(3.2) 
được coi là phần phụ thuộc phi tuyến còn lại giữa iT với các 
đầu vào và sẽ là giá trị đích mà khối phi tuyến cần tạo ra. 
3.2.3. Xây dựng khối phi tuyến của mô hình lai 
Sau khi đã xác định được các thông số mô hình tuyến tính, 
ta tiến hành xây dựng mô hình phi tuyến để ước lượng thành 
phần phi tuyến còn lại (phương trình 3.2). 
3.3. Xây dựng mô hình lai cho bài toán ước lượng 
3.3.1. Bài toán ước lượng thông số khí tượng 
 Giả thiết rằng ta có kết quả đo các thông số khí tượng dựa 
kết quả đo quan trắc ở các điểm A1, A2,, AN. Mục tiêu đặt ra 
là ta cần ước lượng thông số khí tượng tại điểm B (vị trí không 
có trạm quan trắc), khi đó ta cần xây dựng hàm quan hệ (thông 
thường đây là quan hệ phi tuyến) giữa thông số khí tượng tại 
điểm B và tại các điểm Ai có dạng tổng quát như sau: 
 ( ) ( ) ( ) ( )( )1 2, , , , , , ,NT B d g T A d T A d T A d= (3.3) 
trong đó T - thông số khí tượng cần ước lượng, d – ngày đang 
xét; hàm g() là phi tuyến (cần xây dựng). Hàm phi tuyến g() sẽ 
được sử dụng mô hình lai để ước lượng. Mô hình (3.3) cũng có 
thể được sử dụng để bù dữ liệu khuyết thiếu tại điểm B. Ngoài 
ra, mô hình (3.3) có thể đực phát triển phát triển cho việc ước 
lượng thông số T khác (ví dụ để ước lượng Tmax có thể dùng 
RHmax của điểm lân cận,...). 
Từ (3.3) ta ước lượng thông số khí tượng tại 02 địa điểm 
(thành phố Hải Dương, thị xã Chí Linh) dựa trên kết quả đo 
của 05 trạm quan trắc lân cận. 
, , , , , , , , , ,T HD d g T TB d T BN d T QN d T HP d T HY d
 (3.4a) 
- 16 - 
và 
, , , , , , , , , ,T CL d g T TB d T BN d T QN d T HP d T HY d
 (3.4b) 
Từ bộ số liệu đã có, luận án sẽ xây dựng bốn mô hình ước 
lượng cho bốn thông số là Tmax, Tmin, RHmax và RHmin. 
3.3.2. Xác định các thông số đầu vào cho mô hình ước lượng 
Thực hiện tính toán mô phỏng với các bộ đầu vào khác nhau 
cho cùng một địa điểm (ở đây là thành phố Hải Dương hoặc thị 
xã Chí Linh) và cùng một thông số khí tượng (nhiệt độ lớn 
nhất, nhỏ nhất trong ngày, độ ẩm lớn nhất, nhỏ nhất trong 
ngày) để xác định xem cần sử dụng thông tin từ các địa điểm 
lân cận nào để đạt kết quả chính xác nhất. 
3.4. Kết luận chương 3 
− Xây dựng mô hình lai cho bài toán dự báo: phân tích, lựa 
chọn các đặc tính đầu vào cho mô hình, xây dựng mô hình xác 
định thành phần tuyến tính và phi tuyến. 
− Xây dựng mô hình lai cho bài toàn ước lượng: xây dựng 
các kịch bản cho bài toán ước lượng thông số khí tượng dựa 
trên kết quả đo của các trạm quan trắc lân cận. 
Chương 4: CÁC KẾT QUẢ TÍNH TOÁN VÀ MÔ PHỎNG 
4.1. Đặt vấn đề 
Với quy trình xây dựng mô hình như ở chương 3, tiến hành 
tính toán thực nghiệm trên bộ số liệu do Đài Khí tượng thủy 
văn và Biến đổi khí hậu khu vực đồng bằng Bắc Bộ cung cấp. 
4.2. Đánh giá, lựa chọn đặc tính đầu vào cho các mô hình 
Thực nghiệm với 3 phương pháp khác nhau gồm PCA, hàm 
tương quan, khai triển theo hệ số tuyến tính trên cùng bộ số 
liệu đầu vào. Kết quả thực nghiệm phương pháp khai triển theo 
hệ số tuyến tính cho sai số nhỏ nhất và được chọn để xác định 
thành phần tuyến tính trong mô hình lai. 
- 17 - 
 4.3. Kết quả dự báo, ước lượng thông số khí tượng theo 
chuỗi thời gian 
4.3.1. Kết quả xây dựng mô hình lai dự báo thông số khí tượng theo 
chuỗi thời gian 
a. Lựa chọn đặc tính đầu vào cho các mô hình dự báo và xác 
định thành phần tuyến tính 
Sử dụng phương pháp khai triển theo hệ số tuyến tính xác 
định thành phần tuyến tính trong mô hình lai. Kết quả sau khi 
trích chọn đặc tính ta có số liệu các ngày quá khứ ảnh hưởng 
đến ngày dự báo d+1: Tmax (19 đầu vào), Tmin (18 đầu vào), 
RHmax (22 đầu vào), RHmin (19 đầu vào). 
b. Xác định thành phần phi tuyến 
Sai số còn lại sau khi ước lượng thành phần tuyến tính chính 
là giá trị đích cần đạt được của khối phi tuyến. Sử dụng các mô 
hình mạng nơ-rôn khác nhau để huấn luyện mô hình mạng như: 
MLP, MLR, RBF, Elman, BTree, SVM và đánh giá, so sánh 
kết quả sai số. Kết quả SVM cho kết quả sai số tuyệt đối trung 
bình nhỏ nhất và được chọn là mạng nơ-rôn để xác định thành 
phần phi tuyến. 
Hình 4.1 là sai số học và kiểm tra khi xác định thành phần 
phi tuyến với Tmax cho sai số tuyệt đối trung bình 
(MAE=1,38oC). 
Hình 4.1: Sai số học và sai số kiểm tra khi xác định 
thành phần phi tuyến dự báo Tmax trong mô hình lai 
- 18 - 
Hình 4.2 là sai số học và kiểm tra khi xác định thành phần 
phi tuyến với Tmin cho sai số tuyệt đối trung bình 
(MAE=0,97oC). 
Hình 4.2: Sai số học và sai số kiểm tra khi xác định 
thành phần phi tuyến dự báo Tmin trong mô hình lai 
Hình 4.3 là sai số học và kiểm tra khi xác định thành phần 
phi tuyến với RHmax cho sai số tuyệt đối trung bình 
(MAE=3,35%). 
Hình 4.3: Sai số học và sai số kiểm tra khi xác định 
thành phần phi tuyến dự báo RHmax trong mô hình lai 
- 19 - 
Hình 4.4 là sai số học và kiểm tra khi xác định thành phần 
phi tuyến với RHmin cho sai số tuyệt đối trung bình 
(MAE=6,23%). 
Hình 4.4: Sai số học và sai số kiểm tra khi xác định 
thành phần phi tuyến dự báo RHmin trong mô hình lai 
4.3.2. Kết quả xây dựng mô hình lai ước lượng thông số khí tượng 
theo chuỗi thời gian 
Tiến hành thử nghiệm ước lượng thông số khí tượng tại 
thành phố Hải Dương, thị xã Chí Linh dựa trên kết quả đo của 
trạm quan trắc của 05 địa điểm lân cận gồm tỉnh Bắc Ninh, 
Thái Bình, Hưng Yên, Thành phố Hải Phòng, tỉnh Quảng Ninh. 
Hình 4.5: Kết quả kiểm tra ước lượng Tmax tại thành phố Hải Dương 
cho các tổ hợp đầu vào khác nhau 
- 20 - 
Thực hiện kiểm tra thử nghiệm với 25 trường hợp chia làm 
03 nhóm theo số lượng tỉnh lân cận đầu vào từ 2 đến 4. Kết quả 
cả thành phố Hải Dương và thị xã Chí Linh đều có thể sử dụng 
chung một mô hình gồm 4 trạm lân cận là Bắc Ninh, Quảng 
Ninh, Hải Phòng, Hưng Yên. Các hình 4.5÷4.8 là kết quả kiểm 
tra tại thành phố Hải Dương cho các tổ hợp đầu vào khác nhau 
khi ước lượng Tmax (sai số MAE=0,48oC), Tmin (MAE=0,37oC), 
RHmax (MAE=2,23%), RHmin (MAE=3,59%) 
Hình 4.6: Kết quả kiểm tra ước lượng Tmin tại thành phố Hải Dương 
cho các tổ hợp đầu vào khác nhau 
Hình 4.7: Kết quả kiểm tra ước lượng RHmax tại thành phố Hải 
Dương cho các tổ hợp đầu vào khác nhau 
Hình 4.8: Kết quả kiểm tra ước lượng RHmin tại thành phố Hải 
Dương cho các tổ hợp đầu vào khác nhau 
- 21 - 
Hình 4.9; 4.10 là các kết quả kiểm tra tại thị xã Chí Linh cho 
các tổ hợp đầu vào khi ước lượng Tmax (sai số MAE=0,58oC), 
Tmin (sai số MAE=0,43oC) 
Hình 4.9: Kết quả kiểm tra ước lượng Tmax tại thị xã Chí Linh cho 
các tổ hợp đầu vào khác nhau 
Hình 4.10: Kết quả kiểm tra ước lượng Tmin tại thị xã Chí Linh cho 
các tổ hợp đầu vào khác nhau 
Hình 4.11; 4.12 là các kết quả kiểm tra tại thị xã Chí Linh 
cho các tổ hợp đầu vào khi ước lượng RHmax (sai số 
MAE=3,05%), RHmin (sai số MAE=3,96%) 
Hình 4.11: Kết quả kiểm tra ước lượng RHmax tại thị xã Chí Linh 
cho các tổ hợp đầu vào khác nhau 
- 22 - 
Hình 4.12: Kết quả kiểm tra ước lượng RHmin tại thị xã Chí Linh 
cho các tổ hợp đầu vào khác nhau 
4.4. Kết quả dự báo, ước lượng thông số khí tượng theo mùa 
Theo [6, 96] chia bộ dữ liệu trong năm thành 4 mùa/năm: 
Mùa xuân từ 01/3 đến 31/5; Mùa hè từ 01/6 đến 31/8; Mùa thu 
từ 01/9 đến 30/11; Mùa đông từ 01/121 đến 328/02 (hoặc 29/02 
nếu năm nhuận). 
Với 2191 ngày dữ liệu (từ 01/01/2010 đến 31/12/2015) và 
cách phân chia mùa trong năm theo [6, 96], ta có 04 bộ số liệu 
theo mùa: 
− Bộ số liệu mùa xuân (552 ngày số liệu); 
− Bộ số liệu mùa hè (552 ngày số liệu); 
− Bộ số liệu mùa thu (546 ngày số liệu); 
− Bộ số liệu mùa đông (541 ngày số liệu). 
4.4.1. Kết quả xây dựng mô hình dự báo thông số khí tượng 
theo mùa 
Sử dụng mô hình lai, kết quả thực nghiệm cho thấy dự báo 
ngắn hạn theo mùa cho sai số trung bình cộng các mùa từ 1,41oC 
đến 1,80oC (đối với nhiệt độ) và từ 4,63% đến 7,26% (đối với độ 
ẩm). Qua kết quả này cho thấy dự báo theo mùa cho sai số nhỏ 
hơn tuy nhiên phải sử dụng tới 4 mô hình. Sự chênh lệch sai số 
giữa dự báo theo chuỗi thời gian và dự báo theo mùa không nhiều, 
để sử dụng ít mô hình thì sử dụng mô hình dự báo theo chuỗi thời 
gian sẽ hiệu quả hơn và đây cũng là đề xuất của luận án. 
- 23 - 
4.4.2. Kết quả xây dựng mô hình ước lượng thông số khí 
tượng theo mùa 
Thực hiện ước lượng thông số khí tượng theo mùa tại thành 
phố Hải Dương và thị xã Chí Linh dựa theo kết quả trạm quan 
trắc lân cận gồm Hải Phòng, Hưng Yên, Thái Bình, Bắc Ninh 
và Quảng Ninh.Kết quả sử dụng tổ hợp gồm 4 trạm quan trắc 
lân cận: Bắc Ninh – Quảng Ninh – Hải Phòng và Hưng Yên 
cho kết quả sai số nhỏ nhất, 
Kết quả mô phỏng cho thấy với giải pháp đề xuất ước lượng 
thông số khí tượng theo mùa cho sai số trung bình cộng các 
mùa từ 0,48oC đến 0,65oC (đối với nhiệt độ) và từ 2,87% đến 
4,24% (đối với độ ẩm). Với kết quả này giải pháp sử dụng mô 
hình ước lượng theo mùa là đề xuất của luận án. 
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 
Luận án đã đề xuất và sử dụng mô hình lai để xây dựng giải 
pháp dự báo thông số khí tượng (nhiệt độ và độ ẩm) dựa trên 
chuỗi giá trị đo trong quá khứ áp dụng cho một số vị trí trong 
địa bàn tỉnh Hải Dương với độ chính xác khá cao. Kết quả 
trung bình sai số tuyệt đối 
− Sai số khi ước lượng Tmax: 1,38oC; 
− Sai số khi ước lượng Tmin: 0,97oC; 
− Sai số khi ước lượng RHmax: 3,47%; 
− Sai số khi ước lượng RHmin: 6,23%; 
• Sử dụng mô hình lai xây dựng mô hình ước lượng thông 
số thời tiết dựa trên chuỗi giá trị kết quả đo của các trạm quan 
trắc lân cận thành phố Hải Dương và thị xã Chí Linh là Bắc 
Ninh, Quảng Ninh, Hải Phòng, Thái Bình, Hưng Yên với 03 
kịch bản khác nhau cho 02 trạm, 03 trạm và 04 trạm quan 
trắc. Kết quả khi ước lượng thông số khí tượng tại thành phố 
Hải Dương, thị xã Chí Linh, luận án đã tiến hành thử nghiệm 
- 24 - 
với 25 tổ hợp khác nhau và kết quả là sử dụng mô hình ước 
gồm 04 trạm quan trắc lân cận Bắc Ninh – Quảng Ninh – Hải 
Phòng – Hưng Yên. Kết quả sai số khi ước lượng nhiệt độ, độ 
ẩm theo chuỗi thời gian ở thành phố Hải Dương và thị xã Chí 
Linh đạt được là nhỏ hơn 0,6oC (cho nhiệt độ) và 4,00% (cho 
độ ẩm). Mô hình ước lượng theo mùa cho kết quả sai số trung 
bình cộng các mùa nhỏ hơn 0,5oC (đối với nhiệt độ) và 3,22% 
(đối với độ ẩm) và đây cũng là đề xuất của luận án. 
Các ý tưởng và giải pháp mà luận án đề xuất có thể tiếp tục 
bổ sung, phát triển theo một số hướng sau: 
− Tiếp tục thử nghiệm các mô hình ước lượng phi tuyến 
khác (như Random Forrest, Deep Learning, Fuzzy Systems,) 
để lựa chọn được các mô hình có độ chính xác cao nhất (theo 
nguyên tắc thử nghiệm huấn luyện mô hình và kiểm tra lại trên 
bộ số liệu kiểm tra); 
− Thử nghiệm các cấu hình khác nhau của SVM, LS-SVM 
trong các hướng phát triển của luận án; 
− Thử nghiệm sử dụng thêm các đầu vào cho mô hình ước 
lượng thông số khí tượng tại một vị trí như các giá trị thông số 
khí tượng khác, các giá trị quá khứ của các thông số khí tượng 
đã dùng trong ước lượng; 
− Thử nghiệm đề xuất sử dụng mô hình lai cho dự báo và 
ước lượng các thông số khí tượng và thời tiết khác như lượng 
mưa trung bình, lượng gió trung bình,... 
− Kiểm tra thử nghiệm mô hình đề xuất với các địa phương, 
các khu vực khác; 
− Thử nghiệm ứng dụng thực tế trong công tác dự báo tại 
địa phương. 
 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 
CỦA LUẬN ÁN 
1. Đỗ Văn Đỉnh, Đinh Văn Nhượng, Trần Hoài Linh (2015), 
Ứng dụng mô hình hỗn hợp trong ước lượng giá trị lớn nhất 
và nhỏ nhất của nhiệt độ môi trường ngày, Tạp chí khoa 
học và công nghệ - Đại học Đà nẵng, Số 11(96), 2015, 
Quyển 2, trang 35–38. 
2. Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran (2016), 
Applications of SVM networks in hybrid model for 
environment parameters estimation, 4
th
 IEEE International 
Conference on Sustainable Energy Technologies (ICSET). 
November 14-16, 2016, Hanoi, Viet Nam, pp. 190-195. 
3. Đỗ Văn Đỉnh, Đinh Văn Nhượng, Trần Hoài Linh (2016), 
Thiết kế thiết bị đo, thu thập, giám sát một số thông số môi 
trường, Tạp chí khoa học và công nghệ - Đại học Thái 
Nguyên, Tập 151, số 06, 2016, trang 111-118 
4. Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran 
(2016), Applications model of Support Vector Machine 
networks for interpolations parameters weather, The 
9th Regional Conference on Electrical and Electronics 
Engineering (RCEEE). November 17-18, 2016, Hanoi, 
Vietnam, pp. 247-251. 
5. Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran (2017), 
Method for ebaluation and selection of input for environment 
forecasting models, The 11th South East Asial Technical 
University Consortium Symposium Ho Chi Minh University 
of Technology (HCMUT), 13th-14th March 2017. 

File đính kèm:

  • pdfluan_an_xay_dung_mo_hinh_du_bao_mot_so_thong_so_khi_tuong_ch.pdf