Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn

Ngày nay, ngành khoa học máy tính có vai trò rất quan trọng

trong sự phát triển của toàn cầu, đã tác động sâu sắc đến hầu hết các

ngành, lĩnh vực kỹ thuật, kinh tế xã hội. Trên thế giới đã có nhiều

công trình trong lĩnh vực khoa học máy tính nghiên cứu về Tin viễnthông, Tin-y sinh học đã và đang mang lại hiệu quả to lớn cho đời

sống con người, trong khi đó, các công trình nghiên cứu về Tin-thủy

văn vẫn còn nhiều hạn chế. Đề tài này có mục đích góp phần cho sự

phát triển lĩnh vực Tin- thủy văn hiện nay và trong tương lai. Để đạt

được mục đích nêu trên, mục tiêu nghiên cứu của Luận án là:

- Nghiên cứu mô hình GAR(1), tổng quan các công trình liên

quan về mô hình GAR(1), phương pháp mô phỏng ngẫu nhiên, các

phương pháp sinh biến ngẫu nhiên, các mô hình biểu thị mô phỏng

lưu lượng dòng chảy và bài toán xác định dung tích hồ chứa;

- Nghiên cứu các thuật toán sinh biến ngẫu nhiên GAR(1) bao

gồm: đánh giá các thuật toán sinh biến ngẫu nhiên có phân phối đều,

phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối

gamma;

- Nghiên cứu các mô hình biểu thị mô phỏng lưu lượng dòng

chảy hàng tháng, hàng năm với quá trình ngẫu nhiên GAR(1);

- Nghiên cứu bài toán tính dung lượng trung bình của hồ chứa có

dung tích vô hạn với dòng chảy vào là chuỗi các biến ngẫu nhiên

GAR(1).

pdf 27 trang dienloan 20360
Bạn đang xem 20 trang mẫu của tài liệu "Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn

Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn
i 
BỘ GIÁO DỤC VÀ ĐÀO TẠO 
ĐẠI HỌC ĐÀ NẴNG 
NGUYỄN VĂN HƢNG 
NGHIÊN CỨU MÔ HÌNH HỒI QUY GAMMA BẬC 1 [GAR(1)] 
ỨNG DỤNG TRONG LÃNH VỰC THỦY VĂN 
Chuyên ngành: Khoa học máy tính 
Mã số: 62.48.01.01 
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT 
Đà Nẵng - Năm 2016 
ii 
Công trình được hoàn thành tại 
ĐẠI HỌC ĐÀ NẴNG 
Người hướng dẫn khoa học: 
 1. PGS.TSKH. Trần Quốc Chiến 
 2. GS.TS. Huỳnh Ngọc Phiên 
Phản biện 1:______________________________________________ 
 ______________________________________________ 
Phản biện 2: ______________________________________________ 
 ______________________________________________ 
Phản biện 3: ______________________________________________ 
 ______________________________________________ 
1 
GIỚI THIỆU 
 Ngày nay, ngành khoa học máy tính có vai trò rất quan trọng 
trong sự phát triển của toàn cầu, đã tác động sâu sắc đến hầu hết các 
ngành, lĩnh vực kỹ thuật, kinh tế xã hội. Trên thế giới đã có nhiều 
công trình trong lĩnh vực khoa học máy tính nghiên cứu về Tin viễn-
thông, Tin-y sinh học đã và đang mang lại hiệu quả to lớn cho đời 
sống con người, trong khi đó, các công trình nghiên cứu về Tin-thủy 
văn vẫn còn nhiều hạn chế. Đề tài này có mục đích góp phần cho sự 
phát triển lĩnh vực Tin- thủy văn hiện nay và trong tương lai. Để đạt 
được mục đích nêu trên, mục tiêu nghiên cứu của Luận án là: 
 - Nghiên cứu mô hình GAR(1), tổng quan các công trình liên 
quan về mô hình GAR(1), phương pháp mô phỏng ngẫu nhiên, các 
phương pháp sinh biến ngẫu nhiên, các mô hình biểu thị mô phỏng 
lưu lượng dòng chảy và bài toán xác định dung tích hồ chứa; 
 - Nghiên cứu các thuật toán sinh biến ngẫu nhiên GAR(1) bao 
gồm: đánh giá các thuật toán sinh biến ngẫu nhiên có phân phối đều, 
phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối 
gamma; 
 - Nghiên cứu các mô hình biểu thị mô phỏng lưu lượng dòng 
chảy hàng tháng, hàng năm với quá trình ngẫu nhiên GAR(1); 
 - Nghiên cứu bài toán tính dung lượng trung bình của hồ chứa có 
dung tích vô hạn với dòng chảy vào là chuỗi các biến ngẫu nhiên 
GAR(1). 
CHƢƠNG 1 
TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU 
 Để đáp ứng mục tiêu nghiên cứu của đề tài: “Nghiên cứu mô 
hình hồi quy Gamma bậc 1 [GAR(1)] ứng dụng trong lãnh vực 
thuỷ văn”, Tác giả nghiên cứu các tài liệu, công trình đã được công 
bố trong và ngoài nước có liên quan đến những vấn đề sau: 
 - Về lý luận: Các nghiên cứu cơ bản về lý thuyết xác suất, các kết 
quả nghiên cứu về các thuật toán sinh các biến ngẫu nhiên, các 
2 
phương pháp, mô hình và thuật toán dùng để mô phỏng lưu lượng 
dòng chảy hàng tháng, hàng năm và các nghiên cứu về hồ chứa. 
 - Về thực tiễn: Các kết quả công bố liên quan đến việc thực 
nghiệm, mô phỏng lưu lượng dòng chảy tại các trạm đo thuỷ văn và 
dung tích hồ chứa. 
1.1. Một số vấn đề cơ bản của lý thuyết xác suất 
 Trong phần này trình bày các nội dung cơ bản về lý thuyết xác 
suất bao gồm các khái niệm về đại lượng ngẫu nhiên, luật phân phối 
tích phân, hàm mật độ xác suất của đại lượng ngẫu nhiên và các đặc 
trưng số cơ bản của đại lượng ngẫu nhiên: kỳ vọng, phương sai, hệ số 
lệch và độ nhọn làm cơ sở cho các nghiên cứu ở các nội dung kế tiếp. 
1.2. Phân phối Gamma 
1.2.1. Hàm mật độ xác suất của phân phối gamma 
 Một biến ngẫu nhiên liên tục X được gọi là có phân phối gamma 
3 tham số nếu hàm mật độ xác suất có dạng: 
 ( ) 
( ) ( ) 
 ( )
 (1.1) 
trong đó tương ứng là các 
tham số hình dạng, tỉ lệ và vị trí. 
Hàm ( ) được xác định bởi 
 ( ) ∫ 
khi c = 0 ta có phân phối gamma 2 tham số, khi c = 0 và b = 1 ta có 
phân phối gamma 1 tham số. Bằng phương pháp đổi biến số, phân 
phối gamma với 2 hoặc 3 tham số có thể biến đổi về phân phối 
gamma 1 tham số: với phân phối gamma 3 tham số, đặt: y = (x-c)/b 
hoặc x = c + by, với phân phối gamma 2 tham số, đặt: y = x/b hoặc x 
= by. Với cách đổi biến như trên thì biến ngẫu nhiên y có phân phối 
gamma 1 tham số. 
1.2.2. Các đặc trưng số của phân phối gamma 
 Các đặc trưng số cơ bản của phân phối gamma 1 tham số được 
3 
tính như sau: 
Kỳ vọng: E(X) = (1.2) 
Phương sai: Var(X) = (1.3) 
Hệ số lệch: = 
√ 
 (1.4) 
1.3. Mô hình hồi quy gamma bậc 1 [GAR(1)] 
1.3.1. Mô hình GAR(1) 
 Lawrance và Lewis (1981) đề xuất mô hình GAR(1) như sau: 
 (1.5) 
trong đó: là biến ngẫu nhiên biểu diễn quá trình phụ thuộc ở thời 
điểm i; là hệ số hồi quy; là biến ngẫu nhiên độc lập cần được 
xác định; có phân phối gamma 3 tham số và có hàm mật độ xác 
suất như ở phương trình (1.1). Quá trình được xác định bởi phương 
trình (1.5) được gọi là mô hình GAR(1), để mô phỏng quá trình này 
thì các tham số của mô hình phải được xác định và được sinh theo 
các lược đồ thích hợp và có sự kết hợp với các thuật toán sinh biến 
ngẫu nhiên có phân phối đều, phân phối mũ và phân phối Poisson. 
1.3.2. Ước lượng các tham số của mô hình GAR(1) 
 Bằng phương pháp moment, Fernandez và Salas (1990) đề xuất 
lược đồ điều chỉnh độ lệch để ước lượng các tham số của mô hình 
GAR(1). Quá trình ngẫu nhiên tuyến tính dừng GAR(1) ở phương 
trình (1.5) có 4 tham số là , b, c và Φ. Sử dụng phương pháp 
moment, các tham số này và các moment của biến ngẫu nhiên Xi có 
mối liên hệ sau: 
 (1.6) 
 (1.7) 
 √ (1.8) 
 Φ. (1.9) 
 Trong đó , , , là trung bình mẫu, phương sai, độ lệch và 
hệ số tương quan bậc 1. Các tham số đặc trưng này có thể được ước 
lượng dựa trên mẫu thống kê {X1, X2, , XN}. bằng cách tính: 
4 
∑ 
 (1.10) 
∑ ( )
 (1.11) 
( )( ) 
∑ ( )
 (1.12) 
( ) 
∑ ( 
 )( ) (1.13) 
trong đó m, s, và r là ước lượng của , S, và tương ứng, và N 
là kích thước mẫu thống kê. Khi các biến ngẫu nhiên là phụ thuộc và 
không chuẩn, các ước lượng này thường bị lệch vì vậy cần phải điều 
chỉnh độ lệch và sau khi điều chỉnh độ lệch thu được các ước lượng 
không lệch của , S và các công thức (1.6) - (1.9) được sử 
dụng để ước lượng tập các tham số của mô hình: , b, c và Ф tương 
ứng. 
1.4. Sinh biến ngẫu nhiên theo mô hình GAR(1) 
 Sinh biến ngẫu nhiên theo mô hình GAR(1) cần phải kết hợp các 
thuật toán sinh các biến ngẫu nhiên có phân phối đều đơn vị, phân 
phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma. 
Có nhiều công trình nghiên cứu đề xuất các thuật toán để sinh biến 
ngẫu nhiên có phân phối gamma và được phân chia ra hai trường 
hợp: (1) Trường hợp tham số hình dạng a≤1, và, (2) Trường hợp 
tham số hình dạng a>1. Trong những năm gần đây có một số tác giả 
nghiên cứu đề xuất các thuật toán để sinh biến ngẫu nhiên gamma với 
tham số a là bất kỳ như trong công trình của Marsaglia và Tsang 
(2000), và gần đây Hong LiangJie (2012) đánh giá thuật toán do 
Marsaglia và Tsang (2000) đề xuất là một trong các thuật toán dễ cài 
đặt, có tốc độ nhanh nhất hiện nay và được cài đặt trong thư viện 
GSL và phần mềm Matlab “gamrnd”. 
1.5. Bài toán mô phỏng lƣu lƣợng dòng chảy 
 Bài toán mô phỏng lưu lượng dòng chảy đặt ra vấn đề là trên cơ 
sở chuỗi lưu lượng lịch sử hàng năm hoặc hàng tháng quan trắc được 
5 
tại các trạm đo thuỷ văn, áp dụng các phương pháp, mô hình để sinh 
chuỗi số liệu có độ dài n đủ lớn sao cho chuỗi số liệu sinh bảo toàn 
được các đặc trưng số thống kê gồm giá trị trung bình, độ lệch 
chuẩn, hệ số lệch và hệ số tương quan của chuỗi lưu lượng lịch sử. 
 Các đặc trưng số thống kê của chuỗi lưu lượng dòng chảy lịch sử 
hàng tháng: giá trị trung bình, độ lệch chuẩn, hệ số lệch được tính bởi 
các phương trình: 
∑ 
∑ ( )
( )( ) 
 ∑ ( )
 Các mô hình và phương pháp được đề xuất dùng để mô phỏng 
lưu lượng dòng chảy được phân thành nhóm mô hình có tham số và 
nhóm mô hình phi tham số. Nhóm mô hình có tham số được chia 
thành các loại mô hình độc lập và phụ thuộc cuả chuỗi lưu lượng lịch 
sử. Với giả thiết chuỗi lưu lượng lịch sử là độc lập có liên quan đến 
kiểu phân phối xác suất thì nhiều mô hình được đề xuất và trong đó, 
mô hình Thomas-Fiering (1962) biểu thị mô phỏng lưu lượng dòng 
chảy với bất kỳ kiểu phân phối xác suất được sử dụng phổ biến. Với 
sự đa dạng về khí hậu, nhiều công trình nghiên cứu xác định kiểu 
phân phối của lưu lượng dòng chảy thường không chuẩn, có độ lệch 
và phụ thuộc, và đối với trường hợp này, theo Fernandez và Salas 
(1990) thì áp dụng mô hình GAR(1) là rất hiệu quả để mô phỏng lưu 
lượng dòng chảy hàng năm. 
1.6. Bài toán dung tích hồ chứa 
 Trong các nghiên cứu về hồ chứa, nhiều bài toán được đặt ra như 
bài toán quy hoạch, thiết kế, bài toán vận hành hồ chứa hoặc vận 
hành liên hồ chứa. Đối với lớp các bài toán quy hoạch, thiết kế hồ 
chứa, vấn đề quan trọng là xác định được dung tích của hồ chứa trên 
cơ sở các nguồn nước chảy vào và điều tiết dòng chảy ra khỏi hồ 
6 
chứa. Các nghiên cứu về dung tích hồ chứa tuỳ thuộc vào các trường 
hợp hồ chứa có dung tích hữu hạn, bán hữu hạn hoặc vô hạn. Một hồ 
chứa hữu hạn có thể có lượng nước trong hồ tràn đầy hoặc cạn kiệt, 
hồ chứa bán hữu hạn chỉ có thể có một trong hai trường hợp hoặc 
tràn đầy hoặc cạn kiệt. Đối với hồ chứa có dung tích vô hạn thì giả 
thiết rằng hồ chứa không bao giờ tràn đầy hoặc kiệt nước trong 
khoảng thời gian hoạt động của nó là n năm, theo Salas-La Cruz 
(1972), giả thiết này phù hợp cho việc nghiên cứu quy hoạch, thiết kế 
các hồ chứa có dung tích lớn (hàng trăm triệu trở lên). Với sự 
biến đổi khí hậu toàn cầu hiện nay, mưa và khô hạn kéo dài dẫn đến 
lũ lụt và hạn hán phổ biến ở nhiều quốc gia, thực tế này đòi hỏi cần 
nghiên cứu xây dựng các hồ chứa có dung tích lớn để điều tiết nguồn 
nước hợp lý, vì vậy, việc nghiên cứu dung lượng hồ chứa để phục vụ 
việc thiết kế các hồ chứa có dung tích lớn cần được quan tâm. 
KẾT LUẬN CHƢƠNG 1 
 Từ việc nghiên cứu có hệ thống theo chủ đề của các công trình đã 
công bố, Tác giả luận án phát hiện những hạn chế sau đây: 
 - Chưa có nghiên cứu, đánh giá, chọn lựa các thuật toán thích 
hợp để sinh biến ngẫu nhiên GAR(1), chưa có nghiên cứu đề xuất mô 
hình biểu thị mô phỏng lưu lượng dòng chảy hàng tháng với quá 
trình ngẫu nhiên GAR(1) và chưa có nghiên cứu xác định dung lượng 
trung bình của hồ chứa với dòng chảy vào hồ chứa là quá trình ngẫu 
nhiên GAR(1). 
 Từ những hạn chế nêu trên, định hướng nghiên cứu là nghiên 
cứu đánh giá và chọn lựa các thuật toán sinh biến ngẫu nhiên thích 
hợp để sinh biến ngẫu nhiên GAR(1), nghiên cứu các đặc trưng số cơ 
bản của tổng các biến ngẫu nhiên GAR(1), nghiên cứu bài toán mô 
phỏng lưu lượng dòng chảy hàng tháng, hàng năm với quá trình ngẫu 
nhiên GAR(1) và nghiên cứu mô phỏng dung lượng trung bình của 
hồ chứa với dòng chảy vào hồ chứa là quá trình ngẫu nhiên GAR(1). 
7 
CHƢƠNG 2 
CÁC THUẬT TOÁN SINH BIẾN NGẪU NHIÊN GAR(1) 
 Nội dung chương này trình bày các thuật toán sinh các biến ngẫu 
nhiên GAR(1). Bằng phương pháp nghiên cứu lý thuyết và phương 
pháp mô phỏng, các vấn đề lý luận cơ bản và các thuật toán sinh biến 
ngẫu nhiên GAR(1) được nghiên cứu, cài đặt và thử nghiệm. 
2.1. Nghiên cứu một số thuật toán dùng để sinh biến ngẫu nhiên 
GAR(1) 
 Để áp dụng mô hình GAR(1) vào thực tế, cần phải sinh các biến 
ngẫu nhiên GAR(1) dựa vào mẫu thống kê. Để sinh các biến ngẫu 
nhiên GAR(1) cần kết hợp các thuật toán sinh các biến ngẫu nhiên có 
phân phối đều đơn vị, phân phối mũ, phân phối chuẩn, phân phối 
Poisson và phân phối gamma. 
2.2. Đề xuất thuật toán sinh biến ngẫu nhiên gamma với giá trị 
bất kỳ của tham số hình dạng a 
 Thuật toán do Minh (1988) đề xuất được sử dụng để sinh biến 
ngẫu nhiên có phân phối gamma với tham số hình dang a>1. Dựa vào 
kết quả của Marsaglia và Tsang (2000), thuật toán cải tiến từ thuật 
toán Minh được đề xuất bởi Hung, Trang và Chien (2014) gọi là 
thuật toán IMGAG để sinh biến ngẫu nhiên gamma với giá trị bất kỳ 
của tham số a của phân phối gamma như sau: 
 (1) Nếu a>1 sử dụng thuật toán của Minh với tham số a để sinh 
X, chuyển đến bước (3); 
 (2) Nếu 1≥a>0 sử dụng thuật toán của Minh với tham số a+1 để 
sinh tính X = với U∼U(0,1) (U có phân phối đều trong 
khoảng (0,1)); 
 (3) Nhận được X; 
 (4) Kết thúc. 
2.3. Đề xuất bổ sung tiêu chí đánh giá hiệu quả của thuật toán 
sinh biến ngẫu nhiên 
 Trong thực tế, việc đánh giá tính hiệu quả các thuật toán sinh 
biến ngẫu nhiên chủ yếu dựa vào các tiêu chí là độ phức tạp và tính 
dễ cài đặt của thuật toán. Ngoài các tiêu chí nêu trên; Hung, Trang và 
8 
Chien (2014) đề xuất bổ sung tiêu chí để đánh giá tính hiệu quả của 
các thuật toán khác nhau dùng để sinh biến ngẫu nhiên có kiểu phân 
phối xác suất xác định là sử dụng thuật toán sinh chuỗi số ngẫu nhiên 
độc lập và kiểm tra sự bảo toàn các đặc trưng số gồm giá trị kỳ vọng, 
phương sai và hệ số lệch của chuỗi số phát sinh. 
2.4. Mô phỏng thực nghiệm 
2.4.1. Phương pháp mô phỏng 
 Sử dụng các thuật toán sinh biến ngẫu nhiên gamma: Thuật toán 
Ahrens (1974) sử dụng cho trường hợp tham số a 1, thuật toán 
Tadikamalla (1978) sử dụng cho trường hợp tham số a>1, thuật toán 
IMGAG và thuật toán Marsaglia (2000) sử dụng cho mọi giá trị của 
tham số a. Các thuật toán được cài đặt bằng ngôn ngữ C và sử dụng 
mỗi thuật toán để sinh 10.000 số ngẫu nhiên có phân phối gamma với 
các tham số a khác nhau (từ 0.1 đến 500). Dựa vào mẫu các số ngẫu 
nhiên được sinh, các đặc trưng số thống kê gồm giá trị trung bình, 
phương sai và hệ số lệch được tính theo các công thức (1.10) - 
(1.12). Hệ số tương quan tính theo công thức (1.13). 
2.4.2. Kết quả mô phỏng 
 Từ mô phỏng thử nghiệm, kết qủa được trình bày trong các bảng 
2.1 - 2.3 và các hình vẽ 2.1 - 2.3 như sau: 
Bảng 2.1. Giá trị trung bình của 10.000 số ngẫu nhiên gamma được sinh 
theo thuật toán IMGAG, thuật toán Marsaglia và thuật toán Ahrens 
a 
IMGAG Marsaglia Ahrens 
TB sinh % sai số TB sinh % sai số TB sinh % sai số 
0.1 0.099 0.78 0.114 14.32 0.098 2.13 
0.2 0.195 2.39 0.230 15.02 0.199 0.55 
0.3 0.296 1.27 0.343 14.38 0.297 1.09 
0.4 0.390 2.57 0.450 12.67 0.394 1.54 
0.5 0.498 0.41 0.564 12.79 0.502 0.34 
0.6 0.603 0.58 0.665 10.90 0.592 1.26 
0.7 0.693 1.04 0.778 11.14 0.700 0.00 
0.8 0.798 0.30 0.867 8.43 0.794 0.78 
0.9 0.914 1.55 0.980 8.94 0.886 1.54 
1.0 0.984 1.60 1.350 35.03 0.995 0.53 
9 
 Hình 2.1: Giá trị trung bình với các tham số hình dạng a ≤1 
Bảng 2.2. Phương sai của 10.000 số ngẫu nhiên gamma được sinh 
theo thuật toán IMGAG, thuật toán Marsaglia và thuật toán Ahrens 
a 
IMGAG Marsaglia Ahrens 
PS sinh % sai số PS sinh % sai số PS sinh % sai số 
0.1 0.098 1.79 0.094 6.44 0.102 2.13 
0.2 0.192 4.18 0.183 8.54 0.196 2.25 
0.3 0.273 8.03 0.270 10.08 0.290 3.34 
0.4 0.373 6.78 0.346 14.89 0.396 1.01 
0.5 0.483 3.42 0.416 16.71 0.502 0.36 
0.6 0.604 0.70 0.506 15.59 0.578 3.67 
0.7 0.668 4.53 0.562 19.74 0.696 0.52 
0.8 0.795 0.64 0.609 23.92 0.763 4.60 
0.9 0.937 4.12 0.684 23.99 0.872 3.09 
1.0 0.961 3.86 1.351 35.06 0.991 0.86 
 Hình 2.2: Phương sai với các tham số hình dạng a ≤1 
0.1
0.6
1.1
1.6
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
PT (1.2)
IMGAG
Marsaglia
Ahrens
0.1
0.3
0.5
0.7
0.9
1. ... 3.30 32.67 30.37 24.61 
4 39.32 40.82 34.25 29.29 
5 60.89 63.72 53.22 45.05 
6 39.63 38.2 32.01 29.01 
7 25.65 26.07 29.32 19.35 
8 48.82 49.52 71.14 36.02 
9 174.70 178.68 88.39 18.56 
 10 354.16 376.42 438.79 244.56 
 11 549.65 544.42 534.59 401.98 
 12 329.72 334.52 311.34 235.41 
 Hình 3.2: Độ lệch chuẩn tại trạm đo Nông Sơn 
Bảng 3.3. Hệ số lệch tại trạm đo Nông Sơn 
Tháng Lịch sử GAR(1)-M GAR(1)-F Th.Fiering 
1 1.54 1.53 1.51 0.67 
2 1.09 1.23 0.95 0.57 
3 0.87 1.20 0.73 0.43 
4 1.70 1.98 2.18 0.48 
5 0.79 1.00 0.78 0.35 
6 0.77 0.80 0.93 0.34 
7 0.47 0.64 1.32 0.22 
8 1.55 1.76 3.44 0.62 
0
200
400
600
1 2 3 4 5 6 7 8 9 10 11 12
Dữ liệu lịch sử 
GAR(1)-M
GAR(1)-F
THOMAS-FIERING
Tháng 
m3/s 
17 
9 3.08 5.17 2.32 1.73 
 10 0.23 -0.01 -0.12 0.22 
 11 0.68 0.66 1.66 0.42 
 12 0.84 1.12 0.96 0.55 
Hình 3.3 Hệ số lệch tại trạm đo Nông Sơn 
Bảng 3.4. Các đặc trưng số thống kê hàng năm tại trạm đo Nông Sơn 
 Đặc trưng số Lịch sử GAR(1)-M GAR(1)-F Th.Fiering 
Giá trị trung bình 3469.72 3454.17 3467.92 3588.66 
Độ lệch chuẩn 1030.77 729.03 1025.29 664.64 
Hệ số lệch 0.76 0.32 0.78 0.08 
 Tương tự tại các trạm đo Thạnh Mỹ và Yên Bái, Tác giả cũng thu 
được các bảng và các hình vẽ tương ứng. 
KẾT LUẬN CHƢƠNG 3 
 Trong chương 3, Tác giả đã thực hiện nghiên cứu và đạt được kết 
quả như sau: nghiên cứu và đề xuất các mô hình biểu thị mô phỏng 
lưu lượng dòng chảy hàng tháng là mô hình GAR(1)-Monthly và mô 
hình GAR(1)-Fragments. Bằng mô phỏng thực nghiệm, kết quả thu 
được là mô hình GAR(1)-Monthly bảo toàn các đặc trưng số thống 
kê gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn các mô 
hình GAR(1)-Fragments và mô hình Thomas-Fiering và trên cơ sở 
dữ liệu hàng tháng để tính dữ liệu hàng năm thì mô hình GAR(1)-
Fragments bảo toàn các đặc trưng số thống kê gồm giá trị trung bình, 
độ lệch chuẩn và hệ số lệch tốt hơn so với mô hình GAR(1)-Monthly 
và mô hình Thomas-Fiering. 
-2
0
2
4
6
1 2 3 4 5 6 7 8 9 10 11 12
Dữ liệu lịch sử 
GAR(1)-M
GAR(1)-F
THOMAS-FIERING
Tháng 
18 
CHƢƠNG 4 
DUNG LƯỢNG TRUNG BÌNH CỦA HỒ CHỨA 
VỚI DÒNG VÀO LÀ QUÁ TRÌNH NGẪU NHIÊN GAR(1) 
 Nội dung chương này trình bày nghiên cứu về bài toán tính dung 
lượng trung bình của hồ chứa. Bằng phương pháp lý thuyết, các biểu 
thức giải tích về kỳ vọng và phương sai của tổng các biến ngẫu nhiên 
GAR(1) được đề xuất. Kết hợp công thức của Phien (1978) với biểu 
thức giải tích về phương sai của tổng các biến ngẫu nhiên có phân 
phối GAR(1) đã đạt được, Tác giả đề xuất biểu thức xấp xỉ dùng để 
tính dung lượng trung bình của hồ chứa với dòng vào là các biến 
ngẫu nhiên GAR(1). Bằng kỹ thuật mô phỏng, sử dụng mô hình 
GAR(1) phát sinh lưu lượng hàng năm chảy vào hồ chứa và thu được 
các giá trị về dung lượng trung bình của hồ chứa với các tham số 
khác nhau và được so sánh với các giá trị theo biểu thức xỉ. 
4.1. Dung lƣợng của hồ chứa 
4.1.1. Phương trình tính dung lượng hồ chứa tổng quát 
 Xem { } là một chuỗi các biến ngẫu nhiên với ( ) = 0 khi đó 
tổng tích luỹ hay tổng riêng gọi là , cực đại của tổng riêng hay 
lượng dư thừa , cực tiểu của tổng riêng hay lượng thiếu hụt , 
và biên độ dao động của tổng riêng của dãy gồm n biến ngẫu 
nhiên được định nghĩa như sau: 
 (4.1) 
 ( ) (4.2) 
 ( ) (4.3) 
 (4.4) 
dễ thấy rằng và ( ) = 0. 
4.1.2. Dung lượng trung bình của hồ chứa với dòng chảy vào là 
các biến ngẫu nhiên độc lập 
 Dung lượng trung bình của hồ chứa được nghiên cứu với giả thiết 
rằng các dòng chảy vào hồ chứa ( ) là chuỗi các biến ngẫu nhiên 
độc lập. Để loại bỏ sự phụ thuộc của dung lượng trung bình của hồ 
chứa vào các kiểu phân phối khác nhau, một biến ngẫu nhiên mới 
được sử dụng bằng cách chuẩn hoá : 
19 
ở đây là độ lệch chuẩn của . Biến ngẫu nhiên đã được chuẩn hoá 
 có trung bình bằng 0 và phương sai đơn vị. 
 Với việc sử dụng biến ngẫu nhiên mới , nếu ( 
 ) và ( ) 
là các giá trị kỳ vọng của biên độ dao động của dung lượng tương 
ứng với z và , do đó ta có: 
 ( 
 ) ( ) 
 Bằng phương pháp sử dụng hàm đa biến, với giả thiết dòng chảy 
vào hồ chứa là chuỗi các biến ngẫu nhiên có phân phối chuẩn, 
Salas-La Cruz (1972) cho kết quả dung lượng trung bình của hồ chứa 
như sau: 
 ( ) √
∑
 ( ) 
 Với trường hợp chuỗi các biến ngẫu nhiên có phân phối 
gamma độc lập, theo Phien (1978) thì hệ số lệch của phân phối 
gamma cần được tính đến và cho kết quả là biểu thức xấp xỉ tính 
dung lượng trung bình của hồ chứa là: 
 ( ) √
∑
 ( ) 
 ( ) (4.5) 
4.2. Phân tích lý thuyết 
4.2.1. Đặc trưng số cơ bản của tổng các biến ngẫu nhiên GAR(1) 
 Các biến ngẫu nhiên theo mô hình GAR(1) được biểu diễn bởi 
phương trình: 
 Khi đó tổng của n biến ngẫu nhiên GAR(1) là một biến ngẫu 
nhiên gọi là được tính theo phương trình : 
 ∑ 
trong đó: , i = 1, 2, , n là các biến GAR(1). 
 Bằng phân tích lý thuyết, Hung va Chien (2013) đạt được các 
biểu thức giải tích về các đặc trưng số cơ bản: kỳ vọng và phương sai 
20 
của tổng các biến ngẫu nhiên GAR(1) với phân phối gamma 1 tham 
số như sau: 
 Kỳ vọng của tổng của n biến ngẫu nhiên GAR(1) gọi là ( ) và 
 ( ) . 
 Phương sai của tổng của n biến ngẫu nhiên GAR(1) được ký hiệu 
là Var(Sn) và: ( ) ∑ ( ) 
 (4.6) 
4.2.2. Biểu thức xấp xỉ của dung lượng trung bình hồ chứa với 
dòng chảy vào là các biến ngẫu nhiên GAR(1) 
 Biên độ dao động của dung lượng hồ chứa được xem xét là tổng 
luỹ tích 
 ∑ 
 ∑ ( )
trong đó là sự dao động của xung quanh giá trị trung 
bình dài hạn của và là một biến ngẫu nhiên có phân phối 
gamma phụ thuộc tuân theo mô hình GAR(1): 
 Theo kết quả của Phien(1978), hệ số lệch được tính đến, và theo 
kết quả của Hung và Chien(2013), thay thế phương sai của tổng các 
biến ngẫu nhiên GAR(1) ở phương trình (4.6) vào phương trình (4.5) 
ta thu được biểu thức xấp xỉ dùng để tính dung lượng trung bình của 
hồ chứa với các biến ngẫu nhiên theo GAR(1) đã được chuẩn hoá là: 
 ( ) √
∑
[ ∑ ( ) ]
 ( ) (4.7) 
4.3. Mô phỏng thực nghiệm 
4.3.1. Số liệu và phương pháp mô phỏng 
 Với mỗi giá trị về hệ số lệch của phân phối gamma và giá trị về 
hệ số hồi quy của mô hình GAR(1), một mẫu gồm n = 100.000 chuỗi 
các biến ngẫu nhiên GAR(1) được sinh, mỗi chuỗi gồm N = 50 giá 
trị, mỗi giá trị tương ứng với một biên độ dao động của dung lượng 
của hồ chứa và được sử dụng để tính dung lượng trung bình của hồ 
chứa có độ dài (tuổi thọ) 50 năm. Tương tự, tính cho các hồ chứa có 
tuổi thọ (l năm) ngắn hơn (l < 50), mỗi chuỗi gồm l giá trị được sử 
21 
dụng để tính dung lượng trung bình của hồ chứa có tuổi thọ l năm 
tương ứng. Trong thực nghiệm này, Tác giả sử dụng hệ số lệch của 
phân phối gamma có giá trị trong khoảng [0.5,3.0], theo Phien 
(1993); điều này phù hợp với hầu hết các trường hợp dòng chảy vào 
hồ chứa trong thực tế. Sử dụng biểu thức xấp xỉ tính dung lượng 
trung bình của hồ chứa ở công thức (4.7) và bằng phương pháp mô 
phỏng, số liệu được sinh tương ứng với biên độ dao động của dung 
lượng của hồ chứa và giá trị trung bình của dung lượng của hồ chứa 
được tính với các giá trị khác nhau của n, và . 
4.3.2. Kết quả mô phỏng 
 Kết quả được cho ở bảng 4.1 và hình vẽ 4.1 như sau : 
Bảng 4.1. Giá trị dung lượng trung bình của hồ chứa với trường hợp 
hệ số hồi quy và hệ số lệch 
l Năm 
Dung lượng trung bình hồ chứa 
Phương trình (4.7) Kết quả mô phỏng % sai số 
 5 3.225 3.197 0.875 
10 5.663 5.624 0.693 
15 7.688 7.635 0.694 
20 9.452 9.380 0.767 
25 11.034 10.945 0.813 
30 12.482 12.392 0.726 
35 13.823 13.727 0.699 
40 15.079 14.979 0.667 
45 16.264 16.152 0.693 
50 17.389 17.265 0.718 
 Hình 4.1: Hệ số hồi quy = 0.6, hệ số lệch = 2.0 
0
5
10
15
20
0 5 10 15 20 25 30 35 40 45 50
Phương trình (4.7) 
Kết quả mô phỏng 
Năm 
22 
 Tác giả cũng thu được các bảng và các hình vẽ tương tự với các 
hệ số lệch trong khoảng từ 0.5 đến 3.0 và các hệ số hồi quy trong 
khoảng từ 0.2 đến 0.8. 
KẾT LUẬN CHƢƠNG 4 
 Ở chương 4, các kết quả đạt được như sau: Phân tích lý thuyết và 
đạt được biểu thức giải tích về kỳ vọng và phương sai của tổng các 
biến ngẫu nhiên GAR(1), trên cơ sở biểu thức giải tích về phương sai 
của tổng các biến ngẫu nhiên GAR(1), Tác giả đề xuất biểu thức xấp 
xỉ tính dung lượng trung bình của hồ chứa với dòng chảy vào hồ 
chứa là các biến ngẫu nhiên GAR(1) và được so sánh với kết quả mô 
phỏng và kết quả là tương tự với nhau. 
KẾT LUẬN LUẬN ÁN 
1. Kết quả đạt đƣợc 
 Qua quá trình nghiên cứu ở các chương: tổng quan nghiên cứu, 
các thuật toán sinh biến ngẫu nhiên GAR(1), mô phỏng lưu lượng 
dòng chảy với quá trình ngẫu nhiên GAR(1) và dung lượng trung 
bình của hồ chứa với dòng vào là quá trình ngẫu nhiên GAR(1) được 
trình bày trong Luận án, những kết quả sau đây đã đạt được: 
1.1. Về lý thuyết 
 - Nghiên cứu đề xuất thuật toán cải tiến từ thuật toán của 
Minh(1988) gọi là thuật toán IMGAG để sinh biến ngẫu nhiên 
gamma với mọi giá trị của tham số hình dạng a > 0 của phân phối 
gamma. Đề xuất bổ sung yếu tố để đánh giá tính hiệu quả của thuật 
toán sinh biến ngẫu nhiên có kiểu phân phối xác định là dựa vào kỹ 
thuật mô phỏng và sử dụng thuật toán để sinh một chuỗi số ngẫu 
nhiên. Trên cơ sở chuỗi số ngẫu nhiên được sinh, kiểm tra tính độc 
lập (dựa vào hệ số tương quan) và sự bảo toàn các đặc trưng số gồm 
kỳ vọng, phương sai và hệ số lệch của phân phối xác suất; 
 - Nghiên cứu đề xuất 2 mô hình: GAR(1)-Monthly và GAR(1)-
Fragments dùng để mô phỏng lưu lượng dòng chảy hàng tháng. 
23 
 - Phân tích lý thuyết và đạt được biểu thức giải tích về kỳ vọng 
và phương sai của tổng các biến ngẫu nhiên GAR(1). Trên cơ sở biểu 
thức giải tích về phương sai của tổng các biến ngẫu nhiên GAR(1) 
kết hợp với kết quả lý thuyết của Salas-La Cruz (1972) và kết quả 
thực nghiệm của Phien (1978), đề xuất biểu thức xấp xỉ tính dung 
lượng trung bình của hồ chứa với dòng chảy vào hồ chứa là quá trình 
ngẫu nhiên GAR(1). 
1.2. Về mô phỏng thực nghiệm 
 - Trường hợp tham số hình dạng a<1: Thuật toán IMGAG và 
thuật toán AHRENS bảo toàn rất tốt các đặc trưng số gồm kỳ vọng, 
phương sai và hệ số lệch của phân phối gamma trong khi đó thuật 
toán MARSAGLIA bảo toàn không tốt các đặc trưng số của phân 
phối gamma. Trường hợp tham số hình dạng 1<a<5, thuật toán 
TADIKAMALLA và thuật toán IMGAG bảo toàn các đặc trưng số: 
kỳ vọng, phương sai và hệ số lệch của phân phối gamma tốt hơn 
thuật toán MARSAGLIA; 
 - Các mô hình GAR(1)-Monthly, mô hình GAR(1)-Fragments và 
mô hình Thomas-Fiering bảo toàn tốt các đặc trưng số thống kê hàng 
tháng: giá trị trung bình và độ lệch chuẩn của các trạm đo được thử 
nghiệm. Trái lại, mô hình GAR(1)-Fragments và mô hình Thomas-
Fiering không bảo toàn tốt hệ số lệch; 
 - Mô hình GAR(1)-Monthly bảo toàn các đặc trưng số thống kê 
gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn các mô 
hình GAR(1)-Fragments và mô hình Thomas-Fiering; 
 - Trên cơ sở dữ liệu hàng tháng để tính dữ liệu hàng năm thì mô 
hình GAR(1)-Fragments bảo toàn các đặc trưng số thống kê gồm giá 
trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn so với mô hình 
GAR(1)-Monthly và mô hình Thomas-Fiering; 
 - So sánh, đánh giá kết quả thu được bằng phương pháp mô 
phỏng và biểu thức xấp xỉ tính dung lượng trung bình hồ chứa, biểu 
thức xấp xỉ và phương pháp mô phỏng cho kết quả tương tự với 
nhau. Vì vậy, biểu thức xấp xỉ ở phương trình (4.7) có thể được sử 
24 
dụng trong thực tế để tính dung lượng trung bình của hồ chứa có 
dung tích lớn. 
 Với những kết quả đạt được nêu trên, thể hiện: Thuật toán 
IMGAG, biểu thức xấp xỉ, mô hình GAR(1)-Monthly và mô hình 
GAR(1)-Fragments do Tác giả nghiên cứu đề xuất được kiểm chứng 
tính hiệu quả bằng mô phỏng thử nghiệm với các số liệu thực tế. Kết 
quả cho thấy thuật toán IMGAG dùng để sinh biến ngẫu nhiên 
gamma, biểu thức xấp xỉ dùng để tính dung lượng trung bình hồ 
chứa, mô hình GAR(1)-Monthly và mô hình GAR(1)-Fragments 
dùng để mô phỏng lưu lượng dòng chảy hàng tháng với quá trình 
ngẫu nhiên GAR(1) có thể được ứng dụng hiệu quả trong lãnh vực 
thủy văn. 
2. Hƣớng nghiên cứu tiếp tục 
 Bên cạnh những kết quả đã đạt được, hướng nghiên cứu tiếp tục 
của Luận án bao gồm: 
 - Để sinh biến ngẫu nhiên GAR(1) cần phải sử dụng các thuật 
toán sinh các biến ngẫu nhiên có các phân phối đều, phân phối mũ, 
phân phối chuẩn, phân phối Poisson và phân phối gamma. Nội dung 
nghiên cứu của Luận án chỉ mới đánh giá các thuật toán sinh biến 
ngẫu nhiên gamma, vì vậy, sẽ nghiên cứu đánh giá tính hiệu quả của 
các thuật toán sinh biến ngẫu nhiên có phân phối chuẩn và phân phối 
Poisson để có thể áp dụng vào thực tế tốt hơn; 
 - Với mỗi mô hình sinh lưu lượng dòng chảy hàng tháng, phân 
tích một số đặc trưng số thống kê của số liệu lịch sử hàng tháng tại 
một số trạm đo thử nghiệm chưa được bảo toàn tốt. Nghiên cứu đánh 
giá việc bảo toàn hệ số tương quan của các mô hình đã đề xuất; 
 - Nghiên cứu về biểu thức giải tích của dung lượng trung bình hồ 
chứa với dòng vào là quá trình ngẫu nhiên GAR(1). 
 Trên đây là những vấn đề nên được tiếp tục nghiên cứu và giải 
quyết trong tương lai ./. 
25 
DANH MỤC CÔNG TRÌNH ĐÃ ĐƢỢC CÔNG BỐ 
CỦA TÁC GIẢ 
1. Nguyen Van Hung and Tran Quoc Chien, (2013), "Computer 
simulation and approximate expression for the mean range of 
reservoir storage with GAR (1) inflows." In Proceedings of the 
Fourth Symposium on Information and Communication 
Technology, ACM, New York, NY, USA, pp. 11 - 17. 
2. Nguyen Van Hung, Huynh Ngoc Phien, Tran Quoc Chien, (2014), 
“Computer Simulation of Streamflows with GAR(1)-Monthly and 
GAR(1)-Fragments Models”, The World of Computer Science and 
Information Technology Journal (WCSIT, USA), Volume 4, 
No.11, pp. 150 - 156. 
3. Nguyen Van Hung, Ngo Thi Thanh Trang, Tran Quoc Chien, 
(2014), “An Improvement of Minh’s Algorithm for Generating 
Gamma Variates with Any Value of Shape Parameter”, Indian 
Journal of Computer Science and Engineering (IJCSE), Volume 5, 
No 6, pp. 199 - 205. 
 4. Nguyễn Văn Hưng, Trần Quốc Chiến, Võ Đình Nam, (2012) 
“Nghiên cứu đánh giá các thuật toán sinh biến ngẫu nhiên có 
phân phối gamma”, Tạp chí Khoa học và Công nghệ - Đại học Đà 
Nẵng, Số 10(59), trang 58 - 63. 
5. Nguyen Van Hung, Tran Quoc Chien, (2013), “Computer 
Simulation of Monthly Streamflows with Thomas-Fiering model 
and Gar(1)-Fragments model”, Tạp chí Khoa học và Công nghệ - 
Đại học Đà Nẵng, Số.12(73), (Số tiếng Anh). trang. 46 – 51. 
6. Nguyễn Văn Hưng, Ngô Thị Thanh Trang, (2014), “Mô phỏng lưu 
lượng dòng chảy hàng tháng với mô hình FGAR(1) và mô hình 
MGAR(1)”, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, 
Số 1(74), Quyển 2 (Số đặc biệt dành cho hội nghị RAIT), trang 25 
- 29. 
7. Nguyễn Văn Hưng, Phan Văn Sơn, Trần Quốc Chiến, (2014), 
“Nghiên cứu sự bảo toàn các tham số đặc trưng của mô hình 
FGAR(1)”,Kỷ yếu Hội thảo Khoa học Hệ thống thông tin, Trường 
Đại học Sư phạm , Đại học Đà Nẵng, trang 110 - 116. 

File đính kèm:

  • pdftom_tat_luan_an_nghien_cuu_mo_hinh_hoi_quy_gamma_bac_1_gar1.pdf