Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn
Ngày nay, ngành khoa học máy tính có vai trò rất quan trọng
trong sự phát triển của toàn cầu, đã tác động sâu sắc đến hầu hết các
ngành, lĩnh vực kỹ thuật, kinh tế xã hội. Trên thế giới đã có nhiều
công trình trong lĩnh vực khoa học máy tính nghiên cứu về Tin viễnthông, Tin-y sinh học đã và đang mang lại hiệu quả to lớn cho đời
sống con người, trong khi đó, các công trình nghiên cứu về Tin-thủy
văn vẫn còn nhiều hạn chế. Đề tài này có mục đích góp phần cho sự
phát triển lĩnh vực Tin- thủy văn hiện nay và trong tương lai. Để đạt
được mục đích nêu trên, mục tiêu nghiên cứu của Luận án là:
- Nghiên cứu mô hình GAR(1), tổng quan các công trình liên
quan về mô hình GAR(1), phương pháp mô phỏng ngẫu nhiên, các
phương pháp sinh biến ngẫu nhiên, các mô hình biểu thị mô phỏng
lưu lượng dòng chảy và bài toán xác định dung tích hồ chứa;
- Nghiên cứu các thuật toán sinh biến ngẫu nhiên GAR(1) bao
gồm: đánh giá các thuật toán sinh biến ngẫu nhiên có phân phối đều,
phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối
gamma;
- Nghiên cứu các mô hình biểu thị mô phỏng lưu lượng dòng
chảy hàng tháng, hàng năm với quá trình ngẫu nhiên GAR(1);
- Nghiên cứu bài toán tính dung lượng trung bình của hồ chứa có
dung tích vô hạn với dòng chảy vào là chuỗi các biến ngẫu nhiên
GAR(1).
Tóm tắt nội dung tài liệu: Tóm tắt Luận án Nghiên cứu mô hình hồi quy gamma bậc 1 [gar(1)] ứng dụng trong lãnh vực thủy văn
i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN VĂN HƢNG NGHIÊN CỨU MÔ HÌNH HỒI QUY GAMMA BẬC 1 [GAR(1)] ỨNG DỤNG TRONG LÃNH VỰC THỦY VĂN Chuyên ngành: Khoa học máy tính Mã số: 62.48.01.01 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng - Năm 2016 ii Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: 1. PGS.TSKH. Trần Quốc Chiến 2. GS.TS. Huỳnh Ngọc Phiên Phản biện 1:______________________________________________ ______________________________________________ Phản biện 2: ______________________________________________ ______________________________________________ Phản biện 3: ______________________________________________ ______________________________________________ 1 GIỚI THIỆU Ngày nay, ngành khoa học máy tính có vai trò rất quan trọng trong sự phát triển của toàn cầu, đã tác động sâu sắc đến hầu hết các ngành, lĩnh vực kỹ thuật, kinh tế xã hội. Trên thế giới đã có nhiều công trình trong lĩnh vực khoa học máy tính nghiên cứu về Tin viễn- thông, Tin-y sinh học đã và đang mang lại hiệu quả to lớn cho đời sống con người, trong khi đó, các công trình nghiên cứu về Tin-thủy văn vẫn còn nhiều hạn chế. Đề tài này có mục đích góp phần cho sự phát triển lĩnh vực Tin- thủy văn hiện nay và trong tương lai. Để đạt được mục đích nêu trên, mục tiêu nghiên cứu của Luận án là: - Nghiên cứu mô hình GAR(1), tổng quan các công trình liên quan về mô hình GAR(1), phương pháp mô phỏng ngẫu nhiên, các phương pháp sinh biến ngẫu nhiên, các mô hình biểu thị mô phỏng lưu lượng dòng chảy và bài toán xác định dung tích hồ chứa; - Nghiên cứu các thuật toán sinh biến ngẫu nhiên GAR(1) bao gồm: đánh giá các thuật toán sinh biến ngẫu nhiên có phân phối đều, phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma; - Nghiên cứu các mô hình biểu thị mô phỏng lưu lượng dòng chảy hàng tháng, hàng năm với quá trình ngẫu nhiên GAR(1); - Nghiên cứu bài toán tính dung lượng trung bình của hồ chứa có dung tích vô hạn với dòng chảy vào là chuỗi các biến ngẫu nhiên GAR(1). CHƢƠNG 1 TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU Để đáp ứng mục tiêu nghiên cứu của đề tài: “Nghiên cứu mô hình hồi quy Gamma bậc 1 [GAR(1)] ứng dụng trong lãnh vực thuỷ văn”, Tác giả nghiên cứu các tài liệu, công trình đã được công bố trong và ngoài nước có liên quan đến những vấn đề sau: - Về lý luận: Các nghiên cứu cơ bản về lý thuyết xác suất, các kết quả nghiên cứu về các thuật toán sinh các biến ngẫu nhiên, các 2 phương pháp, mô hình và thuật toán dùng để mô phỏng lưu lượng dòng chảy hàng tháng, hàng năm và các nghiên cứu về hồ chứa. - Về thực tiễn: Các kết quả công bố liên quan đến việc thực nghiệm, mô phỏng lưu lượng dòng chảy tại các trạm đo thuỷ văn và dung tích hồ chứa. 1.1. Một số vấn đề cơ bản của lý thuyết xác suất Trong phần này trình bày các nội dung cơ bản về lý thuyết xác suất bao gồm các khái niệm về đại lượng ngẫu nhiên, luật phân phối tích phân, hàm mật độ xác suất của đại lượng ngẫu nhiên và các đặc trưng số cơ bản của đại lượng ngẫu nhiên: kỳ vọng, phương sai, hệ số lệch và độ nhọn làm cơ sở cho các nghiên cứu ở các nội dung kế tiếp. 1.2. Phân phối Gamma 1.2.1. Hàm mật độ xác suất của phân phối gamma Một biến ngẫu nhiên liên tục X được gọi là có phân phối gamma 3 tham số nếu hàm mật độ xác suất có dạng: ( ) ( ) ( ) ( ) (1.1) trong đó tương ứng là các tham số hình dạng, tỉ lệ và vị trí. Hàm ( ) được xác định bởi ( ) ∫ khi c = 0 ta có phân phối gamma 2 tham số, khi c = 0 và b = 1 ta có phân phối gamma 1 tham số. Bằng phương pháp đổi biến số, phân phối gamma với 2 hoặc 3 tham số có thể biến đổi về phân phối gamma 1 tham số: với phân phối gamma 3 tham số, đặt: y = (x-c)/b hoặc x = c + by, với phân phối gamma 2 tham số, đặt: y = x/b hoặc x = by. Với cách đổi biến như trên thì biến ngẫu nhiên y có phân phối gamma 1 tham số. 1.2.2. Các đặc trưng số của phân phối gamma Các đặc trưng số cơ bản của phân phối gamma 1 tham số được 3 tính như sau: Kỳ vọng: E(X) = (1.2) Phương sai: Var(X) = (1.3) Hệ số lệch: = √ (1.4) 1.3. Mô hình hồi quy gamma bậc 1 [GAR(1)] 1.3.1. Mô hình GAR(1) Lawrance và Lewis (1981) đề xuất mô hình GAR(1) như sau: (1.5) trong đó: là biến ngẫu nhiên biểu diễn quá trình phụ thuộc ở thời điểm i; là hệ số hồi quy; là biến ngẫu nhiên độc lập cần được xác định; có phân phối gamma 3 tham số và có hàm mật độ xác suất như ở phương trình (1.1). Quá trình được xác định bởi phương trình (1.5) được gọi là mô hình GAR(1), để mô phỏng quá trình này thì các tham số của mô hình phải được xác định và được sinh theo các lược đồ thích hợp và có sự kết hợp với các thuật toán sinh biến ngẫu nhiên có phân phối đều, phân phối mũ và phân phối Poisson. 1.3.2. Ước lượng các tham số của mô hình GAR(1) Bằng phương pháp moment, Fernandez và Salas (1990) đề xuất lược đồ điều chỉnh độ lệch để ước lượng các tham số của mô hình GAR(1). Quá trình ngẫu nhiên tuyến tính dừng GAR(1) ở phương trình (1.5) có 4 tham số là , b, c và Φ. Sử dụng phương pháp moment, các tham số này và các moment của biến ngẫu nhiên Xi có mối liên hệ sau: (1.6) (1.7) √ (1.8) Φ. (1.9) Trong đó , , , là trung bình mẫu, phương sai, độ lệch và hệ số tương quan bậc 1. Các tham số đặc trưng này có thể được ước lượng dựa trên mẫu thống kê {X1, X2, , XN}. bằng cách tính: 4 ∑ (1.10) ∑ ( ) (1.11) ( )( ) ∑ ( ) (1.12) ( ) ∑ ( )( ) (1.13) trong đó m, s, và r là ước lượng của , S, và tương ứng, và N là kích thước mẫu thống kê. Khi các biến ngẫu nhiên là phụ thuộc và không chuẩn, các ước lượng này thường bị lệch vì vậy cần phải điều chỉnh độ lệch và sau khi điều chỉnh độ lệch thu được các ước lượng không lệch của , S và các công thức (1.6) - (1.9) được sử dụng để ước lượng tập các tham số của mô hình: , b, c và Ф tương ứng. 1.4. Sinh biến ngẫu nhiên theo mô hình GAR(1) Sinh biến ngẫu nhiên theo mô hình GAR(1) cần phải kết hợp các thuật toán sinh các biến ngẫu nhiên có phân phối đều đơn vị, phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma. Có nhiều công trình nghiên cứu đề xuất các thuật toán để sinh biến ngẫu nhiên có phân phối gamma và được phân chia ra hai trường hợp: (1) Trường hợp tham số hình dạng a≤1, và, (2) Trường hợp tham số hình dạng a>1. Trong những năm gần đây có một số tác giả nghiên cứu đề xuất các thuật toán để sinh biến ngẫu nhiên gamma với tham số a là bất kỳ như trong công trình của Marsaglia và Tsang (2000), và gần đây Hong LiangJie (2012) đánh giá thuật toán do Marsaglia và Tsang (2000) đề xuất là một trong các thuật toán dễ cài đặt, có tốc độ nhanh nhất hiện nay và được cài đặt trong thư viện GSL và phần mềm Matlab “gamrnd”. 1.5. Bài toán mô phỏng lƣu lƣợng dòng chảy Bài toán mô phỏng lưu lượng dòng chảy đặt ra vấn đề là trên cơ sở chuỗi lưu lượng lịch sử hàng năm hoặc hàng tháng quan trắc được 5 tại các trạm đo thuỷ văn, áp dụng các phương pháp, mô hình để sinh chuỗi số liệu có độ dài n đủ lớn sao cho chuỗi số liệu sinh bảo toàn được các đặc trưng số thống kê gồm giá trị trung bình, độ lệch chuẩn, hệ số lệch và hệ số tương quan của chuỗi lưu lượng lịch sử. Các đặc trưng số thống kê của chuỗi lưu lượng dòng chảy lịch sử hàng tháng: giá trị trung bình, độ lệch chuẩn, hệ số lệch được tính bởi các phương trình: ∑ ∑ ( ) ( )( ) ∑ ( ) Các mô hình và phương pháp được đề xuất dùng để mô phỏng lưu lượng dòng chảy được phân thành nhóm mô hình có tham số và nhóm mô hình phi tham số. Nhóm mô hình có tham số được chia thành các loại mô hình độc lập và phụ thuộc cuả chuỗi lưu lượng lịch sử. Với giả thiết chuỗi lưu lượng lịch sử là độc lập có liên quan đến kiểu phân phối xác suất thì nhiều mô hình được đề xuất và trong đó, mô hình Thomas-Fiering (1962) biểu thị mô phỏng lưu lượng dòng chảy với bất kỳ kiểu phân phối xác suất được sử dụng phổ biến. Với sự đa dạng về khí hậu, nhiều công trình nghiên cứu xác định kiểu phân phối của lưu lượng dòng chảy thường không chuẩn, có độ lệch và phụ thuộc, và đối với trường hợp này, theo Fernandez và Salas (1990) thì áp dụng mô hình GAR(1) là rất hiệu quả để mô phỏng lưu lượng dòng chảy hàng năm. 1.6. Bài toán dung tích hồ chứa Trong các nghiên cứu về hồ chứa, nhiều bài toán được đặt ra như bài toán quy hoạch, thiết kế, bài toán vận hành hồ chứa hoặc vận hành liên hồ chứa. Đối với lớp các bài toán quy hoạch, thiết kế hồ chứa, vấn đề quan trọng là xác định được dung tích của hồ chứa trên cơ sở các nguồn nước chảy vào và điều tiết dòng chảy ra khỏi hồ 6 chứa. Các nghiên cứu về dung tích hồ chứa tuỳ thuộc vào các trường hợp hồ chứa có dung tích hữu hạn, bán hữu hạn hoặc vô hạn. Một hồ chứa hữu hạn có thể có lượng nước trong hồ tràn đầy hoặc cạn kiệt, hồ chứa bán hữu hạn chỉ có thể có một trong hai trường hợp hoặc tràn đầy hoặc cạn kiệt. Đối với hồ chứa có dung tích vô hạn thì giả thiết rằng hồ chứa không bao giờ tràn đầy hoặc kiệt nước trong khoảng thời gian hoạt động của nó là n năm, theo Salas-La Cruz (1972), giả thiết này phù hợp cho việc nghiên cứu quy hoạch, thiết kế các hồ chứa có dung tích lớn (hàng trăm triệu trở lên). Với sự biến đổi khí hậu toàn cầu hiện nay, mưa và khô hạn kéo dài dẫn đến lũ lụt và hạn hán phổ biến ở nhiều quốc gia, thực tế này đòi hỏi cần nghiên cứu xây dựng các hồ chứa có dung tích lớn để điều tiết nguồn nước hợp lý, vì vậy, việc nghiên cứu dung lượng hồ chứa để phục vụ việc thiết kế các hồ chứa có dung tích lớn cần được quan tâm. KẾT LUẬN CHƢƠNG 1 Từ việc nghiên cứu có hệ thống theo chủ đề của các công trình đã công bố, Tác giả luận án phát hiện những hạn chế sau đây: - Chưa có nghiên cứu, đánh giá, chọn lựa các thuật toán thích hợp để sinh biến ngẫu nhiên GAR(1), chưa có nghiên cứu đề xuất mô hình biểu thị mô phỏng lưu lượng dòng chảy hàng tháng với quá trình ngẫu nhiên GAR(1) và chưa có nghiên cứu xác định dung lượng trung bình của hồ chứa với dòng chảy vào hồ chứa là quá trình ngẫu nhiên GAR(1). Từ những hạn chế nêu trên, định hướng nghiên cứu là nghiên cứu đánh giá và chọn lựa các thuật toán sinh biến ngẫu nhiên thích hợp để sinh biến ngẫu nhiên GAR(1), nghiên cứu các đặc trưng số cơ bản của tổng các biến ngẫu nhiên GAR(1), nghiên cứu bài toán mô phỏng lưu lượng dòng chảy hàng tháng, hàng năm với quá trình ngẫu nhiên GAR(1) và nghiên cứu mô phỏng dung lượng trung bình của hồ chứa với dòng chảy vào hồ chứa là quá trình ngẫu nhiên GAR(1). 7 CHƢƠNG 2 CÁC THUẬT TOÁN SINH BIẾN NGẪU NHIÊN GAR(1) Nội dung chương này trình bày các thuật toán sinh các biến ngẫu nhiên GAR(1). Bằng phương pháp nghiên cứu lý thuyết và phương pháp mô phỏng, các vấn đề lý luận cơ bản và các thuật toán sinh biến ngẫu nhiên GAR(1) được nghiên cứu, cài đặt và thử nghiệm. 2.1. Nghiên cứu một số thuật toán dùng để sinh biến ngẫu nhiên GAR(1) Để áp dụng mô hình GAR(1) vào thực tế, cần phải sinh các biến ngẫu nhiên GAR(1) dựa vào mẫu thống kê. Để sinh các biến ngẫu nhiên GAR(1) cần kết hợp các thuật toán sinh các biến ngẫu nhiên có phân phối đều đơn vị, phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma. 2.2. Đề xuất thuật toán sinh biến ngẫu nhiên gamma với giá trị bất kỳ của tham số hình dạng a Thuật toán do Minh (1988) đề xuất được sử dụng để sinh biến ngẫu nhiên có phân phối gamma với tham số hình dang a>1. Dựa vào kết quả của Marsaglia và Tsang (2000), thuật toán cải tiến từ thuật toán Minh được đề xuất bởi Hung, Trang và Chien (2014) gọi là thuật toán IMGAG để sinh biến ngẫu nhiên gamma với giá trị bất kỳ của tham số a của phân phối gamma như sau: (1) Nếu a>1 sử dụng thuật toán của Minh với tham số a để sinh X, chuyển đến bước (3); (2) Nếu 1≥a>0 sử dụng thuật toán của Minh với tham số a+1 để sinh tính X = với U∼U(0,1) (U có phân phối đều trong khoảng (0,1)); (3) Nhận được X; (4) Kết thúc. 2.3. Đề xuất bổ sung tiêu chí đánh giá hiệu quả của thuật toán sinh biến ngẫu nhiên Trong thực tế, việc đánh giá tính hiệu quả các thuật toán sinh biến ngẫu nhiên chủ yếu dựa vào các tiêu chí là độ phức tạp và tính dễ cài đặt của thuật toán. Ngoài các tiêu chí nêu trên; Hung, Trang và 8 Chien (2014) đề xuất bổ sung tiêu chí để đánh giá tính hiệu quả của các thuật toán khác nhau dùng để sinh biến ngẫu nhiên có kiểu phân phối xác suất xác định là sử dụng thuật toán sinh chuỗi số ngẫu nhiên độc lập và kiểm tra sự bảo toàn các đặc trưng số gồm giá trị kỳ vọng, phương sai và hệ số lệch của chuỗi số phát sinh. 2.4. Mô phỏng thực nghiệm 2.4.1. Phương pháp mô phỏng Sử dụng các thuật toán sinh biến ngẫu nhiên gamma: Thuật toán Ahrens (1974) sử dụng cho trường hợp tham số a 1, thuật toán Tadikamalla (1978) sử dụng cho trường hợp tham số a>1, thuật toán IMGAG và thuật toán Marsaglia (2000) sử dụng cho mọi giá trị của tham số a. Các thuật toán được cài đặt bằng ngôn ngữ C và sử dụng mỗi thuật toán để sinh 10.000 số ngẫu nhiên có phân phối gamma với các tham số a khác nhau (từ 0.1 đến 500). Dựa vào mẫu các số ngẫu nhiên được sinh, các đặc trưng số thống kê gồm giá trị trung bình, phương sai và hệ số lệch được tính theo các công thức (1.10) - (1.12). Hệ số tương quan tính theo công thức (1.13). 2.4.2. Kết quả mô phỏng Từ mô phỏng thử nghiệm, kết qủa được trình bày trong các bảng 2.1 - 2.3 và các hình vẽ 2.1 - 2.3 như sau: Bảng 2.1. Giá trị trung bình của 10.000 số ngẫu nhiên gamma được sinh theo thuật toán IMGAG, thuật toán Marsaglia và thuật toán Ahrens a IMGAG Marsaglia Ahrens TB sinh % sai số TB sinh % sai số TB sinh % sai số 0.1 0.099 0.78 0.114 14.32 0.098 2.13 0.2 0.195 2.39 0.230 15.02 0.199 0.55 0.3 0.296 1.27 0.343 14.38 0.297 1.09 0.4 0.390 2.57 0.450 12.67 0.394 1.54 0.5 0.498 0.41 0.564 12.79 0.502 0.34 0.6 0.603 0.58 0.665 10.90 0.592 1.26 0.7 0.693 1.04 0.778 11.14 0.700 0.00 0.8 0.798 0.30 0.867 8.43 0.794 0.78 0.9 0.914 1.55 0.980 8.94 0.886 1.54 1.0 0.984 1.60 1.350 35.03 0.995 0.53 9 Hình 2.1: Giá trị trung bình với các tham số hình dạng a ≤1 Bảng 2.2. Phương sai của 10.000 số ngẫu nhiên gamma được sinh theo thuật toán IMGAG, thuật toán Marsaglia và thuật toán Ahrens a IMGAG Marsaglia Ahrens PS sinh % sai số PS sinh % sai số PS sinh % sai số 0.1 0.098 1.79 0.094 6.44 0.102 2.13 0.2 0.192 4.18 0.183 8.54 0.196 2.25 0.3 0.273 8.03 0.270 10.08 0.290 3.34 0.4 0.373 6.78 0.346 14.89 0.396 1.01 0.5 0.483 3.42 0.416 16.71 0.502 0.36 0.6 0.604 0.70 0.506 15.59 0.578 3.67 0.7 0.668 4.53 0.562 19.74 0.696 0.52 0.8 0.795 0.64 0.609 23.92 0.763 4.60 0.9 0.937 4.12 0.684 23.99 0.872 3.09 1.0 0.961 3.86 1.351 35.06 0.991 0.86 Hình 2.2: Phương sai với các tham số hình dạng a ≤1 0.1 0.6 1.1 1.6 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 PT (1.2) IMGAG Marsaglia Ahrens 0.1 0.3 0.5 0.7 0.9 1. ... 3.30 32.67 30.37 24.61 4 39.32 40.82 34.25 29.29 5 60.89 63.72 53.22 45.05 6 39.63 38.2 32.01 29.01 7 25.65 26.07 29.32 19.35 8 48.82 49.52 71.14 36.02 9 174.70 178.68 88.39 18.56 10 354.16 376.42 438.79 244.56 11 549.65 544.42 534.59 401.98 12 329.72 334.52 311.34 235.41 Hình 3.2: Độ lệch chuẩn tại trạm đo Nông Sơn Bảng 3.3. Hệ số lệch tại trạm đo Nông Sơn Tháng Lịch sử GAR(1)-M GAR(1)-F Th.Fiering 1 1.54 1.53 1.51 0.67 2 1.09 1.23 0.95 0.57 3 0.87 1.20 0.73 0.43 4 1.70 1.98 2.18 0.48 5 0.79 1.00 0.78 0.35 6 0.77 0.80 0.93 0.34 7 0.47 0.64 1.32 0.22 8 1.55 1.76 3.44 0.62 0 200 400 600 1 2 3 4 5 6 7 8 9 10 11 12 Dữ liệu lịch sử GAR(1)-M GAR(1)-F THOMAS-FIERING Tháng m3/s 17 9 3.08 5.17 2.32 1.73 10 0.23 -0.01 -0.12 0.22 11 0.68 0.66 1.66 0.42 12 0.84 1.12 0.96 0.55 Hình 3.3 Hệ số lệch tại trạm đo Nông Sơn Bảng 3.4. Các đặc trưng số thống kê hàng năm tại trạm đo Nông Sơn Đặc trưng số Lịch sử GAR(1)-M GAR(1)-F Th.Fiering Giá trị trung bình 3469.72 3454.17 3467.92 3588.66 Độ lệch chuẩn 1030.77 729.03 1025.29 664.64 Hệ số lệch 0.76 0.32 0.78 0.08 Tương tự tại các trạm đo Thạnh Mỹ và Yên Bái, Tác giả cũng thu được các bảng và các hình vẽ tương ứng. KẾT LUẬN CHƢƠNG 3 Trong chương 3, Tác giả đã thực hiện nghiên cứu và đạt được kết quả như sau: nghiên cứu và đề xuất các mô hình biểu thị mô phỏng lưu lượng dòng chảy hàng tháng là mô hình GAR(1)-Monthly và mô hình GAR(1)-Fragments. Bằng mô phỏng thực nghiệm, kết quả thu được là mô hình GAR(1)-Monthly bảo toàn các đặc trưng số thống kê gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn các mô hình GAR(1)-Fragments và mô hình Thomas-Fiering và trên cơ sở dữ liệu hàng tháng để tính dữ liệu hàng năm thì mô hình GAR(1)- Fragments bảo toàn các đặc trưng số thống kê gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn so với mô hình GAR(1)-Monthly và mô hình Thomas-Fiering. -2 0 2 4 6 1 2 3 4 5 6 7 8 9 10 11 12 Dữ liệu lịch sử GAR(1)-M GAR(1)-F THOMAS-FIERING Tháng 18 CHƢƠNG 4 DUNG LƯỢNG TRUNG BÌNH CỦA HỒ CHỨA VỚI DÒNG VÀO LÀ QUÁ TRÌNH NGẪU NHIÊN GAR(1) Nội dung chương này trình bày nghiên cứu về bài toán tính dung lượng trung bình của hồ chứa. Bằng phương pháp lý thuyết, các biểu thức giải tích về kỳ vọng và phương sai của tổng các biến ngẫu nhiên GAR(1) được đề xuất. Kết hợp công thức của Phien (1978) với biểu thức giải tích về phương sai của tổng các biến ngẫu nhiên có phân phối GAR(1) đã đạt được, Tác giả đề xuất biểu thức xấp xỉ dùng để tính dung lượng trung bình của hồ chứa với dòng vào là các biến ngẫu nhiên GAR(1). Bằng kỹ thuật mô phỏng, sử dụng mô hình GAR(1) phát sinh lưu lượng hàng năm chảy vào hồ chứa và thu được các giá trị về dung lượng trung bình của hồ chứa với các tham số khác nhau và được so sánh với các giá trị theo biểu thức xỉ. 4.1. Dung lƣợng của hồ chứa 4.1.1. Phương trình tính dung lượng hồ chứa tổng quát Xem { } là một chuỗi các biến ngẫu nhiên với ( ) = 0 khi đó tổng tích luỹ hay tổng riêng gọi là , cực đại của tổng riêng hay lượng dư thừa , cực tiểu của tổng riêng hay lượng thiếu hụt , và biên độ dao động của tổng riêng của dãy gồm n biến ngẫu nhiên được định nghĩa như sau: (4.1) ( ) (4.2) ( ) (4.3) (4.4) dễ thấy rằng và ( ) = 0. 4.1.2. Dung lượng trung bình của hồ chứa với dòng chảy vào là các biến ngẫu nhiên độc lập Dung lượng trung bình của hồ chứa được nghiên cứu với giả thiết rằng các dòng chảy vào hồ chứa ( ) là chuỗi các biến ngẫu nhiên độc lập. Để loại bỏ sự phụ thuộc của dung lượng trung bình của hồ chứa vào các kiểu phân phối khác nhau, một biến ngẫu nhiên mới được sử dụng bằng cách chuẩn hoá : 19 ở đây là độ lệch chuẩn của . Biến ngẫu nhiên đã được chuẩn hoá có trung bình bằng 0 và phương sai đơn vị. Với việc sử dụng biến ngẫu nhiên mới , nếu ( ) và ( ) là các giá trị kỳ vọng của biên độ dao động của dung lượng tương ứng với z và , do đó ta có: ( ) ( ) Bằng phương pháp sử dụng hàm đa biến, với giả thiết dòng chảy vào hồ chứa là chuỗi các biến ngẫu nhiên có phân phối chuẩn, Salas-La Cruz (1972) cho kết quả dung lượng trung bình của hồ chứa như sau: ( ) √ ∑ ( ) Với trường hợp chuỗi các biến ngẫu nhiên có phân phối gamma độc lập, theo Phien (1978) thì hệ số lệch của phân phối gamma cần được tính đến và cho kết quả là biểu thức xấp xỉ tính dung lượng trung bình của hồ chứa là: ( ) √ ∑ ( ) ( ) (4.5) 4.2. Phân tích lý thuyết 4.2.1. Đặc trưng số cơ bản của tổng các biến ngẫu nhiên GAR(1) Các biến ngẫu nhiên theo mô hình GAR(1) được biểu diễn bởi phương trình: Khi đó tổng của n biến ngẫu nhiên GAR(1) là một biến ngẫu nhiên gọi là được tính theo phương trình : ∑ trong đó: , i = 1, 2, , n là các biến GAR(1). Bằng phân tích lý thuyết, Hung va Chien (2013) đạt được các biểu thức giải tích về các đặc trưng số cơ bản: kỳ vọng và phương sai 20 của tổng các biến ngẫu nhiên GAR(1) với phân phối gamma 1 tham số như sau: Kỳ vọng của tổng của n biến ngẫu nhiên GAR(1) gọi là ( ) và ( ) . Phương sai của tổng của n biến ngẫu nhiên GAR(1) được ký hiệu là Var(Sn) và: ( ) ∑ ( ) (4.6) 4.2.2. Biểu thức xấp xỉ của dung lượng trung bình hồ chứa với dòng chảy vào là các biến ngẫu nhiên GAR(1) Biên độ dao động của dung lượng hồ chứa được xem xét là tổng luỹ tích ∑ ∑ ( ) trong đó là sự dao động của xung quanh giá trị trung bình dài hạn của và là một biến ngẫu nhiên có phân phối gamma phụ thuộc tuân theo mô hình GAR(1): Theo kết quả của Phien(1978), hệ số lệch được tính đến, và theo kết quả của Hung và Chien(2013), thay thế phương sai của tổng các biến ngẫu nhiên GAR(1) ở phương trình (4.6) vào phương trình (4.5) ta thu được biểu thức xấp xỉ dùng để tính dung lượng trung bình của hồ chứa với các biến ngẫu nhiên theo GAR(1) đã được chuẩn hoá là: ( ) √ ∑ [ ∑ ( ) ] ( ) (4.7) 4.3. Mô phỏng thực nghiệm 4.3.1. Số liệu và phương pháp mô phỏng Với mỗi giá trị về hệ số lệch của phân phối gamma và giá trị về hệ số hồi quy của mô hình GAR(1), một mẫu gồm n = 100.000 chuỗi các biến ngẫu nhiên GAR(1) được sinh, mỗi chuỗi gồm N = 50 giá trị, mỗi giá trị tương ứng với một biên độ dao động của dung lượng của hồ chứa và được sử dụng để tính dung lượng trung bình của hồ chứa có độ dài (tuổi thọ) 50 năm. Tương tự, tính cho các hồ chứa có tuổi thọ (l năm) ngắn hơn (l < 50), mỗi chuỗi gồm l giá trị được sử 21 dụng để tính dung lượng trung bình của hồ chứa có tuổi thọ l năm tương ứng. Trong thực nghiệm này, Tác giả sử dụng hệ số lệch của phân phối gamma có giá trị trong khoảng [0.5,3.0], theo Phien (1993); điều này phù hợp với hầu hết các trường hợp dòng chảy vào hồ chứa trong thực tế. Sử dụng biểu thức xấp xỉ tính dung lượng trung bình của hồ chứa ở công thức (4.7) và bằng phương pháp mô phỏng, số liệu được sinh tương ứng với biên độ dao động của dung lượng của hồ chứa và giá trị trung bình của dung lượng của hồ chứa được tính với các giá trị khác nhau của n, và . 4.3.2. Kết quả mô phỏng Kết quả được cho ở bảng 4.1 và hình vẽ 4.1 như sau : Bảng 4.1. Giá trị dung lượng trung bình của hồ chứa với trường hợp hệ số hồi quy và hệ số lệch l Năm Dung lượng trung bình hồ chứa Phương trình (4.7) Kết quả mô phỏng % sai số 5 3.225 3.197 0.875 10 5.663 5.624 0.693 15 7.688 7.635 0.694 20 9.452 9.380 0.767 25 11.034 10.945 0.813 30 12.482 12.392 0.726 35 13.823 13.727 0.699 40 15.079 14.979 0.667 45 16.264 16.152 0.693 50 17.389 17.265 0.718 Hình 4.1: Hệ số hồi quy = 0.6, hệ số lệch = 2.0 0 5 10 15 20 0 5 10 15 20 25 30 35 40 45 50 Phương trình (4.7) Kết quả mô phỏng Năm 22 Tác giả cũng thu được các bảng và các hình vẽ tương tự với các hệ số lệch trong khoảng từ 0.5 đến 3.0 và các hệ số hồi quy trong khoảng từ 0.2 đến 0.8. KẾT LUẬN CHƢƠNG 4 Ở chương 4, các kết quả đạt được như sau: Phân tích lý thuyết và đạt được biểu thức giải tích về kỳ vọng và phương sai của tổng các biến ngẫu nhiên GAR(1), trên cơ sở biểu thức giải tích về phương sai của tổng các biến ngẫu nhiên GAR(1), Tác giả đề xuất biểu thức xấp xỉ tính dung lượng trung bình của hồ chứa với dòng chảy vào hồ chứa là các biến ngẫu nhiên GAR(1) và được so sánh với kết quả mô phỏng và kết quả là tương tự với nhau. KẾT LUẬN LUẬN ÁN 1. Kết quả đạt đƣợc Qua quá trình nghiên cứu ở các chương: tổng quan nghiên cứu, các thuật toán sinh biến ngẫu nhiên GAR(1), mô phỏng lưu lượng dòng chảy với quá trình ngẫu nhiên GAR(1) và dung lượng trung bình của hồ chứa với dòng vào là quá trình ngẫu nhiên GAR(1) được trình bày trong Luận án, những kết quả sau đây đã đạt được: 1.1. Về lý thuyết - Nghiên cứu đề xuất thuật toán cải tiến từ thuật toán của Minh(1988) gọi là thuật toán IMGAG để sinh biến ngẫu nhiên gamma với mọi giá trị của tham số hình dạng a > 0 của phân phối gamma. Đề xuất bổ sung yếu tố để đánh giá tính hiệu quả của thuật toán sinh biến ngẫu nhiên có kiểu phân phối xác định là dựa vào kỹ thuật mô phỏng và sử dụng thuật toán để sinh một chuỗi số ngẫu nhiên. Trên cơ sở chuỗi số ngẫu nhiên được sinh, kiểm tra tính độc lập (dựa vào hệ số tương quan) và sự bảo toàn các đặc trưng số gồm kỳ vọng, phương sai và hệ số lệch của phân phối xác suất; - Nghiên cứu đề xuất 2 mô hình: GAR(1)-Monthly và GAR(1)- Fragments dùng để mô phỏng lưu lượng dòng chảy hàng tháng. 23 - Phân tích lý thuyết và đạt được biểu thức giải tích về kỳ vọng và phương sai của tổng các biến ngẫu nhiên GAR(1). Trên cơ sở biểu thức giải tích về phương sai của tổng các biến ngẫu nhiên GAR(1) kết hợp với kết quả lý thuyết của Salas-La Cruz (1972) và kết quả thực nghiệm của Phien (1978), đề xuất biểu thức xấp xỉ tính dung lượng trung bình của hồ chứa với dòng chảy vào hồ chứa là quá trình ngẫu nhiên GAR(1). 1.2. Về mô phỏng thực nghiệm - Trường hợp tham số hình dạng a<1: Thuật toán IMGAG và thuật toán AHRENS bảo toàn rất tốt các đặc trưng số gồm kỳ vọng, phương sai và hệ số lệch của phân phối gamma trong khi đó thuật toán MARSAGLIA bảo toàn không tốt các đặc trưng số của phân phối gamma. Trường hợp tham số hình dạng 1<a<5, thuật toán TADIKAMALLA và thuật toán IMGAG bảo toàn các đặc trưng số: kỳ vọng, phương sai và hệ số lệch của phân phối gamma tốt hơn thuật toán MARSAGLIA; - Các mô hình GAR(1)-Monthly, mô hình GAR(1)-Fragments và mô hình Thomas-Fiering bảo toàn tốt các đặc trưng số thống kê hàng tháng: giá trị trung bình và độ lệch chuẩn của các trạm đo được thử nghiệm. Trái lại, mô hình GAR(1)-Fragments và mô hình Thomas- Fiering không bảo toàn tốt hệ số lệch; - Mô hình GAR(1)-Monthly bảo toàn các đặc trưng số thống kê gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn các mô hình GAR(1)-Fragments và mô hình Thomas-Fiering; - Trên cơ sở dữ liệu hàng tháng để tính dữ liệu hàng năm thì mô hình GAR(1)-Fragments bảo toàn các đặc trưng số thống kê gồm giá trị trung bình, độ lệch chuẩn và hệ số lệch tốt hơn so với mô hình GAR(1)-Monthly và mô hình Thomas-Fiering; - So sánh, đánh giá kết quả thu được bằng phương pháp mô phỏng và biểu thức xấp xỉ tính dung lượng trung bình hồ chứa, biểu thức xấp xỉ và phương pháp mô phỏng cho kết quả tương tự với nhau. Vì vậy, biểu thức xấp xỉ ở phương trình (4.7) có thể được sử 24 dụng trong thực tế để tính dung lượng trung bình của hồ chứa có dung tích lớn. Với những kết quả đạt được nêu trên, thể hiện: Thuật toán IMGAG, biểu thức xấp xỉ, mô hình GAR(1)-Monthly và mô hình GAR(1)-Fragments do Tác giả nghiên cứu đề xuất được kiểm chứng tính hiệu quả bằng mô phỏng thử nghiệm với các số liệu thực tế. Kết quả cho thấy thuật toán IMGAG dùng để sinh biến ngẫu nhiên gamma, biểu thức xấp xỉ dùng để tính dung lượng trung bình hồ chứa, mô hình GAR(1)-Monthly và mô hình GAR(1)-Fragments dùng để mô phỏng lưu lượng dòng chảy hàng tháng với quá trình ngẫu nhiên GAR(1) có thể được ứng dụng hiệu quả trong lãnh vực thủy văn. 2. Hƣớng nghiên cứu tiếp tục Bên cạnh những kết quả đã đạt được, hướng nghiên cứu tiếp tục của Luận án bao gồm: - Để sinh biến ngẫu nhiên GAR(1) cần phải sử dụng các thuật toán sinh các biến ngẫu nhiên có các phân phối đều, phân phối mũ, phân phối chuẩn, phân phối Poisson và phân phối gamma. Nội dung nghiên cứu của Luận án chỉ mới đánh giá các thuật toán sinh biến ngẫu nhiên gamma, vì vậy, sẽ nghiên cứu đánh giá tính hiệu quả của các thuật toán sinh biến ngẫu nhiên có phân phối chuẩn và phân phối Poisson để có thể áp dụng vào thực tế tốt hơn; - Với mỗi mô hình sinh lưu lượng dòng chảy hàng tháng, phân tích một số đặc trưng số thống kê của số liệu lịch sử hàng tháng tại một số trạm đo thử nghiệm chưa được bảo toàn tốt. Nghiên cứu đánh giá việc bảo toàn hệ số tương quan của các mô hình đã đề xuất; - Nghiên cứu về biểu thức giải tích của dung lượng trung bình hồ chứa với dòng vào là quá trình ngẫu nhiên GAR(1). Trên đây là những vấn đề nên được tiếp tục nghiên cứu và giải quyết trong tương lai ./. 25 DANH MỤC CÔNG TRÌNH ĐÃ ĐƢỢC CÔNG BỐ CỦA TÁC GIẢ 1. Nguyen Van Hung and Tran Quoc Chien, (2013), "Computer simulation and approximate expression for the mean range of reservoir storage with GAR (1) inflows." In Proceedings of the Fourth Symposium on Information and Communication Technology, ACM, New York, NY, USA, pp. 11 - 17. 2. Nguyen Van Hung, Huynh Ngoc Phien, Tran Quoc Chien, (2014), “Computer Simulation of Streamflows with GAR(1)-Monthly and GAR(1)-Fragments Models”, The World of Computer Science and Information Technology Journal (WCSIT, USA), Volume 4, No.11, pp. 150 - 156. 3. Nguyen Van Hung, Ngo Thi Thanh Trang, Tran Quoc Chien, (2014), “An Improvement of Minh’s Algorithm for Generating Gamma Variates with Any Value of Shape Parameter”, Indian Journal of Computer Science and Engineering (IJCSE), Volume 5, No 6, pp. 199 - 205. 4. Nguyễn Văn Hưng, Trần Quốc Chiến, Võ Đình Nam, (2012) “Nghiên cứu đánh giá các thuật toán sinh biến ngẫu nhiên có phân phối gamma”, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, Số 10(59), trang 58 - 63. 5. Nguyen Van Hung, Tran Quoc Chien, (2013), “Computer Simulation of Monthly Streamflows with Thomas-Fiering model and Gar(1)-Fragments model”, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, Số.12(73), (Số tiếng Anh). trang. 46 – 51. 6. Nguyễn Văn Hưng, Ngô Thị Thanh Trang, (2014), “Mô phỏng lưu lượng dòng chảy hàng tháng với mô hình FGAR(1) và mô hình MGAR(1)”, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, Số 1(74), Quyển 2 (Số đặc biệt dành cho hội nghị RAIT), trang 25 - 29. 7. Nguyễn Văn Hưng, Phan Văn Sơn, Trần Quốc Chiến, (2014), “Nghiên cứu sự bảo toàn các tham số đặc trưng của mô hình FGAR(1)”,Kỷ yếu Hội thảo Khoa học Hệ thống thông tin, Trường Đại học Sư phạm , Đại học Đà Nẵng, trang 110 - 116.
File đính kèm:
- tom_tat_luan_an_nghien_cuu_mo_hinh_hoi_quy_gamma_bac_1_gar1.pdf