Luận án Các phụ thuộc logic trong mô hình dữ liệu dạng khối
Để có thể xây dựng được một hệ thống cơ sở dữ liệu tốt, người ta
thường sử dụng các mô hình dữ liệu thích hợp.
Đã có một số loại mô hình được sử dụng trong các hệ thống cơ sở dữ
liệu như: mô hình thực thể - liên kết, mô hình mạng, mô hình phân cấp, mô
hình hướng đối tượng, mô hình dữ liệu datalog [53], [54], và mô hình quan hệ
[33], [52], [53], [54]. Trong số các mô hình này, có ba mô hình dữ liệu
thường được sử dụng: mô hình phân cấp, mô hình mạng và mô hình quan hệ.
Đối với ba mô hình này thì mô hình quan hệ được quan tâm hơn cả. Mô hình
này do E. Codd đề xuất ra năm 1970. Sở dĩ mô hình quan hệ được quan tâm
như vậy là vì nó được xây dựng trên một cơ sở toán học chặt chẽ - đó là lý
thuyết toán học về các quan hệ có áp dụng rộng rãi các công cụ đại số và
logic. Tuy nhiên, do các quan hệ có cấu trúc phẳng (tuyến tính) nên mô hình
này chưa đủ đáp ứng đối với các ứng dụng phức tạp, các cơ sở dữ liệu có cấu
trúc phi tuyến,.
Tóm tắt nội dung tài liệu: Luận án Các phụ thuộc logic trong mô hình dữ liệu dạng khối
BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ TRẦN MINH TUYẾN CÁC PHỤ THUỘC LOGIC TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI - 2015 1 BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ TRẦN MINH TUYẾN CÁC PHỤ THUỘC LOGIC TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI Chuyên ngành: Cơ sở toán học cho tin học Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TSKH. NGUYỄN XUÂN HUY HÀ NỘI - 2015 2 LỜI CẢM ƠN Để hoàn thành luận án này, tôi đã nhận được sự giúp đỡ rất nhiệt tình của các thày, cô giáo trong khoa Công nghệ Thông tin, Học viện Kỹ thuật Quân sự và trường Đại học Công đoàn. Tôi xin gửi lời cảm ơn tới các thày, cô giáo trong khoa Công nghệ Thông tin, Học viện kỹ thuật Quân sự và trường Đại học Công đoàn đã tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình viết luận án. Đặc biệt tôi xin trân trọng cảm ơn PGS.TSKH. Nguyễn Xuân Huy, người đã tận tình hướng dẫn, chỉ bảo cho tôi trong toàn bộ quá trình học tập, nghiên cứu đề tài và giúp tôi hoàn thành bản luận án này. Hà Nội, ngày 10 tháng 10 năm 2015 Tác giả luận án Trần Minh Tuyến 3 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của tôi dưới sự hướng dẫn khoa học của PGS.TSKH. Nguyễn Xuân Huy. Các kết quả được viết chung với các đồng tác giả đã được sự chấp thuận của các tác giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tác giả luận án Trần Minh Tuyến 4 MỤC LỤC Trang MỞ ĐẦU 10 Chương 1: Mô hình dữ liệu dạng khối 20 1.1 Mô hình dữ liệu 20 1.1.1 Khái niệm 20 1.1.2 Phân loại 21 1.2 Mô hình dữ liệu dạng khối 23 1.2.1 Khối, lát cắt của khối 23 1.2.2 Đại số khối 26 1.2.3 Phụ thuộc hàm 31 1.2.4 Bao đóng của tập thuộc tính chỉ số 33 1.2.5 Khóa của lược đồ khối = (R,F) 34 1.3 Ánh xạ đóng 36 1.3.1 Khái niệm 36 1.3.2 Khóa của ánh xạ đóng 38 1.4 Các công thức Boolean 39 1.4.1 Khái niệm 39 1.4.2 Bảng trị và bảng chân lý 40 1.4.3 Suy dẫn logic 41 1.4.4 Công thức Boolean dương 41 Chương 2: Phép dịch chuyển lược đồ khối và lược đồ khối cân bằng 43 2.1 Phép dịch chuyển lược đồ khối 43 2.2 Thuật toán dịch chuyển lược đồ khối 45 5 2.3 Biểu diễn bao đóng và khóa qua phép dịch chuyển 47 2.3.1 Biểu diễn bao đóng 47 2.3.2 Biểu diễn khóa 49 2.4 Khóa và các tập thuộc tính nguyên thủy, phi nguyên thủy 54 2.5 Lược đồ khối cân bằng 61 2.6 Thuật toán dịch chuyển lược đồ khối về dạng cân bằng 65 2.7 Tập các vế trái cực tiểu 69 Chương 3: Phụ thuộc Boolean dương và phụ thuộc Boolean dương tổng quát trên khối 72 3.1 Lược đồ khối và ánh xạ đóng 72 3.2 Phụ thuộc Boolean dương trên khối 76 3.2.1 Khối chân lý 76 3.2.2 Phụ thuộc Boolean dương 77 3.3 Mối quan hệ giữa các kiểu phụ thuộc hàm và các công thức Boolean dương trên khối 84 3.4 Phụ thuộc Boolean dương tổng quát trên khối 86 3.5 Thể hiện phụ thuộc Boolean dương tổng quát trên khối 92 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO 95 DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ 97 TÀI LIỆU THAM KHẢO 99 6 DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT Kí hiệu Ý nghĩa của kí hiệu XY Biểu diễn hợp của hai tập X và Y REL(U) Tập toàn thể các quan hệ trên tập thuộc tính U RELp(U) Tập toàn thể các quan hệ có không quá p bộ trên tập thuộc tính U, p 1. t*v Phép kết nối hai bộ t và v. t*S Phép kết nối bộ t với quan hệ S. t[X], t.X hạn chế của bộ (ánh xạ) t trên tập thuộc tính X. id id’ Kí hiệu tích rời rạc của id và id’ MP Hợp của 2 tập con M và P M {MX| X }. {XY | X , Y }. AXĐ Ánh xạ đóng f * g Hội của hai ánh xạ đóng f và g. SubSet(U) Tập tất cả các tập con của U. Suy dẫn logic. Suy dẫn theo quan hệ. 2 Suy dẫn theo quan hệ có không quá 2 phần tử. CTB Công thức Boolean. CTBD Công thức Boolean dương. PTBD Phụ thuộc Boolean dương. PTBDTQ Phụ thuộc Boolean dương tổng quát. Fix(f) Tập toàn bộ các điểm bất động của f. Gen(G) Tập sinh của giàn giao G. Coatom(G) Đối nguyên tử của giàn giao G MAX(M) Tập các phần tử cực đại của M. 7 PTH Phụ thuộc hàm. Uo Tập tất cả các thuộc tính không khoá. UK Tập tất cả các thuộc tính khoá. UI Tập tất cả các thuộc tính nằm trong mọi khoá. LS(f) Vế trái của phụ thuộc hàm f. RS(f) Vế phải của phụ thuộc hàm f. LS(F) Hợp các vế trái của tất cả các phụ thuộc hàm f F. RS(F) Hợp các vế phải của tất cả các phụ thuộc hàm f F. 8 DANH SÁCH BẢNG Trang Bảng 1: Biểu diễn quan hệ CAN_BO_1. 10 Bảng 1.1: Biểu diễn lát cắt của khối KH_HANG. 25 9 DANH SÁCH HÌNH VẼ Trang Hình 1: Biểu diễn khối CAN_BO_2. 11 Hình 2: Biểu diễn khối dữ liệu đa chiều. 12 Hình 1.1: Biểu diễn khối KH_HANG. 24 Hình 3.1: Biểu diễn khối KH_HANG và phụ thuộc Boolean dương f. 77 Hình 3.2: Biểu diễn khối chân lý r1 của khối KH_HANG. 78 Hình 3.3: Biểu diễn khối KH_HANG và PTBDTQ g. 88 Hình 3.4: Biểu diễn khối chân lý r2 của khối KH_HANG. 88 10 MỞ ĐẦU 1. Lý do lựa chọn đề tài Để có thể xây dựng được một hệ thống cơ sở dữ liệu tốt, người ta thường sử dụng các mô hình dữ liệu thích hợp. Đã có một số loại mô hình được sử dụng trong các hệ thống cơ sở dữ liệu như: mô hình thực thể - liên kết, mô hình mạng, mô hình phân cấp, mô hình hướng đối tượng, mô hình dữ liệu datalog [53], [54], và mô hình quan hệ [33], [52], [53], [54]. Trong số các mô hình này, có ba mô hình dữ liệu thường được sử dụng: mô hình phân cấp, mô hình mạng và mô hình quan hệ. Đối với ba mô hình này thì mô hình quan hệ được quan tâm hơn cả. Mô hình này do E. Codd đề xuất ra năm 1970. Sở dĩ mô hình quan hệ được quan tâm như vậy là vì nó được xây dựng trên một cơ sở toán học chặt chẽ - đó là lý thuyết toán học về các quan hệ có áp dụng rộng rãi các công cụ đại số và logic. Tuy nhiên, do các quan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứng đối với các ứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến,... Ví dụ: Khi cần theo dõi hồ sơ cán bộ trong một cơ quan, ta lập bảng sau: CAN_BO_1: ma ten luong trinh_do A01 A 350 ThS A02 B 300 DH A03 C 250 CD Bảng 1: Biểu diễn quan hệ CAN_BO_1. 11 Bảng này gồm các trường: ma (mã cán bộ), ten (tên cán bộ), luong (lương hàng tháng), trinh_do (trình độ cán bộ). Bảng này chính là một quan hệ trong mô hình dữ liệu quan hệ. Mỗi khi lương của một cán bộ thay đổi thì người quản lý cập nhật lương mới cho cán bộ đó, như vậy giá trị của lương cũ mất đi mà thay bằng giá trị lương mới. Tình trạng tương tự với thuộc tính: trinh_do (trình độ cán bộ) khi mà trình độ của một cán bộ thay đổi. Do đó, với cách quản lý nhân sự theo bảng trên thì người quản lý không thể theo dõi được quá trình tăng lương hoặc quá trình nâng cao trình độ của những cán bộ mình quản lý. Đối với họ thì trong cách quản lý này, việc theo dõi quá trình phát triển của mỗi người theo thời gian là một công việc khó khăn. Tuy nhiên, trong mô hình dữ liệu dạng khối thì việc này lại trở nên đơn giản hơn. Ta có thể thấy điều đó qua cách quản lý cán bộ theo mô hình khối dữ liệu, cụ thể như hình ảnh của khối CAN_BO_2 dưới đây: CAN_BO_2: Hình 1: Biểu diễn khối CAN_BO_2. Với khối CAN_BO_2 thì mỗi khi có một cán bộ nào trong cơ quan được tăng lương hoặc thay đổi trình độ, thậm chí cả đổi tên thì ta bổ sung năm đó vào trục thời gian và khối sinh tương ứng một lát cắt mới, ứng với năm vừa bổ sung để người quản lý cập nhật thông tin (trục thời gian có thể tính A01 A 550 TS A01 A 350 ThS t 1 A01 A 200 DH B02 B 400 Ths A02 B 300 DH t 2 A02 B 250 DH C01 C 350 DH 2015 A03 t 3 A03 C 200 CD 2007 ma ten luong trinh_do C 250 CD 2010 12 theo năm, tháng hoặc ngày,... tùy theo yêu cầu quản lý của từng cơ quan). Như vậy, ta có thể quản lý cán bộ trong cơ quan suốt cả quá trình công tác. Nhìn vào khối: CAN_BO_2, ta dễ dàng thấy quá trình tăng lương cũng như quá trình nâng cao trình độ của 3 cán bộ ứng với các bản ghi t1, t2, t3, ở đây các năm 2007, 2010, 2015 cũng chỉ là minh họa; ta có thể bổ sung thêm các năm tùy ý trên trục thời gian này của khối mỗi khi cần cập nhật thông tin cho các cán bộ trong cơ quan. Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình dữ liệu quan hệ đã được nhiều nhà khoa học quan tâm. Một số tác giả đã mở rộng mô hình dữ liệu quan hệ thành mô hình dữ liệu đa chiều và kho dữ liệu,...[14], [15], [16], [18], [19], [20], [21], [26], [32]. Một kỹ thuật thường được dùng trong các hệ thống kho dữ liệu để xử lý phân tích trực tuyến - OLAP (On- Line Analytical Processing) là kỹ thuật sử dụng cách thể hiện dữ liệu đa chiều gọi là các khối (cube) nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Với cấu trúc của khối dữ liệu đa chiều thì mỗi chiều tương ứng với một thuộc tính, nó cung cấp cho người quản lý một khung nhìn đa chiều về dữ liệu. Khối dữ liệu dưới đây là một ví dụ: Hình 2: Biểu diễn khối dữ liệu đa chiều. 13 Với khối dữ liệu đa chiều như ở hình 2 ta thấy đây là khối dữ liệu 3 chiều. Một là chiều Thời gian gồm 4 mốc: Jan-01, Feb-01, Mar-01 và Apr-01, hai là chiều Địa điểm gồm 2 nơi: Tokyo và Rome, ba là chiều Sản phẩm gồm 3 loại máy tính: Standard PC, Executive PC và Ambassador PC. Cũng theo hướng nghiên cứu này một mô hình dữ liệu mới đã được đề xuất, đó là mô hình dữ liệu dạng khối [4], [5], [7],... Mô hình dữ liệu này có thể xem là một mở rộng của mô hình dữ liệu quan hệ. Trong mô hình dữ liệu dạng khối, các khái niệm như: khối, lược đồ khối, lát cắt, đại số khối, phụ thuộc hàm, bao đóng của tập thuộc tính chỉ số,... đã được nghiên cứu [4], [5], [7], [8], [9], [10], [11], [12], [13]. Trong mô hình dữ liệu dạng khối, các lược đồ khối, khối nói chung là lớn và phức tạp. Chính vì vậy mà mô hình này đòi hỏi phải có các thuật toán tốt theo nghĩa, độ phức tạp tính toán chấp nhận được, chẳng hạn là hàm tuyến tính hoặc đa thức theo chiều dài của dữ liệu vào. Các thuật toán này giúp ta tìm bao đóng, khóa của lược đồ khối, khối, giải bài toán thành viên,... Một cách tự nhiên, nếu kích thước của lược đồ khối càng nhỏ thì các thuật toán đó càng phát huy hiệu quả hơn. Từ đó, một số hướng nghiên cứu nhằm tinh giản các lược đồ khối được thực hiện thông qua các phép biến đổi tương đương, chẳng hạn đưa tập phụ thuộc hàm về dạng thu gọn, thu gọn tự nhiên, dạng không dư, dạng tối ưu,... cũng được quan tâm. Đi theo hướng này, phép dịch chuyển lược đồ khối nhằm thu gọn, loại bỏ khỏi lược đồ ban đầu những thuộc tính không quan trọng theo nghĩa chúng không làm ảnh hưởng tới kết quả tính toán các đối tượng đang quan tâm như bao đóng, khóa,... Mặc dù lược đồ khối thu được qua phép thu gọn nhìn chung không tương đương với lược đồ khối ban đầu, nhưng ta lại thu được các đối tượng cần tìm bằng những phép toán đơn giản hơn. 14 Cũng như trong mô hình dữ liệu quan hệ, các phụ thuộc dữ liệu trong mô hình khối đóng vai trò quan trọng đối với việc phản ánh ngữ nghĩa của dữ liệu. Phụ thuộc đầu tiên là phụ thuộc hàm, được E. Codd - tác giả của mô hình dữ liệu quan hệ đề xuất. Phụ thuộc này cũng đã được phát triển thành phụ thuộc hàm trong mô hình dữ liệu dạng khối. Khi khối suy biến thành quan hệ thì khái niệm phụ thuộc hàm trong mô hình dữ liệu dạng khối lại trở thành khái niệm phụ thuộc hàm trong mô hình dữ liệu quan hệ. Với mô hình dữ liệu quan hệ, sau phụ thuộc hàm thì một trong các lớp phụ thuộc quan trọng được phát triển là phụ thuộc Boolean dương, phụ thuộc Boolean dương tổng quát, phụ thuộc Boolean dương đa trị, Ở đây, khái quát hóa các lớp phụ thuộc này vào một khái niệm chung là phụ thuộc logic. Việc nghiên cứu phụ thuộc logic trong mô hình dữ liệu quan hệ được nhiều tác giả quan tâm và các kết quả tìm thấy đã được sử dụng hữu ích trong quá trình thiết kế các cơ sở dữ liệu. Tuy nhiên, trong mô hình dữ liệu dạng khối, cho đến hiện nay thì các phụ thuộc logic còn chưa được quan tâm nhiều, ví dụ như: các khái niệm về phụ thuộc Boolean dương, phụ thuộc Boolean dương tổng quát trên khối,... vẫn chưa có. Chính vì vậy, đề tài muốn đi sâu tìm hiểu xem trong mô hình dữ liệu dạng khối thì các phụ thuộc logic này sẽ được định nghĩa như thế nào? Chúng có những tính chất, đặc trưng gì? Mối quan hệ của chúng với các khái niệm tương ứng trong mô hình dữ liệu quan hệ như thế nào?,... và chắc rằng với các phụ thuộc logic mới được đề xuất trong mô hình dữ liệu dạng khối thì việc sử dụng chúng sẽ có hiệu quả trong việc thiết kế các cơ sở dữ liệu dạng khối trên thực tế. 2. Mục tiêu, đối tượng và phương pháp nghiên cứu Mục tiêu của luận án là đề xuất các khái niệm và tìm hiểu tính chất các loại phụ thuộc logic trong mô hình dữ liệu dạng khối như: phụ thuộc Boolean 15 dương, phụ thuộc Boolean dương tổng quát, ánh xạ đóng và mối quan hệ với phép dịch chuyển lược đồ khối, Mối quan hệ giữa phụ thuộc logic trong mô hình dữ liệu dạng khối với các phụ thuộc tương ứng trong mô hình dữ liệu quan hệ,... Bên cạnh đó, đề tài cũng tìm hiểu về quan hệ giữa phụ thuộc logic trên lược đồ khối và phụ thuộc tương ứng trên lược đồ lát cắt, từ đó xem xét về cấu trúc của các phụ thuộc logic trong mô hình dữ liệu dạng khối. Đối tượng nghiên cứu của luận án chính là các phụ thuộc logic, ánh xạ đóng, lược đồ cân bằng, trong mô hình dữ liệu dạng khối với phép dịch chuyển lược đồ khối. Mối quan hệ của chúng trên lược đồ khối và trên lược đồ lát cắt, trên cơ sở đó xác định rõ các cấu trúc cụ thể của các phụ thuộc logic trong mô hình dữ liệu dạng khối. Phương pháp nghiên cứu của luận án: Hướng nghiên cứu của luận án là nghiên cứu lý thuyết, do đó luận án sử dụng các công cụ của toán học, logic (các phương pháp suy luận, chứng minh, lập bảng chân lý,) để nghiên cứu tìm ra các kết quả mới về các phụ thuộc logic trên lược đồ khối, phép dịch chuyển lược đồ khối, ánh xạ đóng trên khối, 3. Tổng quan tình hình nghiên cứu liên quan đến luận án 3.1 Các nghiên cứu trên thế giới Hiện nay, trên thế giới việc mở rộng mô hình dữ liệu quan hệ của E. Codd đề xuất năm 1970 cũng đã được nhiều nhà nghiên cứu quan tâm. - Năm 1996 tác giả C. Dyreson đã đề xuất một mở rộng của mô hình dữ liệu quan hệ, đó là các khối dữ liệu (data cube) [17]. - Năm 1997, các tác giả R. Agrawal, A. Gupta, and S. Sarawagi đã đề xuất một mở rộng của mô hình dữ liệu quan hệ, đó là mô hình dữ liệu đa chiều (Modeling Multidimensional Databases) [41]. 16 - Năm 1997 các tác giả S. Chaudhuri and U. Dayal đã đề xuất khái niệm nhà kho dữ liệu (Data Warehousing) [49]. - Năm 2001 Paulraj Ponniah đã bàn về nhà kho dữ liệu trong bài báo “Data warehousing fundamentals” [38]. - Năm 2002 Inmon W.H. đã trình bày về việc xây dựng nhà kho dữ liệu trong bài báo “Building the Data Warehouse “ [26]. - Năm 2003 các tác giả Maurizio Rafanelli, M.Rafanelli, ... Q h, nghĩa là h BD(r). Như vậy, ta đã chứng minh được: (i) g BD(r): Tr Tg (ii) h BD(r): Tr = Th kết hợp với định nghĩa của TBD(r) là giao của các Tg , g BD(r) ta suy ra: Tr = TBD(r). 94 Mệnh đề 3.8 Cho R = (id; A1,A2,...,An ), r(R) là một khối, r , U = n i i 1 )(id , là tập các PTBDTQ trên U. Khi đó khối r thể hiện chặt tập PTBDTQ khi và chỉ khi: Tr = T . Chứng minh Sử dụng tính chất: BD(r) = (BD(r)) + và từ mệnh đề về bảng chân lý của BD(r) , Tr = TBD(r) ta có: khối r thể hiện chặt tập PTBDTQ BD(r) = + BD(r) = TBD(r) = T Tr = T. Nhận xét Cho R = (id; A1,A2,...,An ), r(R) là một khối, r , U = n i i 1 )(id , là tập các PTBDTQ trên U. Khi đó, nếu id = {x} thì khối r suy biến thành quan hệ và ta có trong mô hình dữ liệu quan hệ: quan hệ r thể hiện chặt tập PTBDTQ khi và chỉ khi: Tr = T . Kết luận Chương này đã đề xuất các khái niệm mới như: phụ thuộc Boolean dương, phụ thuộc Boolean dương tổng quát,... Chứng minh các tính chất của ánh xạ đóng trên khối, điều kiện cần và đủ của tập thuộc tính chỉ số bất động, tập sinh, tập các đối nguyên tử,... Các tính chất, định lý tương đương,... của phụ thuộc Boolean dương, phụ thuộc Boolean dương tổng quát trên khối và các tính chất của thể hiện phụ thuộc Boolean dương tổng quát trên khối cũng đã được phát biểu và chứng minh ở đây. 95 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO Sau khi đề xuất và nghiên cứu tính chất của các phụ thuộc logic trong mô hình dữ liệu dạng khối, luận án đã đạt được một số kết quả chính sau đây: - Đề xuất phép dịch chuyển lược đồ khối, các thuật toán dịch chuyển, chứng minh tính đúng và độ phức tạp của các thuật toán này. Chứng minh các tính chất về biểu diễn bao đóng của tập thuộc tính chỉ số và khóa của khối, khóa của lát cắt qua phép dịch chuyển. - Chứng minh các định lý cần và đủ về khóa của lược đồ khối, khóa của lát cắt ban đầu và khóa của lược đồ khối, khóa của lát cắt sau khi dịch chuyển. Chứng minh các định lý tương đương về bao đóng của tập thuộc tính chỉ số trên lát cắt và trên khối. - Đề xuất khái niệm lược đồ khối cân bằng, chứng minh các tính chất về mối quan hệ giữa các lược đồ cân bằng trên khối và trên các lát cắt. Chứng minh định lý cần và đủ để một lược đồ khối cân bằng, đưa ra thuật toán dịch chuyển lược đồ khối về dạng cân bằng, chứng minh tính đúng và độ phức tạp của nó. - Chứng minh một số tính chất của ánh xạ đóng trên khối, điều kiện cần và đủ của tập thuộc tính bất động, tập sinh,... Chứng minh một số định lý tương đương về khóa trên khối và trên các lát cắt. - Đề xuất khái niệm phụ thuộc Boolean dương trên khối, chứng minh định lý tương đương, một số điều kiện cần và đủ của các phép suy dẫn. Chứng minh các tính chất và mối quan hệ giữa các kiểu phụ thuộc hàm và các công thức Boolean dương trên khối, trên lát cắt. 96 - Đề xuất khái niệm phụ thuộc Boolean dương tổng quát trên khối, chứng minh định lý tương đương, các điều kiện cần và đủ của các phép suy dẫn đối với phụ thuộc Boolean dương tổng quát trên khối. Chứng minh điều kiện cần và đủ của thể hiện chặt một tập phụ thuộc Boolean dương tổng quát trên khối. Các kết quả nghiên cứu ở trên đã làm rõ thêm cấu trúc các phụ thuộc logic trong thiết kế của mô hình dữ liệu dạng khối. Trong trường hợp khối suy biến thành quan hệ, một số kết quả này lại trùng với các kết quả đã được nhiều tác giả đưa ra đối với quan hệ trong mô hình dữ liệu quan hệ. Một số kết quả khác được xét trong trường hợp riêng của tập các phụ thuộc hàm F trong lược đồ khối, như tập phụ thuộc hàm Fh, tập phụ thuộc hàm Fhx,... Trên cơ sở của các kết quả này, ta có thể nghiên cứu tiếp mối quan hệ giữa các loại phụ thuộc logic khác với phép dịch chuyển trên lược đồ khối, các trường hợp khác của các tập phụ thuộc hàm trên khối, trên lát cắt,.... Các kết quả nghiên cứu đó góp phần làm hoàn chỉnh thêm lí thuyết thiết kế của mô hình dữ liệu dạng khối. 97 DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ [1] Trịnh Đình Thắng, Trần Minh Tuyến (2010), Phép dịch chuyển lược đồ khối và vấn đề biểu diễn bao đóng, khóa trong mô hình dữ liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ XIII “Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông”, Hưng Yên, tr. 276-286. [2] Trịnh Đình Thắng, Trần Minh Tuyến (2011), Khóa và các tập thuộc tính nguyên thủy, phi nguyên thủy với phép dịch chuyển lược đồ khối, Kỷ yếu Hội thảo quốc gia lần thứ 13 "Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông", Cần Thơ, tr. 159-170. [3] Trinh Dinh Thang, Tran Minh Tuyen (2012), Key and key attributes set, non-key attributes set with translation of block schemes, International Journal of Advanced Research in Computer Science, vol. 3, No.3, India, pp. 335-339. [4] Trịnh Đình Thắng, Trần Minh Tuyến (2012), Lược đồ cân bằng, vế trái cực tiểu và khóa với phép dịch chuyển lược đồ khối, Kỷ yếu Hội thảo quốc gia lần thứ XV "Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông", Hà Nội, tr. 174-179. [5] Trần Minh Tuyến (2013), Lược đồ cân bằng với phép dịch chuyển lược đồ khối, Tạp chí khoa học và kỹ thuật, chuyên san Công nghệ Thông tin và Truyền thông số 2, Học viện kỹ thuật quân sự, Hà Nội, S.153, tr. 28-36. [6] Trịnh Đình Thắng, Trần Minh Tuyến (2013), Ánh xạ đóng và phép dịch chuyển lược đồ khối, Kỷ yếu Hội nghị quốc gia lần thứ VI về Nghiên cứu cơ bản và ứng dụng Công nghệ Thông tin (FAIR), Thừa Thiên– 98 Huế, tr. 174-179. [7] Tran Minh Tuyen, Trinh Dinh Thang, Nguyen Xuan Huy (2015), Some properties of the positive boolean dependencies in the database model of block form, Journal of Computer Science and Cybernetics, V.31, N.2, Viet Nam, pp. 159-169. [8] Trần Minh Tuyến, Trịnh Đình Thắng (2014), Phụ thuộc Boole dương tổng quát trong mô hình dữ liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ XVII "Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông", Buôn Ma Thuột, tr. 274-279. 99 TÀI LIỆU THAM KHẢO [1] Nguyễn Xuân Huy, Lê Đức Minh, Vũ Ngọc Loãn (2000), Các ánh xạ đóng và ứng dụng trong cơ sở dữ liệu, Tạp chí Tin học và Điều khiển học, T.16, S.4, tr. 1-6. [2] Nguyễn Xuân Huy, Đoàn Văn Ban, Đàm Gia Mạnh, Nguyễn Thế Dũng (2001), Về mối liên hệ giữa suy diễn phụ thuộc hàm và suy diễn logic, Tạp chí Tin học và Điều khiển học, T.17, S.4, tr. 11-16. [3] Nguyễn Xuân Huy, Đàm Gia Mạnh, Vũ Thanh Xuân, Kim Lan Hương (2001), Về một lớp công thức suy dẫn, Tạp chí Tin học và Điều khiển học, T.17, S.4, tr. 17-22. [4] Nguyễn Xuân Huy, Trịnh Đình Thắng (1998), Mô hình cơ sở dữ liệu dạng khối, Tạp chí Tin học và Điều khiển học, T.14, S.3, tr. 52-60. [5] Nguyễn Xuân Huy, Trịnh Đình Thắng (1999), Một vài thuật toán cài đặt các phép toán của đại số quan hệ trong mô hình dữ liệu dạng khối, Tạp chí Tin học và Điều khiển học, T.15, S.3, tr. 8-17. [6] Nguyễn Xuân Huy (2006), Các phụ thuộc logic trong cơ sở dữ liệu, NXB Thống kê, Hà Nội. [7] Trịnh Đình Thắng (2001), Một số kết quả về bao đóng, khóa và phụ thuộc hàm trong mô hình dữ liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ IV “Một số vấn đề chọn lọc của Công nghệ Thông tin”, Hải Phòng, tr. 245-251. [8] Trịnh Đình Thắng (2005), Một số kết quả về phụ thuộc hàm, phủ của các phụ thuộc hàm và các dạng chuẩn trong mô hình dữ liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ 8 "Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông", Hải Phòng, tr. 580-586. [9] Trịnh Đình Thắng, Trịnh Đình Vinh (2008), Phụ thuộc đa trị trong mô 100 hình dữ liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ 11 "Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông", Huế, tr. 321-328. [10] Trịnh Đình Thắng (2011), Mô hình dữ liệu dạng khối, NXB Lao động. [11] Vũ Đức Thi, Trịnh Đình Vinh (2009), Phụ thuộc đa trị xấp xỉ trong mô hình dữ liêu dạng khối, Kỷ yếu Hội thảo Quốc gia “Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông”, Biên Hoà, tr. 341-350. [12] Vũ Đức Thi, Trịnh Đình Vinh (2010), a-Phụ thuộc hàm và a-Bao đóng trong mô hình cơ sở dữ liêu dạng khối, Tạp chí Tin học và Điều khiển học, 26(2), tr. 131-139. [13] Trịnh Đình Vinh, Vũ Đức Thi (2010), Phủ của tập phụ thuộc hàm và vấn đề tựa chuẩn hoá trong mô hình dữ liêu dạng khối, Tạp chí Tin học và Điều khiển học, 26(4), tr. 312-320. TiÕng Anh: [14] Akrivi Vlachou, Christos Doulkeridis, Kjetil Norvag, Yannis Kotidis (2012), Peer-to-Peer Query Processing over Multidimensional Data (SpringerBriefs in Computer Science) Paperback, Springer; 2012 edition. [15] Apostolos Benisis (2010), Business Process Management:: A Data Cube To Analyze Business Process Simulation Data For Decision Making Paperback, VDM Verlag Dr. Müller. [16] Brian Ciampa (2014), The Data Warehouse Workshop: Providing Practical Experience to the Aspiring ETL Developer Paperback, CreateSpace Independent Publishing Platform. [17] C. Dyreson (1996), Information retrieval from an incomplete data cube, In Proc. of the 22 nd . Int. Conf. on Very Large Data Bases (VLDB) pages 532-543. Morgan Kaufmann Publishers. 101 [18] C. Imhoff, N. Galemmo, and J. G. Geiger.(2003), Mastering Data Warehouse Design: Relational and Dimensional Techniques. John Wiley. [19] Christian S.Jensen, Torben Bach Pedersen, Christian Thomsen, & 1 mo- re (2010), Multidimensional Databases and Data Warehousing (Synthesis Lectures on Data Management) Paperback, Morgan and Claypool Publishers; 1 edition. [20] Daniel T. Larose (2006), Data mining method and models, Wiley- interscience. A john wiley & sons, Inc Publication. [21] E. Thomsen. (1997), OLAP Solutions: Building Multidimensional Information Systems. John Wiley. [22] GARCIA-MOLINA H, ULLMAN J., WIDOM J.(2002), Database System: The Complete Book, Prentice Hall. [23] Haiping Lu, Konstantinos N. Plataniotis, Anastasios Venetsanopoulos (2013), Multilinear Subspace Learning: Dimensionality Reduction of Multidimensional Data (Chapman & Hall/Crc Machine Learning & Pattern Recognition) Hardcover, Chapman and Hall/CRC; 1 edition. [24] Hong Yao, Howard J. Hamilton, Cory J. Butz, FD_Mine (2002), “Discovering Functional Dependencies in a Database Using Equivalences”, Second IEEE International Conference on Data Mining. [25] Hu X.H., Lin T.Y. and Han J.C. (2004), A new rough sets model based on database systems, Fundamenta Informaticae, 59(1), pp. 135-152. [26] Inmon W.H. (2002), Building the Data Warehouse (Third Edition), John Wiley & Sons, Inc. [27] J. Widom (1995), Research problems in data warehousing. CIKM’95. 102 [28] John Paredes (2009), The Multidimensional Data Modeling Toolkit: Making Your Business Intelligence Applications Smart with Oracle OLAP Paperback, OLAP World Press. [29] Kwok-Wa Lam, Victor C.S.Lee (2004), Building Decision Trees Using Functional Dependencies, Processdings of the International Conference on Information Technology: Coding and Computing (ITCC’04). [30] K. M. Azharul Hasan, Tatsuo Tsuji (2011), Extendible Arrays for Multidimensional Databases: Concept, Implementation and Evaluation Paperback, LAP LAMBERT Academic Publishing. [31] Krish Krishnan (2013), Data Warehousing in the Age of Big Data (The Morgan Kaufmann Series on Business Intelligence) Paperback, Morgan Kaufmann; 1 edition. [32] Ladjel Bellatreche, Mukesh K. Mohania (2014), Data Warehousing and Knowledge Discovery: 16th International Conference, DaWaK 2014, Munich, Germany, September 2-4, 2014. Proceedings (Lecture Notes ... Applications, incl. Internet/Web, and HCI) Paperback, Springer; 2014 edition. [33] Maier, D. (1983), The Theory of Relational Databases, Computer Science Press, Rockville, Md. [34] Maurizio Rafanelli, M.Rafanelli (2003), Multidimensional Databases: Problems and Solutions Hardcover, Idea Group Publishing. [35] M.Rafanelli(Ed.) (2003), Multidimensional Databases: Problems and Solutions, Idea Group. [36] Mark W. Humphries Michael W. Hawkins Michelle C. Dy (1998), Data Warehousing Architecture and Implementation, Prentice Hall PTR; Pap/ Cdr edition. 103 [37] OLAP council (1998). MDAPI specification version 2.0. In [38] Paulraj Ponniah (2001), Data warehousing fundamentals, John Wiley & Sons Inc. [39] P. O'Neil and D. Quass (1997), Improved query performance with variant indexes. SIGMOD'97. [40] Qiang Yang, Joshua Zhexue Huang, Michaeng Ng (2003), A data Cube Model for Prediction- Based Web Prefetching, Journal of Intelligent Information Systems, Vol. 20, Issue 1, pp. 11-30. [41] R. Agrawal, A. Gupta, and S. Sarawagi (1997), Modeling Multidimensional Databases, In Proc. of 13 th, Int. Conf. on Data Engineering (ICDE) pages 232-243. IEEE press. [42] R. Kimball and M. Ross (2002), The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. 2ed. John Wiley. [43] Ralph Kimball, Margy Ross, Warren Thornthwaite, Joy Mundy, Bob Becker (2008), The Data Warehouse Lifecycle Toolkit Paperback, Wiley; 2 edition. [44] Ralph Kimball, Margy Ross (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling Paperback, Wiley; 3 edition. [45] Ralph Kimball (2014), Kimball's Data Warehouse Toolkit Classics: 3 Volume Set Paperback, Wiley; 2 edition. [46] Robert Laberge (2011), The Data Warehouse Mentor: Practical Data Warehouse and Business Intelligence InsightsPaperback, McGraw-Hill Osborne Media; 1 edition. [47] Sid Adelman, Larissa T. Moss (2000), Data Warehouse Project Management Paperback, Addison-Wesley Professional; 1 edition. 104 [48] Stanislaw Kozielski, Robert Wrembel (2008), New Trends in Data Warehousing and Data Analysis (Annals of Information Systems), Springer; 1st Edition. 2nd Printing. [49] S. Chaudhuri and U. Dayal (1997), An Overview of Data Warehousing and OLAP technology, SIGMOD Record, 26(1): pp. 65-74. [50] S. Sarawagi and M. Stonebraker (1994), Efficient organization of large multidimensional arrays, ICDE'94. [51] T.B. Pedersen and C.S. Jensen (1999), Multidemensional data Modeling for complex data, In proc. of 15 th Int. Conf. on data Engineering (ICDE) pages 336-345, IEEE Computer Society. [52] Thalheim B. (1987), Dependencies in relational databases , Teubner - Verlag, Leipzig. [53] Ullman, J. D. (1982), Principles of Database systems, Computer Science Press, Rockville, Md. [54] Ullman, J. D. (1989), Principles of Database and Knowlege - Base systems , vol.1,2 , Computer Science Press. [55] Vidette Poe (1996), Building A Data Warehouse for Decision Support, Prentice Hall PTR. [56] W. H. Inmon (2005), Building the Data Warehouse Paperback, Wiley; 4 edition. [57] W. H. Inmon (1996), Building the Data Warehouse, John Wiley. [58] Ziv Pollak (2009), Cube Based Incremental Data Mining: Using Multi- Dimensional Cubes for Incremental Data Mining Paperback, VDM Verlag.
File đính kèm:
- luan_an_cac_phu_thuoc_logic_trong_mo_hinh_du_lieu_dang_khoi.pdf