Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ
Rút gọn thuộc tính và sinh luật quyết định (luật phân lớp) là hai bài toán
quan trọng trong quá trình khám phá tri thức từ dữ liệu. Rút gọn thuộc tính thuộc
giai đoạn tiền xử lý dữ liệu còn sinh luật quyết định thuộc giai đoạn khai phá dữ
liệu. Rút gọn thuộc tính của bảng quyết định là quá trình lựa chọn tập con nhỏ nhất
của tập thuộc tính điều kiện, loại bỏ các thuộc tính dư thừa mà bảo toàn thông tin
phân lớp của bảng quyết định, gọi là tập rút gọn (reduct). Kết quả rút gọn thuộc tính
ảnh hưởng trực tiếp đến hiệu quả thực hiện các nhiệm vụ khai phá: Gia tăng tốc độ,
cải thiện chất lượng, tính dễ hiểu của các kết quả thu được. Sinh luật quyết định là
bước tiếp theo của rút gọn thuộc tính trong khai phá dữ liệu nhằm đánh giá chất
lượng phân lớp của dữ liệu thông qua độ hỗ trợ của tập luật quyết định. Độ chính
xác phân lớp được đánh giá thông qua tỷ lệ phân lớp đúng theo luật quyết định trên
tổng số lớp của tập dữ liệu.
Các kỹ thuật rút gọn thuộc tính được phân thành hai loại: Lựa chọn thuộc
tính (Attribute selection) và biến đổi thuộc tính (Attribute transformation) [44]. Lựa
chọn thuộc tính là chọn ra một tập con tốt nhất (theo một nghĩa nào đó) từ tập dữ
liệu ban đầu. Biến đổi thuộc tính là thực hiện việc biến đổi các thuộc tính của tập dữ
liệu ban đầu thành một tập dữ liệu với các thuộc tính mới có số lượng ít hơn sao cho
bảo tồn được thông tin nhiều nhất. Các công trình nghiên cứu về rút gọn thuộc tính
thường tập trung vào nghiên cứu các kỹ thuật lựa chọn thuộc tính. Lựa chọn thuộc
tính là quá trình lựa chọn một tập con gồm P thuộc tính từ tập gồm A thuộc tính
(PA) sao cho không gian thuộc tính được thu gọn lại một cách tối ưu theo một tiêu
chuẩn nhất định. Hiện nay có hai cách tiếp cận chính đối với bài toán lựa chọn
thuộc tính: Lọc (filter) và đóng gói (wrapper). Cách tiếp cận kiểu lọc thực hiện việc
lựa chọn thuộc tính độc lập với thuật toán khai phá sử dụng sau này. Các thuộc tính
được chọn chỉ dựa trên độ quan trọng của chúng trong việc mô tả dữ liệu. Ngược lại
với cách tiếp cận lọc, lựa chọn thuộc tính kiểu đóng gói tiến hành việc lựa chọn
bằng cách áp dụng ngay kỹ thuật khai phá cụ thể, độ chính xác của kết quả được lấy
làm tiêu chuẩn để lựa chọn các tập con thuộc tính [44)
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ
BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CAO CHÍNH NGHĨA NGHIÊN CỨU CÁC PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI - 2017 BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CAO CHÍNH NGHĨA NGHIÊN CỨU CÁC PHƯƠNG PHÁP RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT QUYẾT ĐỊNH THEO TIẾP CẬN TẬP THÔ MỜ CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 62.48.01.04 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. GS.TS. VŨ ĐỨC THI 2. TS. TÂN HẠNH HÀ NỘI - 2017 LỜI CẢM ƠN Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự giúp đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân. Đầu tiên, tác giả xin bày tỏ lời tri ân tới GS.TS Vũ Đức Thi và TS. Tân Hạnh, những thầy giáo đã tận tình hướng dẫn tác giả hoàn thành luận án này. Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của Học viện Công nghệ Bưu chính Viễn thông - Bộ Thông tin và Truyền thông, là cơ sở đào tạo đã luôn tạo điều kiện để NCS có thể hoàn thành luận án của mình. Tác giả xin gửi lời cảm ơn sâu sắc đến TS. Nguyễn Long Giang - một người thầy thầm lặng và các cán bộ Phòng Tin học quản lý, Viện Công nghệ Thông tin, Viện Khoa học và Công nghệ Việt Nam đã nhiệt tình giúp đỡ và tạo ra môi trường nghiên cứu tốt để tác giả hoàn thành công trình của mình; cảm ơn các thầy cô và các đồng nghiệp ở các nơi mà tác giả tham gia viết bài đã có những góp ý chính xác để tác giả có được những công bố như ngày hôm nay. Tác giả xin gửi lời cảm ơn tới Đảng ủy, Ban Giám đốc Học viện Cảnh sát Nhân dân, các đồng nghiệp Bộ môn Toán - Tin học nơi tác giả công tác đã ủng hộ để luận án được hoàn thành đúng thời hạn. Cuối cùng, tác giả xin gửi tới bạn bè, người thân lời cảm ơn chân thành nhất vì đã đồng hành cùng tác giả trong suốt thời gian qua. Con xin cảm ơn Cha, Mẹ và gia đình đã luôn là chỗ dựa vững chắc về tinh thần và vật chất, cũng là những người luôn mong mỏi cho con thành công; cảm ơn vợ và các em đã gánh vác công việc gia đình thay cho anh; xin lỗi các con vì phần nào đó đã chịu thiệt thòi trong thời gian bố học tập nghiên cứu, chính các con là nguồn động lực lớn lao giúp bố hoàn thành được công việc khó khăn này. Hà Nội, tháng 11 năm 2016 Cao Chính Nghĩa LỜI CAM ĐOAN Các kết quả trình bày trong luận án là công trình nghiên cứu của tôi được hoàn thành dưới sự hướng dẫn của GS.TS. Vũ Đức Thi, TS. Tân Hạnh và TS. Nguyễn Long Giang. Những kết quả trình bày là mới và chưa từng được công bố ở các công trình của người khác. Tôi xin chịu trách nhiệm về những lời cam đoan của mình. Cao Chính Nghĩa i MỤC LỤC MỤC LỤC ....................................................................................................................... i Danh mục các thuật ngữ ................................................................................................ iii Bảng các ký hiệu, từ viết tắt .......................................................................................... iv Danh sách bảng ............................................................................................................ vii Danh sách hình vẽ ....................................................................................................... viii MỞ ĐẦU ....................................................................................................................... 1 CHƯƠNG 1. CÁC KIẾN THỨC CƠ SỞ ....................................................................... 9 1.1. Một số khái niệm về tập thô ............................................................................. 9 1.1.1. Hệ thông tin .............................................................................................. 9 1.1.2. Các tập xấp xỉ ......................................................................................... 10 1.1.3. Miền dương ............................................................................................ 11 1.1.4. Bảng quyết định ...................................................................................... 11 1.2. Một số khái niệm về tập thô mờ xác định trên bảng quyết định miền giá trị thực ...................................................................................................................... 11 1.2.1. Bảng quyết định miền giá trị thực ........................................................... 12 1.2.2. Quan hệ tương đương mờ ....................................................................... 12 1.2.3. Ma trận tương đương mờ ........................................................................ 13 1.2.4. Phân hoạch mờ và lớp tương đương mờ .................................................. 14 1.2.5. Các tập xấp xỉ mờ ................................................................................... 17 1.2.6. Miền dương mờ ...................................................................................... 17 1.3. Một số khái niệm về tập thô mờ xác định trên bảng quyết định mờ ................ 18 1.3.1. Bảng quyết định mờ ................................................................................ 18 1.3.2. Phân hoạch mờ và lớp tương đương mờ .................................................. 20 1.3.3. Các tập xấp xỉ mờ ................................................................................... 21 1.3.4. Miền dương mờ ...................................................................................... 21 1.4. Rút gọn thuộc tính trong bảng quyết định....................................................... 23 1.4.1. Tổng quan về rút gọn thuộc tính ............................................................. 23 1.4.2. Tổng quan về rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập thô ............................................................................................................... 26 1.4.3. Định hướng nghiên cứu của luận án ........................................................ 28 1.5. Kết luận chương 1.......................................................................................... 29 ii CHƯƠNG 2. RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ TRỊ THỰC SỬ DỤNG MIỀN DƯƠNG MỜ VÀ KHOẢNG CÁCH JACCARD MỜ .. 30 2.1. Đặt vấn đề ..................................................................................................... 30 2.2. Rút gọn thuộc tính sử dụng miền dương mờ ................................................... 31 2.2.1. Phương pháp rút gọn thuộc tính sử dụng miền dương mờ ....................... 32 2.2.2. Thử nghiệm và đánh giá kết quả ............................................................. 37 2.3. Rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ ..................................... 44 2.3.1. Khoảng cách Jaccard mờ và các tính chất ............................................... 44 2.3.2. Phương pháp rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ .......... 52 2.3.3. Thử nghiệm và đánh giá kết quả ............................................................. 56 2.4. Kết luận chương 2.......................................................................................... 61 CHƯƠNG 3. RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ TRỊ THỰC SỬ DỤNG KHOẢNG CÁCH PHÂN HOẠCH MỜ .................................. 63 3.1. Đặt vấn đề ..................................................................................................... 63 3.2. Khoảng cách phân hoạch mờ và các tính chất ................................................ 64 3.3. Phương pháp rút gọn thuộc tính sử dụng khoảng cách phân hoạch mờ ........... 70 3.4. Thử nghiệm và đánh giá kết quả .................................................................... 77 3.5. Kết luận chương 3.......................................................................................... 82 CHƯƠNG 4. RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNG QUYẾT ĐỊNH MỜ ................................................................................................................... 84 4.1. Đặt vấn đề ..................................................................................................... 84 4.2. Phương pháp rút gọn thuộc tính của bảng quyết định mờ ............................... 87 4.3. Phương pháp sinh luật quyết định của bảng quyết định mờ ............................ 91 4.3.1. Luật quyết định mờ ................................................................................. 92 4.3.2. Sinh luật quyết định từ bảng quyết định mờ ............................................ 93 4.3.3. Thử nghiệm và đánh giá kết quả ........................................................... 105 4.4. Kết luận chương 4........................................................................................ 110 KẾT LUẬN ............................................................................................................... 112 Danh mục các công trình của tác giả .......................................................................... 114 TÀI LIỆU THAM KHẢO .......................................................................................... 115 iii Danh mục các thuật ngữ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Bảng quyết định Decision Table Bảng quyết định miền giá trị thực Numerical Decision Table Bảng quyết định mờ Fuzzy Decision Table Hệ thông tin Information System Khoảng cách mờ Fuzzy Distance Luật quyết định mờ Fuzzy Decision Rule Ma trận tương đương mờ Fuzzy Equivalent Relational Matrix Miền dương mờ Fuzzy Positive Region Quan hệ tương đương Equivalent Relation Quan hệ tương đương mờ Fuzzy Equivalent Relation Rút gọn thuộc tính Attribute Reduction Tập mờ Fuzzy Set Tập rút gọn Reduct Tập thô Rough Set Tập thô mờ Fuzzy Rough Set Xấp xỉ dưới Lower Approximation Xấp xỉ trên Upper Approximation Xấp xỉ dưới mờ Fuzzy Lower Approximation Xấp xỉ trên mờ Fuzzy Upper Approximation iv Bảng các ký hiệu, từ viết tắt Ký hiệu, từ viết tắt Diễn giải ,I S U A Hệ thông tin ,D T U C D Bảng quyết định ,DT U C D Bảng quyết định mờ U Số đối tượng C Số thuộc tính điều kiện trong bảng quyết định A Số thuộc tính u a Giá trị của đối tượng u tại thuộc tính a I N D P Quan hệ P không phân biệt Pu Lớp tương đương chứa u của quan hệ IND P Pi Ru Lớp tương đường mờ chứa u của quan hệ tương đương mờ PR /U P Phân hoạch của U sinh bởi tập thuộc tính P P Phân hoạch mờ theo tập thuộc tính P PX P xấp xỉ dưới của X PX P xấp xỉ trên của X PP N X P miền biên của X PP O S D P miền dương của D PS IG b Độ quan trọng của thuộc tính b với tập thuộc tính P ( )A u Hàm thuộc của đối tượng u với tập mờ A H P Entropy Shannon E P Entropy Liang v ,P QNFD R R Khoảng cách phân hoạch mờ giữa hai phân hoạch mờ PR và QR ,N Fd C C D Khoảng cách phân hoạch mờ giữa hai tập thuộc tính C và C D ( , )F JD A B Khoảng cách Jaccard mờ giữa hai tập mờ A và B ,F Jd C C D Khoảng cách Jaccard mờ giữa hai tập thuộc tính C và C D F_RSAR1 Thuật toán rút gọn thuộc tính dựa trên miền dương mờ F_RSAR1 (Fuzzy Rough Set Based Attribute Reduction 1) F_RSAR2 Thuật toán rút gọn thuộc tính dựa trên miền dương mờ F_RSAR2 (Fuzzy Rough Set Based Attribute Reduction 2) FJ_DBAR Thuật toán rút gọn thuộc tính dựa trên khoảng cách Jaccard mờ (Fuzzy Jaccard Distance Based Attribute Reduction) FJ_RBAR Thuật toán sinh luật quyết định mờ dựa trên khoảng cách Jaccard mờ (Fuzzy Jaccard Rule Based Attribute Reduction) NF_DBAR Thuật toán rút gọn thuộc tính dựa trên khoảng cách phân hoạch mờ (New Fuzzy Distance Based Attribute Reduction) FAR-VPFRS Thuật toán rút gọn thuộc tính dựa trên miền dương mờ (Forward Attribute Reduction Based On Variable Precision Fuzzy-Rough Model) FA-FPR Thuật toán rút gọn thuộc tính dựa trên miền dương mờ cải tiến (Forward Approximation - Fuzzy Positive Region Reduction) FA-FSCE Thuật toán rút gọn thuộc tính dựa trên Entropy cải tiến (Forward Approximation - Fuzzy Conditional Entropy To Design A Heuristic Feature Selection Algorithm) vi GRAF Thuật toán rút gọn thuộc tính dựa trên Entropy tăng thêm (Attribute Selection Based On Information Gain Ratio In Fuzzy Rough Set Theory) MRBFA Thuật toán sinh luật quyết định mờ dựa trên xấp xỉ tiến (Mine Rules Based On The Forward Approximation) MRBBA Thuật toán sinh luật quyết định mờ dựa trên xấp xỉ lùi (Mine Rules Based On The Backward Approximation) vii Danh sách bảng Bảng 1.1. Bảng quyết định miền giá trị thực .................................................................... 12 Bảng 1.2. Bảng quyết định mờ chơi thể thao ................................................................... 18 Bảng 1.3. Bảng quyết định mờ của Ví dụ 1.3 .................................................................. 22 Bảng 2.1. Bảng quyết định miền giá trị thực của Ví dụ 2.1 .............................................. 34 Bảng 2.2. Bộ dữ liệu thử nghiệm ..................................................................................... 37 Bảng 2.3. Kết quả thực nghiệm của F_RSAR2, FAR-VPFRS ......................................... 40 Bảng 2.4. Tập rút gọn của F_RSAR2, FAR-VPFRS ........................................................ 42 Bảng 2.5. Độ chính xác phân lớp C4.5 của F_RSAR2, FAR-VPFRS .............................. 42 Bảng 2.6. Kết quả thực nghiệm của FJ_DBAR và GRAF ............................................... 57 Bảng 2.7. Tập rút gọn thu được bởi FJ_DBAR và GRAF ................................................ 59 Bảng 2.8. Độ chính xác phân lớp C4.5 của FJ_DBAR và GRAF ..................................... 59 Bảng 3.1. Mối liên hệ giữa khoảng cách phân hoạch mờ và entropy thông tin ................. 69 Bảng 3.2. Kết quả thực nghiệm của FA_FSCE, FA_FPR, NF_DBAR ............................. 78 Bảng 3.3. Tập rút gọn của FA_FSCE, FA_FPR, NF_DBAR .......................................... 80 Bảng 3.4. Độ chính xác phân lớp C4.5 của FA_FSCE, FA_FPR, NF_DBAR .................. 80 Bảng 4.1. Bảng quyết định mờ chơi thể thao biểu diễn lại Bảng 1.2 ................................ 89 Bảng 4.2. Bảng quyết định mờ chơi thể thao đã rút gọn thuộc tính .................................. 97 Bảng 4.3. Khoảng cách Jaccard mờ trực tiếp giữa các biến ngôn ngữ của Bảng 4.2 ......... 98 Bảng 4.4. Kết quả gán nhãn của Bảng 4.2 với (α=0.245; β=0.9) ................................... 100 Bảng 4.5. Kết quả gán nhãn của Bảng 4.2 với (α=0.245; β=0.8) ................................... 101 Bảng 4.6. Kết quả gán nhãn của Bảng 4.2 với (α=0.26) ................................................ 103 Bảng 4.7. Kết quả thực nghiệm của MRBFA, MRBBA và FJ_RBAR ........................... 108 viii Danh sách hình vẽ Hình 1.1. Quá trình ... probabilistic space, Information Sciences, 178(16), pp. 3177- 3187. [17] Chen, D., Hu, Q., & Yang, Y. (2011), Parameterized attribute reduction with Gaussian kernel based fuzzy rough sets, Information Sciences, 181(23), pp. 5169-5179. [18] Chen, D., Zhang, L., Zhao, S., Hu, Q., and Zhu, P. (2012), A novel algorithm for finding reducts with fuzzy rough sets, IEEE Transactions on Fuzzy Systems, 20(2), pp. 385-389. 117 [19] Chen, S. M., Lee, S. H., and Lee, C. H. (2001), A new method for generating fuzzy rules from numerical data for handling classification problems, Applied Artificial Intelligence, 15(7), pp. 645-664. [20] Cheng, Y. (2012), A new approach for rule extraction in fuzzy information systems, Journal of Computational Information Systems, 21(8), pp. 8795-8805. [21] Cheng, Y. (2015), Forward approximation and backward approximation in fuzzy rough sets, Neurocomputing, 148, pp. 340-353. [22] Chierichetti, F., Kumar, R., Pandey, S., & Vassilvitskii, S. (2010, January), Finding the jaccard median, In Proceedings of the twenty-first annual ACM-SIAM symposium on Discrete Algorithms (pp. 293-311), Society for Industrial and Applied Mathematics. [23] Cornelis, C., Jensen, R., Hurtado, G., & Śle, D. (2010), Attribute selection with fuzzy decision reducts, Information Sciences, 180(2), pp. 209-224. [24] Dai, J., and Xu, Q. (2013), Attribute selection based on information gain ratio in fuzzy rough set theory with application to tumor classification, Applied Soft Computing, 13(1), pp. 211-221. [25] Dai, J., & Tian, H. (2013), Fuzzy rough set model for set-valued data, Fuzzy Sets and Systems, 229, pp. 54-68. [26] Degang, C., and Suyun, Z. (2010), Local reduction of decision system with fuzzy rough sets, Fuzzy Sets and Systems, 161(13), pp. 1871-1883. [27] Deng, T., Chen, Y., Xu, W., and Dai, Q. (2007), A novel approach to fuzzy rough sets based on a fuzzy covering, Information Sciences, 177(11), pp. 2308-2326. [28] Demetrovics, J., Thi, V. D., Giang, N. L. (2013), An Efficient Algorithm for Determining the Set of All Reductive Attributes in Incomplete Decision Table, Cybernetics and Information Technologies, 13(4), pp. 118-126. 118 [29] Demetrovics, J., , Thi, V. D., Giang, N. L. (2014), On Finding All Reducts of Consistent Decision Tables, Cybernetics and Information Technologies, 14(4). [30] Demetrovics, J., Huong, N. T. L., Thi, V. D., Giang, N. L. (2016), Metric Based Attribute Reduction Method in Dynamic Decision Tables, Cybernetics and Information Technologies, 16(2), pp. 3-15. [31] Dong, C., Wu, D., & He, J. (2008, December), Knowledge reduction of evaluation dataset based on genetic algorithm and fuzzy rough set, In Computer Science and Software Engineering, 2008 International Conference on (Vol. 3, pp. 889-892), IEEE. [32] Dubois, D., and Prade, H. (1990), Rough fuzzy sets and fuzzy rough sets, International Journal of General System, 17(2-3), pp. 191-209. [33] Dubois, D., and Prade, H. (1992), Putting rough sets and fuzzy sets together, Intelligent Decision Support, Kluwer Academic Publishers, Dordrecht. [34] Fujita, O. (2013), Metrics based on average distance between sets, Japan Journal of Industrial and Applied Mathematics, 30(1), pp. 1-19. [35] Gardner, A., Kanno, J., Duncan, C. A., & Selmic, R. (2014), Measuring distance between unordered sets of different sizes, In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 137-143. [36] He, Q., Wu, C., Chen, D., and Zhao, S. (2011), Fuzzy rough set based attribute reduction for information systems with fuzzy decisions, Knowledge-Based Systems, 24(5), pp. 689-696. [37] Hong, T. P., Wang, T. T., & Chien, B. C. (2001), Learning approximate fuzzy rules from training examples. In Fuzzy Systems, 2001, The 10th IEEE International Conference on (Vol. 1, pp. 256-259), IEEE. 119 [38] Hu, Q., Xie, Z., and Yu, D. (2007), Hybrid attribute reduction based on a novel fuzzy-rough model and information granulation, Pattern recognition, 40(12), pp. 3509-3521. [39] Hu, Q., Yu, D., and Xie, Z. (2006), Information-preserving hybrid data reduction based on fuzzy-rough techniques, Pattern recognition letters, 27(5), pp. 414-423. [40] Hu, Q., Yu, D., Xie, Z., and Liu, J. (2006), Fuzzy probabilistic approximation spaces and their information measures, IEEE transactions on fuzzy systems, 14(2), pp. 191-201. [41] Hu, Q., An, S., & Yu, D. (2010), Soft fuzzy rough sets for robust feature evaluation and selection, Information Sciences, 180(22), pp. 4384-4400. [42] Hu, Q., Zhang, L., Chen, D., Pedrycz, W., & Yu, D. (2010), Gaussian kernel based fuzzy rough sets: Model, uncertainty measures and applications, International Journal of Approximate Reasoning, 51(4), pp. 453-471. [43] Inuiguchi, M., Greco, S., & Slowinski, R. (2004), Fuzzy rough sets, gradual decision rules and approximate reasoning, Mathematical Programming Concerning Decision Makings and Uncertainties. [44] Jensen, R., and Q. Shen, Q.(2008), Computational Intelligence and Feature Selection, Rough and Fuzzy Approaches, Aberystwyth University, IEEE Computational Intelligence Society, Sponsor. [45] Jensen, R., and Shen, Q. (2002), Fuzzy-rough sets for descriptive dimensionality reduction. In Fuzzy Systems, 2002, FUZZ-IEEE'02, Proceedings of the 2002 IEEE International Conference on (Vol. 1, pp. 29-34), IEEE. [46] Jensen, R., & Shen, Q. (2002, September), Aiding fuzzy rule induction with fuzzy-rough attribute reduction, In Proceedings of the 2002 UK Workshop on Computational Intelligence (pp. 81-88). 120 [47] Jensen, R., and Shen, Q. (2004), Fuzzy–rough attribute reduction with application to web categorization, Fuzzy sets and systems, 141(3), pp. 469-485. [48] Jensen, R., and Shen, Q. (2004), Semantics-preserving dimensionality reduction: rough and fuzzy-rough-based approaches, IEEE Transactions on knowledge and data engineering, 16(12), pp. 1457- 1471. [49] Jensen, R., and Shen, Q. (2007), Fuzzy-rough sets assisted attribute selection, IEEE Transactions on fuzzy systems, 15(1), pp. 73-89. [50] Jensen, R., and Shen, Q. (2009), New approaches to fuzzy-rough feature selection, IEEE Transactions on Fuzzy Systems, 17(4), pp. 824- 838. [51] Jensen, R., Cornelis, C., and Shen, Q. (2009, August), Hybrid fuzzy- rough rule induction and feature selection. In Fuzzy Systems, 2009, FUZZ-IEEE 2009, IEEE International Conference on (pp. 1151-1156), IEEE. [52] Kohonen, T. (1988), An introduction to neural computing, Neural networks, 1(1), 3-16. [53] Kohonen, T. (1998), The self-organizing map, Neurocomputing, 21(1), pp. 1-6. [54] Kohonen, T. (2012), Self-organization and associative memory (Vol.8). Springer Science & Business Media. [55] Kumar, M., & Yadav, N. (2014), Fuzzy Rough Sets and Its Application in Data Mining Field, Advances in Computer Science and Information Technology (ACSIT), 237. [56] LEVASHENKO, V., and MARTINCOVÁ, P. (2005), Fuzzy decision tree for parallel processing support, Journal of Information, Control and Management Systems, Vol. 3. 121 [57] Liu, G. (2008), Axiomatic systems for rough sets and fuzzy rough sets, International Journal of Approximate Reasoning, 48(3), pp. 857-867. [58] Liu, X., Qian, Y., & Liang, J. (2014), A rule-extraction framework under multigranulation rough sets, International Journal of Machine Learning and Cybernetics, 5(2), pp. 319-326. [59] Maji, P., & Garai, P. (2013), On fuzzy-rough attribute selection: criteria of max-dependency, max-relevance, min-redundancy, and max- significance, Applied Soft Computing, 13(9), pp. 3968-3980. [60] Mageswari, G. U., & Devi, M. I. (2016), Attribute subset selection based on fuzzy rough set and ranking approach, Int J Adv Engg Tech, Vol. VII, Issue II, April-June, pp. 735-742. [61] Meghabghab, G. (2006, June), Fuzzy Rough Sets as a Pair of Fuzzy Numbers: A New Approach and New Findings, In Fuzzy Information Processing Society, 2006. NAFIPS 2006, Annual meeting of the North American (pp. 46-51), IEEE. [62] Meng, J., Xu, Y., & Zhang, J. (2012, August), Comparison of two algorithms of attribute reduction based on fuzzy rough set, In Computational and Information Sciences (ICCIS), 2012 Fourth International Conference on (pp. 542-545), IEEE. [63] Ming, Z., Zhengbo, Y., Liukun, Z., Huijie, W., and Xiaogang, X. (2012), The Extraction Method of the Energy Consumption Characteristics Based on Fuzzy Rough Set, AASRI Procedia, 1, pp. 142-149. [64] Nguyen, L. G. (2012, September), Metric based attribute reduction in decision tables, In Computer Science and Information Systems (FedCSIS), 2012 Federated Conference on (pp. 311-316), IEEE. [65] Ouyang, Y., Wang, Z., & Zhang, H. P. (2010), On fuzzy rough sets based on tolerance relations, Information Sciences, 180(4), pp. 532-542. 122 [66] Pawlak Z. (1991), Rough sets: Theoretical Aspects of Reasoning About Data, Kluwer Academic Publishers. [67] Pawlak, R., Grzymala-Busse, J.W., Slowinski, R., Ziako, W. (1995), Rough sets, Communications, ACM 38(11), pp. 89-95. [68] Pawlak, Z. (1982), Rough sets, International Journal of Computer & Information Sciences, 11(5), pp. 341-356. [69] Qian, Y., Li, Y., Liang, J., Lin, G., and Dang, C. (2015), Fuzzy granular structure distance, IEEE Transactions on Fuzzy Systems, 23(6), pp. 2245-2259. [70] Qian, Y., Liang, J., and Dang, C. (2009), Knowledge structure, knowledge granulation and knowledge distance in a knowledge base, International Journal of Approximate Reasoning, 50(1), pp. 174- 188. [71] Qian, Y., Liang, J., Wei-zhi, Z. W., and Dang, C. (2011), Information granularity in fuzzy binary GrC model, IEEE Transactions on Fuzzy Systems, 19(2), pp. 253-264. [72] Qian, Y., Wang, Q., Cheng, H., Liang, J., and Dang, C. (2015), Fuzzy- rough feature selection accelerator, Fuzzy Sets and Systems, 258, pp. 61-78. [73] Radzikowska, A. M., and Kerre, E. E. (2002), A comparative study of fuzzy rough sets. Fuzzy sets and systems, 126(2), pp. 137-155. [74] Shen, Q., and Jensen, R. (2004), Selecting informative features with fuzzy-rough sets and its application for complex systems monitoring. Pattern recognition, 37(7), pp. 1351-1363. [75] Sun, R., & Han, R. (2009, June), Data mining based on fuzzy rough set theory and its application in the glass identification, In Information and Automation, 2009. ICIA'09. International Conference on (pp. 154-157), IEEE. 123 [76] Sun, B., and Ma, W. (2011), Fuzzy rough set model on two different universes and its application, Applied Mathematical Modelling 35, pp. 1798–1809. [77] Tavan, P., Grubmüller, H., & Kühnel, H. (1990), Self-organization of associative memory and pattern classification: recurrent signal processing on topological feature maps, Biological Cybernetics, 64(2), pp. 95-105. [78] Tsang, G. C., Degang, C., Tsang, E. C., Lee, J. W., and Yeung, D. S. (2005, October), On attributes reduction with fuzzy rough sets, In 2005 IEEE International Conference on Systems, Man and Cybernetics (Vol. 3, pp. 2775-2780), IEEE. [79] Tsang, E. C., and Chen, D. G. (2006, August), The Fuzzy Rough Set Approaches of Fuzzy Reasoning, In 2006 International Conference on Machine Learning and Cybernetics (pp. 1642-1646), IEEE. [80] Tsang, E. C., Chen, D., Yeung, D. S., Wang, X. Z., and Lee, J. W. (2008). Attributes reduction using fuzzy rough sets, IEEE Transactions on Fuzzy systems, 16(5), pp. 1130-1141. [81] Tsang, E. C., Zhao, S. Y., and Lee, J. W. (2007, August), Rule induction based on fuzzy rough sets, In 2007 International Conference on Machine Learning and Cybernetics (Vol. 5, pp. 3028-3033), IEEE. [82] Wang, X. Z., Ha, Y., & Chen, D. G. (2005, August), On the reduction of fuzzy rough sets, In Machine Learning and Cybernetics, 2005, Proceedings of 2005 International Conference on (Vol. 5, pp. 3174- 3178), IEEE. [83] Wang, X., & Hong, J. (1999), Learning optimization in simplifying fuzzy rules, Fuzzy sets and systems, 106(3), pp. 349-356. [84] Wang, X., Tsang, E. C., Zhao, S., Chen, D., & Yeung, D. S. (2007), Learning fuzzy rules from fuzzy samples based on rough set technique, Information sciences, 177(20), pp. 4493-4514. 124 [85] Wei-feng, D., Hai-ming, L., Yan, G., & Dan, M. (2005, July), Another kind of fuzzy rough sets, In Granular Computing, 2005 IEEE International Conference on (Vol. 1, pp. 145-148), IEEE. [86] Wu, Q. E., Wang, T., Huang, Y. X., & Li, J. S. (2006, August), New research on fuzzy rough sets, In Machine Learning and Cybernetics, 2006 International Conference on (pp. 4178-4183). IEEE. [87] Wu, W. Z., Mi, J. S., and Zhang, W. X. (2003), Generalized fuzzy rough sets.Information sciences, 151, pp. 263-282. [88] Xu, F. F., Miao, D. Q., and Wei, L. (2009), Fuzzy-rough attribute reduction via mutual information with an application to cancer classification, Computers and Mathematics with Applications, 57(6), pp. 1010-1017. [89] Xu, F., Miao, D., and Wei, L. (2007, August), An Approach for Fuzzy- Rough Sets Attributes Reduction via Mutual Information, In FSKD (3) (pp. 107-112). [90] Yao, Y. Y. (1998), A comparative study of fuzzy sets and rough sets, Information sciences, 109(1), pp. 227-242. [91] Yeung, D. S., Chen, D., Tsang, E. C., Lee, J. W., and Xizhao, W. (2005), On the generalization of fuzzy rough sets, IEEE Transactions on fuzzy systems, 13(3), pp. 343-361. [92] Yuan, Y., and Shaw, M. J. (1995), Induction of fuzzy decision trees, Fuzzy Sets and systems, 69(2), pp. 125-139. [93] Zadeh, L. A. (1965), Fuzzy sets, Information and control, 8(3), pp. 338- 353. [94] Zeng, A., Li, T., Liu, D., Zhang, J., & Chen, H. (2015), A fuzzy rough set approach for incremental feature selection on hybrid information systems, Fuzzy Sets and Systems, 258, pp. 39-60. [95] Zhang, S., & Sun, J. (2009, August), Continuous value attribute decision table analysis method based on fuzzy set and rough set theory, 125 In Fuzzy Systems and Knowledge Discovery, 2009, FSKD'09, Sixth International Conference on (Vol. 2, pp. 75-79), IEEE. [96] Zhang, M., Chen, D. G., & Yang, Y. Y. (2013, July), A new algorithm of attribute reduction based on fuzzy clustering, In Machine Learning and Cybernetics (ICMLC), 2013 International Conference on (Vol. 1, pp. 155-158), IEEE. [97] Zhang, X., Mei, C., Chen, D., and Li, J. (2016), Feature selection in mixed data: A method using a novel fuzzy rough set-based information entropy, Pattern Recognition, 56, pp. 1-15. [98] Zhao, S., & Tsang, E. C. (2008), On fuzzy approximation operators in attribute reduction with fuzzy rough sets, Information Sciences, 178(16), pp. 3163-3176. [99] [100] https://sourceforge.net/projects/weka
File đính kèm:
- luan_an_nghien_cuu_cac_phuong_phap_rut_gon_thuoc_tinh_va_sin.pdf