Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ

Rút gọn thuộc tính và sinh luật quyết định (luật phân lớp) là hai bài toán

quan trọng trong quá trình khám phá tri thức từ dữ liệu. Rút gọn thuộc tính thuộc

giai đoạn tiền xử lý dữ liệu còn sinh luật quyết định thuộc giai đoạn khai phá dữ

liệu. Rút gọn thuộc tính của bảng quyết định là quá trình lựa chọn tập con nhỏ nhất

của tập thuộc tính điều kiện, loại bỏ các thuộc tính dư thừa mà bảo toàn thông tin

phân lớp của bảng quyết định, gọi là tập rút gọn (reduct). Kết quả rút gọn thuộc tính

ảnh hưởng trực tiếp đến hiệu quả thực hiện các nhiệm vụ khai phá: Gia tăng tốc độ,

cải thiện chất lượng, tính dễ hiểu của các kết quả thu được. Sinh luật quyết định là

bước tiếp theo của rút gọn thuộc tính trong khai phá dữ liệu nhằm đánh giá chất

lượng phân lớp của dữ liệu thông qua độ hỗ trợ của tập luật quyết định. Độ chính

xác phân lớp được đánh giá thông qua tỷ lệ phân lớp đúng theo luật quyết định trên

tổng số lớp của tập dữ liệu.

Các kỹ thuật rút gọn thuộc tính được phân thành hai loại: Lựa chọn thuộc

tính (Attribute selection) và biến đổi thuộc tính (Attribute transformation) [44]. Lựa

chọn thuộc tính là chọn ra một tập con tốt nhất (theo một nghĩa nào đó) từ tập dữ

liệu ban đầu. Biến đổi thuộc tính là thực hiện việc biến đổi các thuộc tính của tập dữ

liệu ban đầu thành một tập dữ liệu với các thuộc tính mới có số lượng ít hơn sao cho

bảo tồn được thông tin nhiều nhất. Các công trình nghiên cứu về rút gọn thuộc tính

thường tập trung vào nghiên cứu các kỹ thuật lựa chọn thuộc tính. Lựa chọn thuộc

tính là quá trình lựa chọn một tập con gồm P thuộc tính từ tập gồm A thuộc tính

(PA) sao cho không gian thuộc tính được thu gọn lại một cách tối ưu theo một tiêu

chuẩn nhất định. Hiện nay có hai cách tiếp cận chính đối với bài toán lựa chọn

thuộc tính: Lọc (filter) và đóng gói (wrapper). Cách tiếp cận kiểu lọc thực hiện việc

lựa chọn thuộc tính độc lập với thuật toán khai phá sử dụng sau này. Các thuộc tính

được chọn chỉ dựa trên độ quan trọng của chúng trong việc mô tả dữ liệu. Ngược lại

với cách tiếp cận lọc, lựa chọn thuộc tính kiểu đóng gói tiến hành việc lựa chọn

bằng cách áp dụng ngay kỹ thuật khai phá cụ thể, độ chính xác của kết quả được lấy

làm tiêu chuẩn để lựa chọn các tập con thuộc tính [44)

pdf 137 trang dienloan 18740
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ

Luận án Nghiên cứu các phương pháp rút gọn thuộc tính và sinh luật quyết định theo tiếp cận tập thô mờ
BỘ THÔNG TIN VÀ TRUYỀN THÔNG 
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG 
CAO CHÍNH NGHĨA 
NGHIÊN CỨU CÁC PHƯƠNG PHÁP RÚT GỌN 
THUỘC TÍNH VÀ SINH LUẬT QUYẾT ĐỊNH 
THEO TIẾP CẬN TẬP THÔ MỜ 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
HÀ NỘI - 2017 
 BỘ THÔNG TIN VÀ TRUYỀN THÔNG 
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG 
CAO CHÍNH NGHĨA 
NGHIÊN CỨU CÁC PHƯƠNG PHÁP RÚT GỌN 
THUỘC TÍNH VÀ SINH LUẬT QUYẾT ĐỊNH 
THEO TIẾP CẬN TẬP THÔ MỜ 
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN 
MÃ SỐ: 62.48.01.04 
LUẬN ÁN TIẾN SĨ KỸ THUẬT 
NGƯỜI HƯỚNG DẪN KHOA HỌC: 
1. GS.TS. VŨ ĐỨC THI 
2. TS. TÂN HẠNH 
HÀ NỘI - 2017 
LỜI CẢM ƠN 
 Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự 
giúp đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân. Đầu tiên, tác 
giả xin bày tỏ lời tri ân tới GS.TS Vũ Đức Thi và TS. Tân Hạnh, những thầy giáo đã 
tận tình hướng dẫn tác giả hoàn thành luận án này. 
 Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của Học viện Công 
nghệ Bưu chính Viễn thông - Bộ Thông tin và Truyền thông, là cơ sở đào tạo đã 
luôn tạo điều kiện để NCS có thể hoàn thành luận án của mình. 
Tác giả xin gửi lời cảm ơn sâu sắc đến TS. Nguyễn Long Giang - một người 
thầy thầm lặng và các cán bộ Phòng Tin học quản lý, Viện Công nghệ Thông tin, 
Viện Khoa học và Công nghệ Việt Nam đã nhiệt tình giúp đỡ và tạo ra môi trường 
nghiên cứu tốt để tác giả hoàn thành công trình của mình; cảm ơn các thầy cô và các 
đồng nghiệp ở các nơi mà tác giả tham gia viết bài đã có những góp ý chính xác để 
tác giả có được những công bố như ngày hôm nay. 
 Tác giả xin gửi lời cảm ơn tới Đảng ủy, Ban Giám đốc Học viện Cảnh sát 
Nhân dân, các đồng nghiệp Bộ môn Toán - Tin học nơi tác giả công tác đã ủng hộ 
để luận án được hoàn thành đúng thời hạn. 
 Cuối cùng, tác giả xin gửi tới bạn bè, người thân lời cảm ơn chân thành nhất 
vì đã đồng hành cùng tác giả trong suốt thời gian qua. Con xin cảm ơn Cha, Mẹ và 
gia đình đã luôn là chỗ dựa vững chắc về tinh thần và vật chất, cũng là những người 
luôn mong mỏi cho con thành công; cảm ơn vợ và các em đã gánh vác công việc gia 
đình thay cho anh; xin lỗi các con vì phần nào đó đã chịu thiệt thòi trong thời gian 
bố học tập nghiên cứu, chính các con là nguồn động lực lớn lao giúp bố hoàn thành 
được công việc khó khăn này. 
 Hà Nội, tháng 11 năm 2016 
 Cao Chính Nghĩa 
LỜI CAM ĐOAN 
Các kết quả trình bày trong luận án là công trình nghiên cứu của tôi được 
hoàn thành dưới sự hướng dẫn của GS.TS. Vũ Đức Thi, TS. Tân Hạnh và TS. 
Nguyễn Long Giang. Những kết quả trình bày là mới và chưa từng được công bố ở 
các công trình của người khác. 
Tôi xin chịu trách nhiệm về những lời cam đoan của mình. 
 Cao Chính Nghĩa 
i 
MỤC LỤC 
MỤC LỤC ....................................................................................................................... i 
Danh mục các thuật ngữ ................................................................................................ iii 
Bảng các ký hiệu, từ viết tắt .......................................................................................... iv 
Danh sách bảng ............................................................................................................ vii 
Danh sách hình vẽ ....................................................................................................... viii 
MỞ ĐẦU ....................................................................................................................... 1 
CHƯƠNG 1. CÁC KIẾN THỨC CƠ SỞ ....................................................................... 9 
1.1. Một số khái niệm về tập thô ............................................................................. 9 
1.1.1. Hệ thông tin .............................................................................................. 9 
1.1.2. Các tập xấp xỉ ......................................................................................... 10 
1.1.3. Miền dương ............................................................................................ 11 
1.1.4. Bảng quyết định ...................................................................................... 11 
1.2. Một số khái niệm về tập thô mờ xác định trên bảng quyết định miền giá trị thực 
 ...................................................................................................................... 11 
1.2.1. Bảng quyết định miền giá trị thực ........................................................... 12 
1.2.2. Quan hệ tương đương mờ ....................................................................... 12 
1.2.3. Ma trận tương đương mờ ........................................................................ 13 
1.2.4. Phân hoạch mờ và lớp tương đương mờ .................................................. 14 
1.2.5. Các tập xấp xỉ mờ ................................................................................... 17 
1.2.6. Miền dương mờ ...................................................................................... 17 
1.3. Một số khái niệm về tập thô mờ xác định trên bảng quyết định mờ ................ 18 
1.3.1. Bảng quyết định mờ ................................................................................ 18 
1.3.2. Phân hoạch mờ và lớp tương đương mờ .................................................. 20 
1.3.3. Các tập xấp xỉ mờ ................................................................................... 21 
1.3.4. Miền dương mờ ...................................................................................... 21 
1.4. Rút gọn thuộc tính trong bảng quyết định....................................................... 23 
1.4.1. Tổng quan về rút gọn thuộc tính ............................................................. 23 
1.4.2. Tổng quan về rút gọn thuộc tính trong bảng quyết định theo tiếp cận tập 
thô ............................................................................................................... 26 
1.4.3. Định hướng nghiên cứu của luận án ........................................................ 28 
1.5. Kết luận chương 1.......................................................................................... 29 
ii 
CHƯƠNG 2. RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ 
TRỊ THỰC SỬ DỤNG MIỀN DƯƠNG MỜ VÀ KHOẢNG CÁCH JACCARD MỜ .. 30 
2.1. Đặt vấn đề ..................................................................................................... 30 
2.2. Rút gọn thuộc tính sử dụng miền dương mờ ................................................... 31 
2.2.1. Phương pháp rút gọn thuộc tính sử dụng miền dương mờ ....................... 32 
2.2.2. Thử nghiệm và đánh giá kết quả ............................................................. 37 
2.3. Rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ ..................................... 44 
2.3.1. Khoảng cách Jaccard mờ và các tính chất ............................................... 44 
2.3.2. Phương pháp rút gọn thuộc tính sử dụng khoảng cách Jaccard mờ .......... 52 
2.3.3. Thử nghiệm và đánh giá kết quả ............................................................. 56 
2.4. Kết luận chương 2.......................................................................................... 61 
CHƯƠNG 3. RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH MIỀN GIÁ 
TRỊ THỰC SỬ DỤNG KHOẢNG CÁCH PHÂN HOẠCH MỜ .................................. 63 
3.1. Đặt vấn đề ..................................................................................................... 63 
3.2. Khoảng cách phân hoạch mờ và các tính chất ................................................ 64 
3.3. Phương pháp rút gọn thuộc tính sử dụng khoảng cách phân hoạch mờ ........... 70 
3.4. Thử nghiệm và đánh giá kết quả .................................................................... 77 
3.5. Kết luận chương 3.......................................................................................... 82 
CHƯƠNG 4. RÚT GỌN THUỘC TÍNH VÀ SINH LUẬT TRÊN BẢNG QUYẾT 
ĐỊNH MỜ ................................................................................................................... 84 
4.1. Đặt vấn đề ..................................................................................................... 84 
4.2. Phương pháp rút gọn thuộc tính của bảng quyết định mờ ............................... 87 
4.3. Phương pháp sinh luật quyết định của bảng quyết định mờ ............................ 91 
4.3.1. Luật quyết định mờ ................................................................................. 92 
4.3.2. Sinh luật quyết định từ bảng quyết định mờ ............................................ 93 
4.3.3. Thử nghiệm và đánh giá kết quả ........................................................... 105 
4.4. Kết luận chương 4........................................................................................ 110 
KẾT LUẬN ............................................................................................................... 112 
Danh mục các công trình của tác giả .......................................................................... 114 
TÀI LIỆU THAM KHẢO .......................................................................................... 115 
iii 
Danh mục các thuật ngữ 
Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh 
Bảng quyết định Decision Table 
Bảng quyết định miền giá trị thực Numerical Decision Table 
Bảng quyết định mờ Fuzzy Decision Table 
Hệ thông tin Information System 
Khoảng cách mờ Fuzzy Distance 
Luật quyết định mờ Fuzzy Decision Rule 
Ma trận tương đương mờ Fuzzy Equivalent Relational Matrix 
Miền dương mờ Fuzzy Positive Region 
Quan hệ tương đương Equivalent Relation 
Quan hệ tương đương mờ Fuzzy Equivalent Relation 
Rút gọn thuộc tính Attribute Reduction 
Tập mờ Fuzzy Set 
Tập rút gọn Reduct 
Tập thô Rough Set 
Tập thô mờ Fuzzy Rough Set 
Xấp xỉ dưới Lower Approximation 
Xấp xỉ trên Upper Approximation 
Xấp xỉ dưới mờ Fuzzy Lower Approximation 
Xấp xỉ trên mờ Fuzzy Upper Approximation 
iv 
Bảng các ký hiệu, từ viết tắt 
Ký hiệu, từ viết tắt Diễn giải 
 ,I S U A Hệ thông tin 
 ,D T U C D  Bảng quyết định 
  ,DT U C D  Bảng quyết định mờ 
U Số đối tượng 
C Số thuộc tính điều kiện trong bảng quyết định 
A Số thuộc tính 
 u a Giá trị của đối tượng u tại thuộc tính a 
 I N D P Quan hệ P không phân biệt 
 Pu Lớp tương đương chứa u của quan hệ IND P 
 Pi Ru 
Lớp tương đường mờ chứa u của quan hệ tương đương mờ 
 PR 
/U P Phân hoạch của U sinh bởi tập thuộc tính P 
 P Phân hoạch mờ theo tập thuộc tính P 
PX P xấp xỉ dưới của X 
PX P xấp xỉ trên của X 
 PP N X P miền biên của X 
 PP O S D P miền dương của D 
 PS IG b Độ quan trọng của thuộc tính b với tập thuộc tính P 
 ( )A u Hàm thuộc của đối tượng u với tập mờ A 
 H P Entropy Shannon 
 E P Entropy Liang 
v 
  ,P QNFD R R 
Khoảng cách phân hoạch mờ giữa hai phân hoạch mờ  PR 
và  QR 
 ,N Fd C C D 
Khoảng cách phân hoạch mờ giữa hai tập thuộc tính C và 
C D 
 ( , )F JD A B Khoảng cách Jaccard mờ giữa hai tập mờ A và B 
 ,F Jd C C D 
Khoảng cách Jaccard mờ giữa hai tập thuộc tính C và 
C D 
F_RSAR1 
Thuật toán rút gọn thuộc tính dựa trên miền dương mờ 
F_RSAR1 (Fuzzy Rough Set Based Attribute Reduction 1) 
F_RSAR2 
Thuật toán rút gọn thuộc tính dựa trên miền dương mờ 
F_RSAR2 (Fuzzy Rough Set Based Attribute Reduction 2) 
FJ_DBAR 
Thuật toán rút gọn thuộc tính dựa trên khoảng cách Jaccard 
mờ (Fuzzy Jaccard Distance Based Attribute Reduction) 
FJ_RBAR 
Thuật toán sinh luật quyết định mờ dựa trên khoảng cách 
Jaccard mờ (Fuzzy Jaccard Rule Based Attribute Reduction) 
NF_DBAR 
Thuật toán rút gọn thuộc tính dựa trên khoảng cách phân 
hoạch mờ (New Fuzzy Distance Based Attribute Reduction) 
FAR-VPFRS 
Thuật toán rút gọn thuộc tính dựa trên miền dương mờ 
(Forward Attribute Reduction Based On Variable Precision 
Fuzzy-Rough Model) 
FA-FPR 
Thuật toán rút gọn thuộc tính dựa trên miền dương mờ cải 
tiến (Forward Approximation - Fuzzy Positive Region 
Reduction) 
FA-FSCE 
Thuật toán rút gọn thuộc tính dựa trên Entropy cải tiến 
(Forward Approximation - Fuzzy Conditional Entropy To 
Design A Heuristic Feature Selection Algorithm) 
vi 
GRAF 
Thuật toán rút gọn thuộc tính dựa trên Entropy tăng thêm 
(Attribute Selection Based On Information Gain Ratio In 
Fuzzy Rough Set Theory) 
MRBFA 
Thuật toán sinh luật quyết định mờ dựa trên xấp xỉ tiến 
(Mine Rules Based On The Forward Approximation) 
MRBBA 
Thuật toán sinh luật quyết định mờ dựa trên xấp xỉ lùi (Mine 
Rules Based On The Backward Approximation) 
vii 
 Danh sách bảng 
Bảng 1.1. Bảng quyết định miền giá trị thực .................................................................... 12 
Bảng 1.2. Bảng quyết định mờ chơi thể thao ................................................................... 18 
Bảng 1.3. Bảng quyết định mờ của Ví dụ 1.3 .................................................................. 22 
Bảng 2.1. Bảng quyết định miền giá trị thực của Ví dụ 2.1 .............................................. 34 
Bảng 2.2. Bộ dữ liệu thử nghiệm ..................................................................................... 37 
Bảng 2.3. Kết quả thực nghiệm của F_RSAR2, FAR-VPFRS ......................................... 40 
Bảng 2.4. Tập rút gọn của F_RSAR2, FAR-VPFRS ........................................................ 42 
Bảng 2.5. Độ chính xác phân lớp C4.5 của F_RSAR2, FAR-VPFRS .............................. 42 
Bảng 2.6. Kết quả thực nghiệm của FJ_DBAR và GRAF ............................................... 57 
Bảng 2.7. Tập rút gọn thu được bởi FJ_DBAR và GRAF ................................................ 59 
Bảng 2.8. Độ chính xác phân lớp C4.5 của FJ_DBAR và GRAF ..................................... 59 
Bảng 3.1. Mối liên hệ giữa khoảng cách phân hoạch mờ và entropy thông tin ................. 69 
Bảng 3.2. Kết quả thực nghiệm của FA_FSCE, FA_FPR, NF_DBAR ............................. 78 
Bảng 3.3. Tập rút gọn của FA_FSCE, FA_FPR, NF_DBAR .......................................... 80 
Bảng 3.4. Độ chính xác phân lớp C4.5 của FA_FSCE, FA_FPR, NF_DBAR .................. 80 
Bảng 4.1. Bảng quyết định mờ chơi thể thao biểu diễn lại Bảng 1.2 ................................ 89 
Bảng 4.2. Bảng quyết định mờ chơi thể thao đã rút gọn thuộc tính .................................. 97 
Bảng 4.3. Khoảng cách Jaccard mờ trực tiếp giữa các biến ngôn ngữ của Bảng 4.2 ......... 98 
Bảng 4.4. Kết quả gán nhãn của Bảng 4.2 với (α=0.245; β=0.9) ................................... 100 
Bảng 4.5. Kết quả gán nhãn của Bảng 4.2 với (α=0.245; β=0.8) ................................... 101 
Bảng 4.6. Kết quả gán nhãn của Bảng 4.2 với (α=0.26) ................................................ 103 
Bảng 4.7. Kết quả thực nghiệm của MRBFA, MRBBA và FJ_RBAR ........................... 108 
viii 
Danh sách hình vẽ 
Hình 1.1. Quá trình  ...  probabilistic space, Information Sciences, 178(16), pp. 3177-
3187. 
[17] Chen, D., Hu, Q., & Yang, Y. (2011), Parameterized attribute reduction 
with Gaussian kernel based fuzzy rough sets, Information 
Sciences, 181(23), pp. 5169-5179. 
[18] Chen, D., Zhang, L., Zhao, S., Hu, Q., and Zhu, P. (2012), A novel 
algorithm for finding reducts with fuzzy rough sets, IEEE Transactions 
on Fuzzy Systems, 20(2), pp. 385-389. 
117 
[19] Chen, S. M., Lee, S. H., and Lee, C. H. (2001), A new method for 
generating fuzzy rules from numerical data for handling classification 
problems, Applied Artificial Intelligence, 15(7), pp. 645-664. 
[20] Cheng, Y. (2012), A new approach for rule extraction in fuzzy 
information systems, Journal of Computational Information Systems, 
21(8), pp. 8795-8805. 
[21] Cheng, Y. (2015), Forward approximation and backward approximation 
in fuzzy rough sets, Neurocomputing, 148, pp. 340-353. 
[22] Chierichetti, F., Kumar, R., Pandey, S., & Vassilvitskii, S. (2010, 
January), Finding the jaccard median, In Proceedings of the twenty-first 
annual ACM-SIAM symposium on Discrete Algorithms (pp. 293-311), 
Society for Industrial and Applied Mathematics. 
[23] Cornelis, C., Jensen, R., Hurtado, G., & Śle, D. (2010), Attribute 
selection with fuzzy decision reducts, Information Sciences, 180(2), pp. 
209-224. 
[24] Dai, J., and Xu, Q. (2013), Attribute selection based on information 
gain ratio in fuzzy rough set theory with application to tumor 
classification, Applied Soft Computing, 13(1), pp. 211-221. 
[25] Dai, J., & Tian, H. (2013), Fuzzy rough set model for set-valued data, 
Fuzzy Sets and Systems, 229, pp. 54-68. 
[26] Degang, C., and Suyun, Z. (2010), Local reduction of decision system 
with fuzzy rough sets, Fuzzy Sets and Systems, 161(13), pp. 1871-1883. 
[27] Deng, T., Chen, Y., Xu, W., and Dai, Q. (2007), A novel approach to 
fuzzy rough sets based on a fuzzy covering, Information 
Sciences, 177(11), pp. 2308-2326. 
[28] Demetrovics, J., Thi, V. D., Giang, N. L. (2013), An Efficient 
Algorithm for Determining the Set of All Reductive Attributes in 
Incomplete Decision Table, Cybernetics and Information 
Technologies, 13(4), pp. 118-126. 
118 
[29] Demetrovics, J., , Thi, V. D., Giang, N. L. (2014), On Finding All 
Reducts of Consistent Decision Tables, Cybernetics and Information 
Technologies, 14(4). 
[30] Demetrovics, J., Huong, N. T. L., Thi, V. D., Giang, N. L. (2016), 
Metric Based Attribute Reduction Method in Dynamic Decision 
Tables, Cybernetics and Information Technologies, 16(2), pp. 3-15. 
[31] Dong, C., Wu, D., & He, J. (2008, December), Knowledge reduction of 
evaluation dataset based on genetic algorithm and fuzzy rough set, 
In Computer Science and Software Engineering, 2008 International 
Conference on (Vol. 3, pp. 889-892), IEEE. 
[32] Dubois, D., and Prade, H. (1990), Rough fuzzy sets and fuzzy rough 
sets, International Journal of General System, 17(2-3), pp. 191-209. 
[33] Dubois, D., and Prade, H. (1992), Putting rough sets and fuzzy sets 
together, Intelligent Decision Support, Kluwer Academic Publishers, 
Dordrecht. 
[34] Fujita, O. (2013), Metrics based on average distance between 
sets, Japan Journal of Industrial and Applied Mathematics, 30(1), pp. 
1-19. 
[35] Gardner, A., Kanno, J., Duncan, C. A., & Selmic, R. (2014), Measuring 
distance between unordered sets of different sizes, In Proceedings of 
the IEEE Conference on Computer Vision and Pattern Recognition, pp. 
137-143. 
[36] He, Q., Wu, C., Chen, D., and Zhao, S. (2011), Fuzzy rough set based 
attribute reduction for information systems with fuzzy 
decisions, Knowledge-Based Systems, 24(5), pp. 689-696. 
[37] Hong, T. P., Wang, T. T., & Chien, B. C. (2001), Learning approximate 
fuzzy rules from training examples. In Fuzzy Systems, 2001, The 10th 
IEEE International Conference on (Vol. 1, pp. 256-259), IEEE. 
119 
[38] Hu, Q., Xie, Z., and Yu, D. (2007), Hybrid attribute reduction based on 
a novel fuzzy-rough model and information granulation, Pattern 
recognition, 40(12), pp. 3509-3521. 
[39] Hu, Q., Yu, D., and Xie, Z. (2006), Information-preserving hybrid data 
reduction based on fuzzy-rough techniques, Pattern recognition 
letters, 27(5), pp. 414-423. 
[40] Hu, Q., Yu, D., Xie, Z., and Liu, J. (2006), Fuzzy probabilistic 
approximation spaces and their information measures, IEEE 
transactions on fuzzy systems, 14(2), pp. 191-201. 
[41] Hu, Q., An, S., & Yu, D. (2010), Soft fuzzy rough sets for robust 
feature evaluation and selection, Information Sciences, 180(22), pp. 
4384-4400. 
[42] Hu, Q., Zhang, L., Chen, D., Pedrycz, W., & Yu, D. (2010), Gaussian 
kernel based fuzzy rough sets: Model, uncertainty measures and 
applications, International Journal of Approximate Reasoning, 51(4), 
pp. 453-471. 
[43] Inuiguchi, M., Greco, S., & Slowinski, R. (2004), Fuzzy rough sets, 
gradual decision rules and approximate reasoning, Mathematical 
Programming Concerning Decision Makings and Uncertainties. 
[44] Jensen, R., and Q. Shen, Q.(2008), Computational Intelligence and 
Feature Selection, Rough and Fuzzy Approaches, Aberystwyth 
University, IEEE Computational Intelligence Society, Sponsor. 
[45] Jensen, R., and Shen, Q. (2002), Fuzzy-rough sets for descriptive 
dimensionality reduction. In Fuzzy Systems, 2002, FUZZ-IEEE'02, 
Proceedings of the 2002 IEEE International Conference on (Vol. 1, pp. 
29-34), IEEE. 
[46] Jensen, R., & Shen, Q. (2002, September), Aiding fuzzy rule induction 
with fuzzy-rough attribute reduction, In Proceedings of the 2002 UK 
Workshop on Computational Intelligence (pp. 81-88). 
120 
[47] Jensen, R., and Shen, Q. (2004), Fuzzy–rough attribute reduction with 
application to web categorization, Fuzzy sets and systems, 141(3), pp. 
469-485. 
[48] Jensen, R., and Shen, Q. (2004), Semantics-preserving dimensionality 
reduction: rough and fuzzy-rough-based approaches, IEEE 
Transactions on knowledge and data engineering, 16(12), pp. 1457-
1471. 
[49] Jensen, R., and Shen, Q. (2007), Fuzzy-rough sets assisted attribute 
selection, IEEE Transactions on fuzzy systems, 15(1), pp. 73-89. 
[50] Jensen, R., and Shen, Q. (2009), New approaches to fuzzy-rough 
feature selection, IEEE Transactions on Fuzzy Systems, 17(4), pp. 824-
838. 
[51] Jensen, R., Cornelis, C., and Shen, Q. (2009, August), Hybrid fuzzy-
rough rule induction and feature selection. In Fuzzy Systems, 2009, 
FUZZ-IEEE 2009, IEEE International Conference on (pp. 1151-1156), 
IEEE. 
[52] Kohonen, T. (1988), An introduction to neural computing, Neural 
networks, 1(1), 3-16. 
[53] Kohonen, T. (1998), The self-organizing map, Neurocomputing, 21(1), 
pp. 1-6. 
[54] Kohonen, T. (2012), Self-organization and associative memory (Vol.8). 
Springer Science & Business Media. 
[55] Kumar, M., & Yadav, N. (2014), Fuzzy Rough Sets and Its Application 
in Data Mining Field, Advances in Computer Science and Information 
Technology (ACSIT), 237. 
[56] LEVASHENKO, V., and MARTINCOVÁ, P. (2005), Fuzzy decision 
tree for parallel processing support, Journal of Information, Control and 
Management Systems, Vol. 3. 
121 
[57] Liu, G. (2008), Axiomatic systems for rough sets and fuzzy rough sets, 
International Journal of Approximate Reasoning, 48(3), pp. 857-867. 
[58] Liu, X., Qian, Y., & Liang, J. (2014), A rule-extraction framework 
under multigranulation rough sets, International Journal of Machine 
Learning and Cybernetics, 5(2), pp. 319-326. 
[59] Maji, P., & Garai, P. (2013), On fuzzy-rough attribute selection: criteria 
of max-dependency, max-relevance, min-redundancy, and max-
significance, Applied Soft Computing, 13(9), pp. 3968-3980. 
[60] Mageswari, G. U., & Devi, M. I. (2016), Attribute subset selection 
based on fuzzy rough set and ranking approach, Int J Adv Engg Tech, 
Vol. VII, Issue II, April-June, pp. 735-742. 
[61] Meghabghab, G. (2006, June), Fuzzy Rough Sets as a Pair of Fuzzy 
Numbers: A New Approach and New Findings, In Fuzzy Information 
Processing Society, 2006. NAFIPS 2006, Annual meeting of the North 
American (pp. 46-51), IEEE. 
[62] Meng, J., Xu, Y., & Zhang, J. (2012, August), Comparison of two 
algorithms of attribute reduction based on fuzzy rough set, 
In Computational and Information Sciences (ICCIS), 2012 Fourth 
International Conference on (pp. 542-545), IEEE. 
[63] Ming, Z., Zhengbo, Y., Liukun, Z., Huijie, W., and Xiaogang, X. 
(2012), The Extraction Method of the Energy Consumption 
Characteristics Based on Fuzzy Rough Set, AASRI Procedia, 1, pp. 
142-149. 
[64] Nguyen, L. G. (2012, September), Metric based attribute reduction in 
decision tables, In Computer Science and Information Systems 
(FedCSIS), 2012 Federated Conference on (pp. 311-316), IEEE. 
[65] Ouyang, Y., Wang, Z., & Zhang, H. P. (2010), On fuzzy rough sets 
based on tolerance relations, Information Sciences, 180(4), pp. 532-542. 
122 
[66] Pawlak Z. (1991), Rough sets: Theoretical Aspects of Reasoning About 
Data, Kluwer Academic Publishers. 
[67] Pawlak, R., Grzymala-Busse, J.W., Slowinski, R., Ziako, W. (1995), 
Rough sets, Communications, ACM 38(11), pp. 89-95. 
[68] Pawlak, Z. (1982), Rough sets, International Journal of Computer & 
Information Sciences, 11(5), pp. 341-356. 
[69] Qian, Y., Li, Y., Liang, J., Lin, G., and Dang, C. (2015), Fuzzy granular 
structure distance, IEEE Transactions on Fuzzy Systems, 23(6), pp. 
2245-2259. 
[70] Qian, Y., Liang, J., and Dang, C. (2009), Knowledge structure, 
knowledge granulation and knowledge distance in a knowledge 
base, International Journal of Approximate Reasoning, 50(1), pp. 174-
188. 
[71] Qian, Y., Liang, J., Wei-zhi, Z. W., and Dang, C. (2011), Information 
granularity in fuzzy binary GrC model, IEEE Transactions on Fuzzy 
Systems, 19(2), pp. 253-264. 
[72] Qian, Y., Wang, Q., Cheng, H., Liang, J., and Dang, C. (2015), Fuzzy-
rough feature selection accelerator, Fuzzy Sets and Systems, 258, pp. 
61-78. 
[73] Radzikowska, A. M., and Kerre, E. E. (2002), A comparative study of 
fuzzy rough sets. Fuzzy sets and systems, 126(2), pp. 137-155. 
[74] Shen, Q., and Jensen, R. (2004), Selecting informative features with 
fuzzy-rough sets and its application for complex systems 
monitoring. Pattern recognition, 37(7), pp. 1351-1363. 
[75] Sun, R., & Han, R. (2009, June), Data mining based on fuzzy rough set 
theory and its application in the glass identification, In Information and 
Automation, 2009. ICIA'09. International Conference on (pp. 154-157), 
IEEE. 
123 
[76] Sun, B., and Ma, W. (2011), Fuzzy rough set model on two different 
universes and its application, Applied Mathematical Modelling 35, pp. 
1798–1809. 
[77] Tavan, P., Grubmüller, H., & Kühnel, H. (1990), Self-organization of 
associative memory and pattern classification: recurrent signal 
processing on topological feature maps, Biological Cybernetics, 64(2), 
pp. 95-105. 
[78] Tsang, G. C., Degang, C., Tsang, E. C., Lee, J. W., and Yeung, D. S. 
(2005, October), On attributes reduction with fuzzy rough sets, In 2005 
IEEE International Conference on Systems, Man and Cybernetics (Vol. 
3, pp. 2775-2780), IEEE. 
[79] Tsang, E. C., and Chen, D. G. (2006, August), The Fuzzy Rough Set 
Approaches of Fuzzy Reasoning, In 2006 International Conference on 
Machine Learning and Cybernetics (pp. 1642-1646), IEEE. 
[80] Tsang, E. C., Chen, D., Yeung, D. S., Wang, X. Z., and Lee, J. W. 
(2008). Attributes reduction using fuzzy rough sets, IEEE Transactions 
on Fuzzy systems, 16(5), pp. 1130-1141. 
[81] Tsang, E. C., Zhao, S. Y., and Lee, J. W. (2007, August), Rule 
induction based on fuzzy rough sets, In 2007 International Conference 
on Machine Learning and Cybernetics (Vol. 5, pp. 3028-3033), IEEE. 
[82] Wang, X. Z., Ha, Y., & Chen, D. G. (2005, August), On the reduction 
of fuzzy rough sets, In Machine Learning and Cybernetics, 2005, 
Proceedings of 2005 International Conference on (Vol. 5, pp. 3174-
3178), IEEE. 
[83] Wang, X., & Hong, J. (1999), Learning optimization in simplifying 
fuzzy rules, Fuzzy sets and systems, 106(3), pp. 349-356. 
[84] Wang, X., Tsang, E. C., Zhao, S., Chen, D., & Yeung, D. S. (2007), 
Learning fuzzy rules from fuzzy samples based on rough set 
technique, Information sciences, 177(20), pp. 4493-4514. 
124 
[85] Wei-feng, D., Hai-ming, L., Yan, G., & Dan, M. (2005, July), Another 
kind of fuzzy rough sets, In Granular Computing, 2005 IEEE 
International Conference on (Vol. 1, pp. 145-148), IEEE. 
[86] Wu, Q. E., Wang, T., Huang, Y. X., & Li, J. S. (2006, August), New 
research on fuzzy rough sets, In Machine Learning and Cybernetics, 
2006 International Conference on (pp. 4178-4183). IEEE. 
[87] Wu, W. Z., Mi, J. S., and Zhang, W. X. (2003), Generalized fuzzy 
rough sets.Information sciences, 151, pp. 263-282. 
[88] Xu, F. F., Miao, D. Q., and Wei, L. (2009), Fuzzy-rough attribute 
reduction via mutual information with an application to cancer 
classification, Computers and Mathematics with Applications, 57(6), 
pp. 1010-1017. 
[89] Xu, F., Miao, D., and Wei, L. (2007, August), An Approach for Fuzzy-
Rough Sets Attributes Reduction via Mutual Information, In FSKD 
(3) (pp. 107-112). 
[90] Yao, Y. Y. (1998), A comparative study of fuzzy sets and rough sets, 
Information sciences, 109(1), pp. 227-242. 
[91] Yeung, D. S., Chen, D., Tsang, E. C., Lee, J. W., and Xizhao, W. 
(2005), On the generalization of fuzzy rough sets, IEEE Transactions 
on fuzzy systems, 13(3), pp. 343-361. 
[92] Yuan, Y., and Shaw, M. J. (1995), Induction of fuzzy decision 
trees, Fuzzy Sets and systems, 69(2), pp. 125-139. 
[93] Zadeh, L. A. (1965), Fuzzy sets, Information and control, 8(3), pp. 338-
353. 
[94] Zeng, A., Li, T., Liu, D., Zhang, J., & Chen, H. (2015), A fuzzy rough 
set approach for incremental feature selection on hybrid information 
systems, Fuzzy Sets and Systems, 258, pp. 39-60. 
[95] Zhang, S., & Sun, J. (2009, August), Continuous value attribute 
decision table analysis method based on fuzzy set and rough set theory, 
125 
In Fuzzy Systems and Knowledge Discovery, 2009, FSKD'09, Sixth 
International Conference on (Vol. 2, pp. 75-79), IEEE. 
[96] Zhang, M., Chen, D. G., & Yang, Y. Y. (2013, July), A new algorithm 
of attribute reduction based on fuzzy clustering, In Machine Learning 
and Cybernetics (ICMLC), 2013 International Conference on (Vol. 1, 
pp. 155-158), IEEE. 
[97] Zhang, X., Mei, C., Chen, D., and Li, J. (2016), Feature selection in 
mixed data: A method using a novel fuzzy rough set-based information 
entropy, Pattern Recognition, 56, pp. 1-15. 
[98] Zhao, S., & Tsang, E. C. (2008), On fuzzy approximation operators in 
attribute reduction with fuzzy rough sets, Information 
Sciences, 178(16), pp. 3163-3176. 
[99]  
[100] https://sourceforge.net/projects/weka 

File đính kèm:

  • pdfluan_an_nghien_cuu_cac_phuong_phap_rut_gon_thuoc_tinh_va_sin.pdf