Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian

Phát hiện luật kết hợp và mẫu chuỗi, luật chuỗi nằm trong số những vấn

đề quan trọng trong lĩnh vực khai phá dữ liệu. Đến nay, rất nhiều công trình

nghiên cứu liên quan đến các lĩnh vực này. Các luật kết hợp và mẫu chuỗi,

luật chuỗi được đề xuất là rất đa dạng, chúng có thể là các luật, mẫu chuỗi

giao dịch/định lượng; có trọng số/không trọng số; có yếu tố thời gian/không

có yếu tố thời gian;.v.v.

Vấn đề phát hiện luật kết hợp trong các CSDL giao địch được đề xuất lần

đầu vào năm 1993 [1] và đến nay đã có nhiều thuật toán được xây dựng theo

rất nhiều cách tiếp cận khác nhau để phát hiện các luật này trong các CSDL

giao dịch: APRIORI [2], PARTITION [3], A-CLOSE [4], A-CLOSE+ [5],

CLOSE [6], CLOSET [7], CLOSET+ [8], CHARM [9], MAFIA [10],

GENMAX [11], ECLAT [12], DIC [13], FP-GROWTH [14], CFPMINE [15],

ETARM [16], LRM [17], PARM [18], NEGFIN [19].

Tuy nhiên các CSDL trong thực tế thường có các thuộc tính nhận giá trị

số hoặc giá trị phân loại. Những CSDL như vậy được gọi là CSDL định

lượng. Việc phát hiện các luật kết hợp trong CSDL định lượng thường sử

dụng một trong 2 cách đó là: rời rạc hóa [20]–[23] và mờ hóa các thuộc tính

định lượng [24]–[29]. Bản chất của cách tiếp cận thứ nhất là đưa CSDL định

lượng về CSDL giao dịch bằng cách chuyển các thuộc tính định lượng thành

một số mục (item) tương ứng và sau đó áp dụng một trong các thuật toán phát

hiện các luật kết hợp trong các CSDL giao dịch đã biết.

pdf 146 trang dienloan 16680
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian

Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC 
VÀ CÔNG NGHỆ VIỆT NAM 
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ 
----------------------------- 
TRƢƠNG ĐỨC PHƢƠNG 
PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG 
CƠ SỞ DỮ LIỆU ĐỊNH LƢỢNG CÓ YẾU TỐ THỜI GIAN 
LUẬN ÁN TIẾN SĨ MÁY TÍNH 
HÀ NỘI – 2021 
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM 
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ 
...*** 
TRƢƠNG ĐỨC PHƢƠNG 
PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG 
CƠ SỞ DỮ LIỆU ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN 
LUẬN ÁN TIẾN SĨ MÁY TÍNH 
Chuyên ngành : Hệ thống thông tin 
Mã số: 9 48 01 04 
 Ngƣời hƣớng dẫn khoa học: 
 1. PGS.TS. Đỗ Văn Thành 
 2. PGS.TS. Nguyễn Đức Dũng 
Hà Nội – 2021 
i 
LỜI CAM ĐOAN 
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các kết 
quả được viết chung với các tác giả khác đều được sự đồng ý của các đồng tác 
giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực và 
chưa từng được công bố trong các công trình nào khác. 
Luận án được hoàn thành trong thời gian tôi làm Nghiên cứu sinh tại 
Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ 
Việt Nam. 
 Tác giả luận án 
 NCS. Trƣơng Đức Phƣơng 
ii 
 LỜI CẢM ƠN 
Luận án Tiến sỹ “Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở 
dữ liệu định lượng có yếu tố thời gian” được thực hiện dưới sự hướng dẫn 
khoa học của PGS.TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng. 
Trước tiên tôi xin được bày tỏ lòng biết ơn sâu sắc tới các thầy hướng 
dẫn PGS. TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng. Trong quá trình 
thực hiện luận án, nghiên cứu sinh đã nhận được nhiều định hướng khoa học, 
những bài học quý báu, sự hướng dẫn nhiệt tình từ các thầy hướng dẫn. Các 
thầy cũng đã luôn tận tâm động viên, khuyến khích và chỉ dẫn giúp đỡ nghiên 
cứu sinh hoàn thành được bản luận án này. 
Tôi xin chân thành cảm ơn các thầy cô Học viện Khoa học và Công 
nghệ đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình nghiên cứu và 
thực hiện luận án. 
Tôi xin cảm ơn Ban Giám hiệu, tập thể cán bộ, giảng viên khoa Khoa 
học Tự nhiên và Công nghệ, trường Đại học Thủ đô Hà Nội đã tạo điều kiện 
giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu. 
Nhân dịp này, tôi cũng xin bày tỏ lòng biết ơn sâu sắc tới gia đình và 
bạn bè đã cho tôi điểm tựa vững chắc, tạo động lực để tôi hoàn thành luận án 
này. 
 Tác giả 
 NCS. Trương Đức Phương
1 
MỤC LỤC 
DANH MỤC HÌNH VẼ .................................................................................. 4 
DANH MỤC BẢNG BIỂU ............................................................................. 6 
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................ 8 
MỞ ĐẦU .......................................................................................................... 9 
CHƯƠNG 1. TỔNG QUAN VỀ LUẬT KẾT HỢP VÀ MẪU CHUỖI, 
LUẬT CHUỖI CHUNG ................................................................................. 18 
1.1. Luật kết hợp ........................................................................................ 18 
1.1.1. Phát hiện luật kết hợp trong các CSDL giao dịch .............................. 18 
1.1.2. Phát hiện luật kết hợp trong các CSDL định lượng ........................... 21 
1.1.3. Phát hiện luật kết hợp tính đến khoảng cách thời gian xảy ra của các 
giao dịch trong các CSDL có yếu tố thời gian ................................................ 23 
1.2. Mẫu chuỗi ........................................................................................... 25 
1.2.1. Phát hiện mẫu chuỗi trong các CSDL chuỗi giao dịch ...................... 25 
1.2.2. Phát hiện mẫu chuỗi trong các CSDL chuỗi định lượng .................... 29 
1.2.3. Phát hiện mẫu chuỗi tính đến khoảng cách thời gian xảy ra của các 
giao dịch trong các CSDL chuỗi có yếu tố thời gian ..................................... 31 
1.3. Luật chuỗi chung ................................................................................ 34 
1.3.1. Khái niệm luật chuỗi chung ................................................................ 34 
1.3.2. Phát hiện luật chuỗi chung ................................................................. 34 
Kết luận Chương 1 .......................................................................................... 38 
CHƯƠNG 2. PHÁT HIỆN LUẬT KẾT HỢP CÓ TÍNH ĐẾN KHOẢNG 
CÁCH THỜI GIAN TRONG CÁC CSDL ĐỊNH LƯỢNG CÓ YẾU TỐ 
THỜI GIAN ............................................................................................... 42 
2.1. Giới thiệu ............................................................................................ 42 
2.2. Một số khái niệm cơ bản .................................................................... 44 
2.3. Thuật toán phát hiện luật kết hợp mờ với khoảng cách thời gian mờ 52 
2.3.1. Bài toán đặt ra ..................................................................................... 52 
2.3.2. Ý tưởng thuật toán .............................................................................. 53 
2.3.3. Thuật toán FTQ .................................................................................. 54 
2.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 58 
2.3.5. Độ phức tạp thuật toán........................................................................ 60 
2 
2.3.6. Trường hợp suy biến của luật kết hợp mờ với khoảng cách thời gian 
mờ ............................................................................................................ 62 
2.4. Thử nghiệm thuật toán ........................................................................ 63 
2.4.1. Dữ liệu thử nghiệm ............................................................................. 63 
2.4.2. Kết quả thử nghiệm ............................................................................ 66 
Kết luận Chương 2 .......................................................................................... 72 
CHƯƠNG 3. PHÁT HIỆN MẪU CHUỖI CÓ TÍNH ĐẾN KHOẢNG 
CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH LƯỢNG CÓ YẾU 
TỐ THỜI GIAN .............................................................................................. 74 
3.1. Giới thiệu ............................................................................................ 74 
3.2. Một số khái niệm cơ bản .................................................................... 76 
3.3. Thuật toán phát hiện mẫu chuỗi mờ với khoảng cách thời gian mờ .. 84 
3.3.1. Bài toán đặt ra ..................................................................................... 84 
3.3.2. Ý tưởng thuật toán .............................................................................. 84 
3.3.3. Thuật toán FSPFTIM .......................................................................... 85 
3.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 88 
3.3.5. Độ phức tạp thuật toán........................................................................ 90 
3.3.6. Trường hợp suy biến của mẫu chuỗi mờ với khoảng cách thời gian 
mờ ............................................................................................................ 91 
3.3.7. Minh họa thuật toán ............................................................................ 92 
3.4. Thử nghiệm thuật toán ........................................................................ 93 
3.4.1. Dữ liệu thử nghiệm ............................................................................. 93 
3.4.2. Kết quả thử nghiệm ............................................................................ 95 
Kết luận Chương 3 ........................................................................................ 100 
CHƯƠNG 4. PHÁT HIỆN LUẬT CHUỖI CHUNG CÓ TÍNH ĐẾN 
KHOẢNG CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH 
LƯỢNG CÓ YẾU TỐ THỜI GIAN. ............................................................ 101 
4.1. Giới thiệu .......................................................................................... 101 
4.2. Một số khái niệm cơ bản .................................................................. 103 
4.3. Thuật toán phát hiện luật chuỗi chung mờ với khoảng cách thời gian 
mờ .......................................................................................................... 108 
4.3.1. Bài toán đặt ra ................................................................................... 108 
4.3.2. Thuật toán IFERMiner ..................................................................... 108 
4.3.3. Tính đúng đắn và đầy đủ .................................................................. 112 
3 
4.3.4. Độ phức tạp của thuật toán IFERMiner ........................................... 114 
4.3.5. Trường hợp suy biến của luật chuỗi chung mờ với khoảng cách thời 
gian mờ .......................................................................................................... 120 
4.4. Thử nghiệm thuật toán ...................................................................... 121 
4.4.1. Dữ liệu thử nghiệm ........................................................................... 121 
4.4.2. Kết quả thử nghiệm .......................................................................... 123 
Kết luận Chương 4 ........................................................................................ 129 
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 130 
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 132 
TÀI LIỆU THAM KHẢO ............................................................................. 133 
4 
DANH MỤC HÌNH VẼ 
Hình 1.1. Các vấn đề liên quan đến nghiên cứu của luận án .......................... 41 
Hình 2.1. Các hàm thành viên của các tập mờ ứng với tỉ lệ tăng/giảm của các 
mã chứng khoán .............................................................................................. 65 
Hình 2.2. Các hàm thành viên của các tập mờ của Tỉ lệ thay đổi chỉ số VN30
 ......................................................................................................................... 65 
Hình 2.3. Các hàm thành viên của các tập mờ thời gian ................................ 65 
Hình 2.4. Mối quan hệ giữa số lượng luật tìm được từ thuật toán FTQ và độ 
tin cậy cực tiểu min_conf trong các trường hợp khác nhau về độ hỗ trợ cực 
tiểu min_sup .................................................................................................... 66 
Hình 2.5. Mối quan hệ giữa số lượng luật tìm được và min_sup với min_conf 
khác nhau. ........................................................................................................ 67 
Hình 2.6. Chi phí thời gian thực hiện khi min_conf=70% ............................. 67 
Hình 2.7. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia 
khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FTQ ...... 68 
Hình 2.8. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương 
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán 
FTQ ................................................................................................................. 68 
Hình 3.1. Các hàm thành viên của các tập mờ thuộc LT ................................ 81 
Hình 3.2. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời 
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup 
(b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực 
hiện trên tập dữ liệu S100I1000T3D341K. ..................................................... 95 
Hình 3.3. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời 
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup 
(b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực 
hiện trên tập dữ liệu Online Retail_France ..................................................... 96 
5 
Hình 3.4. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời 
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup 
(b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối 
với tập dữ liệu S100I1000T3D341K ............................................................... 97 
Hình 3.5. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời 
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup 
(b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối 
với tập dữ liệu Online Retail_France .............................................................. 97 
Hình 3.6. So sánh số mẫu chuỗi của phương pháp mờ hóa (A) và phương 
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán 
FSPFTIM ......................................................................................................... 98 
Hình 3.7. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương 
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán 
FSPFTIM ......................................................................................................... 98 
Hình 4.1. Mối quan hệ giữa số lượng các luật FCSI valid với min_sup và 
min_conf ........................................................................................................ 124 
Hình 4.2. Mối quan hệ giữa thời gian thực hiện thuật toán với min_sup và 
min_conf ........................................................................................................ 125 
Hình 4.3. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia 
khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán IFERMiner
 ....................................................................................................................... 126 
Hình 4.4. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương 
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán 
IFERMiner .................................................................................................... 127 
6 
DANH MỤC BẢNG BIỂU 
Bảng 1.1. Ví dụ về CSDL giao dịch ............................................................... 18 
Bảng 1.2. Ví dụ về CSDL định lượng ............................................................. 22 
Bảng 1.3. Ví dụ về CSDL giao dịch mua hàng có yếu tố thời gian ................ 24 
Bảng 1.4. Một số nghiên cứu về phát hiện luật kết hợp có tính đến khoảng 
cách thời gian .................................................................................................. 24 
Bảng 1.5. Ví dụ về CSDL chuỗi giao dịch ..................................................... 25 
Bảng 1.6. Ví dụ CSDL chuỗi định lượng ........................................................ 29 
Bảng 1.7. Ví dụ CSDL chuỗi giao dịch có yếu tố thời gian ........................... 31 
Bảng 1.8. Một số ... g and Other 
Applications of Applied Intelligent Systems, 2020, pp. 820–831. 
[39] R. Agrawal, R. Srikant, and others, “Mining sequential patterns,” in 
icde, 1995, vol. 95, pp. 3–14. 
136 
[40] R. Srikant and R. Agrawal, “Mining sequential patterns: Generalizations 
and performance improvements,” in International Conference on 
Extending Database Technology, 1996, pp. 1–17. 
[41] M. N. Garofalakis, R. Rastogi, and K. Shim, “SPIRIT: Sequential 
pattern mining with regular expression constraints,” in VLDB, 1999, vol. 
99, pp. 7–10. 
[42] M. J. Zaki, “SPADE: An efficient algorithm for mining frequent 
sequences,” Mach. Learn., vol. 42, no. 1–2, pp. 31–60, 2001. 
[43] J. Ayres, J. Flannick, J. Gehrke, and T. Yiu, “Sequential pattern mining 
using a bitmap representation,” in Proceedings of the eighth ACM 
SIGKDD international conference on Knowledge discovery and data 
mining, 2002, pp. 429–435. 
[44] E. Salvemini, F. Fumarola, D. Malerba, and J. Han, “Fast sequence 
mining based on sparse id-lists,” in International Symposium on 
Methodologies for Intelligent Systems, 2011, pp. 316–325. 
[45] P. Fournier-Viger, A. Gomariz, M. Campos, and R. Thomas, “Fast 
vertical mining of sequential patterns using co-occurrence information,” 
in Pacific-Asia Conference on Knowledge Discovery and Data Mining, 
2014, pp. 40–52. 
[46] P. Fournier-Viger, C.-W. Wu, and V. S. Tseng, “Mining maximal 
sequential patterns without candidate maintenance,” in International 
Conference on Advanced Data Mining and Applications, 2013, pp. 169–
180. 
[47] D. Lo, S.-C. Khoo, and J. Li, “Mining and ranking generators of 
sequential patterns,” in Proceedings of the 2008 SIAM International 
Conference on Data Mining, 2008, pp. 553–564. 
[48] J. Han, J. Pei, B. Mortazavi-Asl, Q. Chen, U. Dayal, and M.-C. Hsu, 
“FreeSpan: frequent pattern-projected sequential pattern mining,” in 
Proceedings of the sixth ACM SIGKDD international conference on 
Knowledge discovery and data mining, 2000, pp. 355–359. 
[49] J. Pei et al., “Mining sequential patterns by pattern-growth: The 
prefixspan approach,” IEEE Trans. Knowl. Data Eng., vol. 16, no. 11, 
pp. 1424–1440, 2004. 
[50] X. Yan, J. Han, and R. Afshar, “CloSpan: Mining: Closed sequential 
patterns in large datasets,” in Proceedings of the 2003 SIAM 
international conference on data mining, 2003, pp. 166–177. 
[51] T. Van, B. Vo, and B. Le, “Mining sequential patterns with itemset 
constraints,” Knowl. Inf. Syst., vol. 57, no. 2, pp. 311–330, 2018. 
[52] R. Bhatta, C. I. Ezeife, and M. N. Butt, “Mining Sequential Patterns of 
Historical Purchases for E-commerce Recommendation,” in 
137 
International Conference on Big Data Analytics and Knowledge 
Discovery, 2019, pp. 57–72. 
[53] C. Fiot, A. Laurent, and M. Teisseire, “From crispness to fuzziness: 
Three algorithms for soft sequential pattern mining,” IEEE Trans. Fuzzy 
Syst., vol. 15, no. 6, pp. 1263–1277, 2007. 
[54] Y.-C. Hu, R.-S. Chen, G.-H. Tzeng, and J.-H. Shieh, “A fuzzy data 
mining algorithm for finding sequential patterns,” Int. J. Uncertainty, 
Fuzziness Knowledge-Based Syst., vol. 11, no. 02, pp. 173–193, 2003. 
[55] Y.-C. Hu, G.-H. Tzeng, and C.-M. Chen, “Deriving two-stage learning 
sequences from knowledge in fuzzy sequential pattern mining,” Inf. Sci. 
(Ny)., vol. 159, no. 1–2, pp. 69–86, 2004. 
[56] T. C.-K. Huang, “Discovery of fuzzy quantitative sequential patterns 
with multiple minimum supports and adjustable membership functions,” 
Inf. Sci. (Ny)., vol. 222, pp. 126–146, 2013. 
[57] R. J. Kuo, C. M. Chao, and C. Y. Liu, “Integration of K-means 
algorithm and AprioriSome algorithm for fuzzy sequential pattern 
mining,” Appl. Soft Comput., vol. 9, no. 1, pp. 85–93, 2009. 
[58] R. B. V Subramanyam and A. Goswami, “A fuzzy data mining 
algorithm for incremental mining of quantitative sequential patterns,” 
Int. J. Uncertainty, Fuzziness Knowledge-Based Syst., vol. 13, no. 06, 
pp. 633–652, 2005. 
[59] T. Huang, R. Huang, B. Liu, and Y. Yan, “Extracting Various Types of 
Informative Web Content via Fuzzy Sequential Pattern Mining,” in 
Asia-Pacific Web (APWeb) and Web-Age Information Management 
(WAIM) Joint Conference on Web and Big Data, 2017, pp. 230–238. 
[60] M. Yoshida, T. Iizuka, H. Shiohara, and M. Ishiguro, “Mining 
sequential patterns including time intervals,” in Data Mining and 
Knowledge Discovery: Theory, Tools, and Technology II, 2000, vol. 
4057, pp. 213–220. 
[61] Y.-L. Chen, M.-C. Chiang, and M.-T. Ko, “Discovering time-interval 
sequential patterns in sequence databases,” Expert Syst. Appl., vol. 25, 
no. 3, pp. 343–354, 2003. 
[62] F. Giannotti, M. Nanni, D. Pedreschi, and F. Pinelli, “Mining sequences 
with temporal annotations,” in Proceedings of the 2006 ACM 
symposium on Applied computing, 2006, pp. 593–597. 
[63] Y.-L. Chen and T.-K. Huang, “Discovering fuzzy time-interval 
sequential patterns in sequence databases,” IEEE Trans. Syst. Man, 
Cybern. Part B, vol. 35, no. 5, pp. 959–972, 2005. 
[64] I. Mukhlash, D. Yuanda, and M. Iqbal, “Mining Fuzzy Time Interval 
Periodic Patterns in Smart Home Data,” Int. J. Electr. Comput. Eng., 
138 
vol. 8, no. 5, p. 3374, 2018. 
[65] C.-I. Chang, H.-E. Chueh, and N. P. Lin, “Sequential patterns mining 
with fuzzy time-intervals,” in 2009 Sixth International Conference on 
Fuzzy Systems and Knowledge Discovery, 2009, vol. 3, pp. 165–169. 
[66] C.-I. Chang, H.-E. Chueh, and Y.-C. Luo, “An integrated sequential 
patterns mining with fuzzy time-intervals,” in 2012 International 
Conference on Systems and Informatics (ICSAI2012), 2012, pp. 2294–
2298. 
[67] T. H. Duong, D. Janos, V. D. Thi, N. T. Thang, and others, “An 
Algorithm for Mining High Utility Sequential Patterns with Time 
Interval,” Cybern. Inf. Technol., vol. 19, no. 4, pp. 3–16, 2019. 
[68] T. H. Duong, N. T. Thang, V. D. Thi, and others, “HIGH UTILITY 
ITEM INTERVAL SEQUENTIAL PATTERN MINING 
ALGORITHM,” J. Comput. Sci. Cybern., vol. 36, no. 1, pp. 1–15, 2020. 
[69] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo, 
“CMRULES: An Efficient Algorithm for Mining Sequential Rules 
Common to Several Sequences.,” 2010. 
[70] P. Fournier-Viger, J. C.-W. Lin, R. U. Kiran, Y. S. Koh, and R. 
Thomas, “A survey of sequential pattern mining,” Data Sci. Pattern 
Recognit., vol. 1, no. 1, pp. 54–77, 2017. 
[71] P. Fournier-Viger, R. Nkambou, and V. S.-M. Tseng, “RuleGrowth: 
mining sequential rules common to several sequences by pattern-
growth,” in Proceedings of the 2011 ACM symposium on applied 
computing, 2011, pp. 956–961. 
[72] P. Fournier-Viger, T. Gueniche, S. Zida, and V. S. Tseng, “ERMiner: 
sequential rule mining using equivalence classes,” in International 
Symposium on Intelligent Data Analysis, 2014, pp. 108–119. 
[73] Ö. F. Çelebi, E. Zeydan, \.Ismail Ar\i, Ö. Ileri, and S. Ergüt, “Alarm 
sequence rule mining extended with a time confidence parameter,” 
2014. 
[74] S. Kotsiantis and D. Kanellopoulos, “Association rules mining: A recent 
overview,” GESTS Int. Trans. Comput. Sci. Eng., vol. 32, no. 1, pp. 71–
82, 2006. 
[75] X. Wu et al., “Top 10 algorithms in data mining,” Knowl. Inf. Syst., vol. 
14, no. 1, pp. 1–37, 2008. 
[76] H. S. Song, J. kyeong Kim, and S. H. Kim, “Mining the change of 
customer behavior in an internet shopping mall,” Expert Syst. Appl., vol. 
21, no. 3, pp. 157–168, 2001. 
[77] J. R. D. Arcos and A. A. Hernandez, “Analyzing Online Transaction 
Data using Association Rule Mining: Misumi Philippines Market 
139 
Basket Analysis,” in Proceedings of the 2019 7th International 
Conference on Information Technology: IoT and Smart City, 2019, pp. 
45–49. 
[78] M. V. Adheli and M. V. Bag, “Intra and Inter Sector Stock Price 
Forecasting using Association Rule Mining (IISARM),” Int. J. Eng. 
Res. Technol., vol. 3, no. 8, pp. 324–329, 2014. 
[79] V. Rajput and S. Bobde, “Stock market forecasting techniques: 
literature survey,” Int J Comput Sci Mob Comput, vol. 5, no. 6, pp. 500–
506, 2016. 
[80] X. Zhong and D. Enke, “Forecasting daily stock market return using 
dimensionality reduction,” Expert Syst. Appl., vol. 67, pp. 126–139, 
2017. 
[81] D. Gamberger, N. Lavrac, and V. Jovanoski, “High confidence 
association rules for medical diagnosis,” 1999. 
[82] X. Li, Y. Wang, and D. Li, “Medical data stream distribution pattern 
association rule mining algorithm based on density estimation,” IEEE 
Access, vol. 7, pp. 141319–141329, 2019. 
[83] Y.-L. Chen and T. C.-K. Huang, “A new approach for discovering fuzzy 
quantitative sequential patterns in sequence databases,” Fuzzy Sets Syst., 
vol. 157, no. 12, pp. 1641–1661, 2006. 
[84] L. A. Zadeh, “Fuzzy sets,” Inf. Control, vol. 8, no. 3, pp. 338–353, 
1965. 
[85] M. M. Gupta and R. K. Ragade, Fuzzy Set Theory and Its Applications: 
a Survey. Springer Science & Business Media, 1977. 
[86] A. Fu, M. H. Wong, S. C. Sze, W. C. Wong, W. L. Wong, and W. K. 
Yu, “Finding fuzzy sets for the mining of fuzzy association rules for 
numerical attributes,” in Proceedings of the First International 
Symposium on Intelligent Data Engineering and Learning (IDEAL’98), 
1998, pp. 263–268. 
[87] A. Gyenesei, “A fuzzy approach for mining quantitative association 
rules,” Acta Cybern., vol. 15, no. 2, pp. 305–320, 2001. 
[88] J. C.-W. Lin, T. Li, P. Fournier-Viger, and T.-P. Hong, “A fast 
algorithm for mining fuzzy frequent itemsets,” J. Intell. Fuzzy Syst., vol. 
29, no. 6, pp. 2373–2379, 2015. 
[89] T. Đ. Phương and Đ. V. Thành, “Phát hiện luật kết hợp liên kết các giao 
dịch từ cơ sở dữ liệu định lượng thời gian,” in Hội thảo quốc gia lần thứ 
16: Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông, 
2013, pp. 250–258. 
[90] S. Lu and C. Li, “AprioriAdjust: An efficient algorithm for discovering 
the maximum sequential patterns,” 2004. 
140 
[91] Z. Yang and M. Kitsuregawa, “LAPIN-SPAM: An improved algorithm 
for mining sequential pattern,” in 21st International Conference on 
Data Engineering Workshops (ICDEW’05), 2005, p. 1222. 
[92] C. Gao, J. Wang, Y. He, and L. Zhou, “Efficient mining of frequent 
sequence generators,” in Proceedings of the 17th international 
conference on World Wide Web, 2008, pp. 1051–1052. 
[93] S. Yi, T. Zhao, Y. Zhang, S. Ma, and Z. Che, “An effective algorithm 
for mining sequential generators,” Procedia Eng., vol. 15, pp. 3653–
3657, 2011. 
[94] P. Fournier-Viger, A. Gomariz, M. Šebek, and M. Hlosta, “VGEN: fast 
vertical mining of sequential generator patterns,” in International 
Conference on Data Warehousing and Knowledge Discovery, 2014, pp. 
476–488. 
[95] J. Wang, J. Han, and C. Li, “Frequent closed sequence mining without 
candidate maintenance,” IEEE Trans. Knowl. Data Eng., vol. 19, no. 8, 
pp. 1042–1056, 2007. 
[96] A. Gomariz, M. Campos, R. Marin, and B. Goethals, “Clasp: An 
efficient algorithm for mining frequent closed sequences,” in Pacific-
Asia Conference on Knowledge Discovery and Data Mining, 2013, pp. 
50–61. 
[97] P. Fournier-Viger, C.-W. Wu, A. Gomariz, and V. S. Tseng, “VMSP: 
Efficient vertical mining of maximal sequential patterns,” in Canadian 
conference on artificial intelligence, 2014, pp. 83–94. 
[98] C. C. Aggarwal and J. Han, Frequent Pattern Mining. Springer, 2014. 
[99] Y. J. M. Pokou, P. Fournier-Viger, and C. Moghrabi, “Authorship 
Attribution Using Small Sets of Frequent Part-of-Speech Skip-grams.,” 
in FLAIRS Conference, 2016, pp. 86–91. 
[100] D. Schweizer, M. Zehnder, H. Wache, H.-F. Witschel, D. Zanatta, and 
M. Rodriguez, “Using consumer behavior data to reduce energy 
consumption in smart homes: Applying machine learning to save energy 
without lowering comfort of inhabitants,” in 2015 IEEE 14th 
International Conference on Machine Learning and Applications 
(ICMLA), 2015, pp. 1123–1129. 
[101] P. Fournier-Viger, T. Gueniche, and V. S. Tseng, “Using partially-
ordered sequential rules to generate more accurate sequence prediction,” 
in International Conference on Advanced Data Mining and 
Applications, 2012, pp. 431–442. 
[102] G. Yang, J. Huang, and X. Li, “Mining sequential patterns of PM2. 5 
pollution in three zones in China,” J. Clean. Prod., vol. 170, pp. 388–
398, 2018. 
141 
[103] C. Ou-Yang, S.-C. Chou, Y.-C. Juan, and H.-C. Wang, “Mining 
Sequential Patterns of Diseases Contracted and Medications Prescribed 
before the Development of Stevens-Johnson Syndrome in Taiwan,” 
Appl. Sci., vol. 9, no. 12, p. 2434, 2019. 
[104] T. Hong, C.-S. Kuo, and S.-C. Chi, “Mining fuzzy sequential patterns 
from quantitative data,” in IEEE SMC’99 Conference Proceedings. 
1999 IEEE International Conference on Systems, Man, and Cybernetics 
(Cat. No. 99CH37028), 1999, vol. 3, pp. 962–966. 
[105] H. Cao, Y. Zhang, L. Jia, and G. Si, “A Fuzzy Sequential Pattern 
Mining Algorithm Based on Independent Pruning Strategy for 
Parameters Optimization of Ball Mill Pulverizing System,” Inf. Technol. 
Control, vol. 43, no. 3, pp. 303–314, 2014. 
[106] R.-S. Chen, G.-H. Tzeng, C. C. Chen, and Y.-C. Hu, “Discovery of 
fuzzy sequential patterns for fuzzy partitions in quantitative attributes,” 
in Proceedings ACS/IEEE International Conference on Computer 
Systems and Applications, 2001, pp. 144–150. 
[107] T. Guyet, “Enhancing sequential pattern mining with time and 
reasoning,” Université de Rennes 1, 2020. 
[108] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo, 
“CMRules: Mining sequential rules common to several sequences,” 
Knowledge-Based Syst., vol. 25, no. 1, pp. 63–76, 2012. 
[109] R. B. Parihar, R. V Argiddi, and S. S. Apte, “Combined Intra-Inter 
transaction based approach for mining Association among the Sectors in 
Indian Stock Market,” Int. J. Comput. Sci. Inf. Technol., vol. 3, no. 3, 
pp. 3895–3899, 2012. 
[110] Y.-L. Hsieh, D.-L. Yang, J. Wu, and Y.-C. Chen, “Efficient Mining of 
Profit Rules from Closed Inter-Transaction Itemsets.,” J. Inf. Sci. Eng., 
vol. 32, no. 3, pp. 575–595, 2016. 
[111] L. Wang, J. Meng, P. Xu, and K. Peng, “Mining temporal association 
rules with frequent itemsets tree,” Appl. Soft Comput., vol. 62, pp. 817–
829, 2018. 
[112] Tan, P.N., Steinbach, M., and Kumar, Association Analysis: Basic 
Concepts and Algorithms. In Introduction to Data Mining. Addison-
Wesley Longman Publishing Co., Inc. Boston, MA, 2005. 
[113] UCI, “UCI-Machine Learning Repository.” 
https://archive.ics.uci.edu/ml/datasets.php. 
[114] BSC, “Công ty Cổ phần Chứng khoán Ngân hàng Đầu tư và Phát triển 
Việt Nam.”  (accessed Mar. 20, 2006). 
[115] P. Fournier-Viger et al., “The SPMF open-source data mining library 
version 2,” in Lecture Notes in Computer Science (including subseries 
142 
Lecture Notes in Artificial Intelligence and Lecture Notes in 
Bioinformatics), 2016, vol. 9853 LNCS, pp. 36–40, doi: 10.1007/978-3-
319-46131-1_8. 

File đính kèm:

  • pdfluan_an_phat_hien_luat_ket_hop_va_luat_chuoi_mo_trong_co_so.pdf
  • doc2.Mau3_DongGopMoi_TV.doc
  • docx3.Mau3_DongGopMoi_TiengAnh.docx
  • docx4.TrichYeuLuanAn.docx
  • pdfDMCongTrinh-NCS Truong Duc Phuong.pdf
  • pdfDMCongTrinh-NCS Truong Duc Phuong_1.pdf
  • pdfNhững đóng góp mới TA.TV. Trích yếu - Trương Đức Phương_0001.pdf
  • pdfTomTat - NCS Truong Duc Phuong_EN.pdf
  • pdfTomTat - NCS Truong Duc Phuong_VN.pdf