Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian
Phát hiện luật kết hợp và mẫu chuỗi, luật chuỗi nằm trong số những vấn
đề quan trọng trong lĩnh vực khai phá dữ liệu. Đến nay, rất nhiều công trình
nghiên cứu liên quan đến các lĩnh vực này. Các luật kết hợp và mẫu chuỗi,
luật chuỗi được đề xuất là rất đa dạng, chúng có thể là các luật, mẫu chuỗi
giao dịch/định lượng; có trọng số/không trọng số; có yếu tố thời gian/không
có yếu tố thời gian;.v.v.
Vấn đề phát hiện luật kết hợp trong các CSDL giao địch được đề xuất lần
đầu vào năm 1993 [1] và đến nay đã có nhiều thuật toán được xây dựng theo
rất nhiều cách tiếp cận khác nhau để phát hiện các luật này trong các CSDL
giao dịch: APRIORI [2], PARTITION [3], A-CLOSE [4], A-CLOSE+ [5],
CLOSE [6], CLOSET [7], CLOSET+ [8], CHARM [9], MAFIA [10],
GENMAX [11], ECLAT [12], DIC [13], FP-GROWTH [14], CFPMINE [15],
ETARM [16], LRM [17], PARM [18], NEGFIN [19].
Tuy nhiên các CSDL trong thực tế thường có các thuộc tính nhận giá trị
số hoặc giá trị phân loại. Những CSDL như vậy được gọi là CSDL định
lượng. Việc phát hiện các luật kết hợp trong CSDL định lượng thường sử
dụng một trong 2 cách đó là: rời rạc hóa [20]–[23] và mờ hóa các thuộc tính
định lượng [24]–[29]. Bản chất của cách tiếp cận thứ nhất là đưa CSDL định
lượng về CSDL giao dịch bằng cách chuyển các thuộc tính định lượng thành
một số mục (item) tương ứng và sau đó áp dụng một trong các thuật toán phát
hiện các luật kết hợp trong các CSDL giao dịch đã biết.
Tóm tắt nội dung tài liệu: Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- TRƢƠNG ĐỨC PHƢƠNG PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG CƠ SỞ DỮ LIỆU ĐỊNH LƢỢNG CÓ YẾU TỐ THỜI GIAN LUẬN ÁN TIẾN SĨ MÁY TÍNH HÀ NỘI – 2021 VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ...*** TRƢƠNG ĐỨC PHƢƠNG PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG CƠ SỞ DỮ LIỆU ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN LUẬN ÁN TIẾN SĨ MÁY TÍNH Chuyên ngành : Hệ thống thông tin Mã số: 9 48 01 04 Ngƣời hƣớng dẫn khoa học: 1. PGS.TS. Đỗ Văn Thành 2. PGS.TS. Nguyễn Đức Dũng Hà Nội – 2021 i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các kết quả được viết chung với các tác giả khác đều được sự đồng ý của các đồng tác giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực và chưa từng được công bố trong các công trình nào khác. Luận án được hoàn thành trong thời gian tôi làm Nghiên cứu sinh tại Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Tác giả luận án NCS. Trƣơng Đức Phƣơng ii LỜI CẢM ƠN Luận án Tiến sỹ “Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian” được thực hiện dưới sự hướng dẫn khoa học của PGS.TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng. Trước tiên tôi xin được bày tỏ lòng biết ơn sâu sắc tới các thầy hướng dẫn PGS. TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng. Trong quá trình thực hiện luận án, nghiên cứu sinh đã nhận được nhiều định hướng khoa học, những bài học quý báu, sự hướng dẫn nhiệt tình từ các thầy hướng dẫn. Các thầy cũng đã luôn tận tâm động viên, khuyến khích và chỉ dẫn giúp đỡ nghiên cứu sinh hoàn thành được bản luận án này. Tôi xin chân thành cảm ơn các thầy cô Học viện Khoa học và Công nghệ đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình nghiên cứu và thực hiện luận án. Tôi xin cảm ơn Ban Giám hiệu, tập thể cán bộ, giảng viên khoa Khoa học Tự nhiên và Công nghệ, trường Đại học Thủ đô Hà Nội đã tạo điều kiện giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu. Nhân dịp này, tôi cũng xin bày tỏ lòng biết ơn sâu sắc tới gia đình và bạn bè đã cho tôi điểm tựa vững chắc, tạo động lực để tôi hoàn thành luận án này. Tác giả NCS. Trương Đức Phương 1 MỤC LỤC DANH MỤC HÌNH VẼ .................................................................................. 4 DANH MỤC BẢNG BIỂU ............................................................................. 6 DANH MỤC CÁC TỪ VIẾT TẮT ................................................................ 8 MỞ ĐẦU .......................................................................................................... 9 CHƯƠNG 1. TỔNG QUAN VỀ LUẬT KẾT HỢP VÀ MẪU CHUỖI, LUẬT CHUỖI CHUNG ................................................................................. 18 1.1. Luật kết hợp ........................................................................................ 18 1.1.1. Phát hiện luật kết hợp trong các CSDL giao dịch .............................. 18 1.1.2. Phát hiện luật kết hợp trong các CSDL định lượng ........................... 21 1.1.3. Phát hiện luật kết hợp tính đến khoảng cách thời gian xảy ra của các giao dịch trong các CSDL có yếu tố thời gian ................................................ 23 1.2. Mẫu chuỗi ........................................................................................... 25 1.2.1. Phát hiện mẫu chuỗi trong các CSDL chuỗi giao dịch ...................... 25 1.2.2. Phát hiện mẫu chuỗi trong các CSDL chuỗi định lượng .................... 29 1.2.3. Phát hiện mẫu chuỗi tính đến khoảng cách thời gian xảy ra của các giao dịch trong các CSDL chuỗi có yếu tố thời gian ..................................... 31 1.3. Luật chuỗi chung ................................................................................ 34 1.3.1. Khái niệm luật chuỗi chung ................................................................ 34 1.3.2. Phát hiện luật chuỗi chung ................................................................. 34 Kết luận Chương 1 .......................................................................................... 38 CHƯƠNG 2. PHÁT HIỆN LUẬT KẾT HỢP CÓ TÍNH ĐẾN KHOẢNG CÁCH THỜI GIAN TRONG CÁC CSDL ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN ............................................................................................... 42 2.1. Giới thiệu ............................................................................................ 42 2.2. Một số khái niệm cơ bản .................................................................... 44 2.3. Thuật toán phát hiện luật kết hợp mờ với khoảng cách thời gian mờ 52 2.3.1. Bài toán đặt ra ..................................................................................... 52 2.3.2. Ý tưởng thuật toán .............................................................................. 53 2.3.3. Thuật toán FTQ .................................................................................. 54 2.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 58 2.3.5. Độ phức tạp thuật toán........................................................................ 60 2 2.3.6. Trường hợp suy biến của luật kết hợp mờ với khoảng cách thời gian mờ ............................................................................................................ 62 2.4. Thử nghiệm thuật toán ........................................................................ 63 2.4.1. Dữ liệu thử nghiệm ............................................................................. 63 2.4.2. Kết quả thử nghiệm ............................................................................ 66 Kết luận Chương 2 .......................................................................................... 72 CHƯƠNG 3. PHÁT HIỆN MẪU CHUỖI CÓ TÍNH ĐẾN KHOẢNG CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN .............................................................................................. 74 3.1. Giới thiệu ............................................................................................ 74 3.2. Một số khái niệm cơ bản .................................................................... 76 3.3. Thuật toán phát hiện mẫu chuỗi mờ với khoảng cách thời gian mờ .. 84 3.3.1. Bài toán đặt ra ..................................................................................... 84 3.3.2. Ý tưởng thuật toán .............................................................................. 84 3.3.3. Thuật toán FSPFTIM .......................................................................... 85 3.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 88 3.3.5. Độ phức tạp thuật toán........................................................................ 90 3.3.6. Trường hợp suy biến của mẫu chuỗi mờ với khoảng cách thời gian mờ ............................................................................................................ 91 3.3.7. Minh họa thuật toán ............................................................................ 92 3.4. Thử nghiệm thuật toán ........................................................................ 93 3.4.1. Dữ liệu thử nghiệm ............................................................................. 93 3.4.2. Kết quả thử nghiệm ............................................................................ 95 Kết luận Chương 3 ........................................................................................ 100 CHƯƠNG 4. PHÁT HIỆN LUẬT CHUỖI CHUNG CÓ TÍNH ĐẾN KHOẢNG CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN. ............................................................ 101 4.1. Giới thiệu .......................................................................................... 101 4.2. Một số khái niệm cơ bản .................................................................. 103 4.3. Thuật toán phát hiện luật chuỗi chung mờ với khoảng cách thời gian mờ .......................................................................................................... 108 4.3.1. Bài toán đặt ra ................................................................................... 108 4.3.2. Thuật toán IFERMiner ..................................................................... 108 4.3.3. Tính đúng đắn và đầy đủ .................................................................. 112 3 4.3.4. Độ phức tạp của thuật toán IFERMiner ........................................... 114 4.3.5. Trường hợp suy biến của luật chuỗi chung mờ với khoảng cách thời gian mờ .......................................................................................................... 120 4.4. Thử nghiệm thuật toán ...................................................................... 121 4.4.1. Dữ liệu thử nghiệm ........................................................................... 121 4.4.2. Kết quả thử nghiệm .......................................................................... 123 Kết luận Chương 4 ........................................................................................ 129 KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 130 DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 132 TÀI LIỆU THAM KHẢO ............................................................................. 133 4 DANH MỤC HÌNH VẼ Hình 1.1. Các vấn đề liên quan đến nghiên cứu của luận án .......................... 41 Hình 2.1. Các hàm thành viên của các tập mờ ứng với tỉ lệ tăng/giảm của các mã chứng khoán .............................................................................................. 65 Hình 2.2. Các hàm thành viên của các tập mờ của Tỉ lệ thay đổi chỉ số VN30 ......................................................................................................................... 65 Hình 2.3. Các hàm thành viên của các tập mờ thời gian ................................ 65 Hình 2.4. Mối quan hệ giữa số lượng luật tìm được từ thuật toán FTQ và độ tin cậy cực tiểu min_conf trong các trường hợp khác nhau về độ hỗ trợ cực tiểu min_sup .................................................................................................... 66 Hình 2.5. Mối quan hệ giữa số lượng luật tìm được và min_sup với min_conf khác nhau. ........................................................................................................ 67 Hình 2.6. Chi phí thời gian thực hiện khi min_conf=70% ............................. 67 Hình 2.7. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FTQ ...... 68 Hình 2.8. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FTQ ................................................................................................................. 68 Hình 3.1. Các hàm thành viên của các tập mờ thuộc LT ................................ 81 Hình 3.2. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup (b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực hiện trên tập dữ liệu S100I1000T3D341K. ..................................................... 95 Hình 3.3. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup (b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực hiện trên tập dữ liệu Online Retail_France ..................................................... 96 5 Hình 3.4. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup (b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối với tập dữ liệu S100I1000T3D341K ............................................................... 97 Hình 3.5. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup (b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối với tập dữ liệu Online Retail_France .............................................................. 97 Hình 3.6. So sánh số mẫu chuỗi của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FSPFTIM ......................................................................................................... 98 Hình 3.7. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FSPFTIM ......................................................................................................... 98 Hình 4.1. Mối quan hệ giữa số lượng các luật FCSI valid với min_sup và min_conf ........................................................................................................ 124 Hình 4.2. Mối quan hệ giữa thời gian thực hiện thuật toán với min_sup và min_conf ........................................................................................................ 125 Hình 4.3. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán IFERMiner ....................................................................................................................... 126 Hình 4.4. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán IFERMiner .................................................................................................... 127 6 DANH MỤC BẢNG BIỂU Bảng 1.1. Ví dụ về CSDL giao dịch ............................................................... 18 Bảng 1.2. Ví dụ về CSDL định lượng ............................................................. 22 Bảng 1.3. Ví dụ về CSDL giao dịch mua hàng có yếu tố thời gian ................ 24 Bảng 1.4. Một số nghiên cứu về phát hiện luật kết hợp có tính đến khoảng cách thời gian .................................................................................................. 24 Bảng 1.5. Ví dụ về CSDL chuỗi giao dịch ..................................................... 25 Bảng 1.6. Ví dụ CSDL chuỗi định lượng ........................................................ 29 Bảng 1.7. Ví dụ CSDL chuỗi giao dịch có yếu tố thời gian ........................... 31 Bảng 1.8. Một số ... g and Other Applications of Applied Intelligent Systems, 2020, pp. 820–831. [39] R. Agrawal, R. Srikant, and others, “Mining sequential patterns,” in icde, 1995, vol. 95, pp. 3–14. 136 [40] R. Srikant and R. Agrawal, “Mining sequential patterns: Generalizations and performance improvements,” in International Conference on Extending Database Technology, 1996, pp. 1–17. [41] M. N. Garofalakis, R. Rastogi, and K. Shim, “SPIRIT: Sequential pattern mining with regular expression constraints,” in VLDB, 1999, vol. 99, pp. 7–10. [42] M. J. Zaki, “SPADE: An efficient algorithm for mining frequent sequences,” Mach. Learn., vol. 42, no. 1–2, pp. 31–60, 2001. [43] J. Ayres, J. Flannick, J. Gehrke, and T. Yiu, “Sequential pattern mining using a bitmap representation,” in Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, 2002, pp. 429–435. [44] E. Salvemini, F. Fumarola, D. Malerba, and J. Han, “Fast sequence mining based on sparse id-lists,” in International Symposium on Methodologies for Intelligent Systems, 2011, pp. 316–325. [45] P. Fournier-Viger, A. Gomariz, M. Campos, and R. Thomas, “Fast vertical mining of sequential patterns using co-occurrence information,” in Pacific-Asia Conference on Knowledge Discovery and Data Mining, 2014, pp. 40–52. [46] P. Fournier-Viger, C.-W. Wu, and V. S. Tseng, “Mining maximal sequential patterns without candidate maintenance,” in International Conference on Advanced Data Mining and Applications, 2013, pp. 169– 180. [47] D. Lo, S.-C. Khoo, and J. Li, “Mining and ranking generators of sequential patterns,” in Proceedings of the 2008 SIAM International Conference on Data Mining, 2008, pp. 553–564. [48] J. Han, J. Pei, B. Mortazavi-Asl, Q. Chen, U. Dayal, and M.-C. Hsu, “FreeSpan: frequent pattern-projected sequential pattern mining,” in Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, 2000, pp. 355–359. [49] J. Pei et al., “Mining sequential patterns by pattern-growth: The prefixspan approach,” IEEE Trans. Knowl. Data Eng., vol. 16, no. 11, pp. 1424–1440, 2004. [50] X. Yan, J. Han, and R. Afshar, “CloSpan: Mining: Closed sequential patterns in large datasets,” in Proceedings of the 2003 SIAM international conference on data mining, 2003, pp. 166–177. [51] T. Van, B. Vo, and B. Le, “Mining sequential patterns with itemset constraints,” Knowl. Inf. Syst., vol. 57, no. 2, pp. 311–330, 2018. [52] R. Bhatta, C. I. Ezeife, and M. N. Butt, “Mining Sequential Patterns of Historical Purchases for E-commerce Recommendation,” in 137 International Conference on Big Data Analytics and Knowledge Discovery, 2019, pp. 57–72. [53] C. Fiot, A. Laurent, and M. Teisseire, “From crispness to fuzziness: Three algorithms for soft sequential pattern mining,” IEEE Trans. Fuzzy Syst., vol. 15, no. 6, pp. 1263–1277, 2007. [54] Y.-C. Hu, R.-S. Chen, G.-H. Tzeng, and J.-H. Shieh, “A fuzzy data mining algorithm for finding sequential patterns,” Int. J. Uncertainty, Fuzziness Knowledge-Based Syst., vol. 11, no. 02, pp. 173–193, 2003. [55] Y.-C. Hu, G.-H. Tzeng, and C.-M. Chen, “Deriving two-stage learning sequences from knowledge in fuzzy sequential pattern mining,” Inf. Sci. (Ny)., vol. 159, no. 1–2, pp. 69–86, 2004. [56] T. C.-K. Huang, “Discovery of fuzzy quantitative sequential patterns with multiple minimum supports and adjustable membership functions,” Inf. Sci. (Ny)., vol. 222, pp. 126–146, 2013. [57] R. J. Kuo, C. M. Chao, and C. Y. Liu, “Integration of K-means algorithm and AprioriSome algorithm for fuzzy sequential pattern mining,” Appl. Soft Comput., vol. 9, no. 1, pp. 85–93, 2009. [58] R. B. V Subramanyam and A. Goswami, “A fuzzy data mining algorithm for incremental mining of quantitative sequential patterns,” Int. J. Uncertainty, Fuzziness Knowledge-Based Syst., vol. 13, no. 06, pp. 633–652, 2005. [59] T. Huang, R. Huang, B. Liu, and Y. Yan, “Extracting Various Types of Informative Web Content via Fuzzy Sequential Pattern Mining,” in Asia-Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint Conference on Web and Big Data, 2017, pp. 230–238. [60] M. Yoshida, T. Iizuka, H. Shiohara, and M. Ishiguro, “Mining sequential patterns including time intervals,” in Data Mining and Knowledge Discovery: Theory, Tools, and Technology II, 2000, vol. 4057, pp. 213–220. [61] Y.-L. Chen, M.-C. Chiang, and M.-T. Ko, “Discovering time-interval sequential patterns in sequence databases,” Expert Syst. Appl., vol. 25, no. 3, pp. 343–354, 2003. [62] F. Giannotti, M. Nanni, D. Pedreschi, and F. Pinelli, “Mining sequences with temporal annotations,” in Proceedings of the 2006 ACM symposium on Applied computing, 2006, pp. 593–597. [63] Y.-L. Chen and T.-K. Huang, “Discovering fuzzy time-interval sequential patterns in sequence databases,” IEEE Trans. Syst. Man, Cybern. Part B, vol. 35, no. 5, pp. 959–972, 2005. [64] I. Mukhlash, D. Yuanda, and M. Iqbal, “Mining Fuzzy Time Interval Periodic Patterns in Smart Home Data,” Int. J. Electr. Comput. Eng., 138 vol. 8, no. 5, p. 3374, 2018. [65] C.-I. Chang, H.-E. Chueh, and N. P. Lin, “Sequential patterns mining with fuzzy time-intervals,” in 2009 Sixth International Conference on Fuzzy Systems and Knowledge Discovery, 2009, vol. 3, pp. 165–169. [66] C.-I. Chang, H.-E. Chueh, and Y.-C. Luo, “An integrated sequential patterns mining with fuzzy time-intervals,” in 2012 International Conference on Systems and Informatics (ICSAI2012), 2012, pp. 2294– 2298. [67] T. H. Duong, D. Janos, V. D. Thi, N. T. Thang, and others, “An Algorithm for Mining High Utility Sequential Patterns with Time Interval,” Cybern. Inf. Technol., vol. 19, no. 4, pp. 3–16, 2019. [68] T. H. Duong, N. T. Thang, V. D. Thi, and others, “HIGH UTILITY ITEM INTERVAL SEQUENTIAL PATTERN MINING ALGORITHM,” J. Comput. Sci. Cybern., vol. 36, no. 1, pp. 1–15, 2020. [69] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo, “CMRULES: An Efficient Algorithm for Mining Sequential Rules Common to Several Sequences.,” 2010. [70] P. Fournier-Viger, J. C.-W. Lin, R. U. Kiran, Y. S. Koh, and R. Thomas, “A survey of sequential pattern mining,” Data Sci. Pattern Recognit., vol. 1, no. 1, pp. 54–77, 2017. [71] P. Fournier-Viger, R. Nkambou, and V. S.-M. Tseng, “RuleGrowth: mining sequential rules common to several sequences by pattern- growth,” in Proceedings of the 2011 ACM symposium on applied computing, 2011, pp. 956–961. [72] P. Fournier-Viger, T. Gueniche, S. Zida, and V. S. Tseng, “ERMiner: sequential rule mining using equivalence classes,” in International Symposium on Intelligent Data Analysis, 2014, pp. 108–119. [73] Ö. F. Çelebi, E. Zeydan, \.Ismail Ar\i, Ö. Ileri, and S. Ergüt, “Alarm sequence rule mining extended with a time confidence parameter,” 2014. [74] S. Kotsiantis and D. Kanellopoulos, “Association rules mining: A recent overview,” GESTS Int. Trans. Comput. Sci. Eng., vol. 32, no. 1, pp. 71– 82, 2006. [75] X. Wu et al., “Top 10 algorithms in data mining,” Knowl. Inf. Syst., vol. 14, no. 1, pp. 1–37, 2008. [76] H. S. Song, J. kyeong Kim, and S. H. Kim, “Mining the change of customer behavior in an internet shopping mall,” Expert Syst. Appl., vol. 21, no. 3, pp. 157–168, 2001. [77] J. R. D. Arcos and A. A. Hernandez, “Analyzing Online Transaction Data using Association Rule Mining: Misumi Philippines Market 139 Basket Analysis,” in Proceedings of the 2019 7th International Conference on Information Technology: IoT and Smart City, 2019, pp. 45–49. [78] M. V. Adheli and M. V. Bag, “Intra and Inter Sector Stock Price Forecasting using Association Rule Mining (IISARM),” Int. J. Eng. Res. Technol., vol. 3, no. 8, pp. 324–329, 2014. [79] V. Rajput and S. Bobde, “Stock market forecasting techniques: literature survey,” Int J Comput Sci Mob Comput, vol. 5, no. 6, pp. 500– 506, 2016. [80] X. Zhong and D. Enke, “Forecasting daily stock market return using dimensionality reduction,” Expert Syst. Appl., vol. 67, pp. 126–139, 2017. [81] D. Gamberger, N. Lavrac, and V. Jovanoski, “High confidence association rules for medical diagnosis,” 1999. [82] X. Li, Y. Wang, and D. Li, “Medical data stream distribution pattern association rule mining algorithm based on density estimation,” IEEE Access, vol. 7, pp. 141319–141329, 2019. [83] Y.-L. Chen and T. C.-K. Huang, “A new approach for discovering fuzzy quantitative sequential patterns in sequence databases,” Fuzzy Sets Syst., vol. 157, no. 12, pp. 1641–1661, 2006. [84] L. A. Zadeh, “Fuzzy sets,” Inf. Control, vol. 8, no. 3, pp. 338–353, 1965. [85] M. M. Gupta and R. K. Ragade, Fuzzy Set Theory and Its Applications: a Survey. Springer Science & Business Media, 1977. [86] A. Fu, M. H. Wong, S. C. Sze, W. C. Wong, W. L. Wong, and W. K. Yu, “Finding fuzzy sets for the mining of fuzzy association rules for numerical attributes,” in Proceedings of the First International Symposium on Intelligent Data Engineering and Learning (IDEAL’98), 1998, pp. 263–268. [87] A. Gyenesei, “A fuzzy approach for mining quantitative association rules,” Acta Cybern., vol. 15, no. 2, pp. 305–320, 2001. [88] J. C.-W. Lin, T. Li, P. Fournier-Viger, and T.-P. Hong, “A fast algorithm for mining fuzzy frequent itemsets,” J. Intell. Fuzzy Syst., vol. 29, no. 6, pp. 2373–2379, 2015. [89] T. Đ. Phương and Đ. V. Thành, “Phát hiện luật kết hợp liên kết các giao dịch từ cơ sở dữ liệu định lượng thời gian,” in Hội thảo quốc gia lần thứ 16: Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông, 2013, pp. 250–258. [90] S. Lu and C. Li, “AprioriAdjust: An efficient algorithm for discovering the maximum sequential patterns,” 2004. 140 [91] Z. Yang and M. Kitsuregawa, “LAPIN-SPAM: An improved algorithm for mining sequential pattern,” in 21st International Conference on Data Engineering Workshops (ICDEW’05), 2005, p. 1222. [92] C. Gao, J. Wang, Y. He, and L. Zhou, “Efficient mining of frequent sequence generators,” in Proceedings of the 17th international conference on World Wide Web, 2008, pp. 1051–1052. [93] S. Yi, T. Zhao, Y. Zhang, S. Ma, and Z. Che, “An effective algorithm for mining sequential generators,” Procedia Eng., vol. 15, pp. 3653– 3657, 2011. [94] P. Fournier-Viger, A. Gomariz, M. Šebek, and M. Hlosta, “VGEN: fast vertical mining of sequential generator patterns,” in International Conference on Data Warehousing and Knowledge Discovery, 2014, pp. 476–488. [95] J. Wang, J. Han, and C. Li, “Frequent closed sequence mining without candidate maintenance,” IEEE Trans. Knowl. Data Eng., vol. 19, no. 8, pp. 1042–1056, 2007. [96] A. Gomariz, M. Campos, R. Marin, and B. Goethals, “Clasp: An efficient algorithm for mining frequent closed sequences,” in Pacific- Asia Conference on Knowledge Discovery and Data Mining, 2013, pp. 50–61. [97] P. Fournier-Viger, C.-W. Wu, A. Gomariz, and V. S. Tseng, “VMSP: Efficient vertical mining of maximal sequential patterns,” in Canadian conference on artificial intelligence, 2014, pp. 83–94. [98] C. C. Aggarwal and J. Han, Frequent Pattern Mining. Springer, 2014. [99] Y. J. M. Pokou, P. Fournier-Viger, and C. Moghrabi, “Authorship Attribution Using Small Sets of Frequent Part-of-Speech Skip-grams.,” in FLAIRS Conference, 2016, pp. 86–91. [100] D. Schweizer, M. Zehnder, H. Wache, H.-F. Witschel, D. Zanatta, and M. Rodriguez, “Using consumer behavior data to reduce energy consumption in smart homes: Applying machine learning to save energy without lowering comfort of inhabitants,” in 2015 IEEE 14th International Conference on Machine Learning and Applications (ICMLA), 2015, pp. 1123–1129. [101] P. Fournier-Viger, T. Gueniche, and V. S. Tseng, “Using partially- ordered sequential rules to generate more accurate sequence prediction,” in International Conference on Advanced Data Mining and Applications, 2012, pp. 431–442. [102] G. Yang, J. Huang, and X. Li, “Mining sequential patterns of PM2. 5 pollution in three zones in China,” J. Clean. Prod., vol. 170, pp. 388– 398, 2018. 141 [103] C. Ou-Yang, S.-C. Chou, Y.-C. Juan, and H.-C. Wang, “Mining Sequential Patterns of Diseases Contracted and Medications Prescribed before the Development of Stevens-Johnson Syndrome in Taiwan,” Appl. Sci., vol. 9, no. 12, p. 2434, 2019. [104] T. Hong, C.-S. Kuo, and S.-C. Chi, “Mining fuzzy sequential patterns from quantitative data,” in IEEE SMC’99 Conference Proceedings. 1999 IEEE International Conference on Systems, Man, and Cybernetics (Cat. No. 99CH37028), 1999, vol. 3, pp. 962–966. [105] H. Cao, Y. Zhang, L. Jia, and G. Si, “A Fuzzy Sequential Pattern Mining Algorithm Based on Independent Pruning Strategy for Parameters Optimization of Ball Mill Pulverizing System,” Inf. Technol. Control, vol. 43, no. 3, pp. 303–314, 2014. [106] R.-S. Chen, G.-H. Tzeng, C. C. Chen, and Y.-C. Hu, “Discovery of fuzzy sequential patterns for fuzzy partitions in quantitative attributes,” in Proceedings ACS/IEEE International Conference on Computer Systems and Applications, 2001, pp. 144–150. [107] T. Guyet, “Enhancing sequential pattern mining with time and reasoning,” Université de Rennes 1, 2020. [108] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo, “CMRules: Mining sequential rules common to several sequences,” Knowledge-Based Syst., vol. 25, no. 1, pp. 63–76, 2012. [109] R. B. Parihar, R. V Argiddi, and S. S. Apte, “Combined Intra-Inter transaction based approach for mining Association among the Sectors in Indian Stock Market,” Int. J. Comput. Sci. Inf. Technol., vol. 3, no. 3, pp. 3895–3899, 2012. [110] Y.-L. Hsieh, D.-L. Yang, J. Wu, and Y.-C. Chen, “Efficient Mining of Profit Rules from Closed Inter-Transaction Itemsets.,” J. Inf. Sci. Eng., vol. 32, no. 3, pp. 575–595, 2016. [111] L. Wang, J. Meng, P. Xu, and K. Peng, “Mining temporal association rules with frequent itemsets tree,” Appl. Soft Comput., vol. 62, pp. 817– 829, 2018. [112] Tan, P.N., Steinbach, M., and Kumar, Association Analysis: Basic Concepts and Algorithms. In Introduction to Data Mining. Addison- Wesley Longman Publishing Co., Inc. Boston, MA, 2005. [113] UCI, “UCI-Machine Learning Repository.” https://archive.ics.uci.edu/ml/datasets.php. [114] BSC, “Công ty Cổ phần Chứng khoán Ngân hàng Đầu tư và Phát triển Việt Nam.” (accessed Mar. 20, 2006). [115] P. Fournier-Viger et al., “The SPMF open-source data mining library version 2,” in Lecture Notes in Computer Science (including subseries 142 Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2016, vol. 9853 LNCS, pp. 36–40, doi: 10.1007/978-3- 319-46131-1_8.
File đính kèm:
- luan_an_phat_hien_luat_ket_hop_va_luat_chuoi_mo_trong_co_so.pdf
- 2.Mau3_DongGopMoi_TV.doc
- 3.Mau3_DongGopMoi_TiengAnh.docx
- 4.TrichYeuLuanAn.docx
- DMCongTrinh-NCS Truong Duc Phuong.pdf
- DMCongTrinh-NCS Truong Duc Phuong_1.pdf
- Những đóng góp mới TA.TV. Trích yếu - Trương Đức Phương_0001.pdf
- TomTat - NCS Truong Duc Phuong_EN.pdf
- TomTat - NCS Truong Duc Phuong_VN.pdf