Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian

Phát hiện luật kết hợp và mẫu chuỗi, luật chuỗi nằm trong số những vấn

đề quan trọng trong lĩnh vực khai phá dữ liệu. Đến nay, rất nhiều công trình

nghiên cứu liên quan đến các lĩnh vực này. Các luật kết hợp và mẫu chuỗi,

luật chuỗi được đề xuất là rất đa dạng, chúng có thể là các luật, mẫu chuỗi

giao dịch/định lượng; có trọng số/không trọng số; có yếu tố thời gian/không

có yếu tố thời gian;.v.v.

Vấn đề phát hiện luật kết hợp trong các CSDL giao địch được đề xuất lần

đầu vào năm 1993 [1] và đến nay đã có nhiều thuật toán được xây dựng theo

rất nhiều cách tiếp cận khác nhau để phát hiện các luật này trong các CSDL

giao dịch: APRIORI [2], PARTITION [3], A-CLOSE [4], A-CLOSE+ [5],

CLOSE [6], CLOSET [7], CLOSET+ [8], CHARM [9], MAFIA [10],

GENMAX [11], ECLAT [12], DIC [13], FP-GROWTH [14], CFPMINE [15],

ETARM [16], LRM [17], PARM [18], NEGFIN [19].

Tuy nhiên các CSDL trong thực tế thường có các thuộc tính nhận giá trị

số hoặc giá trị phân loại. Những CSDL như vậy được gọi là CSDL định

lượng. Việc phát hiện các luật kết hợp trong CSDL định lượng thường sử

dụng một trong 2 cách đó là: rời rạc hóa [20]–[23] và mờ hóa các thuộc tính

định lượng [24]–[29]. Bản chất của cách tiếp cận thứ nhất là đưa CSDL định

lượng về CSDL giao dịch bằng cách chuyển các thuộc tính định lượng thành

một số mục (item) tương ứng và sau đó áp dụng một trong các thuật toán phát

hiện các luật kết hợp trong các CSDL giao dịch đã biết.

146 trang dienloan 25940

Download

Bạn đang xem 20 trang mẫu của tài liệu "Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở dữ liệu định lượng có yếu tố thời gian

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
TRƢƠNG ĐỨC PHƢƠNG
PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG
CƠ SỞ DỮ LIỆU ĐỊNH LƢỢNG CÓ YẾU TỐ THỜI GIAN
LUẬN ÁN TIẾN SĨ MÁY TÍNH
HÀ NỘI – 2021
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
...***
TRƢƠNG ĐỨC PHƢƠNG
PHÁT HIỆN LUẬT KẾT HỢP VÀ LUẬT CHUỖI MỜ TRONG
CƠ SỞ DỮ LIỆU ĐỊNH LƯỢNG CÓ YẾU TỐ THỜI GIAN
LUẬN ÁN TIẾN SĨ MÁY TÍNH
Chuyên ngành : Hệ thống thông tin
Mã số: 9 48 01 04
Ngƣời hƣớng dẫn khoa học:
1. PGS.TS. Đỗ Văn Thành
2. PGS.TS. Nguyễn Đức Dũng
Hà Nội – 2021
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các kết
quả được viết chung với các tác giả khác đều được sự đồng ý của các đồng tác
giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực và
chưa từng được công bố trong các công trình nào khác.
Luận án được hoàn thành trong thời gian tôi làm Nghiên cứu sinh tại
Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ
Việt Nam.
Tác giả luận án
NCS. Trƣơng Đức Phƣơng
ii
LỜI CẢM ƠN
Luận án Tiến sỹ “Phát hiện luật kết hợp và luật chuỗi mờ trong cơ sở
dữ liệu định lượng có yếu tố thời gian” được thực hiện dưới sự hướng dẫn
khoa học của PGS.TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng.
Trước tiên tôi xin được bày tỏ lòng biết ơn sâu sắc tới các thầy hướng
dẫn PGS. TS. Đỗ Văn Thành và PGS.TS. Nguyễn Đức Dũng. Trong quá trình
thực hiện luận án, nghiên cứu sinh đã nhận được nhiều định hướng khoa học,
những bài học quý báu, sự hướng dẫn nhiệt tình từ các thầy hướng dẫn. Các
thầy cũng đã luôn tận tâm động viên, khuyến khích và chỉ dẫn giúp đỡ nghiên
cứu sinh hoàn thành được bản luận án này.
Tôi xin chân thành cảm ơn các thầy cô Học viện Khoa học và Công
nghệ đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình nghiên cứu và
thực hiện luận án.
Tôi xin cảm ơn Ban Giám hiệu, tập thể cán bộ, giảng viên khoa Khoa
học Tự nhiên và Công nghệ, trường Đại học Thủ đô Hà Nội đã tạo điều kiện
giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu.
Nhân dịp này, tôi cũng xin bày tỏ lòng biết ơn sâu sắc tới gia đình và
bạn bè đã cho tôi điểm tựa vững chắc, tạo động lực để tôi hoàn thành luận án
này.
Tác giả
NCS. Trương Đức Phương
1
MỤC LỤC
DANH MỤC HÌNH VẼ .................................................................................. 4
DANH MỤC BẢNG BIỂU ............................................................................. 6
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................ 8
MỞ ĐẦU .......................................................................................................... 9
CHƯƠNG 1. TỔNG QUAN VỀ LUẬT KẾT HỢP VÀ MẪU CHUỖI,
LUẬT CHUỖI CHUNG ................................................................................. 18
1.1. Luật kết hợp ........................................................................................ 18
1.1.1. Phát hiện luật kết hợp trong các CSDL giao dịch .............................. 18
1.1.2. Phát hiện luật kết hợp trong các CSDL định lượng ........................... 21
1.1.3. Phát hiện luật kết hợp tính đến khoảng cách thời gian xảy ra của các
giao dịch trong các CSDL có yếu tố thời gian ................................................ 23
1.2. Mẫu chuỗi ........................................................................................... 25
1.2.1. Phát hiện mẫu chuỗi trong các CSDL chuỗi giao dịch ...................... 25
1.2.2. Phát hiện mẫu chuỗi trong các CSDL chuỗi định lượng .................... 29
1.2.3. Phát hiện mẫu chuỗi tính đến khoảng cách thời gian xảy ra của các
giao dịch trong các CSDL chuỗi có yếu tố thời gian ..................................... 31
1.3. Luật chuỗi chung ................................................................................ 34
1.3.1. Khái niệm luật chuỗi chung ................................................................ 34
1.3.2. Phát hiện luật chuỗi chung ................................................................. 34
Kết luận Chương 1 .......................................................................................... 38
CHƯƠNG 2. PHÁT HIỆN LUẬT KẾT HỢP CÓ TÍNH ĐẾN KHOẢNG
CÁCH THỜI GIAN TRONG CÁC CSDL ĐỊNH LƯỢNG CÓ YẾU TỐ
THỜI GIAN ............................................................................................... 42
2.1. Giới thiệu ............................................................................................ 42
2.2. Một số khái niệm cơ bản .................................................................... 44
2.3. Thuật toán phát hiện luật kết hợp mờ với khoảng cách thời gian mờ 52
2.3.1. Bài toán đặt ra ..................................................................................... 52
2.3.2. Ý tưởng thuật toán .............................................................................. 53
2.3.3. Thuật toán FTQ .................................................................................. 54
2.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 58
2.3.5. Độ phức tạp thuật toán........................................................................ 60
2
2.3.6. Trường hợp suy biến của luật kết hợp mờ với khoảng cách thời gian
mờ ............................................................................................................ 62
2.4. Thử nghiệm thuật toán ........................................................................ 63
2.4.1. Dữ liệu thử nghiệm ............................................................................. 63
2.4.2. Kết quả thử nghiệm ............................................................................ 66
Kết luận Chương 2 .......................................................................................... 72
CHƯƠNG 3. PHÁT HIỆN MẪU CHUỖI CÓ TÍNH ĐẾN KHOẢNG
CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH LƯỢNG CÓ YẾU
TỐ THỜI GIAN .............................................................................................. 74
3.1. Giới thiệu ............................................................................................ 74
3.2. Một số khái niệm cơ bản .................................................................... 76
3.3. Thuật toán phát hiện mẫu chuỗi mờ với khoảng cách thời gian mờ .. 84
3.3.1. Bài toán đặt ra ..................................................................................... 84
3.3.2. Ý tưởng thuật toán .............................................................................. 84
3.3.3. Thuật toán FSPFTIM .......................................................................... 85
3.3.4. Tính đúng đắn và tính đầy đủ của thuật toán ..................................... 88
3.3.5. Độ phức tạp thuật toán........................................................................ 90
3.3.6. Trường hợp suy biến của mẫu chuỗi mờ với khoảng cách thời gian
mờ ............................................................................................................ 91
3.3.7. Minh họa thuật toán ............................................................................ 92
3.4. Thử nghiệm thuật toán ........................................................................ 93
3.4.1. Dữ liệu thử nghiệm ............................................................................. 93
3.4.2. Kết quả thử nghiệm ............................................................................ 95
Kết luận Chương 3 ........................................................................................ 100
CHƯƠNG 4. PHÁT HIỆN LUẬT CHUỖI CHUNG CÓ TÍNH ĐẾN
KHOẢNG CÁCH THỜI GIAN TRONG CÁC CSDL CHUỖI ĐỊNH
LƯỢNG CÓ YẾU TỐ THỜI GIAN. ............................................................ 101
4.1. Giới thiệu .......................................................................................... 101
4.2. Một số khái niệm cơ bản .................................................................. 103
4.3. Thuật toán phát hiện luật chuỗi chung mờ với khoảng cách thời gian
mờ .......................................................................................................... 108
4.3.1. Bài toán đặt ra ................................................................................... 108
4.3.2. Thuật toán IFERMiner ..................................................................... 108
4.3.3. Tính đúng đắn và đầy đủ .................................................................. 112
3
4.3.4. Độ phức tạp của thuật toán IFERMiner ........................................... 114
4.3.5. Trường hợp suy biến của luật chuỗi chung mờ với khoảng cách thời
gian mờ .......................................................................................................... 120
4.4. Thử nghiệm thuật toán ...................................................................... 121
4.4.1. Dữ liệu thử nghiệm ........................................................................... 121
4.4.2. Kết quả thử nghiệm .......................................................................... 123
Kết luận Chương 4 ........................................................................................ 129
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 130
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 132
TÀI LIỆU THAM KHẢO ............................................................................. 133
4
DANH MỤC HÌNH VẼ
Hình 1.1. Các vấn đề liên quan đến nghiên cứu của luận án .......................... 41
Hình 2.1. Các hàm thành viên của các tập mờ ứng với tỉ lệ tăng/giảm của các
mã chứng khoán .............................................................................................. 65
Hình 2.2. Các hàm thành viên của các tập mờ của Tỉ lệ thay đổi chỉ số VN30
......................................................................................................................... 65
Hình 2.3. Các hàm thành viên của các tập mờ thời gian ................................ 65
Hình 2.4. Mối quan hệ giữa số lượng luật tìm được từ thuật toán FTQ và độ
tin cậy cực tiểu min_conf trong các trường hợp khác nhau về độ hỗ trợ cực
tiểu min_sup .................................................................................................... 66
Hình 2.5. Mối quan hệ giữa số lượng luật tìm được và min_sup với min_conf
khác nhau. ........................................................................................................ 67
Hình 2.6. Chi phí thời gian thực hiện khi min_conf=70% ............................. 67
Hình 2.7. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia
khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán FTQ ...... 68
Hình 2.8. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán
FTQ ................................................................................................................. 68
Hình 3.1. Các hàm thành viên của các tập mờ thuộc LT ................................ 81
Hình 3.2. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup
(b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực
hiện trên tập dữ liệu S100I1000T3D341K. ..................................................... 95
Hình 3.3. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup
(b) trong trường hợp số phân hoạch thuộc tính định lượng khác nhau khi thực
hiện trên tập dữ liệu Online Retail_France ..................................................... 96
5
Hình 3.4. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup
(b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối
với tập dữ liệu S100I1000T3D341K ............................................................... 97
Hình 3.5. Mối quan hệ giữa số lượng mẫu chuỗi mờ với khoảng cách thời
gian mờ với min_sup (a) và giữa thời gian chạy của thuật toán với min_sup
(b) trong trường hợp số phân hoạch khoảng cách thời gian (Kt) khác nhau đối
với tập dữ liệu Online Retail_France .............................................................. 97
Hình 3.6. So sánh số mẫu chuỗi của phương pháp mờ hóa (A) và phương
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán
FSPFTIM ......................................................................................................... 98
Hình 3.7. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán
FSPFTIM ......................................................................................................... 98
Hình 4.1. Mối quan hệ giữa số lượng các luật FCSI valid với min_sup và
min_conf ........................................................................................................ 124
Hình 4.2. Mối quan hệ giữa thời gian thực hiện thuật toán với min_sup và
min_conf ........................................................................................................ 125
Hình 4.3. So sánh số luật của phương pháp mờ hóa (A) và phương pháp chia
khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán IFERMiner
....................................................................................................................... 126
Hình 4.4. So sánh thời gian chạy của phương pháp mờ hóa (A) và phương
pháp chia khoảng (B) đối với khoảng cách thời gian khi thực hiện thuật toán
IFERMiner .................................................................................................... 127
6
DANH MỤC BẢNG BIỂU
Bảng 1.1. Ví dụ về CSDL giao dịch ............................................................... 18
Bảng 1.2. Ví dụ về CSDL định lượng ............................................................. 22
Bảng 1.3. Ví dụ về CSDL giao dịch mua hàng có yếu tố thời gian ................ 24
Bảng 1.4. Một số nghiên cứu về phát hiện luật kết hợp có tính đến khoảng
cách thời gian .................................................................................................. 24
Bảng 1.5. Ví dụ về CSDL chuỗi giao dịch ..................................................... 25
Bảng 1.6. Ví dụ CSDL chuỗi định lượng ........................................................ 29
Bảng 1.7. Ví dụ CSDL chuỗi giao dịch có yếu tố thời gian ........................... 31
Bảng 1.8. Một số ... g and Other
Applications of Applied Intelligent Systems, 2020, pp. 820–831.
[39] R. Agrawal, R. Srikant, and others, “Mining sequential patterns,” in
icde, 1995, vol. 95, pp. 3–14.
136
[40] R. Srikant and R. Agrawal, “Mining sequential patterns: Generalizations
and performance improvements,” in International Conference on
Extending Database Technology, 1996, pp. 1–17.
[41] M. N. Garofalakis, R. Rastogi, and K. Shim, “SPIRIT: Sequential
pattern mining with regular expression constraints,” in VLDB, 1999, vol.
99, pp. 7–10.
[42] M. J. Zaki, “SPADE: An efficient algorithm for mining frequent
sequences,” Mach. Learn., vol. 42, no. 1–2, pp. 31–60, 2001.
[43] J. Ayres, J. Flannick, J. Gehrke, and T. Yiu, “Sequential pattern mining
using a bitmap representation,” in Proceedings of the eighth ACM
SIGKDD international conference on Knowledge discovery and data
mining, 2002, pp. 429–435.
[44] E. Salvemini, F. Fumarola, D. Malerba, and J. Han, “Fast sequence
mining based on sparse id-lists,” in International Symposium on
Methodologies for Intelligent Systems, 2011, pp. 316–325.
[45] P. Fournier-Viger, A. Gomariz, M. Campos, and R. Thomas, “Fast
vertical mining of sequential patterns using co-occurrence information,”
in Pacific-Asia Conference on Knowledge Discovery and Data Mining,
2014, pp. 40–52.
[46] P. Fournier-Viger, C.-W. Wu, and V. S. Tseng, “Mining maximal
sequential patterns without candidate maintenance,” in International
Conference on Advanced Data Mining and Applications, 2013, pp. 169–
180.
[47] D. Lo, S.-C. Khoo, and J. Li, “Mining and ranking generators of
sequential patterns,” in Proceedings of the 2008 SIAM International
Conference on Data Mining, 2008, pp. 553–564.
[48] J. Han, J. Pei, B. Mortazavi-Asl, Q. Chen, U. Dayal, and M.-C. Hsu,
“FreeSpan: frequent pattern-projected sequential pattern mining,” in
Proceedings of the sixth ACM SIGKDD international conference on
Knowledge discovery and data mining, 2000, pp. 355–359.
[49] J. Pei et al., “Mining sequential patterns by pattern-growth: The
prefixspan approach,” IEEE Trans. Knowl. Data Eng., vol. 16, no. 11,
pp. 1424–1440, 2004.
[50] X. Yan, J. Han, and R. Afshar, “CloSpan: Mining: Closed sequential
patterns in large datasets,” in Proceedings of the 2003 SIAM
international conference on data mining, 2003, pp. 166–177.
[51] T. Van, B. Vo, and B. Le, “Mining sequential patterns with itemset
constraints,” Knowl. Inf. Syst., vol. 57, no. 2, pp. 311–330, 2018.
[52] R. Bhatta, C. I. Ezeife, and M. N. Butt, “Mining Sequential Patterns of
Historical Purchases for E-commerce Recommendation,” in
137
International Conference on Big Data Analytics and Knowledge
Discovery, 2019, pp. 57–72.
[53] C. Fiot, A. Laurent, and M. Teisseire, “From crispness to fuzziness:
Three algorithms for soft sequential pattern mining,” IEEE Trans. Fuzzy
Syst., vol. 15, no. 6, pp. 1263–1277, 2007.
[54] Y.-C. Hu, R.-S. Chen, G.-H. Tzeng, and J.-H. Shieh, “A fuzzy data
mining algorithm for finding sequential patterns,” Int. J. Uncertainty,
Fuzziness Knowledge-Based Syst., vol. 11, no. 02, pp. 173–193, 2003.
[55] Y.-C. Hu, G.-H. Tzeng, and C.-M. Chen, “Deriving two-stage learning
sequences from knowledge in fuzzy sequential pattern mining,” Inf. Sci.
(Ny)., vol. 159, no. 1–2, pp. 69–86, 2004.
[56] T. C.-K. Huang, “Discovery of fuzzy quantitative sequential patterns
with multiple minimum supports and adjustable membership functions,”
Inf. Sci. (Ny)., vol. 222, pp. 126–146, 2013.
[57] R. J. Kuo, C. M. Chao, and C. Y. Liu, “Integration of K-means
algorithm and AprioriSome algorithm for fuzzy sequential pattern
mining,” Appl. Soft Comput., vol. 9, no. 1, pp. 85–93, 2009.
[58] R. B. V Subramanyam and A. Goswami, “A fuzzy data mining
algorithm for incremental mining of quantitative sequential patterns,”
Int. J. Uncertainty, Fuzziness Knowledge-Based Syst., vol. 13, no. 06,
pp. 633–652, 2005.
[59] T. Huang, R. Huang, B. Liu, and Y. Yan, “Extracting Various Types of
Informative Web Content via Fuzzy Sequential Pattern Mining,” in
Asia-Pacific Web (APWeb) and Web-Age Information Management
(WAIM) Joint Conference on Web and Big Data, 2017, pp. 230–238.
[60] M. Yoshida, T. Iizuka, H. Shiohara, and M. Ishiguro, “Mining
sequential patterns including time intervals,” in Data Mining and
Knowledge Discovery: Theory, Tools, and Technology II, 2000, vol.
4057, pp. 213–220.
[61] Y.-L. Chen, M.-C. Chiang, and M.-T. Ko, “Discovering time-interval
sequential patterns in sequence databases,” Expert Syst. Appl., vol. 25,
no. 3, pp. 343–354, 2003.
[62] F. Giannotti, M. Nanni, D. Pedreschi, and F. Pinelli, “Mining sequences
with temporal annotations,” in Proceedings of the 2006 ACM
symposium on Applied computing, 2006, pp. 593–597.
[63] Y.-L. Chen and T.-K. Huang, “Discovering fuzzy time-interval
sequential patterns in sequence databases,” IEEE Trans. Syst. Man,
Cybern. Part B, vol. 35, no. 5, pp. 959–972, 2005.
[64] I. Mukhlash, D. Yuanda, and M. Iqbal, “Mining Fuzzy Time Interval
Periodic Patterns in Smart Home Data,” Int. J. Electr. Comput. Eng.,
138
vol. 8, no. 5, p. 3374, 2018.
[65] C.-I. Chang, H.-E. Chueh, and N. P. Lin, “Sequential patterns mining
with fuzzy time-intervals,” in 2009 Sixth International Conference on
Fuzzy Systems and Knowledge Discovery, 2009, vol. 3, pp. 165–169.
[66] C.-I. Chang, H.-E. Chueh, and Y.-C. Luo, “An integrated sequential
patterns mining with fuzzy time-intervals,” in 2012 International
Conference on Systems and Informatics (ICSAI2012), 2012, pp. 2294–
2298.
[67] T. H. Duong, D. Janos, V. D. Thi, N. T. Thang, and others, “An
Algorithm for Mining High Utility Sequential Patterns with Time
Interval,” Cybern. Inf. Technol., vol. 19, no. 4, pp. 3–16, 2019.
[68] T. H. Duong, N. T. Thang, V. D. Thi, and others, “HIGH UTILITY
ITEM INTERVAL SEQUENTIAL PATTERN MINING
ALGORITHM,” J. Comput. Sci. Cybern., vol. 36, no. 1, pp. 1–15, 2020.
[69] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo,
“CMRULES: An Efficient Algorithm for Mining Sequential Rules
Common to Several Sequences.,” 2010.
[70] P. Fournier-Viger, J. C.-W. Lin, R. U. Kiran, Y. S. Koh, and R.
Thomas, “A survey of sequential pattern mining,” Data Sci. Pattern
Recognit., vol. 1, no. 1, pp. 54–77, 2017.
[71] P. Fournier-Viger, R. Nkambou, and V. S.-M. Tseng, “RuleGrowth:
mining sequential rules common to several sequences by pattern-
growth,” in Proceedings of the 2011 ACM symposium on applied
computing, 2011, pp. 956–961.
[72] P. Fournier-Viger, T. Gueniche, S. Zida, and V. S. Tseng, “ERMiner:
sequential rule mining using equivalence classes,” in International
Symposium on Intelligent Data Analysis, 2014, pp. 108–119.
[73] Ö. F. Çelebi, E. Zeydan, \.Ismail Ar\i, Ö. Ileri, and S. Ergüt, “Alarm
sequence rule mining extended with a time confidence parameter,”
2014.
[74] S. Kotsiantis and D. Kanellopoulos, “Association rules mining: A recent
overview,” GESTS Int. Trans. Comput. Sci. Eng., vol. 32, no. 1, pp. 71–
82, 2006.
[75] X. Wu et al., “Top 10 algorithms in data mining,” Knowl. Inf. Syst., vol.
14, no. 1, pp. 1–37, 2008.
[76] H. S. Song, J. kyeong Kim, and S. H. Kim, “Mining the change of
customer behavior in an internet shopping mall,” Expert Syst. Appl., vol.
21, no. 3, pp. 157–168, 2001.
[77] J. R. D. Arcos and A. A. Hernandez, “Analyzing Online Transaction
Data using Association Rule Mining: Misumi Philippines Market
139
Basket Analysis,” in Proceedings of the 2019 7th International
Conference on Information Technology: IoT and Smart City, 2019, pp.
45–49.
[78] M. V. Adheli and M. V. Bag, “Intra and Inter Sector Stock Price
Forecasting using Association Rule Mining (IISARM),” Int. J. Eng.
Res. Technol., vol. 3, no. 8, pp. 324–329, 2014.
[79] V. Rajput and S. Bobde, “Stock market forecasting techniques:
literature survey,” Int J Comput Sci Mob Comput, vol. 5, no. 6, pp. 500–
506, 2016.
[80] X. Zhong and D. Enke, “Forecasting daily stock market return using
dimensionality reduction,” Expert Syst. Appl., vol. 67, pp. 126–139,
2017.
[81] D. Gamberger, N. Lavrac, and V. Jovanoski, “High confidence
association rules for medical diagnosis,” 1999.
[82] X. Li, Y. Wang, and D. Li, “Medical data stream distribution pattern
association rule mining algorithm based on density estimation,” IEEE
Access, vol. 7, pp. 141319–141329, 2019.
[83] Y.-L. Chen and T. C.-K. Huang, “A new approach for discovering fuzzy
quantitative sequential patterns in sequence databases,” Fuzzy Sets Syst.,
vol. 157, no. 12, pp. 1641–1661, 2006.
[84] L. A. Zadeh, “Fuzzy sets,” Inf. Control, vol. 8, no. 3, pp. 338–353,
1965.
[85] M. M. Gupta and R. K. Ragade, Fuzzy Set Theory and Its Applications:
a Survey. Springer Science & Business Media, 1977.
[86] A. Fu, M. H. Wong, S. C. Sze, W. C. Wong, W. L. Wong, and W. K.
Yu, “Finding fuzzy sets for the mining of fuzzy association rules for
numerical attributes,” in Proceedings of the First International
Symposium on Intelligent Data Engineering and Learning (IDEAL’98),
1998, pp. 263–268.
[87] A. Gyenesei, “A fuzzy approach for mining quantitative association
rules,” Acta Cybern., vol. 15, no. 2, pp. 305–320, 2001.
[88] J. C.-W. Lin, T. Li, P. Fournier-Viger, and T.-P. Hong, “A fast
algorithm for mining fuzzy frequent itemsets,” J. Intell. Fuzzy Syst., vol.
29, no. 6, pp. 2373–2379, 2015.
[89] T. Đ. Phương and Đ. V. Thành, “Phát hiện luật kết hợp liên kết các giao
dịch từ cơ sở dữ liệu định lượng thời gian,” in Hội thảo quốc gia lần thứ
16: Một số vấn đề chọn lọc của công nghệ thông tin và truyền thông,
2013, pp. 250–258.
[90] S. Lu and C. Li, “AprioriAdjust: An efficient algorithm for discovering
the maximum sequential patterns,” 2004.
140
[91] Z. Yang and M. Kitsuregawa, “LAPIN-SPAM: An improved algorithm
for mining sequential pattern,” in 21st International Conference on
Data Engineering Workshops (ICDEW’05), 2005, p. 1222.
[92] C. Gao, J. Wang, Y. He, and L. Zhou, “Efficient mining of frequent
sequence generators,” in Proceedings of the 17th international
conference on World Wide Web, 2008, pp. 1051–1052.
[93] S. Yi, T. Zhao, Y. Zhang, S. Ma, and Z. Che, “An effective algorithm
for mining sequential generators,” Procedia Eng., vol. 15, pp. 3653–
3657, 2011.
[94] P. Fournier-Viger, A. Gomariz, M. Šebek, and M. Hlosta, “VGEN: fast
vertical mining of sequential generator patterns,” in International
Conference on Data Warehousing and Knowledge Discovery, 2014, pp.
476–488.
[95] J. Wang, J. Han, and C. Li, “Frequent closed sequence mining without
candidate maintenance,” IEEE Trans. Knowl. Data Eng., vol. 19, no. 8,
pp. 1042–1056, 2007.
[96] A. Gomariz, M. Campos, R. Marin, and B. Goethals, “Clasp: An
efficient algorithm for mining frequent closed sequences,” in Pacific-
Asia Conference on Knowledge Discovery and Data Mining, 2013, pp.
50–61.
[97] P. Fournier-Viger, C.-W. Wu, A. Gomariz, and V. S. Tseng, “VMSP:
Efficient vertical mining of maximal sequential patterns,” in Canadian
conference on artificial intelligence, 2014, pp. 83–94.
[98] C. C. Aggarwal and J. Han, Frequent Pattern Mining. Springer, 2014.
[99] Y. J. M. Pokou, P. Fournier-Viger, and C. Moghrabi, “Authorship
Attribution Using Small Sets of Frequent Part-of-Speech Skip-grams.,”
in FLAIRS Conference, 2016, pp. 86–91.
[100] D. Schweizer, M. Zehnder, H. Wache, H.-F. Witschel, D. Zanatta, and
M. Rodriguez, “Using consumer behavior data to reduce energy
consumption in smart homes: Applying machine learning to save energy
without lowering comfort of inhabitants,” in 2015 IEEE 14th
International Conference on Machine Learning and Applications
(ICMLA), 2015, pp. 1123–1129.
[101] P. Fournier-Viger, T. Gueniche, and V. S. Tseng, “Using partially-
ordered sequential rules to generate more accurate sequence prediction,”
in International Conference on Advanced Data Mining and
Applications, 2012, pp. 431–442.
[102] G. Yang, J. Huang, and X. Li, “Mining sequential patterns of PM2. 5
pollution in three zones in China,” J. Clean. Prod., vol. 170, pp. 388–
398, 2018.
141
[103] C. Ou-Yang, S.-C. Chou, Y.-C. Juan, and H.-C. Wang, “Mining
Sequential Patterns of Diseases Contracted and Medications Prescribed
before the Development of Stevens-Johnson Syndrome in Taiwan,”
Appl. Sci., vol. 9, no. 12, p. 2434, 2019.
[104] T. Hong, C.-S. Kuo, and S.-C. Chi, “Mining fuzzy sequential patterns
from quantitative data,” in IEEE SMC’99 Conference Proceedings.
1999 IEEE International Conference on Systems, Man, and Cybernetics
(Cat. No. 99CH37028), 1999, vol. 3, pp. 962–966.
[105] H. Cao, Y. Zhang, L. Jia, and G. Si, “A Fuzzy Sequential Pattern
Mining Algorithm Based on Independent Pruning Strategy for
Parameters Optimization of Ball Mill Pulverizing System,” Inf. Technol.
Control, vol. 43, no. 3, pp. 303–314, 2014.
[106] R.-S. Chen, G.-H. Tzeng, C. C. Chen, and Y.-C. Hu, “Discovery of
fuzzy sequential patterns for fuzzy partitions in quantitative attributes,”
in Proceedings ACS/IEEE International Conference on Computer
Systems and Applications, 2001, pp. 144–150.
[107] T. Guyet, “Enhancing sequential pattern mining with time and
reasoning,” Université de Rennes 1, 2020.
[108] P. Fournier-Viger, U. Faghihi, R. Nkambou, and E. M. Nguifo,
“CMRules: Mining sequential rules common to several sequences,”
Knowledge-Based Syst., vol. 25, no. 1, pp. 63–76, 2012.
[109] R. B. Parihar, R. V Argiddi, and S. S. Apte, “Combined Intra-Inter
transaction based approach for mining Association among the Sectors in
Indian Stock Market,” Int. J. Comput. Sci. Inf. Technol., vol. 3, no. 3,
pp. 3895–3899, 2012.
[110] Y.-L. Hsieh, D.-L. Yang, J. Wu, and Y.-C. Chen, “Efficient Mining of
Profit Rules from Closed Inter-Transaction Itemsets.,” J. Inf. Sci. Eng.,
vol. 32, no. 3, pp. 575–595, 2016.
[111] L. Wang, J. Meng, P. Xu, and K. Peng, “Mining temporal association
rules with frequent itemsets tree,” Appl. Soft Comput., vol. 62, pp. 817–
829, 2018.
[112] Tan, P.N., Steinbach, M., and Kumar, Association Analysis: Basic
Concepts and Algorithms. In Introduction to Data Mining. Addison-
Wesley Longman Publishing Co., Inc. Boston, MA, 2005.
[113] UCI, “UCI-Machine Learning Repository.”
https://archive.ics.uci.edu/ml/datasets.php.
[114] BSC, “Công ty Cổ phần Chứng khoán Ngân hàng Đầu tư và Phát triển
Việt Nam.” (accessed Mar. 20, 2006).
[115] P. Fournier-Viger et al., “The SPMF open-source data mining library
version 2,” in Lecture Notes in Computer Science (including subseries
142
Lecture Notes in Artificial Intelligence and Lecture Notes in
Bioinformatics), 2016, vol. 9853 LNCS, pp. 36–40, doi: 10.1007/978-3-
319-46131-1_8.

File đính kèm:

luan_an_phat_hien_luat_ket_hop_va_luat_chuoi_mo_trong_co_so.pdf
2.Mau3_DongGopMoi_TV.doc
3.Mau3_DongGopMoi_TiengAnh.docx
4.TrichYeuLuanAn.docx
DMCongTrinh-NCS Truong Duc Phuong.pdf
DMCongTrinh-NCS Truong Duc Phuong_1.pdf
Những đóng góp mới TA.TV. Trích yếu - Trương Đức Phương_0001.pdf
TomTat - NCS Truong Duc Phuong_EN.pdf
TomTat - NCS Truong Duc Phuong_VN.pdf