Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác
Ngày nay, với sự phát triển của mạng xã hội liên quan đến thông tin cá nhân của nhiều
người, việc gợi ý tự động cho người sử dụng các thông tin cũng như các sản phẩm có thể họ
muốn mua hoặc quan tâm, các cá nhân có cùng sở thích hoặc cùng lĩnh vực nghiên cứu với
họ là một việc khả thi và đem lại nhiều lợi ích cho con người. Các hệ gợi ý hay còn gọi là hệ
khuyến nghị đã được quan tâm nghiên cứu và phát triển nhanh chóng trong thời gian gần
đây, đặc biệt các hệ khuyến nghị trong thương mại điện tử đem lại nhiều lợi nhuận cho các
nhà bán sản phẩm. Bên cạnh các hệ khuyến nghị trong thương mại điện tử, các hệ khuyến
nghị liên quan đến khoa học kỹ thuật cũng được quan tâm nghiên cứu. Ví dụ, LinkedIn và
ResearchGate khuyến nghị các công việc mà ai đó (hoặc người dùng nào đó) có thể ứng
tuyển, thông báo các thông tin liên quan đến các nhà khoa học có các công trình nghiên cứu
được tham chiếu trong các bài báo khoa học, v.v. Tuy nhiên, việc khuyến nghị các tác giả
có các nghiên cứu liên quan đến nhau để hợp tác trong tương lai còn chưa được đưa vào
trong các mạng xã hội này. Đây cũng là những khuyến nghị rất có giá trị giúp cho các nhà
nghiên cứu tăng cường hợp tác để tạo ra các công trình khoa học mới trong tương lai. Bài
toán khuyến nghị các nhà nghiên cứu có tiềm năng hợp tác còn được gọi với tên là bài toán
khuyến nghị cộng tác trong mạng đồng tác giả. Trong luận án này, khái niệm “khuyến nghị
cộng tác” (“Collaborations Recommendation” được sử dụng trong [54]) mang hàm ý về sự
khuyến nghị hợp tác trong việc xuất bản bài báo khoa học giữa các nhà nghiên cứu (tác giả).
Ở đây, mạng đồng tác giả là một mạng xã hội trong đó các nút là các nhà khoa học, các cạnh
là các mối cộng tác khoa học giữa các nhà khoa học.
Bài toán khuyến nghị cộng tác trong mạng đồng tác giả được phát biểu như sau:
Cho thông tin về các tác giả đã từng viết chung bài báo khoa học đến thời điểm t,
với một tác giả u nào đó, cần tìm ra một danh sách tác giả có tiềm năng cộng tác
(Collaboration) với tác giả u trong tương lai (từ thời điểm t’ > t).
Tóm tắt nội dung tài liệu: Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Phạm Minh Chuẩn NGHIÊN CỨU VÀ PHÁT TRIỂN MỘT SỐ ĐỘ ĐO LIÊN KẾT TRONG BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC Ngành: Hệ thống thông tin Mã số: 9480104 LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. PGS.TS. Lê Thanh Hương 2. PGS.TS. Trần Đình Khang Hà Nội - 2018 2 LỜI CAM ĐOAN Tôi xin cam đoan tất cả các nội dung trong luận án “Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác” là công trình nghiên cứu của riêng tôi, dưới sự hướng dẫn của PGS.TS. Lê Thanh Hương và PGS.TS. Trần Đình Khang. Tất cả các kết quả, số liệu trong luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình này. Hà Nội, ngày tháng năm 2018 TM. TẬP THỂ HƯỚNG DẪN KHOA HỌC TÁC GIẢ LUẬN ÁN PGS.TS. Lê Thanh Hương Phạm Minh Chuẩn 3 LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn tới Trường Đại học Bách khoa Hà Nội, Viện Công nghệ Thông tin và Truyền thông, Bộ môn Hệ thống thông tin đã tạo điều kiện thuận lợi cho tôi trong quá trình học tập tại Trường. Tôi muốn gửi lời cảm ơn đặc biệt tới tập thể hướng dẫn trực tiếp là PGS.TS. Lê Thanh Hương và PGS.TS. Trần Đình Khang. Thầy và cô đã luôn tận tình giúp đỡ, đưa ra những lời khuyên, những định hướng khoa học rất quý báu để tôi có thể triển khai và hoàn thành công việc nghiên cứu của mình. Đồng thời tôi cũng xin cảm ơn TS. Lê Hoàng Sơn Trung tâm Tính toán Hiệu năng cao – ĐH KHTN – ĐHQGHN đã tạo điều kiện, giúp đỡ tôi hoàn thành luận án này. Xin chân thành cảm ơn các thầy cô, các đồng nghiệp trong Bộ môn Hệ thống Thông tin, Viện Công nghệ Thông tin và Truyền thông, Trường Đại học Bách khoa Hà Nội nơi tôi học tập, thực hiện đề tài nghiên cứu đã nhiệt tình giúp đỡ và động viên tôi trong suốt quá trình nghiên cứu. Xin cám ơn các bạn sinh viên thuộc Bộ môn Hệ thống thông tin, Viện CNTT & TT, đặc biệt là bạn Nguyễn Đăng Tuấn Anh lớp kỹ sư tài năng CNTT K58 đã hỗ trợ tôi trong việc thu thập dữ liệu để phục vụ cho quá trình thực nghiệm. Cảm ơn Khoa Công nghệ Thông tin và Trường Đại học Sư phạm Kỹ thuật Hưng Yên, nơi tôi đang công tác đã luôn tạo điều kiện cho tôi trong suốt quá trình nghiên cứu và hoàn thành luận án này. Xin gửi lời cám ơn đến các thầy cô, các nhà khoa học, các đồng nghiệp và bạn bè thân hữu đã động viên và giúp đỡ tôi trong quá trình nghiên cứu. Cuối cùng tôi muốn bày tỏ lòng biết ơn sâu sắc tới gia đình, nơi nuôi dưỡng và là nguồn động lực để tôi vượt mọi trở ngại khó khăn để hoàn thành luận án này. Nghiên cứu sinh Phạm Minh Chuẩn 4 MỤC LỤC LỜI CAM ĐOAN .................................................................................................................. 2 LỜI CẢM ƠN ........................................................................................................................ 3 MỤC LỤC ............................................................................................................................. 4 GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ............................................................ 6 DANH MỤC CÁC BẢNG .................................................................................................... 8 DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ ............................................................................ 9 MỞ ĐẦU ............................................................................................................................. 11 1. TỔNG QUAN VỀ BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC ................................. 16 1.1 Bài toán khuyến nghị cộng tác trong mạng đồng tác giả ........................................... 16 1.1.1 Mạng xã hội và mạng đồng tác giả ..................................................................... 16 1.1.2 Bài toán khuyến nghị cộng tác ........................................................................... 20 1.1.3. Tổng quan về các độ đo liên kết trong mạng đồng tác giả ................................ 26 1.2. Một số kiến thức liên quan ....................................................................................... 34 1.2.1. Các phương pháp phân lớp ................................................................................ 34 1.2.2 Phân cụm mờ và phân cụm bán giám sát mờ ..................................................... 38 1.2.3. Phân tích theo chủ đề ......................................................................................... 41 1.3. Kết luận..................................................................................................................... 43 2. CÁC ĐỘ ĐO LIÊN KẾT MỞ RỘNG TRONG MẠNG ĐỒNG TÁC GIẢ ............... 44 2.1. Độ đo liên kết dựa trên trọng số mở rộng ................................................................. 44 2.2. Các độ đo liên kết dựa trên nội dung bài báo ........................................................... 46 2.3. Thuật toán tính độ đo liên kết và đánh giá độ phức tạp của thuật toán .................... 50 2.4. Đánh giá các độ đo liên kết trong mạng đồng tác giả............................................... 58 2.4.1. Chuẩn bị dữ liệu ................................................................................................ 58 2.4.2. Kịch bản thực nghiệm........................................................................................ 60 2.4.3. Kết quả thực nghiệm.......................................................................................... 63 2.5 Kết luận...................................................................................................................... 77 3. BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC ................................................................ 78 5 3.1. Giới thiệu .................................................................................................................. 78 3.2. Khuyến nghị cộng tác mới ........................................................................................ 79 3.3. Khuyến nghị cộng tác tăng cường ............................................................................ 88 3.3. Kết luận..................................................................................................................... 96 KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................. 97 TÀI LIỆU THAM KHẢO ................................................................................................... 99 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ............................ 108 6 GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Chữ viết đầy đủ Giải thích AA Adamic & Adar Độ đo liên kết AA AUC Area under the curve Tiêu chí đánh giá phân lớp CN Common Neighbours Độ đo liên kết láng giềng chung JC Jaccard Coefficient Độ đo liên kết JC LDA Latent Dirichlet Allocation Phương pháp phân tích chủ đề OSN Online Social Network Mạng xã hội trực tuyến OHUSN Online HomogeneousUndirected Social Networks Mạng xã hội vô hướng đồng nhất trực tuyến SMO Sequential Minimal Optimization Tối ưu hóa cực tiểu lần lượt SVM Support Vector Machines Máy véc-tơ hỗ trợ WAA Weighted Adamic & Adar Độ đo liên kết trọng số dựa trên AA WCN Weighted Common Neighbours Độ đo liên kết trọng số dựa trên láng giềng chung WJC Weighted Jaccard Coefficient Độ đo liên kết trọng số dựa trên JC TF-IDF Term Frequency - Inverse Document Frequency Trọng số từ SPIRES Stanford Public Information Retrieval System Hệ thống truy xuất thông tin công khai Stanford NCSTRL Networked Computer Science Technical Reference Library Mạng thư viện tham chiếu khoa học máy tính AMC Applied Mathematics and Computation Tạp chí toán ứng dụng và tính toán BJ Biophysical Journal Tạp chí lý sinh CF Collaborative Filtering Lọc cộng tác CB Content-based Dựa trên nội dung 7 KMC Keywords match count Đếm các từ khóa chung AKMC Abtract keywords match count Đếm các từ chung trong nội dung tóm tắt FCM Fuzzy C-means Phân cụm mờ SSSFC Semi-Supervised Standard Fuzzy Clustering Phân cụm bán giám sát mờ 8 DANH MỤC CÁC BẢNG Bảng 1.1 Danh sách các quan hệ cộng tác và các bài báo .................................................. 19 Bảng 1.2 Các phương pháp phân lớp được sử dụng ........................................................... 33 Bảng 2.1 Thống kê trên các bộ dữ liệu ............................................................................... 59 Bảng 2.2 Thống kê tập dữ liệu ............................................................................................ 60 Bảng 2.3 Kịch bản thực nghiệm với các độ đo liên kế ....................................................... 60 Bảng 2.4 Kịch bản thực nghiệm với các độ đo liên kết mở rộng ........................................ 61 Bảng 2.5 Các độ đo liên kết tổ hợp sử dụng khi phân lớp với kịch bản 2 .......................... 62 Bảng 2.6 Các độ đo liên kết tổ hợp sử dụng khi phân lớp với kịch bản 3 .......................... 62 Bảng 2.7 Giá trị Recall@N với các tham số tối ưu trên AMC ........................................... 65 Bảng 2.8 Giá trị Recall ứng với các tham số tối ưu trên BJ ................................................ 67 Bảng 2.9 Giá trị chỉ số đánh giá trên AMC đối với các tổ hợp độ đo liên kết trọng số và mở rộng ............................................................................................................................ 69 Bảng 3.1 Thống kê các tập dữ liệu ...................................................................................... 83 Bảng 3.2 Tập các đặc trưng trong thực nghiệm khuyến nghị cộng tác mới ....................... 83 Bảng 3.3 Số chủ đề tối ưu ứng với các tổ hợp đặc trưng trên các bộ dữ liệu ..................... 84 Bảng 3.4 Giá trị chỉ số Recall trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .................................................................................................................................... 84 Bảng 3.5 Giá trị chỉ số Precision trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .................................................................................................................................... 84 Bảng 3.6 Giá trị chỉ số F1-measure trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .............................................................................................................................. 85 Bảng 3.7 Số chủ đề tối ưu ứng với các tổ hợp đặc trưng trên các bộ dữ liệu ..................... 85 Bảng 3.8 Giá trị chỉ số Recall trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .................................................................................................................................... 85 Bảng 3.9 Giá trị chỉ số Precision trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .................................................................................................................................... 86 Bảng 3.10 Giá trị chỉ số F1-measure trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu .............................................................................................................................. 86 Bảng 3.11 So sánh giá trị chỉ số F1-measure giữa trọng số cộng tác theo công thức (1.1) và (3.1) ứng với từng tác giả được khuyến nghị. ............................................................ 95 9 DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ Hình 1.1 Tiếp cận dự đoán liên kết dựa trên các độ đo liên kết ......................................... 17 Hình 1.2 Tiếp cận dự đoán liên kết dựa trên phân lớp ........................................................ 18 Hình 1.3 Minh họa mạng đồng tác giả với dữ liệu trong Bảng 1.1 từ năm 2000 đến 2002 dưới dạng đồ thị ......................................................................................................... 19 Hình 1.4 Quá trình sinh của LDA (Nguồn [10]) ................................................................. 42 Hình 2.1 Minh họa độ đo liên kết mở rộng ......................................................................... 46 Hình 2.2 So sánh chỉ số đánh giá Recall@N giữa các độ đo liên kết trọng số trên AMC . 63 Hình 2.3 So sánh chỉ số đánh giá Recall@N giữa các độ đo liên kết trọng số trên BJ ...... 63 Hình 2.4 Giá trị Recall@N với số lượng chủ đề và tham số đối với LDAcosin trên AMC .................................................................................................................................... 64 Hình 2.5 So sánh các độ đo liên kết trọng số (#CN) với các độ đo liên kết mở rộng trên AMC ........................................................................................................................... 65 Hình 2.6 So sánh các độ đo liên kết trọng số (#AA) với các độ đo liên kết mở rộng trên AMC ........................................................................................................................... 65 Hình 2.7 So sánh các độ đo liên kết trọng số (#JC) với các độ đo liên kết mở rộng trên AMC .................................................................................................................................... 66 Hình 2.8 Giá trị Recall ứng với số lượng chủ đề và tham số đối với độ đo liên kết LDAcosin trên BJ ........................................................................................................................ 66 Hình 2.9 So sánh các độ đo liên kết trọng số (#CN) với các độ đo liên kết mở rộng trên BJ .................................................................................................................................... 67 Hình 2.10 So sánh các độ đo liên kết trọng số (#AA) với các độ đo liên kết mở rộng trên BJ .................................................................................................................................... 68 Hình 2.11 So sánh các độ đo liên kết trọng số (#JC) với các độ đo liên kết mở rộng trên BJ .................................................................................................................................... 68 Hình 2.12 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight1, và Weight1_#) trên AMC ............................................................................................... 69 Hình 2.13 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight2, và Weight2_#) trên AMC ............................................................................................... 70 Hình 2.14 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight3, và Weight3_#) trên AMC ............................................................................................... 70 Hình 2.15 So sánh giá trị AUC ứng với các tổ hợp độ đo liên kết (Weight#, và Weight#_# ... . [36] J. Golbeck and J. Hendler (2006, January) "Filmtrust: Movie recommendations using trust in web-based social networks," In Proceedings of the IEEE 102 Consumer communications and networking conference, Vol. 96, No. 1, pp. 282- 286. [37] Y. Guisheng, Y. Wansi and D. Yuxin (2014) "A new link prediction algorithm: node link strength algorithm," in Computer Applications and Communications (SCAC), 2014 IEEE Symposium on, IEEE, pp. 5-9. [38] I. Günes, S. Gündüz-Öüdücü and Z. Çataltepe (2016) "Link prediction using time series of neighborhood-based node similarity scores," Data Mining and Knowledge Discovery, vol. 30, no. 1, pp. 147-180. [39] S. Gupta, S. Pandey and K. K. Shukla (2015) "Comparison analysis of link prediction algorithms in social network," International Journal of Computer Applications, vol. 111, no. 16.. [40] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and I. H. Witten (2009) "The WEKA data mining software: an update," ACM SIGKDD explorations newsletter, vol. 11, no. 1, pp. 10-18. [41] T. Hofmann (2004) "Latent semantic models for collaborative filtering," ACM Transactions on Information Systems (TOIS), vol. 22, no. 1, pp. 89-115. [42] T. Hofmann and D. Hartmann (2005) "Collaborative filtering with privacy via factor analysis," in In Proceedings of the 2005 ACM symposium on applied computing. [43] N. M. A. Ibrahim and L. Chen (2015) "Link prediction in dynamic social networks by integrating different types of information," Applied Intelligence, vol. 42, no. 4, pp. 738-750. [44] G. Jeh and J. Widom (2002) "SimRank: a measure of structural-context Silarity," in In Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining. [45] T. Karagiannis and M. Vojnovic (2009, April) "Behavioral profiles for advanced email features," In Proceedings of the 18th international conference on World wide web, pp. 711-720, ACM. [46] L. Katz (1953) "A new status index derived from sociometric analysis," Psychometrika, vol. 18, no. 1, pp. 39-43. [47] H. Kautz, B. Selman and M. Shah (1997) "Referral Web: combining social networks and collaborative filtering," Communications of the ACM, 40(3), 63- 65. 103 [48] Y. Koren (2008) "Factorization meets the neighborhood: a multifaceted collaborative filtering model," in In Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. [49] M. Kubat and S. Matwin (1997) "Addressing the curse of imbalanced training sets: one-sided selection," in ICML, vol. 97, pp. 179-186. [50] D. H. Lee, P. Brusilovsky and T. Schleyer (2011) "Recommending collaborators using social features and mesh terms," Proceedings of the Association for Information Science and Technology, vol. 48, no. 1, pp. 1-10. [51] D. Liben‐Nowell and J. Kleinberg (2007) "The link‐prediction problem for social networks," Journal of the Association for Information Science and Technology, vol. 58, no. 7, pp. 1019-1031. [52] R. N. Lichtenwalter, J. T. Lussier and N. V. Chawla (2010) "New perspectives and methods in link prediction.," in In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining. [53] J. X. F. Li, W. Wang, Z. Chen, N. Y. Asabere and H. Jiang (2014) "Acrec: a co- authorship based random walk model for academic collaboration recommendation," in Proceedings of the 23rd International Conference on World Wide Web, ACM, pp. 1209-1214. [54] G. R. Lopes, M. M. Moro, L. K. Wives and J. P. M. De Oliveira (2010) "Collaboration recommendation on academic social networks," in In International Conference on Conceptual Modeling. [55] J. Lu, X. Yuan and T. Yahagi (2007) “A method of face recognition based on fuzzy c-means clustering and associated sub-NNs,” IEEE Transactions on, Neural Networks, 18(1), 150-160. [56] Z. Lu, B. Savas, W. Tang and I. S. Dhillon (2010) "Supervised link prediction using multiple sources," in Data Mining (ICDM), 2010 IEEE 10th International Conference on, IEEE, pp. 923-928. [57] I. Makarov, O. Bulanov and L. E. Zhukov (2016) "Co-author recommender system," in In International Conference on Network Analysis. [58] A. Martin, V. Gayathri, G. Saranya, P. Gayathri and P. Venkatesan (2011) “A hybrid model for bankruptcy prediction using genetic algorithm, fuzzy c-means and MARS,” International Journal on Soft Computing ( IJSC ), 2(1), 12-24. 104 [59] V. Martínez, F. Berzal and J. C. Cubero (2017) "A survey of link prediction in complex networks," ACM Computing Surveys (CSUR), vol. 49, no. 4, p. 69. [60] D. W. McDonald (2003, April) "Recommending collaboration with social networks: a comparative evaluation," In Proceedings of the SIGCHI conference on Human factors in computing systems, pp. 593-600, ACM. [61] M. Mitzenmacher (2004) "A brief history of generative models for power law and lognormal distributions," Internet mathematics, vol. 1, no. 2, pp. 226-251. [62] J. Mori, Y. Kajikawa, H. Kashima and I. Sakata (2012) "Machine learning approach for finding business partners and building reciprocal relationships., 39(12), .," Expert Systems with Applications, vol. 39, no. 12, pp. 10402-10407. [63] L. Munasinghe (2013) Time-aware methods for link prediction in social networks (Doctoral dissertation, Ph. D. thesis, The Graduate University for Advanced Studies). [64] T. Murata and S. Moriyasu (2007) "Link prediction of social networks based on weighted proximity measures," in the IEEE/WIC/ACM international conference on In Web Intelligence. [65] M. E. Newman (2001) "Scientific collaboration networks. I. Network construction and fundamental results," Physical review E, vol. 64, no. 1, p. 016131. [66] M. E. Newman (2001) "Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality," Physical review E, p. 016132. [67] M. E. Newman (2001) "Clustering and preferential attachment in growing networks," Physical review E, vol. 64, no. 2, p. 025102. [68] M. E. Newman (2004) "Who is the best connected scientist? A study of scientific coauthorship networks," in Complex networks, Springer, Berlin, Heidelberg, pp. 337-370. [69] H. Ogata, Y. Yano, N. Furugori and Q. Jin (2001) "Computer supported social networking for augmenting cooperation", Computer Supported Cooperative Work (CSCW), 10(2), 189-209. [70] M. Pavlov and R. Ichise (2007) "Finding experts by link prediction in co- authorship networks," in In Proceedings of the 2nd International Conference on Finding Experts on the Web with Semantics-Volume 290. 105 [71] J. Platt (1998) "Sequential minimal optimization: A fast algorithm for training support vector machines". [72] J. R. Quinlan (2014) C4. 5: programs for machine learning, Elsevier. [73] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom and J. Riedl (1994) "GroupLens: an open architecture for collaborative filtering of netnews," in Proceedings of the 1994 ACM conference on Computer supported cooperative work, ACM, pp. 175-186. [74] M. R. Rezaee, P. M. Van der Zwet, B. P. Lelieveldt, R. J. Van Der Geest and J. H. Reiber (2000) “A multiresolution image segmentation technique based on pyramidal segmentation and fuzzy clustering,” IEEE Transactions on, Image Processing, 9(7), 1238-1248. [75] M. Sachan and R. Ichise (2010) "Using abstract information and community alignment information for link prediction," in In Machine Learning and Computing (ICMLC), 2010 Second International Conference on. [76] G. Salton and M. J. McGill (1987) Introduction to Modern Information Retrieval, New York: Mc. [77] B. Sarwar, G. Karypis, J. Konstan and J. Riedl (2001) "Item-based collaborative filtering recommendation algorithms," in In Proceedings of the 10th international conference on World Wide Web. [78] B. Sarwar, G. Karypis, J. Konstan and J. Riedl (2002) "Incremental singular value decomposition algorithms for highly scalable recommender systems," in In Fifth International Conference on Computer and Information Science. [79] S. Scellato, A. Noulas and C. Mascolo (2011) "Exploiting place features in link prediction on location-based social networks. (pp. ).," in In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining. [80] F. Schneider, A. Feldmann, B. Krishnamurthy and W. Willinger (2009) "Understanding online social network usage from a network perspective," in In Proceedings of the 9th ACM SIGCOMM conference on Internet measurement conference. [81] U. Shardanand and P. Maes (1995) "Social information filtering: algorithms for automating “word of mouth”," in Proceedings of the SIGCHI conference on Human factors in computing systems, ACM Press/Addison-Wesley Publishing Co., pp. 210-217. 106 [82] N. Shibata, Y. Kajikawa and I. Sakata (2012) "Link prediction in citation networks," Journal of the Association for Information Science and Technology, vol. 63, no. 1, pp. 75-85. [83] J. Tang, S. Wu, J. Sun and H. Su (2012) "Cross-domain collaboration recommendation.," in In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. [84] A. Töscher, M. Jahrer and R. Legenstein (2008) "Improved neighborhood-based algorithms for large-scale recommender systems," in Proceedings of the 2nd KDD Workshop on Large-Scale Recommender Systems and the Netflix Prize Competition, ACM, p. 4. [85] S. H. Walker and D. B. Duncan (1967) "Estimation of the probability of an event as a function of several independent variables," Biometrika, vol. 54, no. 1-2, pp. 167-179. [86] C. Wang and D. M. Blei (2011, August) "Collaborative topic modeling for recommending scientific articles," In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 448- 456, ACM. [87] C. Wang, V. Satuluri and S. Parthasarathy (2007) "Local probabilistic models for link prediction," in In Data Mining, 2007. ICDM 2007. Seventh IEEE International Conference on. [88] P. Wang, B. Xu, Y. Wu and X. Zhou (2015) "Link prediction in social networks: the state-of-the-art," Science China Information Sciences, vol. 58, no. 1, pp. 1- 38. [89] S. Wasserman and K. Faust (1994) "Social Network Analysis in the Social and Behavioral Sciences," in Social Network Analysis: Methods and Applications, Cambridge University Press, pp. 1-27. [90] D. Whitley (1994) "A genetic algorithm tutorial," Statistics and computing, vol. 4, no. 2, pp. 65-85. [91] B. Whitman and S. Lawrence (2002) "Inferring Descriptions and Similarity for Music from Community Metadata," in ICMC. [92] T. Wohlfarth and R. Ichise (2008) "Semantic and Event-Based Approach for Link Prediction," In Proceedings of the 7th International Conference on Practical Aspects of Knowledge Management (PAKM), Yokohama - Japan. 107 [93] S. Wu, J. Sun and J. Tang (2013) "Patent partner recommendation in enterprise social networks," In Proceedings of the sixth ACM international conference on Web search and data mining. [94] F. Xia, Z. Chen, W. Wang, J. Li and L. T. Yang (2014) "Mvcwalker: Random walk-based most valuable collaborators recommendation exploiting academic factors," IEEE Transactions on Emerging Topics in Computing, vol. 2, no. 3, pp. 364-375. [95] S. Xie and Y. Feng (2015, April) "A recommendation system combining LDA and collaborative filtering method for Scenic Spot," In Information Science and Control Engineering (ICISCE), 2015 2nd International Conference on, pp. 67- 71, IEEE. [96] J. Yang, L. Yang and P. Zhang (2015) "A New Link Prediction Algorithm Based on Local Links," in International Conference on Web-Age Information Management, Springer, pp. 16-28. [97] Z. Yang, R. Hu and R. Zhang (2016) "An improved link prediction algorithm based on common neighbors index with community membership information," in Software Engineering and Service Science (ICSESS), 2016 7th IEEE International Conference on, IEEE, pp. 90--93. [98] L. Yao, L. Wang, L. Pan and K. Yao (2016) "Link Prediction Based on Common-Neighbors for Dynamic Social Network," Procedia Computer Science, vol. 83, pp. 82-89. [99] E. Yasunori, H. Yukihiro, Y. Makito and M. Sadaaki (2009) "On semi- supervised fuzzy c-means clustering," in Fuzzy Systems, 2009. FUZZ-IEEE 2009. IEEE International Conference on, IEEE, pp. 1119-1124. [100] Q. Yu, C. Long, Y. Lv, H. Shao, P. He and Z. Duan (2014) "Predicting co- author relationship in medical co-authorship networks," PloS one, p. e101214. [101] O. R. Zaiane, J. Chen and R. Goebel (2007, August) "DBconnect: mining research community on DBLP data," In Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis, pp. 74-81, ACM. [102] J. Zhang and S. Y. Philip (2014) "Link prediction across heterogeneous social networks: A survey," SOCIAL NETWORKS. 108 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN 1. Phạm Minh Chuẩn, Lê Thanh Hương, Trần Đình Khang, Trần Ngọc Cương (2011). Hệ thống khuyến nghị bài báo. Tạp chí Nghiên cứu khoa học và công nghệ quân sự, Số 16, 12.2011, ISSN 1859-1043, trang 136-145. 2. Phạm Minh Chuẩn, Trịnh Khắc Linh, Trần Đình Khang, Lê Hoàng Sơn (2017). Phân tích sự ảnh hưởng của một số độ đo liên kết áp dụng vào bài toán dự đoán liên kết trong mạng đồng tác giả. Kỷ yếu Hội nghị Quốc gia lần thứ X về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR) – Đà Nẵng, 17-18/8/2017. ISBN: 978-604- 913-614-6, trang 760-767. 3. Pham Minh Chuan, Cu Nguyen Giap, Le Hoang Son, Chintan Bhatt, Tran Dinh Khang (2017), Enhance Link Prediction in Online Social Networks Using Similarity Metrics, Sampling and Classification, Proceeding of the 2017 4th International Conference on Information System Design and Intelligent Applications (INDIA- 2017), 15-17 June 2017, Danang, Vietnam, pp. 823 - 833, DOI = https://doi.org/10.1007/978-981-10-7512-4_81. 4. Phạm Minh Chuẩn, Trần Đình Khang, Lê Thanh Hương, Trần Mạnh Tuấn, Lê Hoàng Sơn (2017). Dự đoán liên kết đồng tác giả sử dụng phân cụm bán giám sát mờ. Chuyên san Khoa học Tự nhiên – Kỹ thuật – Công nghệ (Đại học Thái Nguyên), Tập 173, số 13, ISSN 1859-2171, trang 45-50. 5. Pham Minh Chuan, Le Hoang Son, Mumtaz Ali, Tran Dinh Khang, Le Thanh Huong, Nilanjan Dey (2017). Link Prediction in Co-authorship Networks based on Hybrid Content Silarity Metric. Applied Intelligence, ISSN: 0924-669X. doi: 10.1007/s10489-017-1086-x. (SCI, 2016 IF = 1.904, Springer) 6. Phạm Minh Chuẩn, Lê Hoàng Sơn, Trần Đình Khang, Lê Thanh Hương (2017). Đề xuất mô hình khuyến nghị cộng tác mới cho mạng đồng tác giả dựa trên chỉ số cộng tác và tương quan. Tạp chí Khoa học và Công nghệ Việt Nam, Tập 22, Số 11, 11.2017, ISSN 1859-4794, trang 9-14.
File đính kèm:
- nghien_cuu_va_phat_trien_mot_so_do_do_lien_ket_trong_bai_toa.pdf