Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác

Ngày nay, với sự phát triển của mạng xã hội liên quan đến thông tin cá nhân của nhiều

người, việc gợi ý tự động cho người sử dụng các thông tin cũng như các sản phẩm có thể họ

muốn mua hoặc quan tâm, các cá nhân có cùng sở thích hoặc cùng lĩnh vực nghiên cứu với

họ là một việc khả thi và đem lại nhiều lợi ích cho con người. Các hệ gợi ý hay còn gọi là hệ

khuyến nghị đã được quan tâm nghiên cứu và phát triển nhanh chóng trong thời gian gần

đây, đặc biệt các hệ khuyến nghị trong thương mại điện tử đem lại nhiều lợi nhuận cho các

nhà bán sản phẩm. Bên cạnh các hệ khuyến nghị trong thương mại điện tử, các hệ khuyến

nghị liên quan đến khoa học kỹ thuật cũng được quan tâm nghiên cứu. Ví dụ, LinkedIn và

ResearchGate khuyến nghị các công việc mà ai đó (hoặc người dùng nào đó) có thể ứng

tuyển, thông báo các thông tin liên quan đến các nhà khoa học có các công trình nghiên cứu

được tham chiếu trong các bài báo khoa học, v.v. Tuy nhiên, việc khuyến nghị các tác giả

có các nghiên cứu liên quan đến nhau để hợp tác trong tương lai còn chưa được đưa vào

trong các mạng xã hội này. Đây cũng là những khuyến nghị rất có giá trị giúp cho các nhà

nghiên cứu tăng cường hợp tác để tạo ra các công trình khoa học mới trong tương lai. Bài

toán khuyến nghị các nhà nghiên cứu có tiềm năng hợp tác còn được gọi với tên là bài toán

khuyến nghị cộng tác trong mạng đồng tác giả. Trong luận án này, khái niệm “khuyến nghị

cộng tác” (“Collaborations Recommendation” được sử dụng trong [54]) mang hàm ý về sự

khuyến nghị hợp tác trong việc xuất bản bài báo khoa học giữa các nhà nghiên cứu (tác giả).

Ở đây, mạng đồng tác giả là một mạng xã hội trong đó các nút là các nhà khoa học, các cạnh

là các mối cộng tác khoa học giữa các nhà khoa học.

Bài toán khuyến nghị cộng tác trong mạng đồng tác giả được phát biểu như sau:

Cho thông tin về các tác giả đã từng viết chung bài báo khoa học đến thời điểm t,

với một tác giả u nào đó, cần tìm ra một danh sách tác giả có tiềm năng cộng tác

(Collaboration) với tác giả u trong tương lai (từ thời điểm t’ > t).

pdf 108 trang dienloan 8540
Bạn đang xem 20 trang mẫu của tài liệu "Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác

Luận án Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác
 BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI 
Phạm Minh Chuẩn 
NGHIÊN CỨU VÀ PHÁT TRIỂN MỘT SỐ ĐỘ ĐO LIÊN KẾT 
TRONG BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC 
Ngành: Hệ thống thông tin 
Mã số: 9480104 
LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN 
NGƯỜI HƯỚNG DẪN KHOA HỌC: 
 1. PGS.TS. Lê Thanh Hương 
 2. PGS.TS. Trần Đình Khang 
Hà Nội - 2018 
2 
LỜI CAM ĐOAN 
Tôi xin cam đoan tất cả các nội dung trong luận án “Nghiên cứu và phát triển một số 
độ đo liên kết trong bài toán khuyến nghị cộng tác” là công trình nghiên cứu của riêng tôi, 
dưới sự hướng dẫn của PGS.TS. Lê Thanh Hương và PGS.TS. Trần Đình Khang. Tất cả các 
kết quả, số liệu trong luận án là trung thực và chưa từng được ai công bố trong bất kỳ công 
trình này. 
 Hà Nội, ngày tháng năm 2018 
TM. TẬP THỂ HƯỚNG DẪN KHOA HỌC TÁC GIẢ LUẬN ÁN 
PGS.TS. Lê Thanh Hương Phạm Minh Chuẩn 
3 
LỜI CẢM ƠN 
Tôi xin bày tỏ lòng biết ơn tới Trường Đại học Bách khoa Hà Nội, Viện Công nghệ 
Thông tin và Truyền thông, Bộ môn Hệ thống thông tin đã tạo điều kiện thuận lợi cho tôi 
trong quá trình học tập tại Trường. 
Tôi muốn gửi lời cảm ơn đặc biệt tới tập thể hướng dẫn trực tiếp là 
PGS.TS. Lê Thanh Hương và PGS.TS. Trần Đình Khang. Thầy và cô đã luôn tận tình giúp 
đỡ, đưa ra những lời khuyên, những định hướng khoa học rất quý báu để tôi có thể triển khai 
và hoàn thành công việc nghiên cứu của mình. Đồng thời tôi cũng xin cảm ơn TS. Lê Hoàng 
Sơn Trung tâm Tính toán Hiệu năng cao – ĐH KHTN – ĐHQGHN đã tạo điều kiện, giúp 
đỡ tôi hoàn thành luận án này. 
Xin chân thành cảm ơn các thầy cô, các đồng nghiệp trong Bộ môn Hệ thống Thông 
tin, Viện Công nghệ Thông tin và Truyền thông, Trường Đại học Bách khoa Hà Nội nơi tôi 
học tập, thực hiện đề tài nghiên cứu đã nhiệt tình giúp đỡ và động viên tôi trong suốt quá 
trình nghiên cứu. Xin cám ơn các bạn sinh viên thuộc Bộ môn Hệ thống thông tin, Viện 
CNTT & TT, đặc biệt là bạn Nguyễn Đăng Tuấn Anh lớp kỹ sư tài năng CNTT K58 đã hỗ 
trợ tôi trong việc thu thập dữ liệu để phục vụ cho quá trình thực nghiệm. 
Cảm ơn Khoa Công nghệ Thông tin và Trường Đại học Sư phạm Kỹ thuật Hưng Yên, 
nơi tôi đang công tác đã luôn tạo điều kiện cho tôi trong suốt quá trình nghiên cứu và hoàn 
thành luận án này. 
Xin gửi lời cám ơn đến các thầy cô, các nhà khoa học, các đồng nghiệp và bạn bè thân 
hữu đã động viên và giúp đỡ tôi trong quá trình nghiên cứu. 
Cuối cùng tôi muốn bày tỏ lòng biết ơn sâu sắc tới gia đình, nơi nuôi dưỡng và là nguồn 
động lực để tôi vượt mọi trở ngại khó khăn để hoàn thành luận án này. 
 Nghiên cứu sinh 
 Phạm Minh Chuẩn 
4 
MỤC LỤC 
LỜI CAM ĐOAN .................................................................................................................. 2 
LỜI CẢM ƠN ........................................................................................................................ 3 
MỤC LỤC ............................................................................................................................. 4 
GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ............................................................ 6 
DANH MỤC CÁC BẢNG .................................................................................................... 8 
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ ............................................................................ 9 
MỞ ĐẦU ............................................................................................................................. 11 
1. TỔNG QUAN VỀ BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC ................................. 16 
1.1 Bài toán khuyến nghị cộng tác trong mạng đồng tác giả ........................................... 16 
1.1.1 Mạng xã hội và mạng đồng tác giả ..................................................................... 16 
1.1.2 Bài toán khuyến nghị cộng tác ........................................................................... 20 
1.1.3. Tổng quan về các độ đo liên kết trong mạng đồng tác giả ................................ 26 
1.2. Một số kiến thức liên quan ....................................................................................... 34 
1.2.1. Các phương pháp phân lớp ................................................................................ 34 
1.2.2 Phân cụm mờ và phân cụm bán giám sát mờ ..................................................... 38 
1.2.3. Phân tích theo chủ đề ......................................................................................... 41 
1.3. Kết luận..................................................................................................................... 43 
2. CÁC ĐỘ ĐO LIÊN KẾT MỞ RỘNG TRONG MẠNG ĐỒNG TÁC GIẢ ............... 44 
2.1. Độ đo liên kết dựa trên trọng số mở rộng ................................................................. 44 
2.2. Các độ đo liên kết dựa trên nội dung bài báo ........................................................... 46 
2.3. Thuật toán tính độ đo liên kết và đánh giá độ phức tạp của thuật toán .................... 50 
2.4. Đánh giá các độ đo liên kết trong mạng đồng tác giả............................................... 58 
2.4.1. Chuẩn bị dữ liệu ................................................................................................ 58 
2.4.2. Kịch bản thực nghiệm........................................................................................ 60 
2.4.3. Kết quả thực nghiệm.......................................................................................... 63 
2.5 Kết luận...................................................................................................................... 77 
3. BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC ................................................................ 78 
5 
3.1. Giới thiệu .................................................................................................................. 78 
3.2. Khuyến nghị cộng tác mới ........................................................................................ 79 
3.3. Khuyến nghị cộng tác tăng cường ............................................................................ 88 
3.3. Kết luận..................................................................................................................... 96 
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................. 97 
TÀI LIỆU THAM KHẢO ................................................................................................... 99 
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ............................ 108 
6 
GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 
Chữ viết tắt Chữ viết đầy đủ Giải thích 
AA Adamic & Adar Độ đo liên kết AA 
AUC Area under the curve Tiêu chí đánh giá phân lớp 
CN Common Neighbours Độ đo liên kết láng giềng chung 
JC Jaccard Coefficient Độ đo liên kết JC 
LDA Latent Dirichlet Allocation Phương pháp phân tích chủ đề 
OSN Online Social Network Mạng xã hội trực tuyến 
OHUSN 
Online HomogeneousUndirected 
Social Networks 
Mạng xã hội vô hướng đồng nhất 
trực tuyến 
SMO Sequential Minimal Optimization Tối ưu hóa cực tiểu lần lượt 
SVM Support Vector Machines Máy véc-tơ hỗ trợ 
WAA Weighted Adamic & Adar 
Độ đo liên kết trọng số dựa trên 
AA 
WCN Weighted Common Neighbours 
Độ đo liên kết trọng số dựa trên 
láng giềng chung 
WJC Weighted Jaccard Coefficient 
Độ đo liên kết trọng số dựa trên 
JC 
TF-IDF 
Term Frequency - Inverse 
Document Frequency 
Trọng số từ 
SPIRES 
Stanford Public Information 
Retrieval System 
Hệ thống truy xuất thông tin công 
khai Stanford 
NCSTRL 
Networked Computer Science 
Technical Reference Library 
Mạng thư viện tham chiếu khoa 
học máy tính 
AMC 
 Applied Mathematics and 
Computation 
Tạp chí toán ứng dụng và tính 
toán 
BJ Biophysical Journal Tạp chí lý sinh 
CF Collaborative Filtering Lọc cộng tác 
CB Content-based Dựa trên nội dung 
7 
KMC Keywords match count Đếm các từ khóa chung 
AKMC Abtract keywords match count 
Đếm các từ chung trong nội dung 
tóm tắt 
FCM Fuzzy C-means Phân cụm mờ 
SSSFC 
Semi-Supervised Standard Fuzzy 
Clustering 
Phân cụm bán giám sát mờ 
8 
DANH MỤC CÁC BẢNG 
Bảng 1.1 Danh sách các quan hệ cộng tác và các bài báo .................................................. 19 
Bảng 1.2 Các phương pháp phân lớp được sử dụng ........................................................... 33 
Bảng 2.1 Thống kê trên các bộ dữ liệu ............................................................................... 59 
Bảng 2.2 Thống kê tập dữ liệu ............................................................................................ 60 
Bảng 2.3 Kịch bản thực nghiệm với các độ đo liên kế ....................................................... 60 
Bảng 2.4 Kịch bản thực nghiệm với các độ đo liên kết mở rộng ........................................ 61 
Bảng 2.5 Các độ đo liên kết tổ hợp sử dụng khi phân lớp với kịch bản 2 .......................... 62 
Bảng 2.6 Các độ đo liên kết tổ hợp sử dụng khi phân lớp với kịch bản 3 .......................... 62 
Bảng 2.7 Giá trị Recall@N với các tham số tối ưu trên AMC ........................................... 65 
Bảng 2.8 Giá trị Recall ứng với các tham số tối ưu trên BJ ................................................ 67 
Bảng 2.9 Giá trị chỉ số đánh giá trên AMC đối với các tổ hợp độ đo liên kết trọng số và mở 
rộng ............................................................................................................................ 69 
Bảng 3.1 Thống kê các tập dữ liệu ...................................................................................... 83 
Bảng 3.2 Tập các đặc trưng trong thực nghiệm khuyến nghị cộng tác mới ....................... 83 
Bảng 3.3 Số chủ đề tối ưu ứng với các tổ hợp đặc trưng trên các bộ dữ liệu ..................... 84 
Bảng 3.4 Giá trị chỉ số Recall trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu
 .................................................................................................................................... 84 
Bảng 3.5 Giá trị chỉ số Precision trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu
 .................................................................................................................................... 84 
Bảng 3.6 Giá trị chỉ số F1-measure trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ 
liệu .............................................................................................................................. 85 
Bảng 3.7 Số chủ đề tối ưu ứng với các tổ hợp đặc trưng trên các bộ dữ liệu ..................... 85 
Bảng 3.8 Giá trị chỉ số Recall trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu
 .................................................................................................................................... 85 
Bảng 3.9 Giá trị chỉ số Precision trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ liệu
 .................................................................................................................................... 86 
Bảng 3.10 Giá trị chỉ số F1-measure trung bình ứng với các tổ hợp đặc trưng trên các bộ dữ 
liệu .............................................................................................................................. 86 
Bảng 3.11 So sánh giá trị chỉ số F1-measure giữa trọng số cộng tác theo công thức (1.1) và 
(3.1) ứng với từng tác giả được khuyến nghị. ............................................................ 95 
9 
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ 
Hình 1.1 Tiếp cận dự đoán liên kết dựa trên các độ đo liên kết ......................................... 17 
Hình 1.2 Tiếp cận dự đoán liên kết dựa trên phân lớp ........................................................ 18 
Hình 1.3 Minh họa mạng đồng tác giả với dữ liệu trong Bảng 1.1 từ năm 2000 đến 2002 
dưới dạng đồ thị ......................................................................................................... 19 
Hình 1.4 Quá trình sinh của LDA (Nguồn [10]) ................................................................. 42 
Hình 2.1 Minh họa độ đo liên kết mở rộng ......................................................................... 46 
Hình 2.2 So sánh chỉ số đánh giá Recall@N giữa các độ đo liên kết trọng số trên AMC . 63 
Hình 2.3 So sánh chỉ số đánh giá Recall@N giữa các độ đo liên kết trọng số trên BJ ...... 63 
Hình 2.4 Giá trị Recall@N với số lượng chủ đề và tham số  đối với LDAcosin trên AMC
 .................................................................................................................................... 64 
Hình 2.5 So sánh các độ đo liên kết trọng số (#CN) với các độ đo liên kết mở rộng trên 
AMC ........................................................................................................................... 65 
Hình 2.6 So sánh các độ đo liên kết trọng số (#AA) với các độ đo liên kết mở rộng trên 
AMC ........................................................................................................................... 65 
Hình 2.7 So sánh các độ đo liên kết trọng số (#JC) với các độ đo liên kết mở rộng trên AMC
 .................................................................................................................................... 66 
Hình 2.8 Giá trị Recall ứng với số lượng chủ đề và tham số  đối với độ đo liên kết LDAcosin 
trên BJ ........................................................................................................................ 66 
Hình 2.9 So sánh các độ đo liên kết trọng số (#CN) với các độ đo liên kết mở rộng trên BJ
 .................................................................................................................................... 67 
Hình 2.10 So sánh các độ đo liên kết trọng số (#AA) với các độ đo liên kết mở rộng trên BJ
 .................................................................................................................................... 68 
Hình 2.11 So sánh các độ đo liên kết trọng số (#JC) với các độ đo liên kết mở rộng trên BJ
 .................................................................................................................................... 68 
Hình 2.12 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight1, và 
Weight1_#) trên AMC ............................................................................................... 69 
Hình 2.13 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight2, và 
Weight2_#) trên AMC ............................................................................................... 70 
Hình 2.14 So sánh các tiêu chí đánh giá của các tổ hợp độ đo liên kết (Weight3, và 
Weight3_#) trên AMC ............................................................................................... 70 
Hình 2.15 So sánh giá trị AUC ứng với các tổ hợp độ đo liên kết (Weight#, và Weight#_# ... . 
[36] J. Golbeck and J. Hendler (2006, January) "Filmtrust: Movie recommendations 
using trust in web-based social networks," In Proceedings of the IEEE 
102 
Consumer communications and networking conference, Vol. 96, No. 1, pp. 282-
286. 
[37] Y. Guisheng, Y. Wansi and D. Yuxin (2014) "A new link prediction algorithm: 
node link strength algorithm," in Computer Applications and Communications 
(SCAC), 2014 IEEE Symposium on, IEEE, pp. 5-9. 
[38] I. Günes, S. Gündüz-Öüdücü and Z. Çataltepe (2016) "Link prediction using 
time series of neighborhood-based node similarity scores," Data Mining and 
Knowledge Discovery, vol. 30, no. 1, pp. 147-180. 
[39] S. Gupta, S. Pandey and K. K. Shukla (2015) "Comparison analysis of link 
prediction algorithms in social network," International Journal of Computer 
Applications, vol. 111, no. 16.. 
[40] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann and I. H. Witten 
(2009) "The WEKA data mining software: an update," ACM SIGKDD 
explorations newsletter, vol. 11, no. 1, pp. 10-18. 
[41] T. Hofmann (2004) "Latent semantic models for collaborative filtering," ACM 
Transactions on Information Systems (TOIS), vol. 22, no. 1, pp. 89-115. 
[42] T. Hofmann and D. Hartmann (2005) "Collaborative filtering with privacy via 
factor analysis," in In Proceedings of the 2005 ACM symposium on applied 
computing. 
[43] N. M. A. Ibrahim and L. Chen (2015) "Link prediction in dynamic social 
networks by integrating different types of information," Applied Intelligence, 
vol. 42, no. 4, pp. 738-750. 
[44] G. Jeh and J. Widom (2002) "SimRank: a measure of structural-context 
Silarity," in In Proceedings of the eighth ACM SIGKDD international 
conference on Knowledge discovery and data mining. 
[45] T. Karagiannis and M. Vojnovic (2009, April) "Behavioral profiles for 
advanced email features," In Proceedings of the 18th international conference 
on World wide web, pp. 711-720, ACM. 
[46] L. Katz (1953) "A new status index derived from sociometric analysis," 
Psychometrika, vol. 18, no. 1, pp. 39-43. 
[47] H. Kautz, B. Selman and M. Shah (1997) "Referral Web: combining social 
networks and collaborative filtering," Communications of the ACM, 40(3), 63-
65. 
103 
[48] Y. Koren (2008) "Factorization meets the neighborhood: a multifaceted 
collaborative filtering model," in In Proceedings of the 14th ACM SIGKDD 
international conference on Knowledge discovery and data mining. 
[49] M. Kubat and S. Matwin (1997) "Addressing the curse of imbalanced training 
sets: one-sided selection," in ICML, vol. 97, pp. 179-186. 
[50] D. H. Lee, P. Brusilovsky and T. Schleyer (2011) "Recommending 
collaborators using social features and mesh terms," Proceedings of the 
Association for Information Science and Technology, vol. 48, no. 1, pp. 1-10. 
[51] D. Liben‐Nowell and J. Kleinberg (2007) "The link‐prediction problem for 
social networks," Journal of the Association for Information Science and 
Technology, vol. 58, no. 7, pp. 1019-1031. 
[52] R. N. Lichtenwalter, J. T. Lussier and N. V. Chawla (2010) "New perspectives 
and methods in link prediction.," in In Proceedings of the 16th ACM SIGKDD 
international conference on Knowledge discovery and data mining. 
[53] J. X. F. Li, W. Wang, Z. Chen, N. Y. Asabere and H. Jiang (2014) "Acrec: a co-
authorship based random walk model for academic collaboration 
recommendation," in Proceedings of the 23rd International Conference on 
World Wide Web, ACM, pp. 1209-1214. 
[54] G. R. Lopes, M. M. Moro, L. K. Wives and J. P. M. De Oliveira (2010) 
"Collaboration recommendation on academic social networks," in In 
International Conference on Conceptual Modeling. 
[55] J. Lu, X. Yuan and T. Yahagi (2007) “A method of face recognition based on 
fuzzy c-means clustering and associated sub-NNs,” IEEE Transactions on, 
Neural Networks, 18(1), 150-160. 
[56] Z. Lu, B. Savas, W. Tang and I. S. Dhillon (2010) "Supervised link prediction 
using multiple sources," in Data Mining (ICDM), 2010 IEEE 10th International 
Conference on, IEEE, pp. 923-928. 
[57] I. Makarov, O. Bulanov and L. E. Zhukov (2016) "Co-author recommender 
system," in In International Conference on Network Analysis. 
[58] A. Martin, V. Gayathri, G. Saranya, P. Gayathri and P. Venkatesan (2011) “A 
hybrid model for bankruptcy prediction using genetic algorithm, fuzzy c-means 
and MARS,” International Journal on Soft Computing ( IJSC ), 2(1), 12-24. 
104 
[59] V. Martínez, F. Berzal and J. C. Cubero (2017) "A survey of link prediction in 
complex networks," ACM Computing Surveys (CSUR), vol. 49, no. 4, p. 69. 
[60] D. W. McDonald (2003, April) "Recommending collaboration with social 
networks: a comparative evaluation," In Proceedings of the SIGCHI conference 
on Human factors in computing systems, pp. 593-600, ACM. 
[61] M. Mitzenmacher (2004) "A brief history of generative models for power law 
and lognormal distributions," Internet mathematics, vol. 1, no. 2, pp. 226-251. 
[62] J. Mori, Y. Kajikawa, H. Kashima and I. Sakata (2012) "Machine learning 
approach for finding business partners and building reciprocal relationships., 
39(12), .," Expert Systems with Applications, vol. 39, no. 12, pp. 10402-10407. 
[63] L. Munasinghe (2013) Time-aware methods for link prediction in social 
networks (Doctoral dissertation, Ph. D. thesis, The Graduate University for 
Advanced Studies). 
[64] T. Murata and S. Moriyasu (2007) "Link prediction of social networks based on 
weighted proximity measures," in the IEEE/WIC/ACM international conference 
on In Web Intelligence. 
[65] M. E. Newman (2001) "Scientific collaboration networks. I. Network 
construction and fundamental results," Physical review E, vol. 64, no. 1, p. 
016131. 
[66] M. E. Newman (2001) "Scientific collaboration networks. II. Shortest paths, 
weighted networks, and centrality," Physical review E, p. 016132. 
[67] M. E. Newman (2001) "Clustering and preferential attachment in growing 
networks," Physical review E, vol. 64, no. 2, p. 025102. 
[68] M. E. Newman (2004) "Who is the best connected scientist? A study of 
scientific coauthorship networks," in Complex networks, Springer, Berlin, 
Heidelberg, pp. 337-370. 
[69] H. Ogata, Y. Yano, N. Furugori and Q. Jin (2001) "Computer supported social 
networking for augmenting cooperation", Computer Supported Cooperative 
Work (CSCW), 10(2), 189-209. 
[70] M. Pavlov and R. Ichise (2007) "Finding experts by link prediction in co-
authorship networks," in In Proceedings of the 2nd International Conference on 
Finding Experts on the Web with Semantics-Volume 290. 
105 
[71] J. Platt (1998) "Sequential minimal optimization: A fast algorithm for training 
support vector machines". 
[72] J. R. Quinlan (2014) C4. 5: programs for machine learning, Elsevier. 
[73] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom and J. Riedl (1994) 
"GroupLens: an open architecture for collaborative filtering of netnews," in 
Proceedings of the 1994 ACM conference on Computer supported cooperative 
work, ACM, pp. 175-186. 
[74] M. R. Rezaee, P. M. Van der Zwet, B. P. Lelieveldt, R. J. Van Der Geest and J. 
H. Reiber (2000) “A multiresolution image segmentation technique based on 
pyramidal segmentation and fuzzy clustering,” IEEE Transactions on, Image 
Processing, 9(7), 1238-1248. 
[75] M. Sachan and R. Ichise (2010) "Using abstract information and community 
alignment information for link prediction," in In Machine Learning and 
Computing (ICMLC), 2010 Second International Conference on. 
[76] G. Salton and M. J. McGill (1987) Introduction to Modern Information 
Retrieval, New York: Mc. 
[77] B. Sarwar, G. Karypis, J. Konstan and J. Riedl (2001) "Item-based collaborative 
filtering recommendation algorithms," in In Proceedings of the 10th 
international conference on World Wide Web. 
[78] B. Sarwar, G. Karypis, J. Konstan and J. Riedl (2002) "Incremental singular 
value decomposition algorithms for highly scalable recommender systems," in 
In Fifth International Conference on Computer and Information Science. 
[79] S. Scellato, A. Noulas and C. Mascolo (2011) "Exploiting place features in link 
prediction on location-based social networks. (pp. ).," in In Proceedings of the 
17th ACM SIGKDD international conference on Knowledge discovery and data 
mining. 
[80] F. Schneider, A. Feldmann, B. Krishnamurthy and W. Willinger (2009) 
"Understanding online social network usage from a network perspective," in In 
Proceedings of the 9th ACM SIGCOMM conference on Internet measurement 
conference. 
[81] U. Shardanand and P. Maes (1995) "Social information filtering: algorithms for 
automating “word of mouth”," in Proceedings of the SIGCHI conference on 
Human factors in computing systems, ACM Press/Addison-Wesley Publishing 
Co., pp. 210-217. 
106 
[82] N. Shibata, Y. Kajikawa and I. Sakata (2012) "Link prediction in citation 
networks," Journal of the Association for Information Science and Technology, 
vol. 63, no. 1, pp. 75-85. 
[83] J. Tang, S. Wu, J. Sun and H. Su (2012) "Cross-domain collaboration 
recommendation.," in In Proceedings of the 18th ACM SIGKDD international 
conference on Knowledge discovery and data mining. 
[84] A. Töscher, M. Jahrer and R. Legenstein (2008) "Improved neighborhood-based 
algorithms for large-scale recommender systems," in Proceedings of the 2nd 
KDD Workshop on Large-Scale Recommender Systems and the Netflix Prize 
Competition, ACM, p. 4. 
[85] S. H. Walker and D. B. Duncan (1967) "Estimation of the probability of an 
event as a function of several independent variables," Biometrika, vol. 54, no. 
1-2, pp. 167-179. 
[86] C. Wang and D. M. Blei (2011, August) "Collaborative topic modeling for 
recommending scientific articles," In Proceedings of the 17th ACM SIGKDD 
international conference on Knowledge discovery and data mining, pp. 448-
456, ACM. 
[87] C. Wang, V. Satuluri and S. Parthasarathy (2007) "Local probabilistic models 
for link prediction," in In Data Mining, 2007. ICDM 2007. Seventh IEEE 
International Conference on. 
[88] P. Wang, B. Xu, Y. Wu and X. Zhou (2015) "Link prediction in social networks: 
the state-of-the-art," Science China Information Sciences, vol. 58, no. 1, pp. 1-
38. 
[89] S. Wasserman and K. Faust (1994) "Social Network Analysis in the Social and 
Behavioral Sciences," in Social Network Analysis: Methods and Applications, 
Cambridge University Press, pp. 1-27. 
[90] D. Whitley (1994) "A genetic algorithm tutorial," Statistics and computing, vol. 
4, no. 2, pp. 65-85. 
[91] B. Whitman and S. Lawrence (2002) "Inferring Descriptions and Similarity for 
Music from Community Metadata," in ICMC. 
[92] T. Wohlfarth and R. Ichise (2008) "Semantic and Event-Based Approach for 
Link Prediction," In Proceedings of the 7th International Conference on 
Practical Aspects of Knowledge Management (PAKM), Yokohama - Japan. 
107 
[93] S. Wu, J. Sun and J. Tang (2013) "Patent partner recommendation in enterprise 
social networks," In Proceedings of the sixth ACM international conference on 
Web search and data mining. 
[94] F. Xia, Z. Chen, W. Wang, J. Li and L. T. Yang (2014) "Mvcwalker: Random 
walk-based most valuable collaborators recommendation exploiting academic 
factors," IEEE Transactions on Emerging Topics in Computing, vol. 2, no. 3, 
pp. 364-375. 
[95] S. Xie and Y. Feng (2015, April) "A recommendation system combining LDA 
and collaborative filtering method for Scenic Spot," In Information Science and 
Control Engineering (ICISCE), 2015 2nd International Conference on, pp. 67-
71, IEEE. 
[96] J. Yang, L. Yang and P. Zhang (2015) "A New Link Prediction Algorithm 
Based on Local Links," in International Conference on Web-Age Information 
Management, Springer, pp. 16-28. 
[97] Z. Yang, R. Hu and R. Zhang (2016) "An improved link prediction algorithm 
based on common neighbors index with community membership information," 
in Software Engineering and Service Science (ICSESS), 2016 7th IEEE 
International Conference on, IEEE, pp. 90--93. 
[98] L. Yao, L. Wang, L. Pan and K. Yao (2016) "Link Prediction Based on 
Common-Neighbors for Dynamic Social Network," Procedia Computer 
Science, vol. 83, pp. 82-89. 
[99] E. Yasunori, H. Yukihiro, Y. Makito and M. Sadaaki (2009) "On semi-
supervised fuzzy c-means clustering," in Fuzzy Systems, 2009. FUZZ-IEEE 
2009. IEEE International Conference on, IEEE, pp. 1119-1124. 
[100] Q. Yu, C. Long, Y. Lv, H. Shao, P. He and Z. Duan (2014) "Predicting co-
author relationship in medical co-authorship networks," PloS one, p. e101214. 
[101] O. R. Zaiane, J. Chen and R. Goebel (2007, August) "DBconnect: mining 
research community on DBLP data," In Proceedings of the 9th WebKDD and 
1st SNA-KDD 2007 workshop on Web mining and social network analysis, pp. 
74-81, ACM. 
[102] J. Zhang and S. Y. Philip (2014) "Link prediction across heterogeneous social 
networks: A survey," SOCIAL NETWORKS. 
108 
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 
CỦA LUẬN ÁN 
1. Phạm Minh Chuẩn, Lê Thanh Hương, Trần Đình Khang, Trần Ngọc Cương (2011). 
Hệ thống khuyến nghị bài báo. Tạp chí Nghiên cứu khoa học và công nghệ quân sự, 
Số 16, 12.2011, ISSN 1859-1043, trang 136-145. 
2. Phạm Minh Chuẩn, Trịnh Khắc Linh, Trần Đình Khang, Lê Hoàng Sơn (2017). Phân 
tích sự ảnh hưởng của một số độ đo liên kết áp dụng vào bài toán dự đoán liên kết 
trong mạng đồng tác giả. Kỷ yếu Hội nghị Quốc gia lần thứ X về Nghiên cứu cơ bản 
và ứng dụng Công nghệ thông tin (FAIR) – Đà Nẵng, 17-18/8/2017. ISBN: 978-604-
913-614-6, trang 760-767. 
3. Pham Minh Chuan, Cu Nguyen Giap, Le Hoang Son, Chintan Bhatt, Tran Dinh 
Khang (2017), Enhance Link Prediction in Online Social Networks Using Similarity 
Metrics, Sampling and Classification, Proceeding of the 2017 4th International 
Conference on Information System Design and Intelligent Applications (INDIA-
2017), 15-17 June 2017, Danang, Vietnam, pp. 823 - 833, DOI 
= https://doi.org/10.1007/978-981-10-7512-4_81. 
4. Phạm Minh Chuẩn, Trần Đình Khang, Lê Thanh Hương, Trần Mạnh Tuấn, Lê Hoàng 
Sơn (2017). Dự đoán liên kết đồng tác giả sử dụng phân cụm bán giám sát mờ. 
Chuyên san Khoa học Tự nhiên – Kỹ thuật – Công nghệ (Đại học Thái Nguyên), Tập 
173, số 13, ISSN 1859-2171, trang 45-50. 
5. Pham Minh Chuan, Le Hoang Son, Mumtaz Ali, Tran Dinh Khang, Le Thanh Huong, 
Nilanjan Dey (2017). Link Prediction in Co-authorship Networks based on Hybrid 
Content Silarity Metric. Applied Intelligence, ISSN: 0924-669X. doi: 
10.1007/s10489-017-1086-x. (SCI, 2016 IF = 1.904, Springer) 
6. Phạm Minh Chuẩn, Lê Hoàng Sơn, Trần Đình Khang, Lê Thanh Hương (2017). Đề 
xuất mô hình khuyến nghị cộng tác mới cho mạng đồng tác giả dựa trên chỉ số cộng 
tác và tương quan. Tạp chí Khoa học và Công nghệ Việt Nam, Tập 22, Số 11, 
11.2017, ISSN 1859-4794, trang 9-14. 

File đính kèm:

  • pdfnghien_cuu_va_phat_trien_mot_so_do_do_lien_ket_trong_bai_toa.pdf