Tóm tắt Luận án Phân tích ảnh hưởng của trễ truyền thông đến hiệu năng của hệ thống tính toán song song
Khi nghiên cứu về các hệ thống tính toán song song thì một
vấn đề rất quan trọng thường hay đề cập đến, đó chính là Hiệu
năng. Trên thực tế, khi thêm các nút tính toán vào hệ thống thì
mong muốn của chúng ta là hiệu năng hay tốc độ sẽ tăng lên tương
ứng. Tuy nhiên, một điều rất rõ ràng là tốc độ tăng lên này sẽ có
xu hướng giảm dần. Có rất nhiều nguyên nhân ảnh hưởng đến hiệu
năng của toàn bộ hệ thống, có thể kể ra như: cấu hình mạng liên
kết, các trễ truyền thông, kiến trúc bộ nhớ chia sẻ, kiến trúc cache,
kiến trúc chip đa lõi, thuật toán của người dùng, công cụ phần
mềm hỗ trợ lập trình song song v.v.
Như vậy, việc xác định và phân tích rõ ảnh hưởng của các yếu
tố kể đến hiệu năng của hệ thống là một bài toán vô cùng quan
trọng và cần thiết bởi khi đã xác định rõ được sự ảnh hưởng của
các thông số này, người ta hoàn toàn có thể điều chỉnh chúng để
có được hiệu năng tốt nhất cho hệ thống.
Luận án này sẽ đi vào nghiên cứu phân tích hiệu năng của các
hệ thống tính toán song song, trong đó tập trung nghiên cứu sâu
ảnh hưởng của trễ truyền thông đến hiệu năng của hệ thống.
Tóm tắt nội dung tài liệu: Tóm tắt Luận án Phân tích ảnh hưởng của trễ truyền thông đến hiệu năng của hệ thống tính toán song song
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
NGUYỄN MINH QUÝ
PHÂN TÍCH ẢNH HƯỞNG CỦA TRỄ TRUYỀN THÔNG
ĐẾN HIỆU NĂNG CỦA HỆ THỐNG TÍNH TOÁN
SONG SONG
CHUYÊN NGÀNH: KỸ THUẬT PHẦN MỀM
MÃ SỐ: 62480103
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT PHẦN MỀM
Hà Nội – 2015
Công trình được hoàn thành tại:
Trường Đại học Bách khoa Hà Nội
Người hướng dẫn khoa học:
- PGS.TS Huỳnh Quyết Thắng
- TS Hồ Khánh Lâm
Phản biện 1: GS.TS Vũ Đức Thi
Phản biện 2: PGS.TS Hà Hải Nam
Phản biện 3: PGS.TS Ngô Quốc Tạo
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ
cấp trường họp tại Trường Đại học Bách khoa Hà Nội
Vào hồi .. giờ, ngày .. tháng .. năm
Có thể tìm hiểu luận án tại:
1. Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội
2. Thư viện Quốc gia Việt Nam
1
MỞ ĐẦU
1. Lý do chọn đề tài
Khi nghiên cứu về các hệ thống tính toán song song thì một
vấn đề rất quan trọng thường hay đề cập đến, đó chính là Hiệu
năng. Trên thực tế, khi thêm các nút tính toán vào hệ thống thì
mong muốn của chúng ta là hiệu năng hay tốc độ sẽ tăng lên tương
ứng. Tuy nhiên, một điều rất rõ ràng là tốc độ tăng lên này sẽ có
xu hướng giảm dần. Có rất nhiều nguyên nhân ảnh hưởng đến hiệu
năng của toàn bộ hệ thống, có thể kể ra như: cấu hình mạng liên
kết, các trễ truyền thông, kiến trúc bộ nhớ chia sẻ, kiến trúc cache,
kiến trúc chip đa lõi, thuật toán của người dùng, công cụ phần
mềm hỗ trợ lập trình song song v.v...
Như vậy, việc xác định và phân tích rõ ảnh hưởng của các yếu
tố kể đến hiệu năng của hệ thống là một bài toán vô cùng quan
trọng và cần thiết bởi khi đã xác định rõ được sự ảnh hưởng của
các thông số này, người ta hoàn toàn có thể điều chỉnh chúng để
có được hiệu năng tốt nhất cho hệ thống.
Luận án này sẽ đi vào nghiên cứu phân tích hiệu năng của các
hệ thống tính toán song song, trong đó tập trung nghiên cứu sâu
ảnh hưởng của trễ truyền thông đến hiệu năng của hệ thống.
2. Mục tiêu nghiên cứu
Mục tiêu nghiên cứu của luận án là phân tích ảnh hưởng của
trễ truyền thông (Communication Overhead) tới hiệu năng của hệ
thống tính toán song song và đề xuất công thức tính toán trễ truyền
thông ứng với một số cấu trúc mạng liên kết phổ biến. Ngoài ra,
luận án tiến hành thiết kế và thử nghiệm phần mềm thám mã mật
khẩu trong MS Office Word chạy trên nền hệ thống tính toán song
song để cho thấy rõ sự ảnh hưởng của trễ truyền thông đến hiệu
năng của hệ thống. Phương pháp lý thuyết được sử dụng để phân
tích trễ truyền thông trong luận án là mạng hàng đợi và mạng
Petri.
2
3. Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu của luận án là Trễ truyền thông trong
các hệ thống tính toán song song.
3.2 Phạm vi nghiên cứu
Do việc phân tích hiệu năng trong các hệ thống tính toán song
song có phạm vi rất rộng và phức tạp. Vì vậy, phạm vi nghiên cứu
của luận án là phân tích ảnh hưởng của trễ truyền thông đến hiệu
năng của các hệ thống tính toán song song. Các hệ thống tính toán
song song này chỉ gồm kiến trúc chip đa lõi và kiến trúc nối cụm.
Luận án cũng giả thiết các nút tham gia tính toán trong các hệ
thống cụm cũng như các lõi trong cùng một vi xử lý có cấu hình và
năng lực tính toán giống nhau, cùng hoàn thành công việc với
khoảng thời gian như nhau.
Ngoài ra, luận án cũng chỉ tập trung nghiên cứu đối với các hệ
thống tính toán song song mà ở đó sự trao đổi thông tin là không nhỏ
giữa các phần tử tính toán. Còn đối với các hệ thống tính toán mà
các phần tử ít trao đổi thông tin với nhau và ít phải chờ đợi, lệ thuộc
nhau về dữ liệu và tài nguyên thì có thể bỏ qua trễ này.
4. Ý nghĩa khoa học và thực tiễn của đề tài
4.1 Ý nghĩa khoa học
Về mặt khoa học, công thức đề xuất để tính trễ truyền thông
trong luận án có thể làm cơ sở để nghiên cứu tính trễ cho rất nhiều
các loại liên kết mạng khác nhau. Ngoài ra, phương pháp sử dụng
mạng Petri để phân tích hiệu năng là một cách tiếp cận mới ngoài
phương pháp truyền thống là sử dụng mô hình mạng hàng đợi.
4.2 Ý nghĩa thực tiễn
Kết quả nghiên cứu trong luận án có thể được sử dụng vào
việc lựa chọn loại liên kết mạng phù hợp nhất cho mỗi loại ứng
dụng với kích thước các gói tin khác nhau để giảm thiểu nhất trễ
3
truyền thông, từ đó có được hiệu năng cao nhất cho toàn bộ hệ
thống.
Dựa vào công thức tính toán trễ được đề xuất, các hệ thống
phần mềm tính toán có thể tìm các giải pháp về thuật toán trong
chương trình để giảm thiểu các truyền thông không cần thiết, tránh
được các trễ khi thực hiện giao tiếp giữa các nút tính toán.
Phần xây dựng chương trình và thuật toán thám mã mật khẩu
của MS Office Word có thể mở rộng để xử lý trên hệ thống với
nhiều nút tính toán hơn và có tích hợp các bộ tăng tốc đồ họa để
có thể giải quyết nhiều bài toán thám mã tương tự khác, như khôi
phục mật khẩu MS Excel, tệp zip, mật khẩu windows, v.v...
5. Đóng góp của luận án
Các kết quả chính của luận án, gồm:
Thứ nhất: Xây dựng được công thức tính trễ truyền thông
(Công thức 4.5) cho một số mạng liên kết trong hệ thống tính toán
song song ghép cụm. Công thức này có thể được sử dụng để tính
trễ truyền thông cho hầu hết các cấu trúc mạng liên kết đa xử lý
phổ biến như mạng liên kết lưới hai chiều (2Dmesh), lưới ba chiều
(3Dmesh), lưới vòng hai chiều (2Dtorus),...
Thứ hai: Tiến hành phân tích ảnh hưởng của mạng liên kết đến
hiệu năng của hệ thống tính toán song song có sử dụng chip đa lõi
thông qua sử dụng mạng hàng đợi đóng có nghiệm dạng tích các
xác suất và mạng Petri thời gian tổng quát.
Thứ ba: Tiến hành phân tích ảnh hưởng của trễ truyền thông
đến hiệu năng của hệ thống tính toán song song ghép cụm. Sử
dụng mạng hàng đợi CPFQN và mạng Petri để tiến hành phân tích
và đánh giá ảnh hưởng của mạng liên kết đến hiệu năng của hệ
thống cho các kiến trúc điển hình (lưới hai chiều, lưới vòng hai
chiều, lưới lưới ba chiều, lưới vòng ba chiều, siêu lập phương -
Hypercube).
Thứ tư: Thiết kế thuật toán và chương trình thám mã mật khẩu
MS Word chạy trên hệ thống cụm máy tính sử dụng bộ vi xử lý đa
lõi, có thể mở rộng chạy trên hệ thống nhiều nút tính toán.
4
6. Bố cục của luận án
Nội dung của luận án gồm 4 chương, cụ thể như sau:
- Chương 1: Trình bày tổng quan về các mô hình kiến trúc
tính toán song song, các kỹ thuật phân tích và phương pháp đánh
giá hiệu năng. Các nghiên cứu liên quan ở trong và ngoài nước về
lĩnh vực này cũng được đề cập và phân tích.
- Chương 2: Trình bày các cơ sở lý thuyết sẽ được sử dụng
trong luận án để phân tích hiệu năng, đó là mạng hàng đợi
(Queuing network) và mạng Petri (Petri net). Ngoài ra, luật
Amdalh cũng được phân tích và mở rộng trong trường hợp có tính
đến trễ truyền thông.
- Chương 3: Luận án đi vào phân tích ảnh hưởng của trễ
truyền thông đến hiệu năng của hệ thống tính toán song song có sử
dụng chip đa lõi. Luận án đề xuất công thức 4.5 để xác định trễ
truyền thông.
- Chương 4: Mở rộng đánh giá ảnh hưởng của trễ truyền
thông đến hiệu năng đối với hệ thống tính toán song song trong
môi trường cụm máy tính. Ngoài ra, chương này cũng thiết kế
thuật toán trình bày kết quả đánh giá hiệu năng và ảnh hưởng của
trễ truyền thông trên ứng dụng thực với bài toán thám mã mật
khẩu MS Office Word.
CHƯƠNG 1. TỔNG QUAN
1.1 Kiến trúc tính toán song song
1.1.1 Khái niệm
Tính toán song song là một dạng tính toán trong đó nhiều lệnh
được thực hiện đồng thời trên các đơn vị xử lý.
1.1.2 Các loại xử lý song song
Theo phân loại của Michael J. Flynn thì có hình thức song
song là: SISD, SIMD, MISD và MIMD.
1.1.3 Mô hình tính toán song song
a) Song song sử dụng CPU nhiều lõi (MultiCore chip).
b) Song song sử dụng các bộ tăng tốc (bộ xử lý đồ họa GPU).
c) Song song sử dụng các máy tính nối cụm.
5
d) Song song sử dụng mô hình kết hợp: Cụm, GPU,
MultiCore.
1.2 Hiệu năng trong kiến trúc tính toán song song
Có 3 tiêu chí quan trọng để đánh giá là: Thời gian thực thi,
tổng chi phí song song, mức độ tăng tốc, tính hiệu quả và tính mở
rộng.
1.2.1 Thời gian thực thi
Thời gian thực thi song song là khoảng thời gian bắt đầu quá
trình tính toán song song cho đến khi phần tử tính toán cuối cùng
kết thúc, ký hiệu là Tp
1.2.2 Tổng chi phí song song
Chi phí tiêu tốn bởi một chương trình song song được biểu
diễn bởi một biểu thức và được gọi là hàm chi phí (Overhead
function). Ký hiệu là To và To = pTp - Ts
1.2.3 Mức tăng tốc
Mức tăng tốc được định nghĩa là tỉ số giữa thời gian chạy trên
một đơn vị xử lý (tuần tự) và thời gian chạy trên hệ thống tính
toán song song.
1.2.4 Tính hiệu quả
Gọi p là số phần tử tham gia tính toán song song và Ep là mức
độ hiệu quả thì:
1.2.5 Tính mở rộng
Tính mở rộng đo khả năng tận dụng hiệu quả khi tăng số phần
tử xử lý. Các hệ thống mô phỏng có thể được dùng để tiên đoán
tính mở rộng của hệ thống.
1.3 Các kỹ thuật phân tích đánh giá hiệu năng
Để phân tích hiệu năng, có thể tiến hành theo một trong 3
phương pháp: Mô hình hóa, mô phỏng và đo lường.
1.3.1 Mô hình hóa
Sử dụng các mô hình toán học để phân tích như: Mạng hàng
đợi, mạng Petri.
6
1.3.2 Mô phỏng
Mô phỏng hệ thống bằng các công cụ phần mềm.
1.3.3 Đo lường
Thực hiện chạy hệ thống và dùng các phần cứng, phần mềm đo
các thông số cần quan tâm.
1.4 Trễ truyền thông trong các hệ thống tính toán song song
1.4.1 Các nguồn gây trễ
Bao gồm kiến trúc mạng liên kết, đồng bộ hóa, thời gian
truyền thông, thời gian nghỉ/chờ...
1.4.2 Mạng liên kết trong hệ thống tính toán song song
Trong hệ thống tính toán song song, các phần tử xử lý liên kết
với nhau qua một mạng liên kết, có thể là 2Dmesh, 2Dtorus,
3Dmesh, 3Dtorus, Hypercube, v.v....
1.5 Tổng quan về các nghiên cứu liên quan
a) Tình hình trong nước: Chưa có nhiều nghiên cứu và công
trình liên quan đến hệ thống xử lý song song. Dù các cơ sở đào tạo
và nghiên cứu về CNTT lớn như ĐHBKHN, ĐHQGHN,
ĐHQGHCM, Viện hàn lâm khoa học và công nghệ VN đã trang bị
hạ tầng tính toán...
b) Tình hình ngoài nước: Đã có nhiều nghiên cứu, tuy nhiên về
vấn đề trễ truyền thông vẫn còn nhiều việc tiếp tục cần phải
nghiên cứu, phát triển. Trong đó việc tính toán trễ truyền thông
trong công thức Amdahl mở rộng cho một số mạng liên kết cụ thể
cần được tính toán đề xuất.
1.6 Các nhiệm vụ trong luận án
- Nghiên cứu hướng tiếp cận đánh giá hiệu năng sử dụng mạng
hàng đợi đóng có nghiệm dạng tích và mạng Petri.
- Phân tích ảnh hưởng của trễ truyền thông đến hiệu năng của hệ
thống tính toán song song có sử dụng vi xử lý đa lõi cũng như
hệ thống máy tính ghép cụm.
7
- Triển khai thử nghiệm đánh giá ảnh hưởng của trễ truyền
thông đối với bài toán thám mã mật khẩu trong môi trường
tính toán song song.
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT CHO PHÂN TÍCH
HIỆU NĂNG
2.1 Hàng đợi và mạng hàng đợi
2.1.1 Hàng đợi
Mô hình hàng đợi cơ bản của một Trung tâm phục vụ bao gồm
các khách hàng tới một cách tuỳ ý và độc lập với nhau. Hệ thống
phục vụ có n điểm phục vụ (server), mỗi điểm phục vụ có khả
năng phục vụ một khách hàng ở một thời gian. Các thời gian phục
vụ cần thiết cho các khách hàng cũng được mô hình hóa như
những biến tuỳ ý.
2.1.2 Mạng hàng đợi
Mạng hàng đợi là các hệ thống mà chúng gồm một số tùy ý,
nhưng hữu hạn các hàng đợi được nối với nhau.
2.1.3 Mạng hàng đợi một lớp và nhiều lớp công việc
Mạng hàng đợi một lớp công việc là các công việc có cùng
thời gian phục vụ và xác suất định tuyến.
2.1.4 Các số đo hiệu năng của mạng hàng đợi 1 lớp công việc
Các số đo hiệu năng bao gồm: Xác suất biên, mức độ sử dụng,
thông lượng, thông lượng tổng, số lượng trung bình của các công
việc, độ dài trung bình của hàng đợi, thời gian đáp ứng trung bình,
thời gian chờ đợi trung bình.
2.1.5 Số đo hiệu năng của mạng hàng đợi nhiều lớp công việc
Các số đo này giống như các số đo của mạng hàng đợi một lớp
công việc, tuy nhiên công thức tính là khác nhau.
2.1.6 Các mạng hàng đợi có nghiệm dạng tích các xác suất
Bao gồm các mạng hàng đợi: BCMP, BCMP phiên bản 1 (cho
PFQN đóng) và BCMP phiên bản 2 (cho PFQN mở).
8
2.2 Mạng Petri
2.2.1 Giới thiệu mạng Petri
Petri Net (PN) là một đồ thị song hướng có trọng số gồm 4
thành phần: tập hợp các vị trí P (place), tập hợp các chuyển tiếp T
(transition), hàm vào I (input function) và hàm ra O (output
function): ),,,( OITPN (2.42)
2.2.2 Các đặc tính cơ bản của mạng Petri
Các đặc tính cơ bản của mạng Petri gồm: Tuần tự, đồng bộ, kết
hợp, song song hay tương tranh, đụng độ, hỗn độn, loại trừ lẫn
nhau, các ưu tiên, các chuyển tiếp cuối cùng, khóa chết.
2.2.3 Một số mạng Petri phổ biến
Trong mạng Petri, có một số loại mạng hay được sử dụng là
mạng Petri có màu, mạng Petri có đánh dấu, mạng Petri thời gian
ngẫu nhiên, mạng Petri màu ngẫu nhiên.
2.2.4 Phân tích mô hình mạng petri
Việc phân tích mô hình PN cho ta biết hành vi của hệ thống.
Có các kỹ thuật phân tích cấu trúc và các kỹ thuật phân tích không
gian trạng thái.
Các kỹ thuật phân tích cấu trúc gồm các phương pháp: ma trận
liên thuộc, các T-invariant và các S-invariant.
2.3 Luật Amdahl
2.3.1 Mức tăng tốc và hiệu năng
Biểu thức mức tăng tốc chung là:
),(
)(
)(
)()(
pn
p
n
n
nn
(2.56)
σ(n) - thời gian thực hiện phần tuần tự.
φ(n) - thời gian thực hiện phần có thể song song.
κ(n,p) - thời gian liên quan cho thực hiện song song.
2.3.2 Mức tăng tốc theo Luật Amdahl
Theo luật Amdahl, mức tăng tốc là:
9
pff
pn
/)1(
1
),(
(2.61)
2.3.3 Luật Amdahl mở rộng
Mức tăng tốc tính theo Luật Amdahl mở rộng bao gồm cả trễ
truyền thông, được tính bởi công thức:
Sp = 1/(f + tc/ts). Trong đó tc là trễ truyền thông.
CHƯƠNG 3. PHÂN TÍCH ẢNH HƯỞNG CỦA TRỄ
TRUYỀN THÔNG ĐẾN HIỆU NĂNG
CỦA HỆ THỐNG TÍNH TOÁN SONG SONG SỬ DỤNG
CHIP ĐA LÕI
3.1 Hiệu năng của kiến trúc chip đa lõi
3.1.1 Chip đa lõi SMC, AMC và DMC
Có 3 kiến trúc chip đa lõi phổ biến hiện nay là SMC (Symetric
Multicore Chip), AMC (Asymetric MC) và DMC (Dynamic MC).
3.1.2 Phân tích giá hiệu năng thông qua mức tăng tốc
Mức tăng tốc tương ứng với ba kiến trúc là:
frfn
rn
rn
rf
r
f
rnfSpSMC
)1(.1
1
),,( (3.6)
rffrnr
rrnr
rnr
f
r
f
rnfSpAMC
)1(1
1
),,( (3.7)
rffn
rn
n
f
r
f
rnfSpDMC
)1()1(
1
),,( (3.8)
10
3.2 Phân tích ảnh hưởng của mạng liên kết đến hiệu năng
của hệ thống tính toán song song có sử dụng chip đa lõi bằng
mạng hàng đợi đóng có nghiệm dạng tích các xác suất.
3.2.2 Phân tích ảnh hưởng của trễ truyền thông đến hiệu năng
Các kết quả mô phỏng cho thấy: sự thay đổi thời gian phục vụ
trung bình của mạng liên kết tỷ lệ tuyến tính với các thông số hiệu
năng của các lõi CPU. Do giá trị ban đầu của số công việc lớn (≥
1000), nên mức độ sử dụng của các lõi CPU đạt đến mức độ gần
tối đa, 0.9 – 1.0, thời gian chờ đợi (Queue time) tăng lên nhanh,
dẫn đến thông lượng của thông số hiệu năng của lõi CPU ... ảnh hưởng của mạng liên kết đến hiệu năng
của hệ thống tính toán song song có sử dụng chip đa lõi bằng
mạng Petri thời gian tổng quát - GSPN
3.3.1 Mô hình hóa hệ thống bằng GSPN
Với định nghĩa của GSPN và cơ chế thực thi trong kiến trúc
chip đa lõi, việc biểu diễn mô hình hệ thống cho ở Hình 3.5 hoàn
toán có thể biểu diễn bằng GSPN, như sau (Hình 3.13):
11
3.3.2 Mô phỏng hệ thống
Bảng
.1 Các đánh dấu
Các đánh
dấu
Giá trị
M0 0.32653
M1 0.16327
M2 0.16327
M3 0.08163
M4 0.08163
M5 0.08163
M6 0.04082
M7 0.04082
M8 0.02041
Bảng 3.3 Mật độ xác suất thẻ
μ=0 μ =1 μ =2
Core 2 0.14286 0.28571
.57143
L12Ch 1 0 0
L12Q 0.85714 0.14286 0
L12ready 0.42857 0.57143 0
L12Sers 0.57143 0.42857 0
L22Ch 1 0 0
L22Q 1 0 0
Bảng 3.2 Vị trí và số
thẻ trung bình
Vị trí
Số thẻ
trung bình
Core 2 1.42857
L12Ch 0
L12Q 0.14286
L12ready 0.57143
L12Sers 0.42857
L22Ch 0
L22Q 0
L22ready 1
L22Sers 0
Core 1 1.42857
L11Q 0.14286
L3Q 0
L3Sers 0
L11Sers 0.42857
L3ready 1
L3Ch 0
MemQ 0
Hình 3.13 Mô hình GSPN của vi xử lý đa lõi
12
L22ready 0 1 0
L22Sers 1 0 0
Core 1 0.14286 0.28571 0.57143
L11Q 0.85714 0.14286 0
L3Q 1 0 0
L3Sers 1 0 0
L11Sers 0.57143 0.42857 0
L3ready 0 1 0
L3Ch 1 0 0
MemQ 1 0 0
MemSers 1 0 0
Memready 0 1 0
L11Ch 1 0 0
L11ready 0.42857 0.57143 0
L21Q 1 0 0
L21Sers 1 0 0
L21ready 0 1 0
L21Ch 1 0 0
MemSers 0
Memready 1
L11Ch 0
L11ready 0.57143
L21Q 0
L21Sers 0
L21ready 1
L21Ch 0
Bảng 3.4 Các thời
gian lưu lại của các
đánh dấu
Marking Value
M0 0.5
M1 0.25
M2 0.25
M3 0.33333
M4 0.16667
M5 0.33333
M6 0.2
M7 0.2
M8 0.25
Bảng 3.5 Thông lượng của các
chuyển tiếp có trễ thời gian
Transition
Throuh
put
L12out 0.85714
L22Out 0
ReqL12 0.85714
ReqL22 0
ReqL11 0.85714
ReqL31 0
L3Out 0
L11Out 0.85714
ReqM 0
MemOut 0
ReqL32 0
ReqL21 0
L21Out 0
13
3.3.3 Kết luận
Ngoài công cụ phân tích hiệu năng sử dụng CPFQN, công cụ
GSPN cho phép dễ dàng mô hình các kiến trúc đa lõi trong đó có
thể phân tích được các đặc tính hành vi của hệ thống mà CPGQN
còn hạn chế. Việc kết hợp hai công cụ sẽ cho ta cách nhìn toàn
diện hơn về hệ thống cần phân tích, đồng thời cũng là cách để ta
kiểm chứng kết quả theo các cách tiếp cận khác nhau.
CHƯƠNG 4. PHÂN TÍCH ẢNH HƯỞNG CỦA TRỄ
TRUYỀN THÔNG ĐẾN HIỆU NĂNG CỦA HỆ THỐNG
TÍNH TOÁN SONG SONG GHÉP CỤM
4.1 Trễ truyền thông trong các hệ thống tính toán song song
ghép cụm
4.1.1 Hiệu năng của hệ thống tính toán soang song ghép cụm
- Gọi – overhead song song. Khi đó, tổng thời gian
thực hiện chương trình kích thước p trên máy tính song song
ghép cụm với n nút xử lý được xác định bằng:
(4.3)
- Luật Amdahl mở rộng cho mức tăng tốc có tính overhead
song song:
(4.4)
4.1.2 Ảnh hưởng của trễ truyền thông đến hiệu năng
Để phân tích ảnh hưởng của cấu hình mạng liên kết các nút
đến overhead song song, ở đây mặc định rằng các nhiệm vụ có
được sự cân bằng tải chạy trên các nút server xử lý tương đồng
nhau về tài nguyên và thời gian xử lý, do đo có thể coi
, công thức tính trễ truyền thông như sau:
(4.5)
Trong đó, khoảng cách trung bình của định tuyến từ
switch/router (hop) của nút server xử lý nguồn đến nút đích.
),( npTO
),(
)(
)(),(),(),( npT
n
pT
pTnpTnpTnpT
O
par
seqcommOcomp
),(
)(
)(
)()(
),(
npT
n
pT
pT
pTpT
npS
O
par
seq
parseq
),(),( npTnpT commOO
)(),(
datastartupswnetcommO
wtttkHkHTnpT
H
swt
14
trễ ở nút switch/router. thời gian khởi tạo truyền thông.
được cho là không thay đổi (constant). thời gian
truyền một từ dữ liệu, Kích thước của bản tin (số bytes)
(khoản dữ liệu), số lượng các bản tin.
4.2 Sử dụng mạng hàng đợi đóng có nghiệm dạng tích các
xác suất để phân tích ảnh hưởng của trễ truyền thông đến hiệu
năng trong hệ thống tính toán song song ghép cụm
4.2.1 Đánh giá ảnh hưởng của trễ truyền thông bằng mô hình
mạng hàng đợi đóng có nghiệm dạng tích
Để đánh giá ảnh hưởng của trễ truyền thông, luận án sử dụng
mô hình mạng hàng đợi. Mạng hàng đợi cho hệ thống như sau:
4.1.4 Thực nghiệm mô phỏng trên công cụ JMT
Phần mềm sử dụng mô phỏng là JMT 0.8. Các tham số thiết lập
như sau:
2.0;8,0;8.0
;2.0;2.0;8.0 000
inetineti
netnet
ppp
ppp
startupt
startup
t
data
t
w
k
15
Hình 4.5 b. Thông lượng của hệ thống tính toán song song với cấu hình
2DTorus Infiniband interconnect DDR 12x, n=9
Hình 4.5 c. Thông lượng của hệ thống tính toán song song với cấu hình
3DTorus Infiniband interconnect DDR 12x, n=9
16
Hình 4.5 d. Thông lượng của hệ thống tính toán song song với cấu hình
Hypercube Infiniband interconnect DDR 12x, n=9
4.3 Sử dụng mạng Petri màu ngẫu nhiên để phân tích ảnh
hưởng của trễ truyền thông đến hiệu năng của hệ thống tính
toán song song ghép cụm
4.3.1 Mô hình hệ thống
Hệ thống song song kết nối cụm với các cấu hình liên kết phổ biến
là 2Dtorus mà ở đó mỗi một nút xử lý kết nối với 4 nút kề cận (cấp
độ của nút bằng 4). Mô hình gồm 5 nút xử lý: nút P0, nối với 4 nút
kề cận P1, P2, P3, P4. Cấu trúc và công nghệ của mỗi nút Pi
(i=0,1,2,3,4) đều giống nhau (Hình 4.6).
Hình 4.6 SCPN của processor
4.3.2 Mô phỏng trên phần mềm
Xây dựng hai kịch bản thử nghiệm:
17
Kịch bản 1: Đặt: CPU_service_time:=5, net_access_time:=10,
net_service_time:=100, với các trường hợp các proccessor có 8,
16, 32, 64 gói tin (số thẻ).
Kịch bản 2: Đặt: CPU_service_time:=5, net_access_time:=10,
net_service_time:=300, với các trường hợp các proccessor có 8,
16, 32, 64 gói tin (số thẻ).
Dưới đây là kết quả chạy mô phỏng trên phần mềm TimeNet cho
trường hợp kịch bản 1 và 2 với 8 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=100.
Hình 4.9 Kịch bản 1, 8 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=100.
Hình 4.10 Kịch bản 2, 8 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=300
Hình 4.11 Kịch bản 1, 16 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=100.
18
Hình 4.12 Kịch bản 2, 16 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=300.
Hình 4.13 Kịch bản 1, 32 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=100.
Hình 4.14 Kịch bản 2, 32 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=300.
Hình 4.15 Kịch bản 1, 64 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=100.
19
4.3.3 Đánh giá và nhận xét
Bằng phương pháp SCPN có thể xây dựng các mô hình SCPN
cho bất kỳ cấu trúc liên kết mạng nào và thực hiện đánh giá hiệu
năng qua các thông số yêu cầu. Ở đây, trong phạm vi của luận án
chỉ đưa ra mô hình SCPN cho cấu trúc phổ biến là 2Dtorus để
minh họa cho ứng dụng SCPN trong đánh giá hiệu năng của các
hệ thống tính toán song song đa xử lý, còn đối với các cấu trúc
khác có thể thực hiện theo cách tương tự.
4.4 Phân tích hiệu năng hệ thống tính toán song song ghép
cụm thực hiện thám mã mật khẩu MS Office
4.4.1 Bài toán thám mã mật khẩu
Bài toán khôi phục mật khẩu MS Office là một bài toán trong
thực tế có thể sử dụng cơ chế tính toán song song khá hiệu quả.
luận án sẽ đề xuất một cách tiếp cận vừa sử dụng các lõi trong một
bộ xử lý (nút) và vừa sử dụng nhiều nút tính toán trong mạng.
Hình 4.16 Kịch bản 2, 64 gói tin, CPU_service_time=5,
net_access_time=10, net_service_time=300.
20
4.4.2 Thám mã trong MS Office
21
4.4.3 Xây dựng thuật toán
Lưu đồ thuật toán xử lý trong một tiến trình cho 1 lõi:
Mã giả viết trên ngôn ngữ C#:
void Try(int idxCurrentChar)
{
if (Found) return;
for (j = 0; j < CharSet.Length; j++) {
strBuffer[idxCurrentChar] = CharSet[j];
if (i == PasswordLength){
for (k = 1; k <= PasswordLength; k++) {
Key = Key + strBuffer [k];
}
//So sánh password với khóa ứng cử: K=K’?
if (RC4.Verify(Key)) {
Found = true;
PWFound = Key; //Đã tìm thấy pass
}
}
else Try(idxCurrentChar+1);}}//Đệ quy quay lui
22
4.4.4 Thử nghiệm
Trong các thử nghiệm dưới đây, sẽ thực hiện quét mật khẩu
có độ dài 4 ký tự. Kết quả được thể hiện như Hình 4.25.
Hình 4.25 Kết quả thử nghiệm
4.4.5 Phân tích kết quả
Các thử nghiệm cho thấy, khi tăng số lõi xử lý thì tốc độ sẽ
tăng lên nhưng sẽ có xu hướng giảm khi đạt đến số lượng lõi tối
đa của chip. Khi tăng tần suất và kích thước gói tin thì hiệu năng
giảm.
4.4.6 Kết luận
Việc tìm lại mật khẩu trong MS Word cũng như một số hệ
thống khác với độ dài mật khẩu không quá dài và phức tạp hoàn
toàn có thể thực hiện được bằng tấn công vét cạn sử dụng hệ thống
tính toán song song trên nhiều nút và nhiều lõi kết hợp.
Các thực nghiệm ở trên đã cho thấy hiệu năng của hệ thống
tính toán song song phụ thuộc rất nhiều vào các yếu tố, trong đó
phải kể đến là trễ truyền thông, đặc biệt khi lưu lượng truyền
thông tăng lên. Để tăng hiệu năng của hệ thống bằng cách giảm
thiểu trễ truyền thông thì có thể tiến hành giảm lưu lượng truyền
thông giữa các tiến trình và giữa các nút tính toán, như: Giảm tối
thiểu kích thước gói tin hoặc tần suất gửi các gói tin.
Khi lựa chọn số lõi của CPU tham gia vào quá trình tính toán
song song, cần chú ý nên chọn số lượng lõi phù hợp để có hiệu
23
năng đạt mức cao nhất. Không phải cứ chọn hết số lõi để tham gia
tính toán là sẽ có mức tăng tốc tốt nhất.
KẾT LUẬN VÀ KIẾN NGHỊ
1. Kết luận
Nghiên cứu về hệ thống tính toán song song và tính toán hiệu
năng cao đang là một trong những chủ đề nhận được rất nhiều sự
quan tâm. Đặc biệt, khi công nghệ và giá thành cho những hệ
thống ghép cụm có sử dụng những vi xử lý đa lõi và GPU ngày
càng giảm và cho phép người dùng có thể ghép nối gần như không
hạn chế số nút tham gia tính toán.
Đi cùng với khả năng mở rộng các nút tham gia tính toán để
nâng cao hiệu năng là bài toán khá nan giải cần phải được nghiên
cứu giải quyết đó là vấn đề giảm thiểu trễ truyền thông. Vấn đề
này cũng đã được nhiều nhóm nghiên cứu trong và ngoài nước
quan tâm và cũng đã có một số kết quả được công bố. Tuy nhiên,
do có nhiều yếu tố ảnh hưởng đến hiệu năng nên chưa thể có một
nghiên cứu nào bao quát và đưa ra giải pháp trọn vẹn. Ngoài ra,
việc sử dụng các phương pháp và công cụ phân tích khác nhau
cũng là một trong những cách tiếp cận cần được khuyến khích.
Luận án đã tiến hành phân tích hiệu năng của một số kiến trúc
và hệ thống tính toán song song, trong đó sử dụng hai công cụ
phân tích chính là mạng hàng đợi và mạng Petri. Các kết quả
nghiên cứu của luận án có thể ứng dụng trong việc phân tích các
hệ thống tính toán song song trong các hệ thống thực tế mà không
nhất thiết phải là vi xử lý cho máy tính, cụm máy tính. Ví dụ, có
thể áp dụng để phân tích các hệ thống điều khiển song song, hệ
thống cảm biến, hệ thống chip giám sát, hệ thống thu thập thông
tin, v.v...
Luận án đã nghiên cứu ảnh hưởng của mạng liên kết đến hiệu
năng của hệ thống tính toán song song đối với cả các vi xử lý đa
lõi và cả hệ thống có sử dụng nhiều máy tính theo mô hình nối
cụm và đã đề xuất công thức tính trễ ứng với một số cấu trúc mạng
liên kết cụ thể. Từ kết quả này, có thể áp dụng để phân tích các
cấu trúc mạng liên kết tương tự khác.
24
Phần phân tích sự ảnh hưởng của trễ truyền thông đối với bài
toán thám mã mật khẩu MS Office Word giúp khẳng định và làm
sáng tỏ thêm các kết quả nghiên cứu được đề cập trước đó. Các
kết quả thực nghiệm và thuật toán đề xuất trong luận án có thể làm
cơ sở để xây dựng và phát triển các hệ thống tính toán song song
hiệu năng cao sử dụng vi xử lý đa lõi, bộ GPU và cụm máy tính để
thám mã các hệ thống khác bằng phương pháp vét cạn.
Kết quả thực nghiệm và thuật toán đề xuất đối với bài toán
thám mã mật khẩu MS Office Word có thể được sử dụng và áp
dụng đối với các bài toán vét cạn một cách tương tự và chạy trên
hệ thống tính toán song song ghép cụm sử dụng vi xử lý đa lõi, kết
hợp với bộ xử lý đồ họa đa năng GPU. Kết quả nghiên cứu có thể
phát triển thành sản phẩm có tính thương mại cao, tương tự như
các phần mềm thám mã hiện có trên thị trường như: LM Software.
Như vậy, về cơ bản, kết quả của luận án đã đáp ứng được yêu
cầu đặt ra ban đầu và các công trình thể hiện các kết quả trong
đócũng đã được công bố trên các tạp chí và hội thảo chuyên ngành
trong và ngoài nước, đảm bảo độ tin cậy và có ý nghĩa đối với nội
dung nghiên cứu.
2. Kiến nghị và hướng phát triển tiếp theo
Trong khuôn khổ của luận án mới chỉ nghiên cứu một trong
số những yếu tố ảnh hưởng đến hiệu năng trong hệ thống tính toán
song song đó là trễ truyền thông, mà chủ yếu tập trung vào mạng
kết nối hay nói cách khác là cấu trúc topo của mạng kết nối. Các
topo và các mô hình xử lý được lựa chọn để phân tích trong luận
án nhìn chung còn hạn chế cả về số lượng và độ phức tạp.
Vì vậy, cần tiếp tục nghiên cứu về các cấu trúc mạng kết nối
khác nhau cũng như cần đưa vào nghiên cứu những mô hình phức
tạp hơn và sát với thực tế hơn.
Các công cụ phần mềm khác nhau có thể được sử dụng để
kiểm chứng lại các kết quả từ mô hình được xây dựng nhằm đảm
bảo tính đúng đắn của phương pháp được đề xuất.
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN
1. Hồ Khánh Lâm, Huỳnh Quyết Thắng, Nguyễn Minh Quý, "Phân
tích hiệu năng của vi xử lý đa lõi bằng CPFQN và GSPN", Tạp
chí Nghiên cứu khoa học và công nghệ quân sự, Số 16 năm 2011
(tháng 12), ISSN 1859-1043, trang 179-186.
2. Nguyễn Minh Quý, Hồ Khánh Lâm, Huỳnh Quyết Thắng. “Phân
tích ảnh hưởng của mạng liên kết đến hiệu năng của vi xử lý đa
lõi”. Tạp chí Nghiên cứu khoa học và công nghệ quân sự, số 16
năm 2011 (tháng 12), ISSN 1859-1043, trang 187-198.
3. Nguyễn Minh Quý, Hồ Khánh Lâm “Phân tích hiệu năng của
các kiến trúc chip đa lõi”, Kỷ yếu Hội nghị Quốc gia lần thứ VI
về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR)
- Huế, ngày 20 – 21/6/2013, ISBN: 978-604-913-165-3, trang
230-236.
4. Nguyen Minh Quy, Ho Khanh Lam, Huynh Quyet Thang.
“Analysis of Effectiveness of Communication Overheads in the
Parallel Computing System Using the Closed Product Form
Queuing Network”. RIVF-2013: The 10th IEEE RIVF
International Conference on Computing and Communication
Technologies, Hanoi, Vietnam, 10-13 November 2013, pp. 131-
134, ISBN 978-1-4799-1350-3.
5. Nguyen Minh Quy, Huynh Quyet Thang, Ho Khanh Lam,
“Analysis of Effectiveness of Communication Overhead in the
Parallel Computing System Using Stochastic Colored Petri
Nets”, American Journal of Networks and Communications,
ISSN 2326-8964, Vol 2, pp. 29-38, 2014.
6. Nguyễn Minh Quý, Huỳnh Quyết Thắng, Hồ Khánh Lâm. “Phân
tích ảnh hưởng của trễ truyền thông đến hiệu năng của hệ thống
tính toán song song trong bài toán khôi phục mật khẩu Microsoft
Word”. Tạp chí Khoa học và Công nghệ các Trường đại học kỹ
thuật số 104, ISSN 0868-3980, trang 41-45, 2015.
File đính kèm:
tom_tat_luan_an_phan_tich_anh_huong_cua_tre_truyen_thong_den.pdf

