You are on page 1of 1

ĐỀ CƯƠNG ÔN TẬP HỆ PHÂN TÁN

A. Phần Lý thuyết
1.Định nghĩa hệ phân tán. Cho biết vai trò vị trí và ý nghĩa của hệ phân tán trong việc phát triển Công nghệ Thông tin đương đại.
Là hệ thống xử lý thông tin bao gồm nhiều bộ xử lý hoặc bộ xử lý nằm tại các vị trí khác nhau và được liên kết với nhau thông qua phương tiện viễn thông dưới sự điều khiển thống nhất của một
hệ điều hành (điều hành ở đây không phải là hệ điều hành mà đó là một hành động điều hành).
Hệ tin học phân tán đã tạo ra bước ngoặt vĩ đại so với hệ tập trung và hệ khách-chủ. Việc tính toán phân tán về cơ bản giống với việc tính toán của hệ khách chủ trên phạm vi rộng lớn. Dữ liệu
được chứa trên nhiều máy chủ ở tại nhiều vị trí địa lý khác nhau kết nối thông qua mạng diện rộng.
Hệ phân tán là phân tán hóa các quá trình xử lý thông tin và thực hiện công việc đó ở các trạm xa nhau. Đó là cơ sở căn bản cho việc xây dựng các ứng dụng lớn như thương mại điện tử, chính
phủ điện tử…
2.Hãy nêu những điểm giống nhau và khác nhau giữa hệ phân tán và hệ quản trị cơ sở dữ liệu phân tán.
Giống:¬
- Sử dụng kết hợp nhiều máy tập trung, trên mỗi máy đều có lưu trữ một bản sao giống nhau.
- Tài nguyên của hệ là tài nguyên chia sẻ
Khác:¬
- Hệ phân tán là hệ thống xử lý thông tin bao gồm nhiều bộ xử lý hoặc bộ xử lý nằm tại các vị trí khác nhau, được liên kết thông qua phương tiện truyền thông dưới sự điều khiển thống nhất của
một hệ điều hành, còn hệ quản trị CSDL phân tán là một hệ thống phần mềm cho phép quản lý các CSDL phân tán.
- Về cơ bản hệ quản trị cơ sở dữ liệu phân tán là một phần mềm quản trị các dữ liêu được đặt ở các trạm khác nhau, độc lập với nhau về dữ liệu nhưng lại kết hợp với nhau về mặt logic. Còn hệ
phân tán là một hệ thống bao gồm 4 thực thể, như vậy hệ quản trị CSDL có thể thuộc hệ phân tán nào đó.
- Mục đích của hệ phân tán là đa dạng còn hệ quản trị CSDL chỉ có mục đích quản lý cơ sở dữ liệu
3.Trình bày các mục tiêu cơ bản khi thiết kế kiến trúc hệ phân tán.
Tính hiệu quả: Tốc độ tính toán và thông lượng hệ thống có thể được cải thiện qua việc xử lý phân tán và dùng chung tải nếu hệ thống truyền thông được thiết kế cẩn thận.¬
Tính mềm dẻo: Tính mềm dẻo từ cách nhìn hệ thống là khả năng có thể của hệ thống để phát triển và di chuyển. Các thuộc tính chính bao gồm tính module hoá, tính vô hướng, tính di chuyển
được và tính tương hỗ¬
Tính nhất quán: Hệ thống phải có khả năng duy trì tính toàn vẹn của nó với các kỹ thuật điều khiển tương tranh thích hợp, điều khiển lỗi và các thủ tục khắc phục lỗi. Điều khiển tương tranh
trong dữ liệu và các file là kết quả chủ yếu trong các hệ thống file phân tán.¬
Tính bền vững: Là vấn đề quan trọng trong hệ thống phân tán. Tính bền vững đối với khả năng chịu lỗi có nghĩa là hệ thống có khả năng tự khởi động lại tới trạng thái mà ở đó tính toàn vẹn của
hệ thống được duy trì với sự giảm sút hiệu năng của nó.¬
4.Anh (chị) hãy mô tả một ví dụ ứng dụng đặc trưng cho hệ phân tán.
Một ví dụ của hệ thống phân tán là World Wide Web. Khi bạn xem một trang web trên một site, thực ra bạn đang sử dụng một hệ thống phân tán có chứa site đó. Khi bạn duyệt web, trình duyệt
của bạn chạy trên máy tính của bạn giao tiếp với những máy chủ web khác nhau và cung cấp cho bạn các trang web mà bạn yêu cầu.
Rất có thể trình duyệt của bạn dùng qua một máy chủ proxy để truy cập đến nội dung các trang web chứa trên máy chủ web nhanh chóng và an toàn hơn.
Để có thể xác định những máy chủ này, trình duyệt phải dùng hệ thống tên miền phân tán DNS. Trình duyệt có thể truy cập tới tất cả những máy chủ này trên Internet thông qua hệ thống các
router mà chính bản thân chúng cũng tạo nên một hệ thống phân tán khổng lồ.
5.Trình bày vấn đề định danh. Minh họa bằng Internet.
6.Trình bày 8 dạng trong suốt cho mô hình tham chiếu xử lý phân tán mở.
7.Trong các đặc trưng cơ bản của hệ phân tán, theo anh (chị) đặc trưng nào là quan trọng nhất, vì sao?
8.Trình bày về chế độ khóa (blocked) và không khóa (non blocked) trong quá trình giao tiếp giữa Client và Server.
9.Trình bày giải thuật đồng bộ hóa đồng hồ vật lý Berkeley. Cho ví dụ.
10.Hãy phát biểu nguyên lý nhiều bản sao. Trong hệ phân tán, nhiều bản sao được sử dụng cho mục đích gì?
Nguyên lý cơ bản là tại mỗi hệ thống cục bộ sẽ lưu bản sao dữ liệu đang có tại tất cả các hệ thống khác tham gia vào hệ. Tại mỗi máy cục bộ khi thao tác với dữ liệu của mình, nếu thay đổi phải
làm tươi cho tất cả các hệ thống khác trong hệ.
Trong hệ phân tán bản sao được sử dụng để tăng tốc độ truy xuất dữ liệu, tại các máy client hệ thống sẽ truy cập thông tin cục bộ của nó. Ngoài ra các bản sao sẽ giúp tăng cường khả năng chịu
lỗi và phục hồi khi một máy trạm bị hỏng.

B. Phần Bài tập


1.Nhân quả và thời gian
Cho biết nhãn thời gian vecto của các sự kiện♣
Tìm nhát cắt nhất quán, nhát cắt không nhất quán♣
2.Bầu thủ lĩnh trên vòng
Bầu thủ lĩnh trên mạng vòng không đồng bộ có độ phức tạp thông báo O(nlogn)♣
3.Loại trừ lẫn nhau
Giải thuật test♣&set
4.Nhất quán và lặp: tập trung vào các mô hình lấy dữ liệu làm trung tâm.

Giải thuật bầu thủ lĩnh cho mạng không đồng bộ với độ phức tạp O(n log n)
- Tư tưởng: bầu chọn được thực hiện tại bộ xử lý với ID bất kỳ, bầu chọn theo 2 chiều với miền lân cận k = 1, 2, .... Giải thuật chọn BXL có ID lớn nhất là thủ lĩnh.
+ Với pi khi bắt đầu thực hiện bầu thì đặt trạng thái là Active, gửi đi một thông báo có Leader(ID,k=1) theo hai chiều trái và phải.
Với các pj: nếu ở trạng thái PASSIVE thì chỉ chuyển tiếp thông báo theo chiều quy định
- Nhận thông báo sẽ: Giảm k = k -1, xem k = 0 hay chưa?
0 thì so sánh ID của mình với ID trong thông báo:≠ + Nếu k
. Lớn hơn ID trong thông báo thì: nuốt (chặn) thông báo, gửi trả lại cho pi ID của mình (mess(ID_Max)).
. Nhỏ hơn ID trong thông báo, đặt trạng thái của mình thành PASSIVE, chuyển tiếp thông báo sang BXL bên cạnh theo chiều đã quy định.
. Bằng ID trong thông báo: nó là thủ lĩnh.
+ Nếu k = 0 (kết thúc miền lân cận), các nút gửi lại cho pi (mess(ID_Max))
+ Khi mess(ID) quay về nút nguồn:
- Nếu nhận được các mess(ID_Max) với ID_Max nhỏ hơn của mình thì sẽ mở rộng miền lân cận cho đợt thăm dò tiếp theo
- Nếu nhận được ID_Max lớn hơn thì pi sẽ lựa chọn giá trị lớn nhất trong số các ID nhận được và đặt trạng thái của mình thành PASSIVE, đồng thời gửi đi một thông báo Selection(ID) tới BXL có
ID tương ứng để bắt đầu cuộc bầu chọn mới.

You might also like