You are on page 1of 12

Các xu hướng công nghệ lưu trữ dữ liệu

Trần Tuấn Hưng


Hungtt4@fpt.com.vn

1. Giới thiệu chung..................................................................................................... 2


2. Các hướng công nghệ nâng cao giá trị và hiệu quả sử dụng của hệ
thống lưu trữ ................................................................................................................... 3
2.1 Mạng lưu trữ riêng biệt SAN (Storage Area Networks) ............................. 3
2.2 Lưu trữ dựa trên nguyên lý phân mức tầm quan trọng của dữ liệu......... 6
2.2.1 Tiered-storage ......................................................................................................... 6
2.2.2 Quản lý vòng đời dữ liệu (Information Lifecycle Management) ....................... 8
2.3 Ảo hoá hệ thống lưu trữ (Storage Virtualization) ...................................... 10
3. Kết luận................................................................................................................... 11
1. Giới thiệu chung
Trong thời đại hiện nay, hoạt động và sự thành công trong hoạt động của hầu hết các
doanh nghiệp/cơ quan/tổ chức (sau đây gọi chung là doanh nghiệp), phụ thuộc rất nhiều
vào hạ tầng công nghệ thông tin của họ. Xét trên khía cạnh IT, cốt lõi cơ bản trong hoạt
động của các doanh nghiệp là các quá trình lưu trữ, xử lý và trao đổi dữ liệu, thông tin.
Liên quan đến các quá trình này, và cũng là một trong những thành phần quan trọng bậc
nhất của cơ sở hạ tầng thông tin là hệ thống lưu trữ. Khái niệm “hệ thống lưu trữ” chỉ đến
tập hợp của tất cả các tài nguyên sử dụng cho mục đích lưu trữ dữ liệu của hệ thống, bao
gồm:

• các thiết bị lưu trữ, như ổ đĩa cứng trong của các máy chủ, các tủ đĩa ngoài,
các thiết bị băng từ

• các phần mềm quản lý, điều khiển hoặc cung cấp tính năng phụ trợ (như sao
chép, sao lưu vv..) cho các thiết bị lưu trữ,

• các giao thức và phụ kiện cho kết nối và trao đổi dữ liệu giữa các thiết bị lưu
trữ.

Để hoạt động trên nền tảng IT của doanh nghiệp được thông suốt và hiệu quả, hệ thống
lưu trữ cần được thiết kế và vận hành với sự quan tâm cao, được đầu tư xứng đáng cả về
giá trị kinh tế và về công nghệ kỹ thuật. Tất cả các dữ liệu cần thiết cho quá trình hoạt
động của doanh nghiệp phải được lưu trữ đầy đủ (yêu cầu đủ về dung lượng), với độ an
toàn và tính bảo mật cao, cho phép truy xuất với tốc độ nhanh, được sử dụng và xử lý
một cách hiệu quả và hợp lý (yêu cầu về hiệu năng và quản trị lưu trữ).

Đáp ứng những yêu cầu như trên, ngành công nghệ lưu trữ đang có một lộ trình phát triển
nhanh chóng với nhiều bước tiến mới về công nghệ nhằm nâng cao giá trị và hiệu quả sử
dụng của hệ thống lưu trữ. Theo dõi tình hình nghiên cứu và triển khai thực tế, có thể
thấy xu thế phát triển hiện nay của công nghệ lưu trữ đang tập trung vào các điểm nóng
như sau:

- sử dụng mạng lưu trữ riêng biệt, tốc độ cao cho mục đích lưu trữ dữ liệu
(SAN: Storage Area Network)

- phân mức tầm quan trọng của dữ liệu, trên cơ sở đó dùng thiết bị và công
nghệ lưu trữ phù hợp, giảm thiểu chi phí đầu tư và vận hành. Nguyên lý lưu
trữ phù hợp với tầm quan trọng của dữ liệu có thể được áp dụng là phân mức
lưu trữ (Tiered-Storage), và quản lý lưu trữ theo vòng đời dữ liệu (ILM:
Information Lifecycle Management)

- tiến hành hợp nhất hệ thống lưu trữ theo phương pháp ảo hóa (Storage
Virtualization), nâng cao hiệu quả sử dụng.

2
Trong các phần tiếp theo, bài viết sẽ giới thiệu và phân tích các hướng công nghệ nói
trên.

2. Các hướng công nghệ nâng cao giá trị và hiệu quả sử
dụng của hệ thống lưu trữ
2.1 Mạng lưu trữ riêng biệt SAN (Storage Area Networks)
Xét tổng quan về phương diện kết nối, điểm khởi đầu của quá trình phát triển công nghệ
lưu trữ (xem Hình 1) là khi các máy tính và máy chủ nhỏ được trang bị các ổ đĩa trong
của riêng chúng. Với cách lưu trữ này, dung lượng lưu trữ không được lớn, thường chỉ có
khả năng đáp ứng nhu cầu của người sử dụng đầu cuối. Khả năng mở rộng dung lượng,
công nghệ bảo vệ tính toàn vẹn của dữ liệu (cụ thể là công nghệ RAID: Redundant Array
of Independent Disks, cho phép phục hồi nguyên vẹn dữ liệu khi ổ đĩa cứng bị hỏng) còn
rất hạn chế.

Bước phát triển tiếp theo là khi máy tính/máy chủ có kết nối riêng đến thiết bị lưu trữ bên
ngoài của mình (có thể là đĩa cứng hoặc băng từ) qua đường kết nối hoạt động theo giao
thức SCSI (Small Coumpter System Interface). Mỗi máy tính/máy chủ chỉ có quyền kiểm
soát, quản trị thiết bị lưu trữ ngoài của chính mình. Với cách kết nối và quản lý cục bộ
như vậy, rất khó có thể xây dựng được những hệ thống dữ liệu có dung lương cao, chưa
nói đến việc không có được khả năng quản trị tập trung từ xa.

Một hướng phát triển khác là khi thiết bị lưu trữ được thiết kế để dữ liệu trên đó có thể
được truy nhập qua mạng LAN thông thường. Điển hình là các thiết bị NAS (Network
Attached Storage) chứa dữ liệu tập trung và cho phép chia sẻ dữ liệu ở mức file. Mặc dù
đã phần nào giải quyết được vấn đề dung lượng và quản lý tập trung, nhưng việc truyền
tải dữ liệu giữa thiết bị có nhu cầu sử dụng và thiết bị lưu trữ xảy ra trên hạ tầng mạng
LAN thông thường, dùng giao thức mạng TCP/IP, gây hạn chế tốc độ truyền tải, dẫn đến
hiệu năng hoạt động của cả hệ thống không được cao.

Những nhược điểm về tốc độ về hiệu năng được đẩy lùi trong bước phát triển tiếp theo
với sự xuất hiện của công nghệ thiết lập mạng lưu trữ riêng biệt SAN (Storage Area
Network). Mặc dù có thể tận dụng hạ tầng mạng IP để truyền tải luồng dữ liệu của mạng
lưu trữ, điển hình là sự phát triển của các giao thức như iSCSI (Internet SCSI), FCIP
(Fibre Channel over IP), iFCP (Internet Fibre Channel Protocol), nhưng những giao
thức này chưa thật sự có được sự triển khai rộng rãi trong thực tế. Do đó, bài viết sẽ tập
trung vào xu hướng công nghệ phổ biến nhất là mạng SAN sử dụng công nghệ quang FC
(Fibre Channel), thường được nhắc đến với tên gọi FC SAN.

3
FC SAN Fabric

Ethernet LAN

Controllers

Hình 1: Các bước phát triển của công nghệ lưu trữ (từ trái qua phải): Lưu trữ cục bộ; Lưu
trữ tập trung, truy cập qua mạng LAN; Mạng lưu trữ riêng (SAN)

Vậy thế nào là mạng FC SAN? Thành phần của một mạng lưu trữ FC SAN bao gồm các
thiết bị lưu trữ (tủ đĩa, thiết bị băng từ), các máy chủ sử dụng dữ liệu, và các bộ chuyển
mạch SAN switch. Kết nối vật lý cơ bản trong một mạng FC SAN đơn giản được minh
họa trong Hình 2.

Thiết bị chuyển mạch SAN

Máy chủ Thiết bị tủ đĩa Thiết bị băng từ

Hình 2: Kết nối vật lý cơ bản của mạng FC SAN

Cũng có thể nhìn một mạng SAN theo cách phân chia logic thành 3 lớp: Host layer,
Fabric layer và Storage layer như hiển thị trong Hình 3. Host layer chứa các máy chủ
chạy các ứng dụng có sử dụng dữ liệu được lưu trữ trong mạng SAN. Fabric layer chứa
các bộ chuyển mạch SAN switch. Storage layer chứa các thiết bị lưu trữ như tủ đĩa ngoài
và thiết bị băng từ.

4
Hình 3: Phân chia lớp trong mạng SAN

Mạng SAN có quy mô càng lớn thì số lượng các thiết bị và kết nối (máy chủ, switch, tủ
đĩa, thiết bị băng từ) sẽ càng nhiều. Mặc dù vậy, cấu trúc logic tổng quan 3 lớp (host
layer, fabric layer, storage layer) như trong Hình 3 là không thay đổi.

Sử dụng mạng lưu trữ FC SAN mang lại những lợi ích chính sau:

• Tăng hiệu năng hoạt động: Hiệu năng của hệ thống lưu trữ, và theo đó là của cả
hệ thống IT được tăng lên đáng kể. Một mặt, tốc độ truyền tải trong mạng SAN
với sự sử dụng công nghệ quang đạt đến tốc độ 4Gbps, giảm thời gian truy cập dữ
liệu trong các quá trình sử dụng, sao lưu, phục hồi. Mặt khác, với mạng lưu trữ
riêng SAN, luồng dữ liệu trong mạng LAN thông thường dùng giao thức mạng
TCP/IP không còn cần phải chia sẻ đường truyền có dung lượng giới hạn với
luồng dữ liệu của hệ thống lưu trữ, sao lưu. Sự tách rời riêng biệt này tối ưu hoá
hoạt động của cả 2 mạng LAN và SAN.
• Tăng tính linh hoạt của hệ thống lưu trữ: Sử dụng mạng SAN đem lại tính linh
hoạt cao cho hệ thống lưu trữ. Các giao thức và công nghệ chuẩn dùng trong
mạng SAN cho phép sử dụng nhiều chủng loại thiết bị lưu trữ của các nhà sản
xuất khác nhau, khi họ cùng tuân thủ các chuẩn công nghiệp. Dung luợng lưu trữ
trong mạng SAN có thể được sử dụng bởi nhiều máy chủ, nhiều ứng dụng khác
nhau. Dung lương lưu trữ của cả mạng SAN có thể được mở rộng, nâng cấp dễ
dàng. Hơn thế nữa, mạng SAN mở ra khả năng hợp nhất tài nguyên lưu trữ, nâng
cao hiệu suất sử dụng của hệ thống lưu trữ, cho phép vận hành và quản lý hiệu
quả hơn.
• Giảm chi phí sở hữu (Totalcost of Ownership): đối với những doanh nghiệp có
nhiều dữ liệu, mặc dù chi phí đầu tư ban đầu để xây dựng mạng SAN có thể lớn
hơn chi phí xây dựng hệ thống lưu trữ thông thường, nhưng xét về tầm xa thì
SAN là sự đầu tư hợp lý có chí phí sở hữu (bao gồm vận hành, quản lý, và bảo
quản) không cao. Thứ nhất, sử dụng mạng SAN sẽ mở ra khả năng quản lý mềm

5
dẻo, linh hoạt, và đơn giản, do đó giảm thiểu chi phí quản lý, quản trị. Thứ hai,
mạng SAN còn hỗ trợ nhiều tính năng thuận lợi khác trong quá trình sử dụng (như
hợp nhất lưu trữ, hỗ trợ phục hồi dữ liệu nhanh chóng sau sự cố, thảm hoạ...), làm
tăng hiệu quả hoạt động của hệ thống, xứng đáng với chi phí đầu tư ban đầu.

2.2 Lưu trữ dựa trên nguyên lý phân mức tầm quan trọng của
dữ liệu
2.2.1 Tiered-storage
Ý tưởng để xây dưng hệ thống lưu trữ theo môi trường phân mức (tiered-storage) bắt
nguồn từ sự nhận thức và nhu cầu tiết kiệm chi phí hoạt động. Sẽ là lãng phí cho giá
thành đầu tư và vận hành nếu mặc định rằng tất cả các dữ liệu đều quan trọng như nhau
và do đó cần được lưu trữ bằng các thiết bị và công nghệ có giá thành cao giống nhau. Để
tiết kiệm chi phí đầu tư và chi phí hoạt động, cách tốt hơn là lưu trữ dữ liệu theo cách và
bằng thiết bị phù hợp với giá trị của chính nó. Tiêu chí để đánh giá giá trị của dữ liệu, hay
nói cách khác tiêu chí để phân loại dữ liệu có thể là hiệu quả hoạt động do dữ liệu mang
lại; tần suất được truy cập và sử dụng của dữ liệu; mức độ an toàn, bảo mật cần thiết cho
dữ liệu; và một số các tiêu chí khác, tùy vào từng hệ thống cụ thể.

Trước đây, trong các hệ thống lưu trữ truyền thống, việc phân chia thành 2 mức lưu trữ
dữ liệu on-line và off-line là rất phổ biến. Dữ liệu dành cho các ứng dụng yêu cầu tính sẵn
sàng cao, tốc độ hoạt động nhanh, cần truy cập nhiều sẽ được lưu trữ trên các thiết bị lưu
trữ được sản xuất theo tiêu chí tối ưu hoá cho tốc độ hoạt động. Các thiết bị lưu trữ này
có giá thành, chi phí quản lý, bảo quản và vận hành cao. Đây là mức lưu trữ on-line.

Mức lưu trữ off-line dành cho các dữ liệu ít được sử dụng. Dữ liệu trong trường hợp này
được chứa trên các băng từ, một phương pháp rẻ tiền hơn nhưng lại làm chậm tốc độ truy
nhập đến dữ liệu.

Thực tế là theo quá trình phát triển của công nghệ thông tin, nhiều loại dữ liệu có tính
chất nằm giữa 2 loại dữ liệu on-line và off-line ở trên. Các dữ liệu này không thật sự có
yêu cầu quá cao về tính sẵn sàng, cũng như không phải là dữ liệu then chốt cho ứng dụng.
Nhưng bên cạnh đó vẫn cần phải được truy cập và xử lý nhiều lần bởi người sử dụng. Ví
dụ điển hình cho loại dữ liệu này là các tập tin (file) có mức quan trọng không cao (như
tranh ảnh giải trí) được nhiều người truy cập. Vì thế loại dữ liệu này được xếp vào một
mức lưu trữ mới, gọi là mức near-line.

Ý tưởng tiered-storage với 3 mức on-line, near-line, off-line không phải hoàn toàn mới.
Tuy nhiên điều đáng nói là sự xuất hiện của các công nghệ ổ đĩa lưu trữ mới đã cho phép
việc triển khai thực tế của 3 mức lưu trữ trở nên khả thi. Công nghệ lưu trữ được sử dụng
hiện nay cho mức on-line là các thiết bị hoạt động với các ổ đĩa quang FC (tốc độ
đọc/viết nhanh) hoặc SCSI, SAS (Serial Attached SCSI). Các ổ đĩa SATA (Serial ATA)
hoặc FATA (Fibre Channel ATA) được dùng cho mức near-line và các băng từ được sử
dụng cho mức off-line (Advanced Technology Attachment (ATA), còn được biết đến với
tên gọi Intelligent Drive Electronics (IDE), là chuẩn của các ổ đĩa cứng được dùng trong
máy tính cá nhân) . Hình 4 trình bày sự so sánh mang tính định hướng về giá thành giữa

6
các mức lưu trữ dữ liệu. Có thể thấy, khi chuyển từ dùng các thiết bị với ổ đĩa FC sang ổ
đĩa SATA và ổ băng từ, chi phí sở hữu (đầu tư và vận hành, bảo quản) tính theo đơn vị
dung lượng GigaByte có thể giảm xuống nhiều lần, đem lại mức chênh lệch rất lớn. Tuy
nhiên sự giảm chi phí sở hữu có được là do các chỉ số về hiệu năng của từng công nghệ ổ
đĩa giảm dần theo thứ tự ổ đĩa FC, SATA và FATA. Hiệu năng của ổ đĩa cứng (xem
Bảng 1) được đánh giá dựa vào các yếu tố dung lượng, tốc độ quay (càng cao càng tốt vì
tỷ lệ thuận với tốc độ đọc dữ liệu), thời gian trung bình để đọc/ghi dữ liệu, tốc độ truyền
tải dữ liệu tối đa. Cũng vì vậy, khi chọn lựa mức lưu trữ phù hợp cho dữ liệu, cần cân
nhắc giữa mức quan trọng của dữ liệu, chi phí đầu tư cho phép và các chỉ số hiệu năng
của từng loại ổ đĩa. Tất nhiên việc phân loại giá trị của dữ liệu để xác định mức lưu trữ
phù hợp mang tính chủ quan, phụ thuộc vào tính chất hoạt động của từng doanh nghiệp
và vào từng trường hợp cụ thể.

Online Nearline Offline

Servers
Optical
Library

IP Storage
LAN
or FC Network
or WAN

Tape
Library
SATA drives
Heterogeneous FC drives (Nearline Storage)
Storage

Very Fast Fast Slow


$$$$$/GB $$/GB $/GB

Hình 4: So sánh các mức lưu trữ on-line, near-line và off-line

Bảng 1: So sánh hiệu năng các công nghệ ổ đĩa cứng

SATA FATA FC FC tốc độ cao


Dung lượng (capacity) / 1 250, 500 GB 500 GB 73, 146, 300 GB 73, 146 GB
đĩa
Tốc độ quay (Rotational 7,200 rpm 7,200 rpm 10,000 rpm 15,000 rpm
speed) (rotation per
minute)

Thời gian đọc trung bình 8.5 ms 8.5 ms 4.9 ms 3.5 ms

7
(Average Read)
Thời gian ghi trung bình 9.5 ms 9.5 ms 5.5 ms 4.0 ms
(Average Write)
Tốc độ truyền tối đa (Max. 34-59 MB/sec 34-59 MB/sec 39 – 80 MB/s 58 – 96 MB/s
sustained data transfer
rate)

2.2.2 Quản lý vòng đời dữ liệu (Information Lifecycle Management)


Cùng với xu hướng phân mức lưu trữ tiered-storage là xu hướng tiến tới phương thức
quản lý dữ liệu theo vòng đời của chúng, hay còn gọi là ILM (Information LifeCycle
Management). ILM quản lý việc lưu trữ dữ liệu hợp lý tùy theo mức độ quan trọng và tùy
theo từng thời điểm trong vòng đời của dữ liệu. Tầm quan trọng của dữ liệu trước hết phụ
thuộc một cách chủ quan vào đối tượng sử dụng. Ví dụ trong một doanh nghiệp, đối với
bộ phận nhân sự, bản danh sách chứa bảng lương cụ thể và cập nhật của tất cả các nhân
viên trong doanh nghiệp có tầm quan trọng cao hơn hẳn so với thông tin hồ sơ của các cá
nhân. Mặt khác, cùng một dữ liệu nhưng tại mỗi thời điểm khác nhau, nhu cầu sử dụng
và truy cập, và theo đó là tầm quan trọng của dữ liệu sẽ khác nhau. Ví dụ văn bản (có giá
trị thi hành theo từng năm) quy định mức độ đãi ngộ và bảo hiểm y tế của nội bộ công ty
trong năm hiện tại, sẽ được nhiều nhân viên truy cập rất nhiều lần trong năm đó, nhưng
10 năm sau sẽ hầu như không được truy cập đến nữa.

Hình 5: Tầm quan trọng của dữ liệu thay đổi theo thời gian

Hình 5 cho thấy mức độ quan trọng của dữ liệu, theo các thể loại email, kinh doanh,
nghiên cứu, quảng bá, đều thay đổi theo dòng thời gian. Đồng thời Hình 5 cũng đề xuất
các mức lưu trữ phù hợp gán cho dữ liệu trong từng thời điểm. Có thể thấy, tầm quan
trọng của dữ liệu kinh doanh thể hiện sự biến thiên theo đường hình sin (đường màu đỏ)
trong một giai đoạn nhất định. Trong giai đoạn này, on-line hoặc near-line là phương

8
thức lưu trữ hợp lý. Sau một thời gian, mức quan trọng của dữ liệu kinh doanh giảm dần
một cách rõ rệt và khi đó nên được lưu trữ dưới dạng off-line, trước khi bị hủy bỏ hoàn
toàn. Tầm quan trọng của dữ liệu thư điện tử (email) giảm nhanh chóng theo thời gian
(đường màu vàng). Sự biến thiên cho các dữ liệu thể loại nghiên cứu, quảng cáo cũng có
thể suy ra dễ dàng từ hình vẽ. Tại mỗi thời điểm, dữ liệu sẽ được lưu trữ tại mức (on-line,
near-line hay off-line) phù hợp với tầm quan trọng của chúng. Như vậy có thể thấy
tiered-storage là một biện pháp hỗ trợ thực hiện ILM.

Theo các kết quả thống kê trong thực tế trên thể giới, lượng dữ liệu của một doanh nghiệp
có mức tăng trưởng từ 30 đến 70% theo từng năm. Với tốc độ tăng trưởng như vậy, cùng
với sự phân hoá mức quan trọng của dữ liệu như đã phân tích ỏ trên, sẽ là bất hợp lý và
gây lãng phí lớn nếu tất cả dữ liệu được chứa ở mức on-line, mức có chi phí sở hữu cao
nhất. Tăng chi phí quản lý, tăng độ phức tạp trong quản trị dữ liệu của hệ thống, tăng các
chi phí vận hành là những nhược điểm của biện pháp lưu trữ dữ liệu chỉ ở cùng 1 mức
on-line.

ILM giải quyết vấn đề xác định đúng vị trí (mức) cần được lưu trữ của dữ liệu và giải
quyết việc chuyển đổi vị trí dữ liệu khi cần thiết. Các quá trình xác định và chuyển đổi vị
trí như vậy sẽ được tiến hành một cách tự động, tuân thủ theo những nguyên tắc được
người quản trị hệ thống thiết lập sẵn.

Áp dụng ILM mang lại những lợi ích cơ bản như sau:

• tạo phương pháp quản lý và kiểm soát được hệ thống lưu trữ dữ liệu cũng như
quản lý và kiểm soát chi phí cho lưu trữ,
• tăng độ linh hoạt cho hệ thống lưu trữ,
• tự động hoá vị trí, mức lưu trữ cho dữ liệu phù hợp với yêu cầu, bắt đầu ngay từ
thời điểm dữ liệu được tạo ra
• tăng hiệu quả sử dụng của hệ thống lưu trữ nhờ vào cách quản lý và kiểm soát tự
động theo những quy tắc định trước

Nhìn nhận được tầm quan trọng của ILM, các hãng sản xuất thiết bị lưu trữ (như IBM,
HP, EMC, SUN…) nói chung đều có sự đầu tư phát triển những sản phẩm phục vụ dịch
vụ này. Mỗi hãng sản xuất đều đưa ra các sản phẩm quản trị nhất định cung cấp cho
khách hàng tập hợp các tính năng ILM. Một mặt, tiered-storage, nhân tố quan trọng hỗ
trợ thực hiện ILM, được hầu hết các hãng sản xuất hỗ trợ bằng cách cung cấp các dải sản
phẩm thiết bị lưu trữ đa dạng (với các ổ đĩa FC, SAS, SCSI, SATA, băng từ). Mặt khác,
các hãng còn cung cấp thêm những sản phẩm phần mềm, hoặc sản phẩm tích hợp phần
cứng và phần mềm phục vụ mục đích ILM. Ví dụ hãng IBM có các sản phẩm như IBM
TotalStorage SAN File System (sản phẩm tích hợp cả phần cứng và phần mềm, cho phép
thiết lập một hệ thống tập tin (file system) chung trong mạng SAN để thực hiện một cách
tự động các nguyên tắc lưu trữ dữ liệu), hoặc IBM Tivoli Storage Manager (sản phẩm
phần mềm quản trị quá trình sao lưu, bảo tồn, hoặc sử dụng dữ liệu cho dịch vụ phục hồi
thảm họa).

9
2.3 Ảo hoá hệ thống lưu trữ (Storage Virtualization)
Như đã đề cập, lượng dữ liệu doanh nghiệp cần lưu trữ và sử dụng cho hoạt động của
mình ngày càng tăng nhanh theo thời gian. Điều này đòi hỏi doanh nghiệp phải đầu tư,
mua sắm các thiết bị lưu trữ để mở rộng và nâng cấp dung lượng khi có như cầu phát
sinh. Do nhiều lý do khách quan như lịch sử hoạt động, năng lực đầu tư của doanh nghiệp
tại thời điểm phát sinh nhu cầu, ảnh hưởng của hiện trạng công nghệ, của thị trường và
thị phần lưu trữ tại thời điểm đầu tư vv…, tình trạng phổ biến là mỗi doanh nghiệp
thường sở hữu nhiều loại thiết bị lưu trữ với dung lượng khác nhau, xuất xứ từ nhiều
hãng sản xuất khác nhau, có nguyên lý hoạt động không giống nhau. Nói cách khác, hệ
thống lưu trữ của doanh nghiệp mang nặng tính không đồng bộ, không thống nhất. Với
thực trạng như vậy, bài toán đặt ra là phải làm thế nào để có thể sử dụng có hiệu quả nhất
hệ thống lưu trữ đó?

Sáng kiến mang tính nền tảng để giải quyết cho bài toán ở trên là phải hợp nhất ở mức
logic tất cả các dung lương lưu trữ trong hệ thống. Sao cho đối với người sử dụng, tất cả
hệ thống lưu trữ được coi như một nguồn lưu trữ duy nhất mà trên đó người sử dụng có
thể thực hiện các tác nghiệp về lưu trữ dữ liệu một cách thuận tiện. Việc giải quyết hợp
nhất ở mức logic các thiết bị lưu trữ khác nhau về phiên bản, xuất xứ, nguyên lý hoạt
động thành một nguồn lưu trữ duy nhất, chính là quá trình ảo hoá lưu trữ. Gọi là ảo hoá,
vì người sử dụng sẽ chỉ nhìn thấy một nguồn lưu trữ duy nhất, trong khi thực tế về mặt
vật lý thì không phải như vậy. Các thiết bị lưu trữ đã được ảo hoá, hợp nhất thành một
nguồn lưu trữ chung. Người quản trị hệ thống sẽ có quyền điều khiển, quản lý nguồn lưu
trữ được hợp nhất ở mức logic, tạo và sửa đổi vai trò của các thiết bị lưu trữ vật lý trong
nguồn lưu trữ logic đó.

Ảo hoá lưu trữ thường được thực hiện bởi các phần mềm chuyên dụng. Phần mềm
chuyên dụng có thể được cài đặt và tích hợp trực tiếp trên các máy chủ chạy ứng dụng
của hệ thống hoặc cũng có thể cài đặt/tích hợp trên thiết bị lưu trữ. Tuy nhiên, xu hướng
hiện nay là ảo hoá được thực hiện trong mạng SAN, trong đó phần mềm chuyên dụng
được cài đặt vào các bộ chuyển mạch hoặc các máy chủ chuyên dụng. Trong các sản
phẩm có mặt trên thị trường, nổi bật có thế nhắc đến SVC (SAN Volume Controller) của
hãng IBM. Sản phẩm này bao gồm phần mềm ảo hóa chuyên dụng cùng với các máy chủ
nền tảng x86 chạy trong chế độ chia sẻ tải (cluster), dùng để cài đặt phần mềm ảo hóa
(xem Hình 6). Một ví dụ khác là sản phẩm phần mềm ảo hoá lưu trữ Invista của hãng
EMC được cài đặt trực tiếp trên các SAN switch.

10
Thực hiện các thay
đổi về lưu trữ mà
không cần ngừng
các ứng dụng đang Quản trị nguồn lưu
chạy trên máy chủ trữ ảo chung từ 1
địa điểm
Đĩa Đĩa Đĩa Đĩa
ảo ảo ảo ảo
Thực hiện các
tính năng sao SAN
chép trong
nguồn lưu trữ SAN Volume Controller
ảo chung
Các tính năng sao chép

Storage Pool
Hợp nhất các thiết bị
SUN IBM EMC HP lưu trữ khác nhau
HDS
thành 1 nguồn lưu
trữ ảo chung

Hình 6: Mô hình chức năng của sản phẩm ảo hoá lưu trữ IBM SVC

Áp dụng ảo hoá lưu trữ mang lại những lợi ích cơ bản sau:
• Đơn giản hóa việc quản lý hạ tầng lưu trữ: việc quản lý duy nhất 1 nguồn lưu
trữ ảo sẽ đơn giản hơn cho người quản trị. Thay vì phải thao tác các công việc
quản lý tại chỗ cho từng thiết bị riêng biệt trong mạng SAN, nguời quản trị sẽ
quản lý tập trung từ 1 địa điểm. Với cách quản lý tập trung như vậy, việc di
chuyển dữ liệu trong mạng SAN từ thiết bị này sang thiết bị khác khi có nhu cầu
sẽ được xử lý nhanh chóng và thuận tiện hơn rất nhiều. Hơn nữa, ứng dụng chạy
trên các máy chủ không cần phải ngừng hoạt động khi thực hiện việc di chuyển
dữ liệu.
• Góp phần nâng cao hiệu quả sử dụng dữ liệu: ảo hoá dữ liệu góp phần làm tăng
tính sẵn sàng của dữ liệu, hỗ trợ khả năng quản lý dữ liệu theo vòng đời. Các khả
năng như vậy góp phần làm tăng hiệu quả sử dụng của cả hệ thống lưu trữ.

3. Kết luận
Nhu cầu sử dụng hệ thống lưu trữ dữ liệu một cách có hiệu quả luôn là nhu cầu thực tế
của các doanh nghiệp có hoạt động dựa trên nền tảng số hóa và công nghệ thông tin. Nhu
cầu này càng trở nên cấp thiết khi tốc độ tăng trưởng theo từng năm của dữ liệu rất
nhanh, cả về dung lượng (đến 30-70%) và cả về độ phức tạp. Những yếu tố đó là tiền đề
dẫn đến các hướng phát triển công nghệ nhằm mục đích nâng cao giá trị và hiệu quả sử
dụng của hệ thống lưu trữ. Bài viết đã trình bày về 3 xu hướng chính, bao gồm :

- thiết lập mạng lưu trữ riêng trên nền tảng công nghệ quang (Fibre Channel
Storage Area Network FC SAN),

- phân loại tầm quan trọng của dữ liệu bằng nguyên lý phân lớp (tiered-storage) và
quản lý vòng đời dữ liệu (Information Lifecycle Management ILM), từ đó chọn
thiết bị và vị trí lưu trữ phù hợp

11
- ảo hóa hệ thống lưu trữ dữ liệu (Storage Virtualization)

Tại Việt Nam trong thời điểm hiện nay, thị trường về hệ thống lưu trữ cho thấy nhu cầu
lớn nhất chủ yếu đang là xây dựng những mạng SAN quy mô nhỏ và vừa. Trong khi tại
các nước phát triển, việc áp dụng các công nghệ tiered-storage, ILM, và ảo hóa lưu trữ đã
bắt đầu được đẩy mạnh, thì tại Việt nam chúng chưa thật sự có được sự quan tâm lớn. Lý
do là thị trường Việt nam còn ít những mạng SAN quy mô lớn và phức tạp, dẫn đến chưa
có nhu cầu thực tế cao cho ảo hoá và quản lý vòng đời dữ liệu. Tuy vậy, như đã nhắc đến
ở trên, tốc độ tăng trưởng của dữ liệu của các doanh nghiệp là rất nhanh, và Việt nam
không nằm ngoài diễn biến chung này. Vì vậy trong những năm tới, chắc chắn tất cả các
xu hướng công nghệ được trình bày trong bài viết sẽ ngày càng được áp dụng rộng rãi tại
Việt Nam, mang lại hiệu quả cao hơn cho hoạt động của các doanh nghiệp.

12

You might also like