ExaGrid và Commvault: Chống trùng lặp tối đa và dễ dàng quản lý

1. Tóm tắt

Báo cáo này ghi lại quá trình xác thực của Nhóm chiến lược doanh nghiệp của TechTarget đối với thử nghiệm ExaGrid, chứng minh cả khả năng tiết kiệm công suất và tính dễ sử dụng có sẵn từ sự kết hợp giữa ExaGrid và Commvault.

2. Thách thức

Việc lưu trữ và bảo vệ lượng dữ liệu ngày càng tăng sẽ làm tăng căng thẳng cho cả cơ sở hạ tầng và nhân viên CNTT. Theo nghiên cứu gần đây của Nhóm Chiến lược Doanh nghiệp, gần 3/4 (73%) số người tham gia khảo sát cho biết họ có hơn 500 TB dữ liệu sao lưu tại chỗ, trong đó 12% cho biết họ có 5 PB trở lên.1 Trong một cuộc khảo sát khác, 74 % số người được hỏi báo cáo rằng khối lượng dữ liệu sao lưu tăng hơn 20% mỗi năm, với 32% báo cáo rằng chúng tăng hơn 50% mỗi năm. Bảo vệ dữ liệu này là một nhiệm vụ quan trọng trong thế giới ngày nay, nơi các tổ chức phụ thuộc trên các ứng dụng và dữ liệu có tính sẵn sàng cao, nhưng việc sao lưu dữ liệu đó sẽ gây tốn kém ngân sách CNTT.


Ngoài ra, trong khi những đổi mới công nghệ đang chuyển đổi CNTT theo hướng tích cực thì các tổ chức vẫn tiếp tục phải vật lộn với sự phức tạp của CNTT. Theo nghiên cứu gần đây của Nhóm Chiến lược Doanh nghiệp, 53% số người tham gia khảo sát cho biết môi trường CNTT của họ phức tạp hơn so với hai năm trước.
CNTT phức tạp hơn nữa đang là xu hướng với việc có nhiều nhân viên CNTT tổng quát xử lý nhiều nhiệm vụ hơn là các chuyên gia dành riêng cho các lĩnh vực cụ thể như bảo vệ dữ liệu.

3. Giải pháp: Lưu trữ ExaGrid kết hợp với phần mềm sao lưu Commvault

Riêng Commvault và ExaGrid đều cung cấp tính năng chống trùng lặp dữ liệu, nhưng chúng cùng nhau cung cấp giải pháp sao lưu hiệu quả cao có thể giảm tới 300% dung lượng lưu trữ, tiết kiệm dung lượng và chi phí lưu trữ. Việc giảm này cũng đảm bảo rằng cần có băng thông WAN tối thiểu để sao chép từ xa. Không cần thay đổi hoạt động nào đối với cấu hình Commvault, khiến quản trị viên có thể đơn giản thêm mục tiêu ExaGrid vào môi trường Commvault hiện có. Mặc dù việc đánh giá đầy đủ tất cả các tính năng ExaGrid và Commvault nằm ngoài phạm vi của bài viết này nhưng phần mô tả ngắn gọn sẽ được cung cấp bên dưới.
Tính năng chống trùng lặp dữ liệu của ExaGrid hoạt động với tính năng chống trùng lặp dữ liệu của Commvault và nén Commvault và cả hai đều có thể được bật hoặc tắt. Khi tính năng nén Commvault được bật, ExaGrid sẽ thực hiện giải nén trước khi loại bỏ trùng lặp và luôn trả về dữ liệu sao lưu cho Commvault ở dạng được ghi ban đầu. Kết quả thử nghiệm trong bài đánh giá kỹ thuật này đã đạt được khi bật tính năng chống trùng lặp dữ liệu Commvault và tắt tính năng nén. Nhóm Chiến lược Doanh nghiệp chưa thử nghiệm ExaGrid khi bật tính năng nén.
Bộ lưu trữ sao lưu theo cấp ExaGrid được thiết kế đặc biệt để bảo vệ dữ liệu. Một tính năng chính là tầng Landing Zone đảm bảo sao lưu và khôi phục nhanh chóng. Dữ liệu được gửi tới ExaGrid sẽ đi đến Landing Zone trước khi được sao chép và lưu trữ trong kho lưu trữ. Điều này giúp loại bỏ tắc nghẽn lưu trữ của tính năng chống trùng lặp nội tuyến thông thường và giảm thiểu cửa sổ sao lưu. Nó cũng cho phép khôi phục nhanh chóng vì không cần bù nước cho dữ liệu bị trùng lặp.
Repository ExaGrid cung cấp khả năng chống trùng lặp toàn cầu, lưu giữ dữ liệu dài hạn và sao chép sang các thiết bị ExaGrid bổ sung qua mạng WAN hoặc tới đám mây công cộng (Amazon AWS và Microsoft Azure) để khắc phục thảm họa. Đây là một hệ thống mở rộng quy mô hỗ trợ các mô hình có kích thước dung lượng khác nhau và sử dụng tính năng bảo vệ RAID6 với các thành phần có thể hot-plug. Các tính năng khác bao gồm:

  • Chống trùng lặp thích ứng, cho phép sao chép trong cửa sổ sao lưu.
  • Vùng không kết nối mạng, cộng với các đối tượng dữ liệu không thể thay đổi và xóa chậm, cho phép khôi phục khi bị Ransomware tấn công.
  • Mã hóa dữ liệu ở phần còn lại và trong quá trình di chuyển dữ liệu trên mạng WAN.
  • Tích hợp tính năng nén và chống trùng lặp của Commvault.
  • Hỗ trợ môi trường ứng dụng sao lưu không đồng nhất.

Commvault từ lâu đã là nhà cung cấp giải pháp sao lưu và bảo vệ dữ liệu hàng đầu. Nền tảng duy nhất của Commvault cung cấp khả năng bảo vệ và phục hồi cấp doanh nghiệp cho các tệp, ứng dụng và cơ sở dữ liệu ảo và vật lý tại chỗ và trên nền tảng đám mây. Các tính năng bao gồm:

  • Sao lưu hiệu suất cao.
  • Phục hồi nhanh và chi tiết.
  • Mã hóa đầu cuối.
  • Tích hợp tính năng bảo vệ chống ransomware.
  • Quản lý dữ liệu sao chép linh hoạt cho phép sử dụng nhiều dữ liệu sao lưu.
  • Chống trùng lặp toàn cầu.

4. Nhóm chiến lược doanh nghiệp đã được thử nghiệm

4.1 ExaGrid + Commvault = Giảm dung lượng lưu trữ thông qua tính năng chống trùng lặp nâng cao

Enterprise Strategy Group lần đầu tiên xem xét thử nghiệm ExaGrid nhằm chứng minh cách giải pháp ExaGrid/Commvault kết hợp có thể tăng tỷ lệ chống trùng lặp dữ liệu, giúp khách hàng tiết kiệm tiền cho dung lượng lưu trữ. Commvault loại bỏ các bản sao lưu trùng lặp nội tuyến và gửi chúng đến thiết bị ExaGrid. Dữ liệu được loại bỏ trùng lặp trước tiên sẽ đến vùng đích ExaGrid và sau đó được loại bỏ trùng lặp thêm trước khi được lưu trữ trên kho lưu trữ không kết nối mạng ExaGrid.
Cần lưu ý rằng thử nghiệm này được thiết kế để chứng minh khả năng chống trùng lặp bổ sung trên mục tiêu ExaGrid Nó mô phỏng một kịch bản trong thế giới thực nhưng không sử dụng lượng lớn dữ liệu mà khách hàng thường sao lưu; về bản chất, khối lượng dữ liệu lớn này làm tăng tỷ lệ trùng lặp.
Đầu tiên, chúng tôi xem xét công cụ thiết lập giường thử nghiệm và tạo dữ liệu.

  • Tập dữ liệu. 15,5 TB đã được tạo bằng công cụ tạo dữ liệu FileMod của ExaGrid. Dữ liệu là 10 TB dữ liệu hệ thống tệp; năm máy ảo VMware (VM) Windows Server 2019, mỗi máy có 1 TB dữ liệu hệ thống tệp; và cơ sở dữ liệu SQL Server 500 GB. Kích thước tệp dao động từ 4 KB đến 500 MB, trung bình là 10 MB và trải rộng trên hơn 110 nghìn thư mục. Các thư mục được gán một giá trị gốc để đảm bảo rằng các bản sao lưu liên tiếp bao gồm dữ liệu duy nhất.
  • Tiến trình sao lưu. Đối với hệ thống tệp và dữ liệu VM, thử nghiệm đã chạy 5 bản sao lưu đầy đủ với 4 đến 6 bản sao lưu gia tăng ở giữa. Tất cả các bản sao lưu SQL đã đầy. Các bản sao lưu được chạy hai lần một ngày để mô phỏng— nhưng tăng tốc—một tuần làm việc thông thường, với dữ liệu thay đổi 1% đối với hệ thống tệp và 0,025% đối với SQL, với mỗi lần sao lưu. Thay đổi dữ liệu bao gồm tăng, thu hẹp, thay đổi, đổi tên, xóa, sắp xếp lại, v.v..
  • Tài nguyên sao lưu. Các bản sao lưu được thực thi bằng Commvault CommServer phiên bản 11.24.7 và được gửi đến thiết bị ExaGrid EX84 thông qua giao thức CIFS/Samba. Vùng đích ExaGrid có kích thước 84 TB.

Biểu đồ hiển thị kết quả của 15 ngày thử nghiệm, khi tính năng nén Commvault bị tắt. Điều quan trọng cần lưu ý là ngay sau khi quá trình thử nghiệm này hoàn tất, ExaGrid đã thông báo rằng họ hỗ trợ bật tính năng nén Commvault cùng với tính năng chống trùng lặp Commvault. Trong thời gian đó, tập dữ liệu ứng dụng hoàn chỉnh đã tăng lên, trong khi tính năng chống trùng lặp của Commvault và ExaGrid đều giảm lượng dữ liệu trên đĩa.

  • Trong vòng 15 ngày, tập dữ liệu 15,5 TB có 5 bản sao lưu đầy đủ, cộng với khoảng 25 bản sao lưu tăng dần giữa các lần đầy, nâng tổng kích thước tập dữ liệu lên khoảng 123,76 TB.
  • Trong số 123,76 TB đó, Commvault chỉ phân phối 27,25 TB cho ExaGrid—tỷ lệ chống trùng lặp là 4,5:1.
  • ExaGrid sau đó đã giảm 27,25 TB đó xuống còn 8,66 TB, tỷ lệ bổ sung 3:1.
  • Tổng số chống trùng lặp kết hợp là hơn 14:1.

Tiếp theo, chúng tôi đăng nhập vào công cụ ExaGrid để xem chi tiết về ngày cuối cùng từ GUI ExaGrid. Hình hiển thị chi tiết về tổng số lần loại bỏ trùng lặp.

 

4.2 Chống Trùng Lặp Thích Ứng

ExaGrid có một tính năng gọi là sao chép thích ứng cho phép ExaGrid chỉ bắt đầu sao chép khi mức sử dụng tài nguyên của thiết bị ở mức thấp. Điều này cho phép ExaGrid nhanh chóng hoàn thành back-end, chống trùng lặp bổ sung mà không làm chậm bất kỳ quá trình sao lưu hoặc khôi phục nào. ExaGrid cũng cung cấp các biểu đồ hiển thị tốc độ ghi, byte được sửa đổi, tốc độ chống trùng lặp và hàng đợi sao chép theo thời gian, giúp quản trị viên dễ dàng hiểu cách quản lý dữ liệu. Quản trị viên có thể phóng to để xem ngày cụ thể hoặc thu nhỏ để xem tổng quan. Hình cho thấy khả năng chống trùng lặp thích ứng ExaGrid (màu Tím) tăng lên khi tốc độ ghi của bản sao lưu Commvault (màu xanh lá) bắt đầu chậm lại.

Tại sao điều này lại quan trọng
Lưu trữ dữ liệu sao lưu là rất quan trọng để đảm bảo năng suất kinh doanh tối đa, nhưng việc tăng trưởng dữ liệu liên tục sẽ gây áp lực lên ngân sách. Các tổ chức có thể tiết kiệm tiền bằng cách sao chép dữ liệu sao lưu để giảm dung lượng lưu trữ họ cần.
Nhóm Chiến lược Doanh nghiệp đã xác thực rằng giải pháp ExaGrid/Commvault kết hợp đã giảm 123 TB dữ liệu xuống còn 8,66 TB, giảm yêu cầu về dung lượng lưu trữ xuống 14:1. Cần lưu ý rằng thiết lập thử nghiệm ExaGrid rất thận trọng và phương pháp này cung cấp dữ liệu ngẫu nhiên xác định. Khách hàng trong môi trường sản xuất thực tế có thể nhận thấy tỷ lệ trùng lặp thậm chí còn cao hơn với giải pháp chung này.

4.3 Dễ dàng triển khai và quản lý với Commvault và ExaGrid

Tiếp theo, chúng tôi thấy việc dễ dàng triển khai và quản lý các bản sao lưu bằng Commvault và ExaGrid.
Việc thêm ExaGrid vào môi trường Commvault hiện tại cũng đơn giản như thêm Chính sách lưu trữ và Thư viện Commvault mới cho ExaGrid và chọn chúng để sử dụng. Đây là một nhiệm vụ nhanh chóng và dễ dàng mà quản trị viên Commvault đã quen thuộc. Nhóm chiến lược doanh nghiệp đã xem bản demo của quá trình triển khai ban đầu một lần quá trình này cũng đơn giản và bao gồm một số nhiệm vụ ở phía ExaGrid và sau đó là ở phía Commvault. Sau đó, chúng tôi đã xem bản demo về quy trình tạo chia sẻ ExaGrid.

4.4 Triển khai ban đầu

4.4.1 Nhiệm vụ của ExaGrid

Sau khi đăng nhập vào ExaGrid EX84, chúng tôi đã thêm người dùng và tạo chính sách truy cập trước khi tạo chia sẻ ExaGrid để sao lưu. Bạn có thể có tối đa 32 thiết bị EX189 trong một hệ thống mở rộng quy mô duy nhất có thể bảo vệ hàng petabyte dữ liệu.

  • Từ tab Security/Local Users, chúng tôi đã thêm một người dùng tên là DaveCV và chỉ định các đặc quyền chỉ sao lưu.
  • Tiếp theo, chọn Security/User Access Policies và tạo một chính sách mới tên là CommvaultBackup.
    • Với nút Modify, chúng tôi đã thêm DaveCV vào chính sách đó; người dùng có thể được thêm đơn lẻ hoặc theo nhóm. (Mặc dù không bắt buộc phải chỉ định người dùng chia sẻ nhưng đây là một biện pháp bảo mật tốt.)
  • Kế tiếp, chúng tôi tạo một Network Access Policy với địa chỉ IP mở Các chính sách này có thể chỉ định máy chủ, địa chỉ IP và phạm vi địa chỉ IP cụ thể.

Sau khi những chính sách này được thiết lập, chúng tôi tạo một chia sẻ trên ExaGrid EX84. Từ tab Shares and Replicas , chúng tôi chọn +New Share, đặt tên nó là CVshare2, và chọn loại Commvault. Sự tích hợp chặt chẽ giữa Commvault và ExaGrid đảm bảo rằng dữ liệu được gửi đến chia sẻ Commvault được tối ưu hóa bằng các tính năng của ExaGrid.
Tiếp theo, chúng tôi chọn protocol CIFS/SMBNetwork Access Policy, và CommvaultBackup User Access Policy đã tạo trước đó. Tính năng Xóa màn hình cũng có sẵn, chức năng này sẽ cảnh báo cho quản trị viên trong trường hợp một tỷ lệ phần trăm chia sẻ đã chọn bị xóa trong vòng 24 giờ như một biện pháp bảo vệ khỏi phần mềm tống tiền hoặc dữ liệu trái phép khác.

Tiếp theo, chúng tôi đã thêm một công cụ ExaGrid EX40000E để hoạt động như một ExaGridSpoke từ xa và bắt đầu sao chép từ công cụ đầu tiên. Sau đó, dữ liệu sao lưu Commvault được sao lưu vào Vùng đích ExaGrid, được sao chép và lưu trữ trên phần chia sẻ ExaGrid, sau đó được sao chép sang trang web từ xa. Chúng tôi cũng đã bật ExaGrid InstantDR trên máy chủ từ xa để dữ liệu có thể được hiển thị bằng cùng Chính sách truy cập người dùng

 

4.4.2 Nhiệm vụ của Commvault

Về phía Commvault, chúng tôi đã tạo Chính sách Thư viện và Lưu trữ để cùng nhau hướng dẫn Commvault cách truy cập vào phần chia sẻ ExaGrid.
Đầu tiên, chúng tôi tạo Thư viện Commvault. Từ Bảng điều khiển Commvault CommCell Console, chúng tôi chọn Libraries/Storage/Expert Storage Configuration và thêm máy chủ cvmedia1 đã tạo trước đó vào thư viện CVShare để truy cập vào phần chia sẻ. Sau đó, chúng tôi chọn Shared Disk Device và thêm đường dẫn cũng như thư mục backups vào ExaGridshare.

Kế tiếp, chúng tôi tạo Commvault Storage Policy. Cuộn qua thư mục Commvault của máy chủ và cụm để tìm dữ liệu tệp, VMware VMs, và csdl SQL cần backup. Từ tab Storage Policies, chọn CVShare, chọn Properties, và thêm 24 subclients chứa ứng dụng đó.
Tiếp theo, chúng tôi đã thêm thời gian lưu giữ là 90 ngày và cho phép tạo cơ sở dữ liệu chống trùng lặp máy chủ phương tiện để theo dõi kích thước ứng dụng và mức giảm dữ liệu.

 

Từ Properties menu, chúng tôi có thể thêm nội dung cũng như bộ lọc, tác vụ trước và sau xử lý, bảo mật và các thuộc tính khác. Từ menu này, chúng tôi chọn Storage Device/Data Storage Policy và chọn CVShare. Việc chọn chính sách lưu trữ này, chứa thư viện mà chúng tôi đã tạo để ghi vào chia sẻ ExaGrid, chính là yếu tố liên kết tập dữ liệu sao lưu đã chọn của chúng tôi với mục tiêu. Chúng tôi đã tắt tính năng nén và mã hóa trong Commvault vì ExaGrid thực hiện mã hóa cấp ổ đĩa. (Cần nhắc lại rằng ngay sau khi quá trình thử nghiệm này hoàn tất, ExaGrid đã thông báo rằng họ hỗ trợ bật tính năng nén Commvault cùng với tính năng chống trùng lặp Commvault được bật.) Cuối cùng, chúng tôi đã tạo lịch thực hiện sao lưu 12 giờ một lần.
Tại sao điều này lại quan trọng
Khi độ phức tạp của CNTT tăng lên, các tổ chức đang xem xét cẩn thận các giải pháp công nghệ mới. Đổi mới công nghệ tối ưu xem xét nhu cầu về sự đơn giản và dễ sử dụng. Sự phức tạp tạo ra sự kém hiệu quả và chi phí, trong khi sự đơn giản đảm bảo thời gian định giá nhanh hơn.
Nhóm Chiến lược Doanh nghiệp đã xác thực mức độ dễ dàng và nhanh chóng khi thiết lập triển khai ExaGrid/Commvault ban đầu để sao lưu dữ liệu một cách an toàn, sao chép dữ liệu và cung cấp dữ liệu để khôi phục ngay lập tức. Các tác vụ ExaGrid rất đơn giản để hoàn thành bằng GUI trực quan và các tác vụ Commvault quen thuộc với quản trị viên Commvault.

5. Kết luận

Tăng hiệu quả không bao giờ lỗi thời vì những lý do hiển nhiên: Tiết kiệm tiền là mục tiêu kinh doanh quan trọng. Theo khảo sát Technology Spending Intentions mới nhất của Enterprise Strategy Group, hoạt động hiệu quả hơn vẫn là mục tiêu được nhắc đến nhiều nhất trong nỗ lực chuyển đổi kỹ thuật số của các tổ chức, như đã diễn ra trong bốn năm qua.
Ai cũng biết rằng cả ExaGrid và Commvault đều cung cấp các giải pháp sao lưu dễ sử dụng và có thể giúp các tổ chức lưu trữ dữ liệu hiệu quả hơn bằng tính năng chống trùng lặp. Điều có thể ít được biết đến hơn là giải pháp ExaGrid và Commvault kết hợp có thể đạt được khả năng chống trùng lặp thậm chí còn lớn hơn: lên tới 20:1 trong nhiều trường hợp. Việc giảm 20 lần chi phí lưu trữ dự phòng có thể là một sự thúc đẩy đáng kể cho bất kỳ ngân sách nào.
Nhóm Chiến lược Doanh nghiệp đã xác nhận rằng:

  • Giải pháp ExaGrid/Commvault kết hợp đã giảm bộ dữ liệu sao lưu 123 TB bao gồm dữ liệu tệp trong 15 ngày, máy ảo VMware và các bản sao lưu cơ sở dữ liệu SQL xuống còn 8,66 TB, mức giảm 14:1, trong môi trường thử nghiệm thực tế nhưng thận trọng có chủ ý.
  • Triển khai và quản lý giải pháp kết hợp đơn giản, trực quan và nhanh chóng.

Chúng tôi cũng đã xem xét công cụ tính tổng chi phí sở hữu (TCO) ExaGrid cho thấy mức tiết kiệm đáng kể khi sử dụng Commvault và ExaGrid so với Commvault với ổ lưu trữ chính tiêu chuẩn.
Bất kỳ giải pháp nào cũng cần được thử nghiệm và lập kế hoạch phù hợp với nhu cầu và mục tiêu cụ thể của tổ chức. Khi cân nhắc điều này, nếu tổ chức của bạn muốn chi tiêu ít hơn cho bộ nhớ sao lưu mà không làm tăng thêm sự phức tạp cho sơ đồ bảo vệ dữ liệu của mình, Enterprise Strategy Group khuyên bạn nên xem xét kỹ giải pháp ExaGrid và Commvault kết hợp.