Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu

Thứ tư - 04/05/2016 05:00
  • ODS ra mắt trung tâm dữ liệu mới
  • Điện toán đám mây nội địa: Một nửa chặng đường
  • Con đường thành công là con đường đơn giản
  • Hướng doanh nghiệp chuyển sang điện toán đám mây
  • Tier 3 - Chuẩn mực mới cho Data Center

Lời tòa soạn.Với xu hướng công nghệ phát triển và thay đổi nhanh, việc xây dựng và vận hành một hệ thống lưu trữ và xử lý dữ liệu quy mô lớn, hay còn gọi là trung tâm dữ liệu (TTDL - data center) trước sự bùng nổ dữ liệu hiện nay, là việc vô cùng cần thiết trong các tổ chức, doanh nghiệp, và đặc biệt quan trọng đối các tập đoàn lớn hoạt động trong nhiều lĩnh vực.

Chính từ lý do này, nhiều dự án xây dựng TTDL đã và đang được triển khai, vận hành. Với đặc thù riêng, xây dựng TTDL là công việc phức tạp và đòi hỏi chuyên môn rất cao, về cả công nghệ và quy trình, phương pháp triển khai.

Ban biên tập PC World Vietnam chia sẻ bài dịch của kỹ sư Bùi Tuấn Việt, đang làm việc tại Viettel - trong việc xây dựng một TTDL, từ khâu tư vấn, thiết kế, triển khai và nghiệm thu.  

Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu 1

Theo kinh nghiệm của Viện Uptime (tổ chức tư vấn độc lập về xây dựng cơ sở hạ tầng cho doanh nghiệp) qua việc kiểm chứng hơn 550 trung tâm dữ liệu  tại 65 quốc gia, các vấn đề trong việc xây dựng sẽ gây ra hậu quả về trong vận hành khai thác TTDL kém và có các đặc tính sau:

  • Tích hợp kém trong các hệ thống phức tạp.
  • Thiếu thông tin xuyên suốt hay lịch trình thử nghiệm bị co lại.
  • Thiết kế thay đổi.
  • Sự thay thế của vật liệu hay sản phẩm/thiết bị.

Các vấn đề này tăng lên trong suốt quá trình xây dựng, thử nghiệm và thậm chí ngay cả khi đã đưa vào khai thác và có thể ảnh hưởng đến chi phí, tiến độ triển khai và hoạt động CNTT. Các vấn đề về xây dựng thường xảy ra do quy trình quản lý thay đổi kém, các nhóm dự án không có kinh nghiệm, mục tiêu nhắm tới của các thành viên tham gia không giống nhau, hoặc thiếu đánh giá cẩn trọng của bên thứ 3.

Sai sót trong lập kế hoạch, hoạch định ngân sách và giám sát có thể làm cho hệ thống hạ tầng không đạt đươc mong muốn của chủ đầu tư (CĐT), dẫn tới việc phải kéo dài thêm thời gian triển khai hoặc tăng ngân sách để giải quyết vấn đề.

Chỉ định một đại diện của chủ đầu tư

Thông thường, mục tiêu của CĐT khác nhiều so với mục tiêu của nhà xây dựng (NXD). CĐT muốn việc xây dựng TTDL có mức phù hợp về chi phí, thời gian và nhu cầu khai thác thương mại tổng thể, bao gồm cả độ sẵn sàng của hệ thống. NXD thì muốn đạt được mức phù hợp về ngân sách dự án và yêu cầu về tiến độ trong mức dự phòng chi phí của dự án. Độ sẵn sàng của TTDL và mức vận hành khai thác thường nằm ngoài phạm vi của NXD và thẩm định.

Yêu cầu bắt buộc của CĐT là phải nắm quyền kiểm soát nhằm hạn chế khả năng thay đổi của nhà thầu về chi phí nhân công và vật liệu, thiết bị sẵn có, yêu cầu của địa phương, giúp nhà thầu tiết kiệm tiền và xây dựng theo tiến độ nhưng lại không đạt thỏa hiệp về độ sẵn sàng và độ tin cậy của TTDL .

Chủ đầu tư TTDL phải chỉ định một đại diện có kinh nghiệm để kiểm soát, đánh giá nhà thầu về năng lực, kinh nghiệm, khả năng điều hành và truyền thông, tránh rủi ro về việc không đảm bảo chất lượng và thỏa hiệp trong thiết kế.

Trên thực tế, nhà thầu có thể triển khai dự án bằng cách thực hiện các công việc không theo tuần tự. Hậu quả của cách làm này là thường phải thực hiện lại, làm nặng thêm các vấn đề về tiến độ dự án. Ví dụ như việc lấy sai không gian được cấp phát cho các hệ thống khác nên phải sửa lại.

Không nên thỏa hiệp cho phép cắt ngắn thời gian thử nghiệm vì lý do tiến độ chậm trễ. Tiền phạt cho việc chậm trễ trong xây dựng hợp đồng là một giải pháp nên được cân nhắc.

Đánh giá kỹ thuật

Đánh giá kỹ thuật (Value Engineering - VE) thường được CĐT chấp nhận trong xây dựng thực tế để giảm các chi phí khi xây dựng từ một bản thiết kế hoàn chỉnh. Quy trình VE có lợi nhưng lại có xu hướng chỉ tập trung vào các chi phí ban đầu trong xây dựng (CAPEX). Việc thay đổi thường được dẫn ra bởi nhà thầu. Thực tế có nhiều tiếng xấu bởi nhà thiết kế (NTK) thường dẫn tới sự thay đổi nhằm thỏa hiệp với ý định thiết kế. Các nhà thiết kế khác tin rằng với những nhà xây dựng đã được đánh giá tốt thì VE hay thậm chí VE bên trong các TTDL vẫn có thể tiết kiệm lớn cho Chủ đầu tư mà không ảnh hưởng đến độ tin cậy, độ sẵn sàng hay mức vận hành khai thác của hệ thống.

Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu 2
Hình 1: Ví dụ cho 1 thiết kế được cấp chứng chỉ đạt chuẩn Tier 3

Phòng tránh các vấn đề trong xây dựng trung tâm dữ liệu 3
Hình 2: Ví dụ về xây dựng 1 hệ thống đã qua VE. Chú ý chỉ có 1 van giữa các phần tử thay vì 2 van như hình 1.

Nếu VE được thực hiện mà thiếu thông tin từ phía vận hành khai thác và đánh giá thiết kế, thì bất cứ sự thay đổi nào từ VE nhằm tiết kiệm chi phí có thể đi quá xa so với việc khắc phục hậu quả để khôi phục các chức năng cần thiết đạt được “Concurrent Maintainability” hay “Fault Tolerance” và tăng chi phí vận hành khai thác trong suốt vòng đời của TTDL.

Uptime tin rằng Chủ đầu tư TTDL cần phải lo lắng về các thay đổi từ VE mà làm chệch hướng mục tiêu của dự án hay ý định thiết kế. Tiết kiệm chi phí có thể không cần thiết nếu kết quả thay đổi từ VE làm thay đổi đáng kể thiết kế. Do vậy mỗi thay đổi phải được xem xét kỹ lưỡng và đánh giá ảnh hưởng của nó đến thiết kế. Giữ lại kỹ sư thiết kế ban đầu hay kỹ sư dự án có kinh nghiệm về TTDL sẽ làm giảm sự thay đổi không hợp lý trong suốt quá trình triển khai. Nhà thầu có thể thay đổi các thiết bị có giá thành thấp khác về dung lượng, phương thức điều khiển, độ chính xác hay tiêu chuẩn mà không nhận ra ảnh hưởng đến độ tin cậy.

Ví dụ về sự thay đổi của VE sai:

  • Tối thiểu các van ngắt nước cần thiết cho “Concurrent Maintainability”
  • Giảm số lượng ATS (Automatic Transfer Switches) bằng việc tập trung thiết bị trên 1 ATS.
  • Triển khai trên 1 bảng điện có sẵn thay vì 2 bảng điện để phù hợp với “Fault Tolerence”.
  • Tích hợp các hệ thống giám sát năng lượng và đo hiệu quả năng lượng theo 1 cách sẽ không cho phép đạt mức vận hành khai thác “Concurrent Maintainability” hay “Fault Tolerance”.

Ghi chú:
• Tier 3 - Uptime: Concurrent Maintainability.
• Tier 4 – Uptime: Fault Tolerance.
• TTDL của Viettel tại T6 – TTr HLC đang dự kiến lấy chứng chỉ Tier 3 – Uptime về thiết kế và xây dựng.

Đủ thời gian cho vận hành thử nghiệm

Các vướng mắc do chậm trễ trong xây dựng thỉnh thoảng là kết quả việc không đủ thời gian cho quá trình test ở mức 4 và mức 5. Các nhóm xây dựng không có đủ kinh nghiệm rất dễ mắc phải lỗi này.

Không thể nói rằng NXD không đóng góp vào các vấn đề này với kiểu làm việc theo thời hạn chót và thời gian vận hành được dùng như khoảng đệm khi các công việc triển khai trễ hơn dự kiến. Do cả 2 lý do trên nên CĐT và đại diện CĐT phải kiểm soát thời gian biểu một cách chính xác cho thử nghiệm và đảm bảo rằng nhà thầu phải hoàn thành nhanh hơn tiến độ cho thời hạn chót. Đây là việc rất quan trọng.

Hơn nữa, chi phí đầu tư TTDL có thể không phù hợp với các nhóm thiếu kinh nghiệm trong nhiệm vụ ở môi trường khắc nghiệt, phát sinh những yêu cầu làm ảnh hưởng đến ngân sách.

Ví dụ, CĐT và đại diện CĐT phải rà soát các gói thầu xây dựng để đảm bảo có nguồn tiền và thời gian cho:

  • Kiểm tra chứng thực theo điều kiện nhà máy cho các thiết bị quan trọng.
  • Mở rộng thử nghiệm đưa vào khai thác mức 4 và mức 5 kèm theo hỗ trợ từ nhà cung cấp.
  • Thử tải giả lập ở mức đầy tải định mức trong môi trường khắc nghiệt.
  • Thử dầu diesel và đánh giá hệ thống các máy phát điện.

Các ví dụ về lỗi trong xây dựng TTDL

Các lỗi nghiêm trọng có thể xảy ra bất cứ lúc nào trong quá trình xây dựng, bao gồm cả quá trình đấu thầu. Ví dụ, chủ đầu tư cố gắng giảm chi phí tốt đa cho UPS nhưng lại không thành công trong việc đặt hàng thanh dẫn và các phần tử khác kết nối đến UPS.

Một ví dụ khác: cân nhắc việc một nhà cung cấp trúng thầu dựa trên chi phí vận chuyển máy phát điện đã lắp đặt hoàn thiện xa hơn 800 dặm (1.287,5km). Khi nhà cung cấp đe dọa không hỗ trợ bảo hành sản phẩm, nhà thầu đã buộc phải thêm 1 khoản chi phí đáng kể để vận chuyển máy phát điện theo cách thông thường. Trong trường hợp này, chủ đầu tư có thể phải khôn khéo theo dõi chặt chẽ khi nhà thầu cố gắng bù lại chi phí bằng thay đổi thiết kế hoặc các thiết bị quan trọng khác.

Trong trường hợp khác, một nhà thầu ở Mỹ La-tinh đã không muốn làm theo điều khoản của hợp đồng. Nhà thầu đã thực hiện thay đổi không được sự phê chuẩn chính thức nhưng lại được phê duyệt bởi kỹ sư địa phương. Cho đến khi một kỹ sư dự án có kinh nghiệm được thuê bởi CĐT chỉ ra sự khác nhau thì mới đấu tranh bắt nhà thầu thực hiện sửa lỗi.

Trong việc này, kỹ sư dự án đã không biết nhượng bộ nhà thầu, nhưng do thiếu kinh nghiệm anh ta đã đệ trình gói thầu có mức ứng dụng thực tế thấp tại địa phương.

Phòng tránh các vấn đề trong xây dựng

Một khi thiết kế đã được quyết định và phù hợp với yêu cầu cho dự án của chủ đầu tư, các quy trình điều khiển thay đổi (change control processes) là cần thiết nhằm quản lý hiệu quả và giảm rủi ro trong quá trình xây dựng. Do nhiều nguyên nhân, nhiều NXD, và thậm chí chủ đầu tư, có thể không quen với điều khiển quy trình thay đổi quan trọng (important change process control) khi nó liên quan tới dự án TTDL. Không có dự án nào hoàn toàn không có lỗi; tuy nhiên quy trình và tài liệu tốt sẽ giảm số lượng lỗi nghiêm trọng và có mắc lỗi thì cũng dễ dàng xử lý hơn. Uptime khuyến nghị bất cứ dự án TTDL cũng cần làm các bước sau để tránh xảy ra lỗi và các vấn đề phát sinh trong quá trình xây dựng.

Tập hợp nhóm thiết kế, xây dựng, và quản lý dự án có kinh nghiệm về TTDL. Nếu cần, hãy thuê chuyên gia bên ngoài vào làm để tập trung vào yêu cầu cho dự án của chủ đầu tư. Hãy nhớ rằng nhóm CNTT có thể không hiểu rủi ro về tiến độ thời gian hay tính phức tạp của dự án. Các nhóm có kinh nghiệm có thể sẽ lùi tiến độ kế hoạch thời gian hay đề nghị VE không phù hợp với yêu cầu cho dự án, nhưng điều này tránh rủi ro và đảm bảo cho khả năng khai thác sau này, có có lợi cho chủ đầu tư. Chi phí ban đầu có thể cao hơn nhưng các sẽ mang lại hiệu quả thu hồi vốn (ROI- Return of Investment) cao hơn.

Do các nhóm có kinh nghiệm hiểu được sự quan trọng của Cx (commissioning agency) riêng biệt, nhân viên thử nghiệm đưa vào sử dụng sẽ làm việc có hiệu quả hơn rất sớm trong quy trình, cài đặt trạng thái để chuyển giao cho khai thác. Các yêu cầu về Cx và tập trung trên chức năng sẽ rõ ràng ngay lúc ban đầu.

Thêm nữa, nhóm khai thác nên tham gia cùng nhóm thiết kế và xây dựng TTDL ngay khi bắt đầu dự án. Đưa cả khai thác vào quản lý thay đổi (change management) sẽ giúp họ cơ hội chia sẻ thông tin, học được cách TTDL sẽ vận hành như thế nào, các điểm cần đặt ra chính yếu, luân chuyển thiết bị, quản lý thay đổi, đào tạo, và quản lý thiết bị/vật tư dự phòng – đây là nhu cầu cần thiết hằng ngày cho khai thác và xử lý khi có sự cố.

Cuối cùng, nhà cung cấp nên có nhân sự trong nhóm xây dựng TTDL, nhưng hầu như chỉ trên định nghĩa giấy tờ vì các mối quan tâm của họ và của chủ đầu tư sẽ không cùng 1 hướng.

Kết hợp nhóm kinh nghiệm chỉ mang lại lợi ích khi họ làm việc như một nhóm. Chủ đầu tư và đại diện CĐT có thể khuyến khích sự phối hợp giữa các thành viên trong nhóm có các mối quan tâm khác nhau, đóng góp ý kiến với NTK, kỹ thuật dự án, và NXD để đạt mức tối ưu cho dự án. Nhiều chuyên gia về TTDL thấy rằng quy trình thiết kế - xây dựng hay thiết kế - thầu – xây dựng sử dụng giá an toàn tối đa (GMP – Guaranteed Maximum Price) và chia sẻ chi phí tiết kiệm của hợp đồng được dùng để phát triển một nhóm chuyên môn khi như mong muốn.

Đánh giá của đơn vị thứ 3 có thể đảm bảo với CĐT là dự án được chuyển giao đúng với yêu cầu. Uptime có bằng chứng việc đánh giá của đơn vị thứ 3 sẽ đảm bảo khả năng làm việc của nhà thầu tốt hơn,có lẽ bởi việc đánh giá tăng khả năng tìm thấy các điểm thiếu hay bị cắt bỏ và sửa đổi cho chi phí của nhà thầu. Uptime không cho rằng tất cả nhà thầu đều tham gia vào từng công việc nhưng xét về logic thì việc đánh giá này có thể làm các nhà thầu chú ý hơn về “thông dịch ngôn ngữ hợp đồng” và làm những thay đổi mà những kỹ sư dự án không có kinh nghiệm và đại diện nhà thầu không phát hiện ra.

Chứng nhận và kiểm tra chỉ hiệu quả khi không có thiên vị, từ một đơn vị không liên quan đến nhà thầu. Nhiều chứng nhận trên thương trường không đạt được yêu cầu này. Một vài quy trình chứng nhận và kiểm tra chỉ có giá trị hơn một chút so với con dấu đóng đã kiểm tra chất lượng. Những cái còn lại chỉ là kiểu kiểm tra danh mục mà không có thực nghiệm kiểm tra lỗi.

Ví dụ như nhân viên thử nghiệm cần hoạt động độc lập và không phải là NTK hay kỹ sư dự án. Hơn nữa nhóm Cx nên có kinh nghiệm nhiều về TTDL. Nhân viên thử nghiệm nên tập trung vào thiết kế và lắp đặt theo như dự án, chỉ nên chuyên sâu đúng mức vào chức năng kiểm tra và chứng nhận. Cũng nên lưu ý rằng, nếu lỗi trong quá trình thử nghiệm không được chỉ ra và định rõ, nó sẽ có khả năng lặp lại trong quá trình khai thác.

Kiểm tra và chứng nhận của đơn vị thứ 3 được đánh giá ngang hàng về thay đổi thiết kế và VE.

Lấy chứng nhận Tier sai thời gian để tìm ra lỗi

Theo Uptime, quy trình lấy chứng chỉ Tier không phải là thời gian phù hợp để tìm ra lỗi trong thiết kế và xây dựng hay tìm ra hạ tầng không đạt “Concurrently Maintainable” hay “Fault Tolerant”. Thực tế đã cảnh báo rằng trong quy trình lấy chứng chỉ Tier, việc sửa lỗi là tốn chi phí nhất.

Trong vấn đề này, số lượng lỗi được phát hiện trong quá trình thử nghiệm và chứng nhận Tier chỉ ra được giá trị của việc đánh giá của bên thứ 3 về thiết kế và xây dựng hạ tầng. Bằng việc tìm ra các vấn đề, đánh giá của bên thứ 3 cứu cho công ty những sự cố tiềm tàng.

Hơn nữa, Uptime tin rằng quy trình xây dựng được tổ chức tốt, bao gồm thử nghiệm đưa vào khai thác mức 4 và mức 5 độc lập và chứng nhận Tier, kiểm tra và tìm lỗi ở mức sớm nhất có thể và tối thiểu việc nhà thầu giải trình hay tối thiểu nhu cầu cho việc sửa lỗi khi xây dựng lệch so với thiết kế ban đầu.

Bùi Tuấn Việt – ATD – Uptime – SE – VTNet
tuanviet.bui@gmail.com
Lược dịch theo tạp chí Uptime Institue Volume 5: Design and Technology 

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Thống kê
  • Đang truy cập34
  • Máy chủ tìm kiếm4
  • Khách viếng thăm30
  • Hôm nay2,242
  • Tháng hiện tại88,121
  • Tổng lượt truy cập4,831,252
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây