Nó bắt đầu vào một buổi tối thứ bảy với vợ tôi hỏi tại sao DVR của chúng tôi đột nhiên ngừng phát một chương trình mà cô ấy đang xem. Tôi nói với cô ấy có lẽ chỉ là một trục trặc, nhưng tôi sẽ xem xét. Tôi đi vào phòng gia đình để xem, và về cơ bản lỗi đã nói rằng đĩa bên dưới không còn nữa. Không tốt! Đây là khởi đầu của câu chuyện kinh dị kéo dài ba ngày của tôi
Một chút nền tảng
DVR của tôi thực sự chỉ là phần mềm chuyên dụng (SageTV dành cho những người tò mò) chạy trên PC. Phần mềm này rất linh hoạt và cho phép bạn tách biệt tất cả các khía cạnh khác nhau của nó. Tôi có một máy riêng để điều khiển tập trung, lập lịch và ghi âm, các máy riêng biệt để phát lại và ngôi sao của câu chuyện này, một máy riêng để lưu trữ. Để lưu trữ, tôi sử dụng máy chủ tệp Linux, sử dụng LVM (Trình quản lý khối tin hợp lý) để tổng hợp nhiều ổ đĩa không đồng nhất, riêng biệt thành một ổ đĩa logic lớn (~ 6TB hiện tại) mà hệ điều hành nhìn thấy. Vì việc sao lưu nhiều TB dữ liệu là không thực tế và vì dữ liệu được nói là các chương trình truyền hình chỉ là trên truyền hình trực tuyến, nên triết lý sao lưu của tôi cho việc này luôn luôn là không quan tâm. Cho đến những sự kiện gần đây, triết lý này đã không được thử nghiệm bởi một sự kiện trong thế giới thực.
Đang cố gắng khôi phục dữ liệu
Khi thấy lỗi trên DVR, tôi lập tức bắt đầu nhìn vào máy chủ lưu trữ. Hệ thống tập tin rất chậm chạp và phản hồi chậm, vì vậy tôi truy vấn LVM về trạng thái của các ổ đĩa vật lý nằm dưới khối lượng logic của nó. Sau một thời gian trì hoãn, nó xuất hiện và nói rằng ổ đĩa 750 GB bị thiếu. Ừ-ôi! Tôi khởi động lại máy chủ và thật ngạc nhiên, ổ đĩa quay trở lại. Tôi đưa ra lệnh pvmove để tự động di chuyển tất cả dữ liệu ra khỏi ổ đĩa đó, nhưng nó đã thất bại khi chưa hoàn thành dưới 2%.
Đối mặt với một ổ đĩa rất không hợp tác trong việc đọc dữ liệu của nó, nhưng ít nhất hiển thị trong BIOS, tôi chuyển sang công cụ khôi phục ổ đĩa yêu thích của mình, Spinrite. Mặc dù Spinrite thường khởi động từ phương tiện di động, nhiều năm trước tôi đã thiết lập khả năng khởi động mạng tại nhà cho các tiện ích khác nhau vì vậy tôi không phải lo lắng về việc theo dõi bất kỳ phương tiện nào. Thông thường tôi chỉ kết nối với mạng của mình, chọn khởi động từ mạng và tôi có nhiều công cụ theo ý mình để khắc phục nhiều sự cố. Vấn đề là cỗ máy làm cho tất cả các phép thuật này hoạt động giống như cái máy hiện đang ngừng hoạt động. Tôi nói không có gì to tát, tôi sẽ chỉ khởi động từ đĩa CD Spinrite. Ngoại trừ một vài năm trước, ổ đĩa quang trên máy chủ tệp của tôi đã từ bỏ bóng ma. Vào thời điểm đó, tôi đã quyết định vì tôi không bao giờ sử dụng phương tiện quang học trong máy đó, tôi không cần phải thay thế nó. Đừng lo lắng, tôi tự nhủ, tôi sẽ lấy ổ đĩa quang ra khỏi máy tính chính của mình. Tôi tắt máy tính chính của mình và rút ổ đĩa quang. Sau đó, tôi tìm CD khởi động Spinrite của mình. Không thể tìm thấy nó! Chúng tôi đã chuyển đến một ngôi nhà mới vài tháng trước, vì vậy mọi thứ đang trong tình trạng hỗn loạn. Tôi nghĩ rằng tôi sẽ ghi một bản sao mới, nhưng tôi thậm chí không thể tìm thấy bất kỳ phương tiện quang học trống nào! Lên kế hoạch tiếp theo, một ổ đĩa flash có thể khởi động! Sau vài phút trên Google để làm mới bộ nhớ của tôi, tôi có một ổ đĩa flash Spinrite có khả năng khởi động. Tôi khởi động hộp Linux của mình và khởi chạy Spinrite. Máy tính đóng băng và dường như bị sập. Tìm cách loại bỏ các biến, tôi chuyển ổ đĩa xấu từ cắm vào thẻ mở rộng PCI-e sang cắm trực tiếp vào bo mạch chủ. Bây giờ Spinrite khởi chạy tốt, nhưng mất nhiều thời gian và độ tuổi để liệt kê các ổ đĩa được kết nối với nó. Tôi rút phích cắm một cách có hệ thống tất cả các ổ đĩa khác ngoại trừ ổ đĩa xấu, nhưng nó không bao giờ hoàn thành việc liệt kê các ổ đĩa cho dù tôi có đợi bao lâu. Lên kế hoạch tiếp theo! Tôi lấy ổ đĩa ra khỏi hộp Linux của mình, kết nối nó với máy tính chính của tôi và khởi động từ ổ flash Spinrite mới sáng bóng của tôi. Spinrite khởi chạy và thấy ổ đĩa ngay lập tức, và tôi bảo nó bắt đầu khôi phục dữ liệu, hài lòng rằng cuối cùng tôi cũng đạt được một số tiến bộ. Tôi quay lại để kiểm tra nó sau khoảng 10 phút, và có một lỗi trên màn hình, và có vẻ như ổ đĩa đã một lần nữa biến mất. Thất vọng, tôi thử thêm một vài lần nữa và bảo Spinrite bắt đầu ở nhiều phần khác nhau của ổ đĩa, nhưng nhận được kết quả giống nhau mỗi lần. Dường như điều này sẽ không giúp tôi sau tất cả.
Trong một hy vọng phi lý, tôi đặt ổ đĩa trở lại vào hộp Linux của mình và cấp nguồn cho nó. Trước sự ngạc nhiên của tôi, ổ đĩa xuất hiện và LVM mang mọi thứ hoạt động. Tiếp tục thử vận may của mình, tôi đưa ra một lệnh pvmove khác để cố gắng di chuyển dữ liệu khỏi ổ đĩa một lần nữa. Ban đầu, tôi thấy các thông báo lỗi về việc không thể đọc từ ổ đĩa, nhưng thật đáng ngạc nhiên, pvmove tiếp tục đạt được tiến bộ, ngày càng gần hơn và hoàn thành 100%. Một hỗn hợp của sự nhầm lẫn, nhẹ nhõm, và phấn khích rửa qua tôi. Tôi sẽ thoát khỏi sự vô tình này? Đáng buồn thay, điều cuối cùng LVM thực hiện dưới vỏ bọc để hoàn thành sạch pvmove là viết nhật ký cập nhật cho tất cả các ổ đĩa dưới sự kiểm soát của nó. Điều này tất nhiên thất bại khi nó cố ghi vào ổ đĩa xấu, và do đó nó hủy bỏ toàn bộ quá trình. Thất bại chộp lấy từ hàm chiến thắng một lần nữa! Tôi quay trở lại Google và phát hiện ra có thể kiểm soát lượng dữ liệu lệnh pvmove di chuyển thay vì di chuyển TẤT CẢ dữ liệu trong một lần chụp. Tôi thử nghiệm điều này và đã thành công khi chuyển một phần nhỏ dữ liệu của mình tại một thời điểm. Tôi trở nên tham lam và ổ đĩa biến mất một vài lần, nhưng luôn quay trở lại sau một chu kỳ điện của máy tính. Giả thuyết rằng có lẽ chỉ một số phần nhất định của ổ đĩa là xấu, tôi bắt đầu nhảy xung quanh thay vì làm việc ở đầu ổ đĩa. Sau một vài lần lặp lại điều này, tôi có tất cả trừ 40 GB trong số 750 GB được di chuyển khỏi ổ một cách an toàn. Đối với 40 GB còn lại, nó không di chuyển cho dù tôi có cố gắng gì. Bây giờ là tối chủ nhật và tôi đã kiệt sức, vì vậy tôi quyết định đi ngủ và giải quyết vấn đề này nhiều hơn vào ngày hôm sau.
Ngày hôm sau, sau một vài giấc ngủ và nửa ngày đầu tiên của tôi tại nơi làm việc, tôi quyết định chỉ cắn viên đạn vì tôi không quan tâm đến 40 GB chương trình truyền hình được ghi lại gần đây và bắt đầu xóa ổ đĩa khỏi cấu hình LVM của tôi . Tôi đã làm điều này nhiều lần trước đây, vì vậy nó diễn ra khá suôn sẻ. Tiếp theo trong danh sách dọn dẹp là sửa chữa lỗ hổng ở giữa hệ thống tập tin. Tôi chỉ có 40 GB thay vì 750 GB bị thiếu, điều đó không quá tệ, phải không? Sai lầm! Sau khi sửa chữa, tôi có thêm 900 GB dung lượng trống so với trước khi bắt đầu thử thách, do đó, điều đó gây choáng khá nhiều. Ồ, tôi tự nhủ, dù sao nó cũng chỉ là TV. DVR của tôi cuối cùng đã hoạt động trở lại sau ba ngày gián đoạn và cuối cùng tôi có thể ngừng suy nghĩ về điều này với mỗi chu kỳ não dự phòng.
Bài học kinh nghiệm
Vậy tôi đã học được gì từ tất cả những điều này? Tôi nên làm một công việc tốt hơn về những gì thực sự quan trọng. Điều này đã xảy ra vài tuần trước và trong thời gian đó tôi thậm chí không bỏ lỡ bất kỳ nội dung TV nào đã biến mất. Tuy nhiên, tôi rất hối hận vì đã ngăn cản bản thân mình, nhưng quan trọng hơn là gia đình tôi đã không thể sử dụng TV trong ba ngày và để bản thân rơi vào tình trạng khủng hoảng căng thẳng cao độ trong ba ngày đó. Nếu tôi đã từ bỏ việc khôi phục dữ liệu của mình ngay từ đầu, chức năng sẽ được khôi phục sau khoảng một giờ chứ không phải ba ngày. Tôi biết rất rõ rằng hầu hết thời gian dữ liệu của chúng tôi là quý giá, nhưng trong tình huống này thì không.
Thứ hai, nếu dữ liệu của bạn thực sự quý giá, và 99% thời gian thực sự là như vậy, bạn cần phải bảo vệ nó! Sao lưu dữ liệu của bạn, không có lời bào chữa. Đối với dữ liệu của tôi không thể thay thế, như hàng ngàn bức ảnh của con trai tôi có trên máy tính của mình, tôi đảm bảo sao lưu nó không dưới ba nơi, một trong số đó là nhà cung cấp sao lưu đám mây. Đối với bộ lưu trữ DVR, tôi vẫn không nghĩ rằng việc sao lưu lên đám mây là điều thiết thực, nhưng với giá của các ổ đĩa ngày nay, tôi không có lý do gì để không bảo vệ nó bởi RAID và đó chỉ là những gì tôi sẽ làm. Khi tôi lần đầu tiên thiết lập cụm lưu trữ của mình cách đây nhiều năm, tôi nghĩ rằng tôi đã mất 10 ổ đĩa trở lên để có được một nhóm nhiều TB. Tôi vừa kiểm tra giá và bạn có thể mua ổ 3 TB ngay bây giờ với giá dưới 100 đô la. Tôi chỉ đơn giản là không có lý do gì để dữ liệu của mình không được bảo vệ và nếu việc mất dữ liệu như thế này xảy ra với tôi một lần nữa, đó thực sự là lỗi của tôi.






