Cloudflare ngừng hoạt động - Gần một nửa trang web trên thế giới bị sập
01-11-2022
Ngày 21 tháng 6 năm 2022, Cloudflare xác nhận ngừng hoạt động tạm thời ảnh hưởng đến 19 điểm truy cập dữ liệu trên toàn thế giới. Nguyên nhân của sự cố này được xác định là nằm trong kế hoạch của dự án tăng khả năng phục hồi cấu hình mạng tại những vị trí có người sử dụng đông đảo nhất.
Cùng Ứng Dụng Việt tìm hiểu kỹ hơn về sự cố lần này để có hướng khắc phục vấn đề mạng cho những tình huống tiếp theo.
Sự cố Cloudflare gây ảnh hưởng đến các website trên thế giới
1. Cách hoạt động của sự cố Cloudflare
Sự cố Cloudflare là một phần cải tiến hệ thống nhằm tiêu chuẩn hóa cơ sở hạ tầng trở thành phiên bản tốt hơn so với phiên bản cũ. Dưới đây là những thay đổi và ảnh hưởng của nó:
Thông tin bổ sung trong sự cố Cloudflare
Điều này không ảnh hưởng đến quá trình hoạt động của các điểm truy cập vì đây chỉ là những thông tin bổ sung vào phần quảng cáo.
Sự khác biệt trong sự cố Cloudflare
Ở định dạng khác biệt này, dấu chấm than phía trước các điều khoản cho biết sự sắp xếp lại các điều khoản. Trong trường hợp này, nhiều cụm từ được chuyển lên và hai cụm từ được thêm vào dưới cùng. Cụ thể, các điều khoản 4-ADV-SITE-LOCALS và 6-ADV-SITE-LOCALS đã di chuyển từ trên xuống dưới. Các thuật ngữ này hiện đứng sau thuật ngữ TỪ CHỐI-THE-REST và như có thể rõ ràng từ tên gọi, thuật ngữ này là một từ chối rõ ràng.
Vì thuật ngữ này hiện có trước các điều khoản khác, Cloudflare đã ngay lập tức ngừng quảng cáo tiền tố địa phương của trang web, xóa quyền truy cập trực tiếp của Cloudflare vào tất cả các vị trí bị ảnh hưởng, cũng như loại bỏ khả năng máy chủ của Cloudflare tiếp cận máy chủ gốc.
Ngoài việc không thể liên hệ với nguồn gốc, việc xóa các tiền tố site-local này cũng khiến hệ thống cân bằng tải nội bộ của Cloudflare có tên gọi Multimog (một biến thể của bộ cân bằng tải Unimog) ngừng hoạt động, vì nó không còn có thể chuyển tiếp yêu cầu giữa các máy chủ trong MCP. Điều này có nghĩa là các cụm máy tính nhỏ hơn trong MCP nhận được cùng một lượng lưu lượng truy cập như các cụm lớn nhất của Cloudflare khiến các cụm nhỏ hơn bị quá tải.
2. Cách khắc phục lỗi Cloudflare
Quy trình: Mặc dù chương trình MCP được thiết kế để cải thiện tính khả dụng, nhưng lỗ hổng về thủ tục trong cách cập nhật các trung tâm dữ liệu này cuối cùng đã gây ra tác động rộng rãi hơn ở các địa điểm MCP cụ thể. Mặc dù Cloudflare đã sử dụng quy trình ngăn chặn cho thay đổi này, nhưng chính sách ngăn chặn không bao gồm trung tâm dữ liệu MCP cho đến bước cuối cùng. Các thủ tục thay đổi và tự động hóa cần phải bao gồm các thủ tục thử nghiệm MCP cụ thể và triển khai để đảm bảo không có hậu quả ngoài ý muốn.
Kiến trúc: Cấu hình bộ định tuyến không chính xác đã ngăn không cho thông báo các tuyến đường thích hợp, ngăn lưu lượng truy cập vào cơ sở hạ tầng của Cloudflare một cách chính xác. Cuối cùng, tuyên bố chính sách gây ra quảng cáo định tuyến không chính xác sẽ được thiết kế lại để ngăn chặn việc đặt hàng không chính xác không cố ý.
Hệ thống được thực hiện theo quy trình để cải tiến Cloudflare
Tự động hóa: Có một số cơ hội trong bộ tự động hóa của chúng tôi có thể giảm thiểu một số hoặc tất cả tác động thấy được từ sự kiện này. Trước hết, chúng tôi sẽ tập trung vào các cải tiến tự động hóa nhằm thực thi chính sách trì trệ được cải thiện để triển khai cấu hình mạng và cung cấp quá trình hoàn trả tự động “xác nhận cam kết”. Cải tiến trước đây sẽ làm giảm đáng kể tác động tổng thể và cải tiến sau sẽ giảm đáng kể Thời gian giải quyết trong sự cố.
Cloudflare là dịch vụ DNS trung gian, giúp điều phối lượng truy cập giữa máy chủ và các client qua lớp bảo vệ của Cloudflare. Vì thế mà mọi thay đổi Cloudflare đều ảnh hưởng lớn đến các website. Ứng Dụng Việt cung cấp những tin tức mới về công nghệ, theo dõi Ứng Dụng Việt để cập nhật nhanh chóng và đưa ra giải pháp cho doanh nghiệp của bạn. Đồng thời Ứng Dụng Việt cũng là nơi cung cấp tên miền hàng đầu Việt Nam.