Sự cố này là một lời nhắc nhở chúng ta rằng ngay cả những hệ thống phức tạp và được thiết kế cẩn thận nhất như Google cũng có thể sụp đổ vì những lỗi rất cơ bản.
Vào lúc 10 giờ 45 phút sáng ngày 12 tháng 6 năm 2025, theo giờ Thái Bình Dương, hàng loạt nền tảng internet nổi tiếng trên thế giới như Google, Spotify, Discord và Cloudflare cùng nhiều dịch vụ internet khác dừng hoạt động trên diện rộng. Không lâu sau đó, nguyên nhân của sự cố này được xác định là do Google Cloud. Đây được xem như một trong những sự cố nghiêm trọng nhất trong lịch sử hoạt động của nền tảng này cũng như ảnh hưởng đến hàng chục triệu người dùng trên toàn cầu.
Điều đáng chú ý nhất về sự cố này không phải quy mô thiệt hại mà chính là nguyên nhân gây ra nó – một lỗi lập trình cơ bản mà bất kỳ sinh viên khoa học máy tính năm nhất nào cũng được dạy cách tránh. Câu chuyện này cho thấy như thế nào một sai lầm nhỏ có thể lan truyền và gây ra hậu quả khôn lường trong thế giới công nghệ hiện đại.

Vào ngày 12-6 vừa qua, hàng loạt dịch vụ internet gặp sự cố dừng hoạt động
Chuỗi sai lầm nối tiếp sai lầm
Để hiểu rõ sự cố, trước tiên cần nắm được vai trò của hệ thống Service Control trong cơ sở hạ tầng Google Cloud. Service Control đóng vai trò như một cổng kiểm soát trung tâm, xử lý tất cả các yêu cầu API gửi đến Google Cloud. Hệ thống này chịu trách nhiệm xác thực người dùng, kiểm tra hạn ngạch sử dụng, thực thi các chính sách bảo mật và ghi lại thông tin để tính phí. Có thể nói, Service Control là “tim” của toàn bộ nền tảng Google Cloud.
Chuỗi sự kiện dẫn đến thảm họa bắt đầu từ ngày 29 tháng 5 năm 2025, khi đội ngũ kỹ sư Google triển khai một tính năng mới cho Service Control. Tính năng này được thiết kế để cung cấp khả năng kiểm soát hạn ngạch chi tiết hơn, nhằm đáp ứng nhu cầu ngày càng phức tạp của khách hàng doanh nghiệp.
Tuy nhiên, việc triển khai này đã mắc phải một sai lầm nghiêm trọng trong quy trình phát triển phần mềm. Các kỹ sư đã triển khai tính năng mới mà không sử dụng “feature flag” – một cơ chế cho phép bật hoặc tắt tính năng mới một cách nhanh chóng trong trường hợp khẩn cấp. Điều này có nghĩa là một khi tính năng được triển khai, nó sẽ hoạt động trên toàn bộ hệ thống mà không có cách nào để vô hiệu hóa ngay lập tức.

Service Control, trung tâm trong hệ thống kiểm soát API của Google
Tệ hơn nữa, tính năng mới này chứa một lỗi null pointer – một trong những lỗi cơ bản nhất trong lập trình. Lỗi null pointer xảy ra khi chương trình cố gắng truy cập vào một vùng nhớ không tồn tại hoặc chưa được khởi tạo. Trong trường hợp này, lỗi chỉ xuất hiện khi hệ thống gặp phải một loại dữ liệu cụ thể mà trong quá trình kiểm thử không được mô phỏng.
Hai tuần sau khi triển khai tính năng có lỗi, vào ngày 12 tháng 6, một sự kiện tưởng chừng như vô hại đã kích hoạt thảm họa. Một nhân viên Google đã tải lên một bản cập nhật chính sách vào cơ sở dữ liệu Spanner của công ty. Bản cập nhật này chứa một số trường dữ liệu trống – điều hoàn toàn bình thường trong vận hành hàng ngày và thường được hệ thống xử lý mà không gặp vấn đề gì.
Khi Service Control đọc dữ liệu chính sách có chứa các trường trống này, tính năng mới được kích hoạt và lập tức gặp phải lỗi null pointer. Kết quả là toàn bộ Service Control binary bị crash, khiến hệ thống không thể xử lý bất kỳ yêu cầu API nào.
Tình huống trở nên tồi tệ hơn do cách thức hoạt động của cơ sở dữ liệu Spanner. Spanner được thiết kế để tự động sao chép dữ liệu ra tất cả các khu vực trên toàn cầu nhằm đảm bảo tính nhất quán và sẵn sàng cao. Trong trường hợp này, dữ liệu chính sách có vấn đề đã được lan truyền đến mọi trung tâm dữ liệu của Google trên khắp thế giới chỉ trong vài giây. Kết quả là các phiên bản Service Control tại mọi khu vực đều lần lượt bị crash khi cố gắng xử lý dữ liệu độc hại này.

Từ một lỗi null pointer sơ đẳng, cả hệ thống của Google và các đối tác đã gặp sự cố theo dây chuyền domino
Hậu quả trầm trọng của sự cố
Tác động của sự cố lan rộng nhanh chóng ra ngoài hệ sinh thái Google. Vì nhiều dịch vụ và ứng dụng của bên thứ ba dựa vào Google Cloud để vận hành, chúng cũng bị ảnh hưởng nghiêm trọng. Trong số các dịch vụ bị gián đoạn đáng kể nhất có Cloudflare – một công ty chuyên cung cấp dịch vụ bảo mật và tăng tốc website, nổi tiếng với độ tin cậy cao.
Sự cố cũng ảnh hưởng đến hàng loạt ứng dụng phổ biến mà hàng triệu người dùng sử dụng hàng ngày. Spotify gặp khó khăn trong việc phát nhạc, Discord không thể duy trì kết nối giữa các cộng đồng người dùng, Snapchat gián đoạn dịch vụ chia sẻ ảnh, và thậm chí ChatGPT của OpenAI cũng ngừng hoạt động trong một thời gian. Một phần dịch vụ của Amazon Web Services cũng bị ảnh hưởng do sự phụ thuộc lẫn nhau giữa các nhà cung cấp dịch vụ đám mây.
Đội ngũ Site Reliability Engineering (SRE) của Google đã phản ứng khá nhanh chóng. Chỉ trong vòng 2 phút sau khi phát hiện sự cố, họ đã xác định được nguyên nhân và bắt đầu triển khai giải pháp khắc phục. Google đã kích hoạt cơ chế “kill switch” để vô hiệu hóa đường dẫn code có vấn đề sau mười phút kể từ khi sự cố được phát hiện.

Quá trình phục hồi diễn ra khá thuận lợi ở hầu hết các khu vực. Trong vòng 40 phút, đa số các dịch vụ đã trở lại hoạt động bình thường. Tuy nhiên, khu vực us-central1 (Iowa) gặp phải vấn đề phức tạp hơn. Khi tất cả các phiên bản Service Control trong khu vực này cùng lúc cố gắng khởi động lại, chúng đã tạo ra một lượng tải quá lớn lên cơ sở dữ liệu backend. Hiện tượng này, được gọi là “herd effect”, đã khiến việc phục hồi tại khu vực này kéo dài gần 3 giờ đồng hồ.
Một khía cạnh đáng chú ý khác của sự cố là vấn đề giao tiếp với khách hàng. Google không thể cập nhật thông tin về tình trạng dịch vụ cho người dùng vì chính bảng điều khiển trạng thái của họ cũng được lưu trữ trên cùng cơ sở hạ tầng bị sự cố. Điều này khiến khách hàng phải dựa vào các nguồn thông tin bên ngoài như DownDetector và mạng xã hội để hiểu tình hình.
Sau sự cố, Google đã công bố báo cáo phân tích chi tiết và cam kết thực hiện một số biện pháp khắc phục. Công ty hứa sẽ cải thiện khả năng xử lý dữ liệu không hợp lệ của hệ thống API management, triển khai các biện pháp bảo vệ để ngăn chặn việc sao chép dữ liệu có vấn đề ra toàn cầu mà không qua kiểm tra, và mở rộng quy trình kiểm thử để phát hiện sớm các trường hợp dữ liệu bất thường.
Sự cố đã làm nổi bật xu hướng tập trung hóa ngày càng gia tăng trong ngành công nghệ. Khi nhiều dịch vụ cùng phụ thuộc vào một số ít nhà cung cấp hạ tầng lớn, một sự cố tại một điểm có thể gây ra hiệu ứng domino trên quy mô toàn cầu. Điều này đặt ra câu hỏi về tính đa dạng và phân tán trong thiết kế hệ thống công nghệ hiện đại.
Mặc dù Google đã xử lý sự cố một cách chuyên nghiệp và nhanh chóng, nhưng sự kiện này nhắc nhở chúng ta rằng ngay cả những hệ thống phức tạp và được thiết kế cẩn thận nhất cũng có thể thất bại vì những lỗi rất cơ bản. Trong thời đại mà cuộc sống số ngày càng phụ thuộc vào các dịch vụ đám mây, việc xây dựng các biện pháp dự phòng và quy trình xử lý sự cố hiệu quả trở nên quan trọng hơn bao giờ hết.
Theo
Đời sống Pháp luật
Copy link
Lấy link
Thời Sự
Hà Nội yêu cầu công an xác minh vụ đốt tài liệu có dấu đỏ cạnh trụ sở phường
Th6
Video
Trailer: ⚔️Wield Your Blade | 狐妖小红娘王权篇 Fox Spirit Matchmaker: Sword and Beloved | iQIYI | Stay tuned
Th6
Video
Thư Quyển Nhất Mộng Tập 1 Thuyết minh
Th6
Video
Dễ làm mà sần sật ngất ngây với BÊ CUỘN KHÌA NƯỚC DỪA | MÓN NGON MỖI NGÀY
Th6
Video
KHE RỖ & ĐỒNG CAO địa điểm nổi tiếng tỉnh Bắc Giang I Lạc Đường vlog
Th6
Video
Bất ngờ với em Thơm | Nhịp Sống Tây Bắc
Th6
Thời Sự
Quốc hội: Tập trung nâng cao hiệu quả công tác quản lý nhà nước
Th6
Thời Sự
Giám đốc Công an Hà Nội thông tin về tài liệu bị đốt cạnh UBND phường Cổ Nhuế 2
Th6
Video
सबसे बढ़िया DJ मिक्सर | nexus 4 dj mixer | aerons india dj mixer
Th6
Video
Nhạc Thiếu Nhi – Hoạt Hình Động Vật Sôi Động, Nhạc Con Chuột, Con Vịt Nâu, Chuột Trộm Bánh Mì
Th6
Video
Dẻo thơm, không hề khó XÔI CẨM THỊT CUA | MÓN NGON MỖI NGÀY
Th6
Video
TRẢI NGHIỆM VỚI BÊ QUAY TẠI TP BUÔN MA THUỘT CÙNG LẠC ĐƯỜNG VLOG
Th6
Video
MÓN ĂN ĐỘC LẠ ÍT NƠI BIẾT ĂN | Nhịp Sống Tây Bắc
Th6
Công Nghệ
Cảnh báo Trojan SparkKitty giả mạo TikTok, tấn công người dùng iOS và Android
Th6
Thời Sự
Bổ nhiệm lãnh đạo Viện KSND TP.HCM sau sáp nhập, hợp nhất
Th6
Thời Sự
Bắt khẩn cấp người đàn ông kéo sập cửa nhà hàng xóm vì bị nhắc hát karaoke ồn ào
Th6
Giải Trí
NSND Thu Hà yêu kiều giữa trời Tây, Ngọc Huyền ‘Dịu dàng màu nắng’ trẻ trung
Th6
Thời Sự
Sẽ không còn phân loại trường đại học định hướng nghiên cứu hay ứng dụng
Th6
Video
hört auf mich mit Holzi zu shippen #animation #deutsch #fyp #anime #memes #tuubaa
Th6
Video
Tân Tiếu Ngạo Giang Hồ – Tập 15 _ Phim Truyền Hình Trung Quốc _ Phim Hành Động, võ thuật Cổ trang
Th6
Video
Ăn chơi cực dễ với KHOAI CHIÊN LẮC MAYO MÈ | MÓN NGON MỖI NGÀY
Th6
Video
Hướng Dẫn Nấu Món Tiểu Hổ Đơn Giản Tại Nhà II Cùng Vào Bếp Với Lạc Đường Vlog
Th6
Video
CHUẨN BỊ CỖ LÊN NHÀ MỚI CHÚ VĨNH | Nhịp Sống Tây Bắc
Th6
Công Nghệ
CEO Jensen Huang ngậm ngùi ‘thế giới không còn như xưa nữa’ khi lật đổ văn hóa quản trị nổi tiếng suốt 45 năm trong kỷ nguyên AI
Th6
Thời Sự
Thông tin về sửa Luật Thuế thu nhập cá nhân, điều chỉnh mức giảm trừ gia cảnh
Th6
Giải Trí
Bạn gái tin đồn của Hieuthuhai đam mê du lịch
Th6
Thời Sự
Dự báo thời tiết 27/6/2025: Miền Bắc mưa lớn, tâm điểm dữ dội nhất khu vực nào?
Th6
Video
Kỳ Án Trung Quốc Sự Thật Trong Vụ Án Cái Chết Của Người Chồng
Th6
Video
Quý Đích tập 6 Full – Người Phụ Nữ Trở Về – Vietsub
Th6
Video
Cách làm PANCAKE XỐT ĐẬU GÀ Thơm bùi quyện sánh, vị ngon ấn tượng | MÓN NGON MỖI NGÀY
Th6
Video
CÁCH LỌC XƯƠNG LƯƠN VÀ CHẾ BIẾN BA MÓN ĂN ĐẶC SẢN LÀM TỪ LƯƠN CỦA LẠC ĐƯỜNG VLOG
Th6
Video
LÊN NÚI TÌM ỐC ĐÁ | Nhịp Sống Tây Bắc
Th6
Công Nghệ
Chỉ vì một lỗi sơ đẳng trong lập trình, các kỹ sư giỏi nhất của Google đã vô tình đánh sập một nửa internet của thế giới như thế nào
Th6
Thời Sự
Giám đốc Công an Hà Nội thông tin vụ tài liệu bị đốt cạnh trụ sở phường Cổ Nhuế 2
Th6
Thời Sự
Tăng lương tối thiểu đến 9,2% vẫn là ‘cuộc rượt đuổi chưa cân sức’
Th6
Giải Trí
Ca sĩ có chất ‘điên’ khiến NSND Phạm Phương Thảo tiếc nuối
Th6
Thời Sự
Đã có điểm chuẩn lớp 10 TPHCM 2025
Th6
Video
💫 Nghe nhạc thư giãn 😇 bạn nhé..!
Th6
Video
Luyện Khí Mười Vạn Năm Tập 94 Thuyết Minh
Th6
Video
MÓN NGON BÌNH DÂN TỪ LẠC ĐƯỜNG QUÁN
Th6
Video
Chuẩn vị không hề khó TOM YUM KUNG chua cay hấp dẫn | MÓN NGON MỖI NGÀY
Th6
Video
ĐẶC SẢN TRÊN NÚI ĐÁ | Nhịp Sống Tây Bắc
Th6
Video
Tìm kiếm ổ nhện rừng
Th6
Thể Thao
Lịch thi đấu FIFA Club World Cup 2025 ngày 28/6
Th6
Thời Sự
Hà Nội họp đánh giá 1 tuần vận hành thử nghiệm mô hình chính quyền mới
Th6
Thời Sự
Bí thư Thị ủy giải trình việc phường chặt cây xanh trước ngày sáp nhập
Th6
Thể Thao
Nhận định bóng đá Real Madrid vs Salzburg, FIFA Club World Cup
Th6
Thời Sự
Top trường điểm chuẩn lớp 10 TPHCM thấp nhất, hơn 3 điểm/môn vẫn trúng tuyển
Th6
Video
#临江仙 摊牌了!这次仙尊白鹿要夺回一切!#白鹿 #曾舜晞 #FEUD #iqiyi #chinesedrama #爱奇艺东方奇幻
Th6
Video
Chú rể bế em vợ qua sào mới được rước nàng về dinh
Th6
Quang Hùng Video
LK | AI MANG CÔ ĐƠN ĐI COVER CHILL
Th6
Thể Thao
Kết quả bóng đá vòng loại World Cup 2026 Nam Mỹ
Th6
Thời Sự
Bộ trưởng Nguyễn Kim Sơn: Phải kiểm soát tốt nguồn gốc sản phẩm để đảm bảo an toàn thực phẩm trong trường học
Th6
Video
X-126: KÝ SỰ TÂM LINH ĐỜI LÍNH – CHƯƠNG 4: TRUYỀN THUYẾT NGƯỜI VỢ MA Ở LÀO
Th6
Quang Hùng Video
BẢN TINH CA ĐÂU TIEN QUANG HÙNG
Th4
Quang Hùng Video
TỰ LAU NƯỚC MẮT QUANG HÙNG
Th6
Thời Sự
Quốc hội sẽ xem xét, thông qua dự án Luật Đường sắt (sửa đổi) tại Kỳ họp thứ 9
Th6
Thể Thao
Ronaldo chính thức đặt bút kí vào bản hợp đồng ‘khủng nhất’ trong thế giới thể thao
Th6