Cạnh tranh là điều tốt. Tối thứ Hai là một lời nhắc vì sao chúng tôi đang xây dựng.
Chúng tôi thực sự tin vào sự cạnh tranh. Hãy nhìn những gì Texas Card House và The Lodge đã làm cho poker ở Austin — hai cardroom tuyệt vời liên tục thúc đẩy nhau, nâng chuẩn mực và trong quá trình đó đưa Austin lên bản đồ như một trong những thành phố poker tốt nhất nước Mỹ. Đó là điều tuyệt vời cho cả cộng đồng. Thủy triều dâng lên sẽ nâng mọi con thuyền.
Vì vậy khi chúng tôi nói về chuyện xảy ra tối thứ Hai với Hijack, không phải để dẫm đạp ai. Mà vì những khoảnh khắc như thế này chính là lý do chúng tôi đang xây dựng salty.poker — và vì sao chúng tôi tin mình có thể làm tốt hơn.
Chuyện gì đã xảy ra vào tối thứ Hai
Tối thứ Hai. Giờ cao điểm. Người chơi sẵn sàng ngồi xuống bàn.
Hijack sập. Không còn bàn nào. Không còn người chơi nào. Mất hoàn toàn.
Chúng tôi phát hiện vào lúc 18:05 — lỗi đăng nhập, không có bàn, không có hoạt động. Phải đến 18:50, Hijack mới gửi push notification cho chính người dùng của họ để thừa nhận sự cố. Khi phần lớn người chơi của họ nhận ra có vấn đề, chúng tôi đã theo dõi tình hình được bốn mươi lăm phút rồi. Nền tảng quay lại vào lúc 19:53 — tổng cộng một giờ bốn mươi tám phút downtime hoàn toàn trong một tối thứ Hai.
Chúng tôi thành thật mong họ khắc phục được. Một hệ sinh thái online poker lành mạnh là điều tốt cho tất cả mọi người, bao gồm cả salty.poker.
salty.poker được xây dựng cho những tình huống này như thế nào
Những sự cố kiểu này không phải xui rủi ngẫu nhiên. Chúng là kết quả của những quyết định về kiến trúc được đưa ra sớm — hoặc không được đưa ra bao giờ. Khả năng chịu lỗi không phải là thứ bạn thêm vào sau khi ra mắt. Đó là thứ bạn thiết kế từ trước khi viết dòng code đầu tiên, và đó chính xác là điều chúng tôi đã làm.
salty.poker được xây dựng trên Microsoft Azure với dự phòng ở mọi tầng. Auto-scaling hấp thụ các đợt tăng tải trước khi chúng trở thành sự cố. Health check và failover tự động đảm bảo một thành phần lỗi không kéo cả hệ thống xuống. Hệ thống giám sát của chúng tôi được thiết kế để phát hiện vấn đề thật nhanh — đôi khi, như tối thứ Hai đã chứng minh, nhanh hơn cả chính nền tảng đang gặp sự cố.
Mục tiêu rất đơn giản: khi có thứ gì đó hỏng — và kiểu gì cuối cùng cũng có thứ hỏng — các bàn vẫn chạy, người chơi vẫn ở nguyên chỗ, và phần lớn mọi người không hề hay biết có chuyện gì đã xảy ra.
Về khoảng dẫn 45 phút đó
Việc chúng tôi phát hiện sự cố sớm hơn gần 45 phút so với thời điểm Hijack thông báo cho chính người chơi của họ là điều đáng để dừng lại suy nghĩ. Chúng tôi không phải đội ops của họ. Chúng tôi không có bất kỳ quyền truy cập nào vào hạ tầng nội bộ của họ. Vậy mà sự việc đã diễn ra như vậy.
Điều này đặt ra vài câu hỏi. Những câu hỏi bắt đầu kết nối với một vài mô hình thú vị mà chúng tôi đã quan sát thấy trong dữ liệu người chơi của họ. Trong cộng đồng đang có những tin đồn về chuyện bot hoành hành trên nền tảng đó. Chúng tôi cũng có vài ý kiến về việc này.
Nhưng đó là bài viết dành cho một ngày khác.
Stay salty.
The Salty Korean
Người sáng lập Salty Poker Network. Viết về poker Texas, xây dựng nền tảng và tương lai của poker trực tuyến. Đọc thêm tại The Salty Korean.