Tóm tắt: dữ liệu về số ca nhiễm Corona ở TP HCM, từ ngày 25/06 tới 25/07 được vẽ lại là đưa ra nhận xét về xu hướng tiến triển của dịch bệnh. Xu hướng hiện tại vẫn và tăng theo hàm mũ (cấp số nhân). Tuy nhiên tín hiệu tốt là hệ số mũ có xu hướng giảm, mặc dù khá chậm, thể hiện cho việc dịch bệnh đang được ngăn chặn.
Chú thích: vẫn có khả năng là dịch bệnh đang lây lan nhanh hơn hàm mũ, như đề cập ở cuối bài viết.
UPDATE 1- ngày 23/7/2021 - Đã cập nhật kết quả thực tế để kiểm tra lại kết quả dự báo. (Hình 7) UPDATE 2 - ngày 25/7/2021 - Dự phóng đỉnh dịch với 2 mô hình.
Từ ngày 25/06/2021, số ca nhiễm Corona trong ngày tại TP. HCM tăng đột biến lên 724 ca. Từ đó đến nay, xu hướng tăng vẫn là chủ đạo, mặc dù các biện pháp cách li, phong toả được thực hiện có vẻ quyết liệt hơn, cụ thể là chỉ thị 16 được áp dụng từ này 09/07.
Trước tiên hãy cùng nhìn lại đồ thị về số ca nhiễm cho tới thời điểm này, như ở Hình 1 bên dưới.
Hình 1: Dữ liệu dịch bệnh thực tế tại TP HCM (cột màu xanh), từ ngày 25/06 tới ngày 16/07 được lấy từ <i><a href="https://vnexpress.net/covid-19/covid-19-viet-nam">VnExpress</a>. </i>Đường xu hướng (màu đỏ) được tính bằng phương pháp bình phương tối thiểu, với 3 tham số A,B,C: f(x) = A e^{Bx} + Cx, và biến x là số ngày tính từ 25/06.
Hình 1: Dữ liệu dịch bệnh thực tế tại TP HCM (cột màu xanh), từ ngày 25/06 tới ngày 16/07 được lấy từ VnExpress. Đường xu hướng (màu đỏ) được tính bằng phương pháp bình phương tối thiểu, với 3 tham số A,B,C: f(x) = A e^{Bx} + Cx, và biến x là số ngày tính từ 25/06.
Khi chỉ nhìn bằng mắt thường vào các cột dữ liệu thực tế, bạn cũng có thể thấy là hình dáng của hàm mũ - tức là dịch bệnh đang lây lan theo cấp số nhân. (Nếu vẽ đồ thị theo lang logarithm thì bạn sẽ thấy hình dáng của một đường thẳng dốc lên.) Tính theo từng tuần, số ca đã tăng từ: 2958 lên 4721, sau một tuần lên 10295, rồi tuần sau đó lên 23913.😇
Ý nghĩa của hàm mũ: nếu tốc độ lây lan là cố định, ví dụ: nếu mỗi người nhiễm đều lây cho 1.3 người khác, trong một ngày, thì tổng số ca bệnh mỗi ngày sẽ nhân thêm 2.3. Khi đó ta nói dịch bệnh tăng theo cấp số nhân, cũng tức là tăng theo hàm mũ.

Dùng toán để mô phỏng thực tế

Còn khi xem xét kĩ hơn, ta có thể rút ra một vài thông tin chi tiết hơn về dịch bệnh. Ở đây mình sử dụng mô hình gần như tối giản với 3 tham số
Dùng thuật toán bình phương tối thiểu thông dụng (Least square), ta sẽ tính được các tham số A, B, C.
Trong 3 tuần vừa qua, tham số B vào khoảng 0.11, tức là mỗi ca bệnh trung bình sẽ lây cho e^B-1 ≈ 0.12 người khác, trong một ngày. Từ đó suy ra một người nhiễm, trong 2 tuần, có thể lây cho 0.12*14 = 1.68 người khác.

Xem xét dữ liệu quá khứ

Bây giờ hãy nhìn lại quá khứ và xem dịch bệnh tiến triển theo thời gian như thế nào. Ở Hình 2, mình đã dùng dữ liệu của 2 tuần trước đó để "giả dự đoán" , tức là ngoại suy ra số ca nhiễm, từ ngày 10/7 tới 16/7. Ta thấy kết quả dự đoán khá phù hợp, tuy có thấp hơn thực tế một chút ở những ngày cuối.
Hình 2: Dùng dữ liệu từ 25/06 tới 09/07 để ngoại suy ra số ca nhiễm từ ngày 10/07 tới 16/07. Các con số trên đồ thị là của dữ liệu thực tế. Đường ngoại suy là đường màu cam.<br>
Hình 2: Dùng dữ liệu từ 25/06 tới 09/07 để ngoại suy ra số ca nhiễm từ ngày 10/07 tới 16/07. Các con số trên đồ thị là của dữ liệu thực tế. Đường ngoại suy là đường màu cam.

Dự phóng cho 7 ngày tới

Bây giờ hãy dùng dữ liệu từ 2 tuần vừa qua để dự báo cho tuần tới. Ở hình 3, mình ngoại suy để tính toán số ca nhiễm dự phóng cho 7 ngày tới. Nếu tình hình lây nhiễm không nhiều thay đổi nhiều thì số ca nhiễm vào ngày 23/7 là khoảng 55000 người.
Một tín hiệu tích cực đó là hệ số mũ "B" giảm từ 0.11 về 0.10 . [xem hình 2 và hình 3]. Tuy rằng khá ít, nhưng cho thấy tín hiệu về tính hiệu quả của việc tiêm vaccine, cũng như của 1 tuần áp dụng chỉ thị 16.
Hình 3: Dùng dữ liệu từ 02/06 tới 09/07 để dự báo số ca nhiễm từ ngày 17/07 tới 23/07.  Dữ liệu ngoại suy là các cột màu cam.
Hình 3: Dùng dữ liệu từ 02/06 tới 09/07 để dự báo số ca nhiễm từ ngày 17/07 tới 23/07. Dữ liệu ngoại suy là các cột màu cam.
Mong rằng công tác chống dịch hiệu quả hơn nữa để kết quả thực tế sẽ thấp hơn kết quả dự đoán ở đây.

Phần kết

Trước tiên , mình mong dịch bệnh mau chóng được ngăn chặn.
Thứ hai, mình mong thông qua bài này giúp mọi người có dược cái nhìn tổng quan về dịch bệnh hiện tại và trong tương lai gần, để không quá hốt hoảng khi nhìn thấy con số ca nhiễm tăng lên 50000 hay 100000.
Thứ ba, mình mong các công cụ thống kê được sử dụng tốt hơn để đối phó với dịch bệnh, ví dụ như phân tích tác động của biến thể Delta tại Việt Nam. Và từ đó để mọi người có thể tự điều chỉnh hành vi sinh hoạt, kế hoạch làm việc,... cho tương lai gần.

Happy Ending ....

_______________________________________________________________________

Chú thích thêm

Nếu chỉ dùng mô hình hàm mũ f(x) = A e^{Bx} thì số ca bệnh thực tế cao hơn khá nhiều so với dự báo, và dẫn tới kết luận là dịch bệnh tăng nhanh hơn cả hàm mũ/cấp số nhân.
Điều này vẫn có thể đúng do khả năng lây nhiễm mạnh của biến thể Delta, cũng như công tác chống dịch không hiệu quả, ví dụ như lây nhiễm chéo trong khu cách li.
Nhưng cá nhân mình tin tưởng mô hình có tham số C hơn, vì cho fitting tốt hơn, và có lẽ công tác chống dịch đang dần có hiệu quả.
Hình 4: Tương tự hình 1, nhưng không có tham số C
Hình 4: Tương tự hình 1, nhưng không có tham số C
Hình 5: Tương tự như hình 2, ta thấy dịch bệnh đang tăng nhanh hơn cả hàm mũ. (đường màu cam)
Hình 5: Tương tự như hình 2, ta thấy dịch bệnh đang tăng nhanh hơn cả hàm mũ. (đường màu cam)
Hình 6: Tương tự như hình 3, dự đoán số ca nhiễm trong 7 ngày tới.
Hình 6: Tương tự như hình 3, dự đoán số ca nhiễm trong 7 ngày tới.

Nguồn dữ liệu

Update 23/07/2021 - Review lại kết quả dự báo ở Hình 3

Hình 7: Cập nhật dữ liệu thực tế cho kết quả dự báo ở hình 3. Con số trên biểu đồ là của các cột màu xanh dương. Đường màu cam là đường dự báo trước đó.
Hình 7: Cập nhật dữ liệu thực tế cho kết quả dự báo ở hình 3. Con số trên biểu đồ là của các cột màu xanh dương. Đường màu cam là đường dự báo trước đó.
Đã được một tuần kể từ khi bài viết được đăng, mình cập nhật thêm dữ liệu thực tế ở đây. Có thể thấy rằng tổng số ca nhiễm đã giảm rõ rệt so với đường ngoại suy màu cam, thể hiện việc dịch bệnh đang dần được kiểm soát.
Chúc cho công tác chống dịch hiệu quả và khoa học hơn nữa.

Update 25/07/2021 - Dự phóng cho đỉnh dịch

Hình 8: Dự báo thời điểm dịch đạt đỉnh. Dùng mô hình hàm mũ với hệ số mũ giảm dần theo thời gian để mô tả <i>số ca nhiễm mới. </i>Hệ số mũ giảm dần theo thời gian ứng với giả thiết là công tác chống dịch có hiệu quả và dịch bệnh được kiểm soát.
Hình 8: Dự báo thời điểm dịch đạt đỉnh. Dùng mô hình hàm mũ với hệ số mũ giảm dần theo thời gian để mô tả số ca nhiễm mới. Hệ số mũ giảm dần theo thời gian ứng với giả thiết là công tác chống dịch có hiệu quả và dịch bệnh được kiểm soát.
Hình 9: Dự báo thời điểm dịch đạt đỉnh. Dùng mô hình <a href="https://en.wikipedia.org/wiki/Skew_normal_distribution">skew-normal-distribution</a> để mô tả <i>số ca nhiễm mới. </i>Ý tưởng cho mô hình này xuất phát từ hình dáng đồ thị trong các đợt dịch lần trước. Hệ số skewness được chọn bằng 4.
Hình 9: Dự báo thời điểm dịch đạt đỉnh. Dùng mô hình skew-normal-distribution để mô tả số ca nhiễm mới. Ý tưởng cho mô hình này xuất phát từ hình dáng đồ thị trong các đợt dịch lần trước. Hệ số skewness được chọn bằng 4.