img_0
Yelp, and it's a big one.
Khi nói về Open Data, tức là nói đến dữ liệu mà bất cứ ai cũng có thể truy cập, sử dụng, tái sử dụng và chia sẻ. Qua cách mà hầu hết các chính phủ tung ra các cổng thông tin mở (open data portals) của mình, rất dễ để nhận định rằng dữ liệu cung cấp từ những trang này thường là nguồn dữ liệu duy nhất có sẵn cho sự sử dụng của cộng đồng. Tuy vậy, điều này là không đúng.
Dù những data sets được gắn mác "open" của chính phủ thường nhận được nhiều sự chú ý của công chúng hơn rất nhiều, chúng thực sự lại chỉ chiếm một phần rất nhỏ so với "public data" trên mạng.

Vậy sự khác nhau giữa “public" data và “open” data là gì?

Open data là gì?

img_1
Nói chung í, "open data" là thông tin được phát hành qua các cổng thông tin được phê chuẩn bởi chính phủ (vd như: thống kê định kỳ về sức khỏe cộng đồng, môi trường hay giáo dục, v.v..). May mắn là nguồn dữ liệu này thường có cấu trúc nhất quán, machine-readable, open-licensed, và được bảo trì thường xuyên.

Public data là chi?

img_2
"Public data" là tất cả cái đống data còn lại, là cái lượng thông tin trên mạng mà người ta gọi là "freely available" (nhưng không accessible cho lắm). Và cái đống này thường không có cấu trúc, khó hiểu, khó sử dụng, và ứng dụng của chúng thường khá mơ hồ.
Only 10% of government data is published as open data
img_3

What does this mean?

Weo, for starters, điều này có nghĩa là có một sự khác biệt rõ rệt giữa "open data" từ các cổng thông tin chính phủ và "public data" nói chung. Đây là khác biệt đầu tiên và lớn nhất, vì khi ngày càng có nhiều sự hứng thú xoay quanh làn sóng "open data" và tiềm năng thay đổi cả xã hội hiện đại của chúng; nơi đặt cơ sở cho tiền đề này - open data - mới chỉ chiếm một mảnh rất nhỏ cho những gì "cần" để khiến tiềm năng này được chú ý đến.
Sự thật là: phần lớn data hữu ích của chính phủ thường hoặc là thuộc về tài sản của ai đó hoặc là được "bảo quản" ở đâu đó, những thứ có sẵn với chúng ta chỉ là tình cờ được phát hành thui.
Originally published at https://blog.thinkdataworks.com.