Dữ liệu nói lên rất nhiều câu chuyện quan trọng về đất nước chúng ta. Chúng ta nên đối xử một cách tôn trọng hơn với nó.
Viết bởi Abdullah Shihipar
Ông Shihipar là một Thạc sĩ trong ngành Y tế công cộng.
Ngày 24 tháng 10 năm 2019
   Gần đây, chính từ “dữ liệu” khơi gợi nỗi sợ và sự nghi ngờ ở rất nhiều người trong chúng ta - và với lý do chính đáng. Các công ty xét nghiệm DNA đang chia sẻ những thông tin về gen với chính phủ. Một công ty được thuê bởi chiến dịch Trump đã có được quyền truy cập vào thông tin cá nhân của 50 triệu người dùng Facebook. Các khách sạn, bệnh viện, và một cơ quan báo cáo tín dụng tiêu dùng đã thừa nhận ở phạm vi lớn. Nhưng trong khi rất nhiều người trong chúng ta dành sự quan tâm đúng lúc đối với việc các tổ chức tư nhân sử dụng sai dữ liệu cá nhân của chúng ta, chúng ta nên lo lắng về cả những câu chuyện quan trọng mang tầm quốc gia chưa từng được nhắc đến khi cư dân đồng bào của chúng ta không cảm thấy đủ an toàn để chia sẻ chúng với các nhà nghiên cứu.
   Một phần lý do rất nhiều người trong chúng ta lo lắng về dữ liệu mình và cũng như việc  ai có thể tiếp cận nó là bởi một phần dữ liệu của chúng ta có thể được kết hợp để vẽ nên một bức tranh chi tiết về cuộc sống của chúng ta: chúng ta làm ra bao nhiêu tiền, chúng ta thích gì, chúng ta đang lái ô tô nào. Nhưng theo một cách tương tự, trải nghiệm cá nhân trở thành những tập hợp điểm dữ liệu định hình sự hiểu biết của chúng ta về những gì đang diễn ra trong đất nước này. 
   Điều này đặc biệt đúng trong lĩnh vực y tế công cộng. Cái chết của một phụ nữ da đen trong phòng hộ sinh có thể bị bác bỏ như một trường hợp hy hữu, cho đến khi nó được kết hợp với hàng nghìn những trường hợp khác và so sánh với tỷ lệ bệnh trạng của những người mẹ da trắng. Khi cư dân của Flint, Mich., liên tục phàn nàn về việc nhiễm bệnh từ nước máy có màu cam, họ đã bị từ chối và gạt đi như bị hoang tưởng, chỉ được minh oan khi tiến sĩ Mona Hanna-Attisha xuất bản một nghiên cứu chỉ ra rằng trẻ em ở Flint có nồng độ chì trong máu tăng cao sau khi nguồn nước của thành phố được chuyển đổi.
   Dữ liệu được thu thập bởi Censu Bureau - bao gồm tình trạng giáo dục, công việc, tình trạng nhà cửa, an toàn thực phẩm, thu nhập - đặc biệt quan trọng. Nó thông báo các quyết định về phân bổ nguồn lực và chủ yếu là tái phân chia chính trị. 
   Nếu không có những loại dữ liệu này, khả năng để chúng ta hiểu về thế giới xung quanh mình sẽ bị hạn chế. Canada, nơi dữ liệu công cộng có sẵn bị hạn chế tương đối cả về độ lớn và phạm vi, cung cấp một lời cảnh tỉnh. Tiến sĩ Arjumand Siddiqi thuộc đại học Toronto cố gắng để thực hiện một nghiên cứu tương tự nghiên cứu được hoàn thành ở Hoa Kỳ chỉ ra rằng những người Mỹ da trắng trung niên không có bằng đại học đã chết với tỉ lệ cao hơn trong những năm gần dây, đặc biệt là những cái chết gây ra bởi rượu và thuốc. Nhưng nỗ lực của cô đã thất bại vì hồ sơ tử vong ở Canada, ngạc nhiên thay, không có bất kỳ  thông tin ghi chép nào về chủng tộc hay giáo dục.
   Ngay cả ở Hoa Kỳ, cũng có những khoảng trống trong dữ liệu. Nghệ sĩ Mimi Onuoha giám sát và tuyển chọn “Những bộ dữ liệu còn thiếu” - một danh sách những phần thông tin vắng mặt khỏi những ghi chép công cộng. Danh sách này bao gồm số người bị đuổi khỏi khu vực nhà ở công cộng vì tiền án tiền sự, thống kê nghèo đói có sự kết hợp của những người bị giam giữ và số lượng những sở cảnh sát sử dụng công nghệ do thám điện thoại di động.
   Khi nói đến dữ liệu được thu thập bởi chính phủ, những người không xuất hiện trong tập dữ liệu thường là bộ phận những người từ chối chia sẻ thông tin của họ vì nỗi sợ hãi và sự thiếu lòng tin. Điều này là mối quan tâm khi trong năm 2018, chính quyền Trump thông báo có thể sẽ đưa những câu hỏi về quyền công dân vào cuộc điều tra dân số:  Các nhà phê bình lo lắng rằng câu hỏi đó sẽ gây ra phản ứng sợ hãi và trầm cảm từ phía những người hiện đang bị tước đi quyền và nghĩa vụ của công dân cũng như  những thành viên trong gia đình họ. Chính quyền cuối cùng cũng rút lại những đề nghị đó sau khi bị bác bỏ bởi Tòa án tối cao. 
   Để khuyến khích việc thu thập thông tin bảo vệ cho quyền con người, chúng ta cần những hạn chế cơ bản trong việc chia sẻ thông tin giữa những cơ quan với nhau. Mặc dù có một số luật chi phối việc thu thập dữ liệu, nhưng lại có rất ít hạn chế trong việc truy cập cơ sở dữ liệu. Lấy ví dụ, những người làm nghiên cứu trong lĩnh vực chăm sóc sức khỏe sẽ bị chi phối bởi Đạo luật bảo hiểm y tế linh động và trách nhiệm (HIPAA), quy định cách chúng ta thu thập và sử dụng quyền truy cập và những thông tin nhạy cảm của người bệnh, trong khi vẫn giữ tính bảo mật tối quan trọng cho bệnh nhân. Thực thi pháp luật lại thường được phép bỏ qua những điều khoản trong HIPAA và trong những trường hợp này, truy cập dữ liệu có thể trở nên tương đối dễ dàng. 
   Khi từ bỏ kế hoạch của mình trong việc sử dụng cuộc điều tra dân số để thu thập thông tin về quyền công dân, ông Trump đã chỉ đạo các cơ quan liên bang khai thác cơ sở dữ liệu của họ cho dữ liệu về quyền công dân. Trên toàn quốc, các cơ quan thực thi pháp luật đã kết nối với các cơ sở dữ liệu không thuộc quyền hạn của họ. Các nhân viên ICE thường xuyên có quyền truy cập vào cơ sở dữ liệu về biển số xe được quản lý bởi Sở cấp phép bang Washington. Ở Massachusetts, cảnh sát tiểu bang đã thực hiện hàng nghìn cuộc điều tra thông qua chương trình theo dõi dữ liệu đơn thuốc của liên  bang, nơi chứa hàng triệu những hồ sơ nhạy cảm ghi chép về lịch sử sử dụng thuốc của người dân.
   Tất cả những điều này cần phải được dừng lại, nếu chính phủ muốn có được lòng tin đối với dữ liệu của người dân. Chúng ta cần pháp luật hạn chế sự truy cập dữ liệu của các cơ quan vì những lí do khác ngoài mục đích mà nó được thu thập. Từ năm 2018, Massachusetts, cùng với 12 bang khác, đã hạn chế truy cập vào dữ liệu người bệnh, yêu cầu thực thi pháp luật để có một lệnh lấy thông tin. Những luật tương tự cần được thông qua cho tất cả các dữ liệu có thể nhận dạng được tồn tại trong tập dữ liệu chính phủ. Nếu một cơ quan cần quyền truy cập dữ liệu, họ phải có giấy phép. 
   Tài nguyên nên được sử dụng để đảm bảo rằng những người bình thường cũng biết cách làm sao để tải xuống những tập dữ liệu cho nghiên cứu và sự tò mò của riêng họ. Rồi các tổ chức cộng đồng và các nhà hoạt động đã sử dụng dữ liệu để buộc các cơ quan chính phủ chịu trách nhiệm. Mijente, một nhóm đấu tranh vì người nhập cư do Latinx lãnh đạo đã sử dụng nhiều Đạo luật Tự do thông tin để yêu cầu tiết lộ những chi tiết phía sau những cuộc đột kích ICE thu hút sự chú ý của công chúng.
   Ngoài ra, các cơ quan nên tạo điều kiện cho mọi người biết rằng khi nào có ai đó xem hồ sơ của họ một cách dễ dàng hơn. 
   Cuối cùng, các nhà nghiên cứu và những tác vụ thu thập dữ liệu cần được xem như những người ủng hộ đã thành công trong việc đánh bại sự nỗ lực của chính quyền Trump để thêm những câu hỏi về quyền công dân vào cuộc điều tra dân số, và hỏi chính họ rằng nếu những dữ liệu họ đang thu thập có đẩy mọi người vào nguy hiểm hay không. Có những nguy hại tiềm ẩn được gây ra bởi việc đặt câu hỏi hơn giá trị nghiên cứu của nó không? Đôi lúc, câu trả lời sẽ là có. 
   Bằng cách cung cấp một bức tranh về cuộc sống của người Mỹ, việc thu thập thông tin mới thật sự có thể phục vụ lợi ích cho cộng đồng - nhưng, điều đó chỉ xảy ra khi những người cung cấp dữ liệu nhận được sự tôn trọng mà họ họ xứng đáng có được.
Người dịch: Bảo Ân