Thứ Sáu, 29 tháng 8, 2014

Tại sao Big data lại gặp nhiều khó khăn trong khai thác đến vậy? (Phần 2)

Biztek xin giới thiệu phần 2 của bài phân tích về lý do tại sao Big Data đang gặp nhiều khó khăn trong việc khai thác từ trang công nghệ Gigaom. Và 2 khó khăn cuối cùng trong việc khai thác Big Data đến từ chính trị và luật pháp.

Chính trị: Nơi dữ liệu tốt không hẳn là quan trọng.
Chính trị mới thực sự là một trở ngại quan trọng cần vượt qua hơn là nỗi sợ hãi. Từ thị trấn nhỏ đến thủ đô Washington D.C. của nước Mỹ, cơ quan chính phủ thường xuyên xử lý các vấn đề vượt quá quy mô hay thẩm quyền của một cơ quan phi lợi nhuận lớn nhất cả nước. Thật không may, tất cả những dữ liệu và các nghiên cứu quan trọng nhất trên thế giới dường như không thành vấn đề khi các cuộc bầu cử đang bị đe dọa.
Thay vì đề cập đến vô số các nghiên cứu hay những kiểu dữ liệu mới mà chúng ta có thể thu thập để giải quyết các bức xúc còn tồn đọng về súng, ma túy, bất bình đẳng thu nhập…, các chính trị gia thường rơi vào những tranh luận về tư tưởng nhằm xoa dịu cử tri và người tham gia các chiến dịch tranh cử.
Trong một thảo luận tại KDD, Jens Ludwig, một nhà kinh tế học đến từ trường Đại học Chicago và là giám đốc phòng thí nghiệm về tội phạm của trường, mô tả những thách thức mà các chính trị gia phản ứng với dữ liệu như một trong những cách mang những “lời hứa” của họ tới cử chi. Ví dụ như các phòng thí nghiệm tội phạm đã tiến hành một dự án nghiên cứu cho thấy rằng đầu tư vào các chương trình xã hội có những tác động tích cực lên tỉ lệ tội phạm; và vì thế Thị trưởng thành phố Chicago, ông Rahm Emanuel đã dùng ngay kết quả này để đẩy mạnh việc tăng chi phí cho những dự án xã hội. Tuy nhiên, Ludwig cũng nói thêm rằng, vẫn chưa có bất kì những bằng chứng cụ thể đâu là mức cần đầu tư và liệu chúng có gây ra những gánh nặng khác cho xã hội hay không. Điều đó cho thấy là những chính khách sẽ phải ủng hộ những nghiên cứu mà sẽ làm hài lòng 51% cử tri thay vì khoa học đơn thuần là những thí nghiệm ngẫu nhiên không có bất kì yếu tố chính trị nào.

Ảnh: Ông Jens Ludwig (bên phải)
Đối với lĩnh vực y học, Ludwig cũng cho biết lĩnh vực phòng chống bạo lực vẫn đang ở thời kỳ sơ khai. Một chiến phần vì dữ liệu xung quanh hiệu quả của những lược như “dừng và lục soát” (stop-and-frisk) hay chính sách broken window quá giống nhau và không có nguyên nhân rõ ràng. Tiếp tục tăng hay giảm việc thực hiện những chính sách này không thực sự trả lời câu hỏi tại sao xảy ra hiện tượng phạm tội và liệu cần thiết có những chính sách đó để ngăn chặn tình trạng phạm tội.
Tuy nhiên, riêng đối với tình trạng biến đổi khí hậu thì hầu như những dữ liệu liên quan đến quan hệ nhân quả của hành động con người trên thế giới dường như bị bỏ ngoài tai bởi những chính trị gia trên toàn thế giới.
Hệ thống luật pháp quá phức tạp
Tuy nhiên, các chính trị gia và cán bộ nhà nước thì sử dụng nhiều hơn là chỉ quản lý ngân sách hay quyết định những chính sách cần thiết; và họ cũng là người lập và thực thi pháp luật. Và tại đây, Big Data phải đối mặt với một số thách thức lớn, với việc nhiều nhà cầm quyền quan tâm đến việc làm sao chúng ta giữ Big Data trong tầm kiểm soát hơn là việc sử dụng nó để giải quyết các vấn đề xã hội.
Trong thời gian hội thảo kéo dài 4 tiếng tại sự kiện KDD bàn về vấn đề đạo đức trong dữ liệu, các diễn giả và những người tham gia đã bàn luận về một số nguy cơ mà Big Data có thể gây ra; đặc biệt xung quanh vấn đề tối thiểu hóa dữ liệu thu thập, bảo vệ sự riêng tư và làm giảm nguy cơ phân biệt đối xử dựa trên dữ liệu thu thập. Những mối quan tâm này cùng thống nhất ý kiến: Càng nhiều dữ liệu mà các công ty thu thập về người dân, càng dễ dàng suy luận họ là ai và họ đang làm gì. Và càng dễ dàng thu thập dữ liệu thì nguy cơ bắt đầu phân biệt đối xử giữa người với người càng tăng (dù vô ý hay cố ý) dựa vào những yếu tố như chủng tộc, giới tính, thu nhập hay sức khỏe. Những dữ liệu này cũng có thể dẫn đến những kết luận sai lầm và có thể ảnh hưởng tiêu cực đến người dùng. Báo cáo hồi tháng 05 của Nhà Trắng về Big Data cũng đã giải quyết rất nhiều quan ngại, nhưng chưa hẳn báo cáo này có ý nghĩa tác động đến luật pháp và các quy định về Big Data.
Mark Latonero, hiệu trưởng trường Đại học Công nghệ Nam California và trưởng dự án nghiên cứu việc buôn bán ngưới, nói về việc nhóm của ông đang thử xác định những nạn nhân tiềm tàng của việc buôn bán người bằng cách phân tích các dữ liệu về quảng cáo phân loại trực tuyến và các nguồn dữ liệu khác. Dù đây có thể là nguồn dữ liệu thực sự quan trọng và trong khi các dự án khác (ngay cả Google) cũng đang làm việc với các nhà thực thi pháp luật để có quyền khai thác những nguồn dữ liệu này thì nhóm của ông không thể làm được. Một phần là do thực tế các trường đại học thường muốn dính vào những nghiên cứu chứ không phải là những việc làm thực tế, và họ cũng có thể đoán trước được những thách thức pháp lý nghiêm trọng liên quan đến việc điều tra dựa trên việc khai thác dữ liệu chứ không phải thông qua những bằng chứng khiếu nại cụ thể.
Điều đáng lo ngại nhất là mặc dù có nhiều mối quan tâm hợp lý về Big Data, và rất nhiều ý tưởng tuyệt vời để sử dụng hiệu quả chúng, nhưng vẫn chưa có đủ động lực để những dự liệu ấy bước từ những bài nghiên cứu học thuật ra ngoài thực tiễn. Việc vi phạm quyền riêng tư chủ yếu được giải quyết thông qua các vụ kiện và chỉ làm giàu cho giới luật sư thay vì mang lại lợi ích cho nguyên đơn.
Vấn đề này đi kèm với rất nhiều nỗi sợ. Lo sợ rằng nếu dùng luật để đàn áp mạnh tay lên những quyền riêng tư trên nền tảng web, thì sẽ bóp nghẹt sự đổi mới trong một khu vực được coi là một trong những triển vọng lớn của nền kinh tế Mỹ. Lo sợ rằng nếu đưa ra các luật lệ quá tập trung vào các vấn đề tồn đọng hôm nay, những nguồn luật ấy sẽ trở nên lạc hậu qua 1 năm tới. Các nhà lập pháp đang gặp nhiều rắc rối chỉ vì họ không biết làm thế nào để giải quyết vấn đề này một cách hiệu quả. Trong khi chờ đợi thì việc kinh doanh dữ liệu vẫn diễn ra như bình thường.
Thật khó để tìm ra câu trả lời cho vấn đề trên, những nếu chúng ta thực sự tin rằng Big Data sẽ giúp giải quyết những vấn đề khó khăn nhất tại thời điểm hiện tại, hoặc Big Data có thể tạo ra những vấn đề khác của riêng nó, việc cần thiết là phải tìm ra một ý tập thể để giải quyết những vấn đề trên. Nếu không, sẽ tiếp tục có những ý tưởng hay và rất nhiều nghiên cứu thú vị bị chôn vùi.

Không có nhận xét nào:

Đăng nhận xét