Big Data đã ảnh hưởng đến bầu cử tổng thống Mỹ và Brexit như thế nào

Trở lại bài : ” Tại sao Big Data ảnh hưởng đến người dùng?

Chiến dịch số của Trump chỉ dựa trên một người: Brad Parscale. Một tay tiếp thị hăng hái và sáng lập viên một start-up thất bại, anh này đã làm cho Trump một website đơn giản giá 1.500 USD. Trump ở tuổi 70 khó mà được gọi là người của kỷ nguyên số – trên bàn của ông ấy chẳng có máy tính. Có lần trợ lý đã tiết lộ, thậm chí ông còn không dùng email. Bản thân cô trợ lý này đã dạy ông dùng điện thoại, và từ đó ông dùng nó để đổ dòng suy nghĩ của mình lên Twitter. Hillary Clinton, ngược lại, thừa kế từ Obama, tổng thống đầu tiên của mạng xã hội. Bà ấy có danh sách địa chỉ của đảng Dân chủ, hàng triệu subscriber, ủng hộ của Google và Dreamworks. Tháng 6, khi Trump thuê Cambridge Analytica, nhiều người nhăn mặt. Thuê những kẻ ngoại quốc mặc vest và chẳng hiểu biết gì về đất nước này? Thật ư?

Chiến dịch của Trump dựa trên nền tảng Big Data của Cambridge Analytica

“Thật vinh dự khi được kể cho quý vị về sức mạnh của Big Data và psychometrics trong chiến dịch tranh cử”, Nix phát biểu tại hội nghị. Sau lưng anh ấy là slide với logo của hãng: hình bộ não được vẽ dạng lưới như bản đồ. “Chỉ vài tháng trước, Ted Cruz là một trong những ứng viên lẹt đẹt nhất”, anh chàng tóc vàng nói với giọng Anh. “Chỉ có 40% cử tri biết tên ông ta”. Tất cả khán giả nhớ lại câu chuyện về sự bứt phá nhanh chóng của Thượng nghị sỹ Cruz, có lẽ là hiện tượng khó lý giải nhất trong cuộc đua. Người cạnh tranh nguy hiểm cuối cùng của Trump trong nội bộ đảng Cộng hòa dường như xuất hiện từ không khí.

“Vậy thì chuyện gì đã xảy ra?”, Nix hỏi. Vào cuối 2014, Cambridge Analytica tham gia chiến dịch tranh cử của Mỹ chính là trong tư cách cố vấn của Ted Cruz, người được tỷ phú Robert Mercer tài trợ. Trước đó, Nix khẳng định, chiến dịch tranh cử được thực hiện theo các tiêu chí nhân khẩu học: “Một ý tưởng ngu ngốc, nếu suy nghĩ về nó một cách nghiêm túc: tất cả phụ nữ nhận cùng một thông điệp, vì họ cùng giới tính; tất cả người gốc Phi nhận một thông điệp khác, căn cứ vào chủng tộc”. Cách thức tài tử như vậy cũng được Clinton sử dụng: chia xã hội thành những nhóm đồng nhất, do các nhà xã hội học tư vấn. Chính là những người mà đến phút cuối vẫn dự là bà sẽ thắng.

Đến đây, Nix chuyển sang slide sau: năm khuôn mặt, tương ứng với năm chiều đo của Big Five. “Ở Cambridge Analytica, chúng tôi đã phát triển mô hình cho phép tính toán được nhân cách mỗi công dân trưởng thành của Mỹ”, Nix nói tiếp. Khán phòng im lặng tuyệt đối. Kết quả tiếp thị của CA dựa trên 3 nền tảng: phân tích tâm lý học hành vi theo OCEAN (behavioral science), nghiên cứu Big Data (Data analytics), và quảng cáo hướng mục tiêu (Addressable Ad Tech). Kỹ thuật cuối có nghĩa là quảng cáo cá nhân hóa, được xây dựng theo tính cách của từng cá thể người dùng. Nix giải thích thành thực về chuyện công ty anh ấy làm điều đó thế nào (bài nói chuyện được up trên YouTube). Công ty này mua dữ liệu cá nhân từ tất cả các nguồn có thể. Ở Mỹ, có thể mua được bất kỳ dữ liệu cá nhân nào. Nếu bạn muốn biết, ví dụ phụ nữ Do Thái sống ở đâu, có thể mua cơ sở dữ liệu. Sau đó, Cambridge Analytica tích hợp Big Data đó với danh sách những người ủng hộ đảng Cộng hòa và dữ liệu like/re-post trên Facebook  và hồ sơ cá nhân theo phương pháp OCEAN sẵn sàng. Từ trong mớ dữ liệu số bỗng hiên ra những hình người với nỗi sợ, ý định và mối quan tâm của riêng mình và cả địa chỉ nơi ở.

Nix trình bày về công nghệ phân tích Big Data

Quy trình y hệt mô hình của Kosinski. Cambridge Analytica cũng sử dụng các bài test IQ và những app nhỏ để nhận được những like có giá trị từ người dùng Facebook. Và công ty của Nix làm ra thứ mà Kosinski đã cảnh báo: “Chúng tôi có sơ đồ tâm lý của tất cả công dân Mỹ, 220 triệu người. Trung tâm điều khiển của chúng tôi trông thế này, xin chú ý”, Nix nói và lật slide. Trên màn hình hiện ra bang Iowa, nơi Ted Cruz thu được một số lượng phiếu lớn bất ngờ trong bầu cử sơ bộ (primaries). Trên bản đồ Big Data có hàng trăm nghìn chấm nhỏ: đỏ và xanh, theo màu đảng. Nix chọn tiêu chí. Đảng Cộng hòa, và các điểm xanh biến mất. Những người chưa quyết bầu cho ai, số điểm ít hơn. Đàn ông, ít hơn nữa, và cứ thế. Cuối cùng, hiện ra tên của một người: với tuổi, địa chỉ, các mối quan tâm, thiên kiến chính trị. Nhưng Cambridge Analytica gửi thông điệp gì cho những con người cụ thể này?

Trong một slide khác, Nix lấy luật về sở hữu súng làm ví dụ: “Với những người hay lo sợ, có mức độ nhạy cảm (Neuroticism) cao thì chúng tôi giới thiệu súng như công cụ bảo đảm an toàn. Bên trái, quý vị thấy hình bàn tay kẻ đạo chích đang đập cửa sổ. Còn bên phải là hình người đàn ông cầm súng đang cùng con trai đi trên cánh đồng trong hoàng hôn. Rõ là đi săn vịt,  tranh này là dành cho những người bảo thủ giàu có và hướng ngoại”.

Big Data Cản trở bầu cho Clinton như thế nào?

Bản chất đầy mâu thuẫn của Trump, tính phi nguyên tắc và hệ quả là số lượng lớn các loại thông điệp khác nhau bỗng trở nên hữu ích cho ông ta: mỗi cử tri nhận được một thông điệp riêng. “Trump hành xử như một thuật toán cơ hội lý tưởng, hoàn toàn chỉ dựa trên phản ứng của công chúng”, nhà toán học Cathy O’Neil nhận xét vào tháng 8.

Đúng ngày tranh luận thứ ba giữa Trump và Clinton, đội của Trump đã gửi vào mạng xã hội (chủ yếu là Facebook) hơn 175 nghìn thông điệp. Chúng chỉ khác nhau ở những chi tiết rất nhỏ, nhằm phù hợp nhất với tâm lý của người nhận cụ thể: tiêu đề, tiêu đề phụ, màu nền, ảnh và video. Cách làm tỉ mỉ như vậy khiến cho thông điệp nhận được sự đồng cảm của những nhóm cư dân nhỏ nhất, như Nix giải thích cho Das Magazine: “Bằng cách đó chúng tôi có thể vươn đến tận làng, khu phố hay ngôi nhà cần thiết, thậm chí là từng người”. Khu Little Haiti ở Maiami nhận được thông tin về việc quỹ Clinton từ chối tham gia khắc phục hậu quả động đất ở Haiti, để thuyết phục người dân thôi bỏ phiếu cho bà. Đó là một mục tiêu nữa: giữ những cử tri của Clinton khỏi hòm phiếu, “đè bẹp” lựa chọn của họ, như lời của một cộng sự của Trump. Thứ gọi là các “post đen” trên Facebook cũng được dùng: những thông báo được trả tiền xuất hiện giữa các bản tin, chỉ dành cho những nhóm người cụ thể. Ví dụ, người Mỹ gốc Phi được xem những post có video trong đó Clinton so sánh đàn ông da màu với thú ăn thịt.

Chiến thắng của Trump từ sự đóng góp rất lớn của Cambridge Analytica từ phân tích Big Data

“Bọn trẻ nhà tôi sẽ không bao giờ hiểu tại sao lại có những tấm biển quảng cáo với nội dung như nhau cho tất cả mọi người”, Nix kết thúc bài trình bày ở hội nghị, cám ơn cử tọa và rời sân khấu. Khó có thể nói xã hội Mỹ bị tác động đến mức nào bởi các chuyên gia của Trump tại một thời điểm cụ thể, vì họ không sử dụng các kênh truyền thống mà dùng mạng xã hội và truyền hình cáp. Và trong khi đội Clinton, hành động theo chỉ dẫn của các nhà xã hội học, đang mơ ngủ, thì ở San Antonio, nơi đóng bản doanh số của Trump, đã xuất hiện, theo lời của phóng viên Bloomberg, đại bản doanh thứ hai. Chỉ có hơn chục người, nhóm Cambridge Analytica nhận của Trump 100.000 USD vào tháng 7, thêm 250.000 USD tháng 8, và tháng 9 thêm 5 triệu USD. Nix tính rằng tổng thù lao dịch vụ là 15 triệu USD.

Ngay cả các chương trình khác cũng rất cấp tiến. Từ tháng 7, các tình nguyện viên của Trump đã nhận được app cho phép biết được thiên kiến chính trị và loại nhân cách của cư dân nhà này hay nhà khác. Theo đó, những tình nguyện viên, tuyên truyền viên điều chỉnh hội thoại của mình với người dân. Phản hồi của người dân lại được họ ghi ngược vào app đó, và dữ liệu chuyển thẳng về trung tâm phân tích Big Data của Cambridge Analytica. Công ty xác định ra 32 loại tính cách tâm lý của dân Mỹ, tập trung ở 17 bang. Và như Kosinski đã phát hiện, rằng đàn ông thích mỹ phẩm MAC thì hầu như chắc chắn là đồng tính, Cambridge Analytica chứng minh rằng những kẻ trung thành với ô tô Mỹ hẳn nhiên là ngả theo Trump. Hơn nữa, những phát kiến như vậy giúp bản thân Trump hiểu những thông điệp nào dùng ở đâu thì tốt nhất. Quyết định của đại bản doanh về việc tập trung vào Michigan và Wisconsin vào những tuần cuối cùng là dựa trên phân tích Big Data. Ứng viên trở thành mô hình để áp dụng hệ thống.

Nhưng thực sự Big Data và psychometrics ảnh hưởng mức nào đến kết quả bầu cử? Cambridge Analytica tỏ ra không vội vã trong việc chứng minh hiệu quả chiến dịch của mình. Hoàn toàn có khả năng sẽ không có câu trả lời. Nhưng dù sao, có một sự thật là nhờ Cambridge Analytica mà Ted Cruz từ số không đã trở thành đối thủ nguy hiểm của Trump ở vòng sơ bộ. Hay sự thật về tăng trưởng số phiếu của cử tri nông thôn. Hay mức độ tích cực của cử tri gốc Phi giảm. Cả việc Trump chi ít tiền như vậy cũng có thể nói lên hiệu quả của phương pháp cá nhân hóa. Hay là việc ông ấy dành 3/4 ngân sách quảng cáo vào không gian số. Facebook trở thành vũ khí hoàn hảo và trợ thủ đắc lực nhất trong bầu cử, như một trong cộng sự Trump viết trên Twitter. Nhân tiện, đảng phái “Giải pháp khác cho nước Đức” có nhiều fan trên Facebook hơn hai đảng dẫn đầu cộng lại. Ngoài ra, không thể khẳng định là các nhà xã hội học, chuyên gia thống kê đã thua trong cuộc bầu cử vì dự đoán sai. Ngược lại, các chuyên gia thống kê đã thắng, nhưng chỉ những ai dùng phương pháp tiên tiến nhất. Trò đùa của lịch sử: Trump luôn phê phán ngành khoa học này, nhưng rốt cuộc thắng là nhờ nó.

Kẻ chiến thắng thứ hai – Công ty Cambridge Analytica. Chủ của Breitbart News, cái loa chính của phe bảo thủ, Steve Bannon là thành viên HĐQT của công ty. Mới đây, ông ấy được bổ vào vị trí chiến lược gia của Trump. Marion Le Pen, thủ lĩnh “Mặt trận nhân dân” Pháp cũng đã mừng vui loan báo về quan hệ hợp tác với hãng. Theo Nix, công ty đang được rất nhiều khách hàng trên thế giới quan tâm. Có cả từ Thụy Sĩ và Đức.

Kosinski theo dõi những chuyện này từ phòng mình ở Stanford. Sau bầu cử Mỹ, mọi thứ trong trường bị đảo lộn. Để đáp trả, Kosinski sử dụng vũ khí sắc bén nhất trong những thứ mà một nhà nghiên cứu có thể có: phân tích khoa học. Cùng với cộng sự Sandra Matz, anh đã thực hiện một loạt test, mà kết quả sẽ sớm được công bố. Một vài trong số đó, được nhà khoa học chia sẻ với Das Magazine, gây sốc. Ví dụ, kỹ thuật xác định mục tiêu bằng tâm lý, tương tự với những gì Cambridge Analytica dùng để phân tích Big Data, làm tăng số click vào quảng cáo trên Facebook lên 60%. Còn xác suất của việc sau khi xem các quảng cáo đã được cá nhân hóa người dùng sẽ có hành động (mua gì đó hay bỏ phiếu cho ai đó) thì tăng 1.400%.

Ngày nay thế giới đã đảo ngược: Brexit xảy ra, còn Trump sắp lãnh đạo nước Mỹ. Tất cả khởi đầu từ một người đã muốn cảnh báo chúng ta về hiểm họa. Hằng ngày, anh lại nhận được vô vàn trách móc qua hộp thư. “Không. Tôi không có lỗi”, Kosinski nói. “Không phải tôi là người chế tạo bom, tôi chỉ chỉ ra rằng chúng tồn tại”.

Vì Big Data mà Scandal Facebook đã diễn ra như thế nào?

Scandal của Facebook rõ ràng là một sự kiện chính trị nổi bật khi nó xảy ra trước thềm cuộc bầu cử hội đồng nhân dân Mỹ và là thước đo về sự ủng hộ của quần chúng nhân dân với chủ tịch Donal Trump. Xâu chuỗi sự kiện một cách logic thì phải xét từ vụ Edward Snowden, cựu nhân viên CIA đã phanh phui chương trình thu thập dữ liệu quần chúng của chính phủ dưới thời chủ tịch nước Obama. Vào giữa năm 2013, Snowden bắt đầu cung câp tin cho báo chí tố cáo chương trình do thám công dân của CIA. Chủ tịch nước Obama đã phải ra quyết định hủy chương trình tranh cãi này nhưng đồng thời yêu cầu các cơ quan chức năng tống đạt quyết định truy nã Snowden, hủy hộ khẩu và hộ chiếu của y tại Mỹ.

Cũng trong 2013, GS Alexandr Kogan đã được Facebook cho phép truy cập dữ liệu của 270.000 người dùng mạng xã hội này kéo theo danh sách thông tin cá nhân của 50 triệu người là bạn bè, người thân trong list của họ. Tại sao Facebook lại hợp tác với Kogan? Điều này cũng dễ hiểu như việc các công ty cho sinh viên thực tập hay tài trợ cho các nghiên cứu.. những cái đó đều phục vụ lợi ích của họ mà ở đây là việc Kogan thử nghiệp ứng dụng “lọc” và xử lý thông tin cá nhân của người dùng Facebook nếu thành công thì đương nhiên Facebook sẽ tiếp nhận ứng dụng đó bằng một hình thức hợp tác nào đó. Tôi nhắc đến Snowden để cho thấy rằng công nghệ do thám, lọc thông tin cá nhân quần chúng đã đạt tới trình độ cao và CIA nắm được công nghệ đó thì đương nhiên các tổ chức khác như Facebook cũng đủ khả năng để có nó.

Mark Zuckerberg chua xót trả lời phỏng vấn CNN

2014, Facebook đã thay đổi chính sách trên nền tảng của mình, về việc hạn chế số dữ liệu mà các nhà phát triển bên thứ 3 có thể tiếp cận. Phải nói là họ rất “cáo”. Sau khi Kogan sử dụng phương pháp Michal Kosinski lọc dữ liệu Facebook xong, Facebook chắc chắn cũng nắm được công nghệ lọc thông tin cá nhân và ứng dụng vô cùng to lớn của nó nên bắt đầu tìm cách ngăn không cho thằng khác lấy được tài nguyên của mình(thông tin của hàng tỷ người dùng). Cũng trong thời gian này, khi mọi ứng dụng lọc đã sẵn sàng sau khi hợp tác với Kogan, Facebook bắt đầu cưỡng bức người dùng phải khai tên thật với lý do rất nhân văn là để mọi người kết nối trung thực với nhau nhưng thực chất là ngụy biện cho việc khai thác thông tin chính xác nhất của người dùng phục vụ cho mục đích kinh doanh của mình.

Nhưng Kogan cũng khôn lỏi, ngay sau đó bán thông tin cho Cambridge Analytica vào năm 2015 cũng là năm tranh cử của Donald Trump. Tại sao Facebook không ngăn chặn được Kogan và không công khai vụ việc này? Bởi vì nó ít nhiều lien quan đến vụ Snowden về mặt truyền thông. Khi nước Mỹ và cả thế giới vẫn đang choáng về vụ Snowden và cả Wikileak nữa thì Facebook hẳn là không đủ can đảm để công khai vụ việc.

Vậy Facebook có 2 cái sai:

Facebook cho Alexandr Kogan sử dụng dữ liệu của 270.000 người dùng để thu thập thông tin, khảo sát, tổng cộng cả bạn bè của họ thì lên đến 50.000.000 người dùng. Đây là cái sai đầu tiên và tai hại nhất của Facebook. Sau đó Alexandr Kogan bán dữ liệu đã thu thập, phân tích, xử lý cho cty Cambridge Analytica, công ty chuyên nghiên cứu Big Data.

2015, Facebook biết chuyện nhưng không công khai và xử lý được. Cái sai thứ 2 là thiếu trách nhiệm và bưng bít thông tin..

Kỳ kế tiếp : ” Big Data gây hiểm họa cho người dùng như thế nào