Tôi không bao giờ tôi không thích siêu dữ liệu

Tôi không bao giờ  tôi không thích siêu dữ liệu

Đó là khoảng thời gian cho một mùa Black Hat / DEFCON, và tôi đi qua ghi chép của tôi từ năm ngoái. Một trong những điều đáng chú ý nhất trong BH năm ngoái là bài ​​phát biểu của tướng Alexander, người đứng đầu của NSA. Điều này là đúng trên gót của mạc khải bởi Edward Snowden rằng chính phủ Mỹ đã cơ bản nghe, xem, đọc và phân tích tất cả mọi thứ. Trong thực tế nó trông như thế này là chức năng chính của chính phủ, một nỗ lực rất lớn mà nó cần thiết để được thuê ngoài cho các nhà thầu chính và phụ, nằm ​​ở trung tâm dữ liệu lớn nhất bao giờ tưởng tượng và đến cùng với một vốn từ vựng hoàn toàn mới.

Đó là cách nói chung nhìn tôi từ giữa phòng khiêu vũ của khách sạn. Tôi có thể nói rằng đó là một khán giả rất thù địch, và rằng chung xử lý chính mình với phẩm giá và ơn thánh. Không có vấn đề gì bạn nghĩ về chàng trai, ông là không thể lay chuyển trong thông điệp của mình và giữ mát mẻ của mình mặc dù toàn bộ tình hình.

Tổng nói với chúng tôi rằng NSA đã không thực sự nắm bắt được nội dung của các cuộc gọi điện thoại, nhưng chỉ chiếm được siêu dữ liệu. Đó là từ chính chúng ta sẽ thảo luận ngày hôm nay. Trong lời giải thích của chung, siêu dữ liệu bao gồm các bản ghi cuộc gọi được thực hiện cho một kẻ xấu được biết đến từ một điện thoại nhất định, tại một thời điểm nhất định. Vì vậy, nếu một mô hình có thể được phân tích rằng số điện thoại ở đây tại Hoa Kỳ đã được hàm ý bởi lý do kết nối với kẻ xấu khác được biết đến, đó là số điện thoại ở đây phải được sử dụng bởi một kẻ xấu. Phân tích này sau đó có thể được bàn giao cho cơ quan chức năng khác để bắt hoặc truy tố những kẻ xấu ở Mỹ. Đó là siêu dữ liệu, (phân tích các mối quan hệ của một mẩu thông tin để miếng khác được biết đến thông tin, và các mô hình được tiết lộ) Bây giờ đây không phải là loại duy nhất của siêu dữ liệu thế giới sẽ thấy. Bây giờ chúng ta sống trong một thế giới mà có cái gì đó gọi là BIG DATA. Lớn dữ liệu giả định rằng nếu một cơ thể đủ lớn dữ liệu có thể được thu thập về một người, hoặc một nhóm người, hay một công ty, hay một quốc gia, hoặc bất kỳ bộ sưu tập khác của người dân, rằng dữ liệu đó sẽ tạo ra một phân tích sâu sắc và tiết lộ về bất kỳ khía cạnh của người đó hoặc nhóm người. (màu mắt, thói quen bỏ phiếu, ưu tiên trong xe ô tô, thói quen duyệt web, vv)

Vì vậy, chúng ta hãy giả, chỉ vì lợi ích của đối số, rằng bạn là đối tượng của một phân tích như vậy. Nơi dữ liệu sẽ đến từ đâu? Từ Facebook, và phương tiện truyền thông xã hội khác, từ GOOGLE, và công cụ tìm kiếm khác, từ thẻ giảm giá bạn sử dụng tại các hiệu thuốc hoặc tại các cửa hàng tạp hóa, từ ba cơ quan báo cáo tín dụng, từ các hồ sơ vị trí cung cấp từ điện thoại di động của riêng bạn, từ một phân tích về số lượng và loại từ được sử dụng trong email và văn bản của bạn (được gọi là trường hợp dựa trên lý luận, và rất nhiều một loại siêu dữ liệu của điều) và như vậy. Có một đại dương của dữ liệu về bạn, một thiên hà của nó.

Và phân tích các dữ liệu này sẽ tiết lộ chính xác ai và những gì bạn đang có. Đó là siêu dữ liệu trong hành động.

Chú ý

Tôi đã nói trong một thời gian mà Google biết nhiều về bạn hơn nhà phân tích của bạn. Vâng, một số bạn không có các nhà phân tích. Bài viết này (nhấp vào đây để đọc nó) nói rằng họ biết nhiều hơn về bạn hơn làm người phối ngẫu của riêng bạn.

Và tôi nói cho bạn này ngay bây giờ. Điều này bạn đang nghĩ chính phủ đang làm. Nó không chỉ là NSA. Các quốc gia khác có thể làm điều đó. Các nhà quảng cáo đã làm điều đó. Các phe phái chính trị có thể làm điều đó. Bọn tội phạm có thể làm điều đó. Xu hướng này sẽ chỉ tiếp tục, trên thực tế, để báo Al Jolson, “Bạn không nhìn thấy gì cả.”

kiên trì,

David Perry

Huntington Beach, CA