Інтернет використовує особисту інформацію без нашого відома і контролю. Ми часто добровільно вносимо свої особисті дані, заповнюючи анкети і користуючись соціальними мережами.
Коли, наприклад, користувач бачить оголошення про депресію, він не може зрозуміти, що воно з’явилося, тому що він недавно відправив повідомлення про те, що йому сумно.
Роксана Гімбезу і Августин Шенро, доценти інформатики в Колумбійському університеті, прагнуть змінити це і в той же час привнести більше прозорості в Інтернет.
Вони і аспірант Матіас Лекьюайер розробили Ікс-Рей – новий інструмент, який показує дані в веб-рахунку, такі як повідомлення електронної пошти, пошук або аналізовані продукти, які використовуються для націлення та реклами.
Вони представлятимуть прототип, який зробить використання персональних даних більш доступними. Розробники виклали системи з відкритим вихідним кодом для інших дослідників, зацікавлених у вивченні того, як веб-сервіси використовують особисті дані.
«Сьогодні у нас є проблема: мережа не прозора. Ми розглядаємо Ікс-рей в якості першого кроку в демонстрації того, як веб-сайти використовують ваші особисті дані», – каже Гімбезу, яка також є членом Інституту Колумбії та Центру кібербезпеки.
Ми живемо у великому світі інформації, де приголомшливі суми персональних даних: наших історій пошуків, листів, повідомлень, фотографій, постійно збираються та аналізованих Google, Amazon, Facebook і багатьма іншими веб-сервісами.
У той час як освоєння великих даних, безумовно, може поліпшити наше повсякденне життя (Amazon-пропозиції, Netflix-побажання, твіти екстреного реагування і т.д.), ці корисні застосування також породили хаос серед веб-сервісів, які активно винаходять нові способи придбання та комерціалізації інформації.
«Дуже важливо, зараз, як ніколи, примирити потреби нашого приватного життя з показовим прогресом в мобілізації цих даних», – каже Шенро. Гімбезу уточнює: «Якщо ми залишимо це без уваги, інформація може стати живильним середовищем для зловживання даними, конфіденційністю або облудній діловою практикою».
Повний рішучості забезпечити систему стримувань і противаг для зловживання даними, Ікс-Рей призначений, щоб стати першою масштабується для веб-відстеження особистих даних.
Наприклад, можна використовувати прототип Ікс-Рей, чтои вивчити, чому користувачеві було показано конкретне оголошення в Gmail. Гімбезу і Шенро визначили, наприклад, що користувач Gmail бачить рекламу про різні форми спіритизму, тому що він або вона послала електронне повідомлення про депресію.
Розробка Ікс-Рей була складною, кажуть дослідники. «Науки про розуміння використання особистих веб-даних, зокрема окремих повідомлень, фотографій, листів і т.д., не існує, – зауважила Гімбезу.
– Дійсно, немає нічого, що може точно визначити, які саме пошукові запити, відвідувані сайти або аналізовані продукти викликають той чи інший відповідь. Було ясно, що нам потрібно придумати новий, міцний інструмент для аудиту, який може ефективно застосовуватися для різних послуг».
Як це працює
«Ми з самого початку знали, що найбільшою проблемою в досягненні прозорості буде масштабтрованіе – як відслідковувати більше даних при використанні мінімальних ресурсів– каже Гімбезу.
– Теоретичні результати були обнадійливими, але були занадто гарні, щоб стати правдою. Протестувавши Ікс-Рей в реальних ситуаціях, ми винесли уроки з експериментів на Gmail, Amazon і YouTube. Остаточний результат здивував нас: Ікс-Рей впорався з усіма експериментами, і це соответствовует нашим теоретичним припущенням в складніших випадках.
Ми усвідомили, що досягнення веб-прозорості – це не сон про віддалене майбутнє, а те, що ми можемо почати будувати вже зараз». Нинішня система Ікс-Рей працює з Gmail, Amazon, і YouTube.
Ключовою ідеєю Ікс-Рей є використання чорного ящика для кореляції входу і виходу даних для виявлення їх використання. Для оцінки практичної цінності програми дослідники створили демо-сервіс, який постійно збирає і діагностіірует Gmail-оголошення, пов’язані з набором питань, включаючи різних захворювання, вагітність, расу, сексуальну орієнтацію, розлучення, борги і т.д.
Вони створювали електронні листи, включаючи ключові слова, тісно пов’язані з однією темою, а потім запустили Ікс-Рей та розглянули цільові асоціації. Дані Ікс-Рей тепер доступні онлайн для всіх, хто цікавиться темами таргетингу в Gmail.
Дослідники зробили висновки: аналіз показав цільові теми в поштових скриньках користувачів, включаючи рак, депресію або вагітність. Для багатьох оголошень планування було вкрай неясним і неочевидним для кінцевих користувачів, які відкривають їх.
Дослідники відзначили ознаки таких порушень, як субстандартні оголошення про іпотечні позики, продажі старих автомобілів, орієнтованих на борги в поштових скриньках користувачів.
Цей інструмент може бути використаний для збільшення обізнаності користувачів про те, як їх дані використовуються, а також для забезпечення доступу для аудиторів, наприклад, дослідників, журналістів та слідчих, щоб зберегти це зловживання під контролем.
«Наша робота сприяє кращій практиці добровільної прозорості, – каже Шенро, – в той же час, розширення прав і можливостей слідчих і контролерів з новим інструментом вимагає підвищення пильності».