Штучний інтелект розкриває анонімність в мережі

Штучний інтелект розкриває анонімність в мережі

Дослідники під керівництвом AI-інженера Саймона Лермена продемонстрували, як великі мовні моделі (LLM) можуть розпізнавати особистості користувачів за їх анонімними коментарями на різних платформах. У своєму дослідженні, яке отримало назву «Large-Scale Online Deanonymization with LLMs», команда оцінила потенціал LLM в аналізі даних з Hacker News, Reddit, LinkedIn та анонімізованих інтерв'ю з датасету Anthropic.

Принцип дії моделі полягає у витягу непрямих даних з коментарів користувачів. На першому етапі формується пул з 100 потенційних кандидатів, а на фінальному етапі LLM аналізує та визначає найбільш ймовірного автора. У тестах на користувачах Hacker News, де моделі завданням було відновити зв'язок між анонімним профілем і реальним, модель досягла 67% точності.

Результати здивували багатьох, адже точність досягала 90% у випадках, коли система генерувала відповідь. Інший експеримент на Reddit показав, що комбінація ембеддінгів та логічного аналізу перевершує традиційні методи, навіть при збільшенні кількості кандидатів до десятків тисяч.

Такі можливості LLM викликають занепокоєння серед фахівців, адже потенційно можуть бути використані урядами для стеження за журналістами або корпораціями для створення точних рекламних профілів. Однак, критики зазначають, що деанонімізація існувала й раніше, і LLM лише спрощує вже відомі методи.

Загалом, дослідження коштувало близько $2000, з розрахунком на вартість деанонімізації одного профілю від $1 до $4 в експериментальних умовах. Цей інструмент може змінити підходи до конфіденційності в інтернеті, створюючи нові виклики для захисту особистих даних.

← Всі статті: Новини