Когда ваше лицо вам больше не принадлежит

Ряд студентов американских университетов поучаствовали в научном исследовании и в результате обнаружили, что их лица стали частью набора данных, который будет «жить вечно» в сети и потенциально доступен для всех.

Публикуется с сокращениями

Автор: Сидни Фасселл

Когда в кофейне собирается 20 человек, то в помещении есть по крайней мере 21 камера: по одной в телефонах и минимум одна в углу помещения. Ваш разговор могут записать и выложить в твиттер, а ваше лицо – «засветиться» на фоне селфи другого клиента или сеанса Skype. Но это не мешает даже беспокоящимся о приватности людям посещать кофейни. Они принимают на себя соответствующие риски.

Это понятие — «разумного» ожидания конфиденциальности – помогает исследователям, которые изучают публичные объекты. Но сама идея того, что в этом случае разумно, достаточно сложна. Преподаватели в трех университетах — Дьюка, Стэнфорде и Университете Колорадо в Колорадо-Спрингс — столкнулись с негативной реакцией после формирования баз данных лиц студентов, посещающих кафе в студенческих городках. Когда вы приходите в подобное заведение, разумно ожидать, что вас увидит камера, однако навряд ли вы готовы к тому, что станете предметом исследования, частью набора данных, который может жить в сети вечно.

До этого Советы по этике университетов одобрили все три исследовательских проекта, в которых использовались данные студентов для уточнения алгоритмов машинного обучения. Исследователь из Университета Дьюка Карло Томази отказался от интервью с The Atlantic, но в заявлении для местного издания отметил, что он «искренне считал», что следовал рекомендациям Совета по институциональному обзору. Ранее учёный и его коллеги разместили предупреждения на всех входах в общественные места, сообщая людям, что их снимают, и предоставляя контакты, по которым можно обратиться в случае, если участники хотят удаления личных данных из наборов исследований. Но никто по этим контактам не обратился.

Однако, когда параметры исследования изменились учёный не поставил в известность Совет по этике. Для небольших изменений это допускается. Однако Томази получал разрешение на запись в помещении, а не на улице. И что еще важнее, он обещал разрешить доступ к базе данных только по запросу. Вместо этого он открыл доступ для всех желающих. «В сложившейся ситуации нельзя обвинять Совет, так как я не смог проконсультироваться с ними в критические моменты. Я несу полную ответственность за свои ошибки и приношу извинения всем людям, данные которых были использованы, а также Университету Дьюка за последствия» — говорится в заявлении.

Университет Дьюка в конечном итоге решил удалить набор данных, связанных с исследованием. Стэнфорд в аналогичном случае сделал то же самое. В UCCS, где исследователи регистрировали студентов для тестирования программного обеспечения по распознаванию лиц, команда никогда не собирала индивидуально идентифицирующую информацию. Исследователи из проектов Стэнфорда и UCCS не ответили на запросы о комментариях. В отдельных заявлениях каждый университет подтвердил, что Советы по этике одобрили все исследования, и подчеркнул свою приверженность конфиденциальности студентов.

Но заключается проблема в том, что Советы по этике в университете по своей сути ограничены. Они наблюдают за некоторыми узкими аспектами того, как проводится исследование, но не всегда контролируют то, что происходит с данными после его завершения. А в век информации большинство научных исследований появляется онлайн, а значит живет вечно. Другие исследователи, не связанные соответствующими обязательствами, могут скачать набор данных и использовать его по своему усмотрению, без согласия тех, чьи персональные данные были использованы.

Эти последствия могут распространяться далеко за пределы того, что представляют исследователи. Адам Харви, эксперт по противодействию слежке в Германии, обнаружил более 100 проектов по машинному обучению по всему миру, которые ссылались на набор данных Университета Дьюка. Он создал карту, которая отслеживала распространение информации по всему миру. Университеты, стартапы и различные учреждения использовали этот набор данных, в том числе SenseTime и Megvii, китайские фирмы, разрабатывающие системы слежки.

Управление федерального правительства по защите исследований США недвусмысленно просит членов совета не рассматривать «возможные долгосрочные последствия применения знаний, полученных в ходе исследования». Вместо этого им предлагается сосредоточиться только на предметах, непосредственно вовлеченных в исследование. И если этими субъектами являются в основном анонимные люди, которые находятся в общественном месте, нет никаких оснований полагать, что им был нанесен явный вред.

Кейси Файслер, доцент кафедры информатики в Университете Колорадо в Боулдере, пишет об этике использования открытых данных в научных исследованиях. Фирма Файслер предложила систему контроля доступа к наборам данных, аналогичную использованию авторских прав. Она отмечает, что положения о добросовестном использовании носят субъективный характер, но имеют стандарты, основанные на том, как заказчик планирует использовать материал. Аналогичные правила действуют для программного обеспечения с открытым исходным кодом: лицензия Creative Commons подразумевает использование интеллектуальной собственности только для некоммерческой работы, основанной на оригинале без копирования, и предполагает ответственность в случае искажения намерений. Это субъективные метрики, которые не вписываются бюрократизированную академическую среду, но могут быть полезны, по крайней мере, в попытках представить себе направление движения.

Сидни Фасселл — штатный сотрудник The Atlantic, он пишет о технологиях.

Оригинал: The Atlantic

Похожие Записи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Последние <span>истории</span>

Поиск описаний функциональности, введя ключевое слово и нажмите enter, чтобы начать поиск.