logo-image
Особенности применения GDPR разработчиками AI и ML
Автор: Виталий Кулинич
Источник: Юрист&Закон. – №08. – 28 февраля 2019 года
Скачать

AI и ML: современное состояние

АІ (artificial intelligence – искусственный интеллект) является способностью компьютерных систем выполнять задачи, требующие интеллекта человека. На современном этапе AI, в частности, используется для автономного управления транспортными средствами, медицинской диагностики, автономного планирования, биржевого анализа, распознавания текста и выявления определенных семантических (смысловых) признаков в нем.

Стремительное развитие AI, которое мы наблюдаем в последнее время, стало возможным благодаря ML (machine learning – машинному обучению) с использованием искусственных нейронных сетей и достаточной вычислительной мощности современного аппаратного обеспечения – "железа" для обработки значительных объемов данных. Благодаря указанным возможностям классический способ программирования (написания программ, способных лишь выбирать заранее запрограммированный "вручную" вариант поведения) дополнен ML, то есть " обучением" систем на наборах соответствующих данных.

Соответствующие системы обучают выявлять определенные существенные характеристики в наборах данных и должным образом реагировать на них. Такой подход позволяет обеспечить принятие решений соответствующими компьютерными системами в автоматическом режиме при значительном/неограниченном количестве характеристик, которые следует проанализировать, что фактически невозможно при классическом программировании. Однако недостаток таких систем заключается в том, что сложно понять, как именно они принимают решение. Такие решения являются результатом непонятной внутренней работы соответствующих систем (принцип черного ящика).

Применение AI и ML для обеспечения соблюдения требований GDPR

Возможность АІ выявлять определенные семантические (смысловые) признаки в наборах данных является ключевым свойством для эффективной обработки данных, что обусловило широкое использование АІ для такой обработки. Одним из направлений такого использования является обеспечение соблюдения нормативных актов.

Особенно актуально использование АІ для обеспечения соблюдения требований GDPR (General Data Protection Regulation – Общий регламент о защите данных), начиная с момента идентификации полученной информации в качестве персональных данных, в течение всего периода ее обработки, то есть до момента ее стирания.

Вместе с тем такие особенности АІ, как принцип черного ящика и автоматизированность, в процессе обработки данных и принятия соответствующих решений входят в противоречие с отдельными требованиями GDPR. Далее мы проведем анализ соответствующих норм в контексте их влияния на обработку данных с помощью АІ и ML. Рассчитываем, что анализ будет полезен и украинским разработчикам АІ и ML для учета положений таких норм при проектировании соответствующих систем.

Ограничение относительно автоматического принятия решений

Положениями GDPR установлено ограничение относительно автоматического принятия решений при обработке персональных данных. В частности, параграф 1 ст. 22 Регламента предусматривает, что субъект данных должен иметь право не подлежать решению, которое основывается исключительно на автоматизированной обработке, в том числе профайлинге.

Указанное ограничение установлено для решений, которые создают правовые последствия для субъектов данных или подобным образом существенно влияют на них. Типовым примером решения, создающего правовые последствия для субъекта данных, является решение о предоставлении кредита, которое принимается на основании персональных данных. Соответственно, такое решение, по общему правилу, не может приниматься автоматически.

Вместе с тем из указанного общего ограничения имеются существенные исключения. Например, автоматическое принятие решения, касающегося субъектов данных, разрешается, если такое решение: (a) является необходимым для заключения или выполнения договора между субъектом данных и контролером данных; (b) разрешено законодательством Европейского Союза или государства-члена; или (c) основывается на прямо выраженном согласии.

Итак, разработчикам АІ и МL для обеспечения принятия компьютерными системами правильных решений по поводу возможности автоматической обработки персональных данных, необходимо решить следующие задачи:

– научить соответствующие компьютерные системы определять, являются ли решения, принимаемые в процессе обработки персональных данных, решениями, которые существенно влияют на субъектов данных;

– в случае если система решит, что такое влияние существует, обеспечить возможность установления системой существования/отсутствия исключений, позволяющих принимать решение автоматически. В частности, способность определить, основывается ли соответствующее решение на прямо выраженном согласии субъекта данных и не отозвано ли такое согласие;

– в случае если система определит, что решение не может быть принято автоматически, обеспечить возможность эффективного принятия соответствующего решения с участием контролера.

Объяснение причин, лежащих в основе автоматически принятых решений

Положениями GDPR (ст. ст. 13 – 15) предусмотрена обязанность контролера предоставлять субъекту данных информацию о логике, значимости и предполагаемых последствиях автоматизированного принятия решений. Также ст. 22 Регламента предусматривает, что в случаях, когда разрешается автоматическое принятие решений в отношении субъектов данных, контролер должен, в частности, принять надлежащие меры для гарантирования права на человеческое вмешательство со стороны контролера, высказывание своего мнения субъектом данных и обжалование им соответствующего решения. Из указанных положений следует, что субъект данных имеет право получить объяснения о причинах, лежащих в основе автоматически принятых решений.

То есть Регламент, по сути, требует предоставления контролером объяснений по поводу внутренней работы компьютерных систем на базе АІ, с чем, как указывалось выше, имеются значительные сложности ввиду принципа черного ящика, который характерен для таких систем.

На данный момент систем АІ, которые бы полностью обеспечивали выполнение указанных требований Регламента, не существует. Разработчикам соответствующих АІ-систем при их проектировании необходимо, в частности, обеспечить возможность предоставления такими системами информации о том, какая именно персональная информация была учтена при автоматическом принятии решения, а также насколько весомыми были конкретные данные при принятии соответствующего решения.

Необходимо ли переобучение компьютерной системы в случае необходимости стирания данных обучения?

В соответствии с ч. 1 ст. 17 Регламента субъект данных имеет право на стирание своих персональных данных, которое должен осуществить контролер без какой-либо безосновательной задержки.

Указанное положение Регламента вызывает спорные вопросы по поводу стирания данных, использовавшихся для обучения нейронных сетей. В частности, с одной стороны, данные, которые использовались для такого обучения, после его завершения могут быть удалены без вреда для соответствующей компьютерной системы.

С другой стороны, поскольку такие данные были использованы для обучения нейронной сети и, соответственно, осуществили на нее определенное влияние, то возникает вопрос: возможно ли обратное воссоздание таких данных? Соответственно, если ответ положительный и данные могут быть воссозданы, то соответствующую нейронную сеть следует переобучить таким образом, чтобы такое воссоздание стало невозможным.

Насколько известно автору, вопрос возможности такого воссоздания имеет больше научный, а не практический характер, и потому на сегодняшний день отсутствует надобность переобучения компьютерной системы в случае необходимости стирания данных, использовавшихся для ее обучения.