AI та ML: сучасний стан

АІ (artificial intelligence, штучний інтелект) є здатністю комп’ютерних систем виконувати завдання, які потребують інтелекту людини. На сучасному етапі AI, зокрема, використовується для автономного управління транспортними засобами, медичної діагностики, автономного планування, біржового аналізу, розпізнавання тексту і виявлення певних семантичних (смислових) ознак в ньому.

Стрімкий розвиток AI, який ми спостерігаємо останнім часом, став можливим завдяки ML (machine learning, машинному навчанню) з використанням штучних нейронних мереж та достатній обчислювальній потужності сучасного апаратного забезпечення – "заліза" для обробки значних об’ємів даних. Завдяки вказаним можливостям класичний спосіб програмування (написання програм, які здатні лише вибирати наперед запрограмований «вручну» варіант поведінки) був доповнений ML, тобто «навчанням» систем на наборах відповідних даних.

Відповідні системи навчаються виявляти певні суттєві характеристики в наборах даних і належно реагувати на них. Такий підхід дає можливість забезпечити прийняття рішень відповідними комп’ютерними системами в автоматичному режимі при значній/необмеженій кількості характеристик, які слід проаналізувати, що є фактично неможливим при класичному програмуванні. Однак, недолік таких систем в тому, що складно зрозуміти, як саме ними приймаються рішення. Такі рішення є результатом незрозумілої внутрішньої роботи відповідних систем (принцип чорного ящика).

Застосування AI, ML для забезпечення дотримання вимог GDPR

Можливість АІ виявляти певні семантичні (смислові) ознаки в наборах даних є ключовою властивістю для ефективного опрацювання даних, що зумовило широке використання АІ для такого опрацювання. Одним із напрямків такого використання є забезпечення дотримання нормативних актів.

Особливо актуальним є використання АІ для забезпечення дотримання вимог GDPR (General Data Protection Regulation, Загальний регламент про захист даних), починаючи з моменту ідентифікації отриманої інформації як персональних даних, протягом всього періоду її опрацювання тобто до моменту її стирання.

Разом з тим такі особливості АІ як принцип чорного ящика та автоматизованість при опрацюванні даних та прийнятті відповідних рішень входять в протиріччя з окремими вимогами GDPR. Далі ми проведемо аналіз відповідних норм в контексті їхнього впливу на опрацювання даних за допомогою АІ, ML. Розраховуємо, що аналіз буде корисний і українським розробникам АІ, ML для врахування положень таких норм при проектуванні відповідних систем.

Обмеження щодо автоматичного прийняття рішень

Положеннями GDPR встановлено обмеження щодо автоматичного прийняття рішень при опрацюванні персональних даних. Так параграф 1 ст. 22 Регламенту передбачає, що суб’єкт даних повинен мати право не підлягати рішенню, що ґрунтується винятково на автоматизованому опрацюванні, в тому числі профайлінгу.

Вказане обмеження встановлено для рішень, які створюють правові наслідки для суб’єктів даних або подібним чином істотно впливають на них. Типовим прикладом рішення, яке створює правові наслідки для суб’єкта даних, є рішення про надання кредиту, яке приймається на основі персональних даних. Відповідно, таке рішення, за загальним правилом, не може прийматися автоматично.

Разом з тим, з вказаного загального обмеження встановлені суттєві виключення. Так, автоматичне прийняття рішення, яке стосується суб’єктів даних, дозволяється, якщо таке рішення: (a) є необхідним для укладення чи виконання договору між суб’єктом даних і контролером даних; (b) дозволено законодавством Європейського союзу або держави-члена; або (c) ґрунтується на прямо висловленій згоді.

Отже розробникам АІ, МL, для забезпечення прийняття комп’ютерними системами вірних рішень з приводу можливості автоматичного опрацювання персональних даних, слід вирішити наступні завдання:

- навчити відповідні комп’ютерні системи визначати, чи є рішення, які приймаються в процесі обробки персональних даних, рішеннями, що істотно впливають на суб’єктів даних;

- в разі, якщо система вирішить, що такий вплив існує, забезпечити можливість встановлення системою існування/відсутності виключень, які дозволяють приймати рішення автоматично. Зокрема, здатність визначити, чи ґрунтується відповідне рішення на прямо висловленій згоді суб’єкта даних та чи не відкликана така згода.

- в разі, якщо система прийде до висновку, що рішення не може бути прийнято автоматично, забезпечити можливість ефективного прийняття відповідного рішення за участю контролера.

Пояснення причин, які лежать в основі автоматично прийнятих рішень

Положеннями GDPR (ст.13-ст.15) передбачено обов’язок контролера надавати суб’єкту даних інформацію про логіку, значимість та передбачувані наслідки автоматизованого прийняття рішень. Також ст. 22 Регламенту передбачає, що у випадках, коли дозволяється автоматичне прийняття рішень щодо суб’єктів даних, контролер повинен, зокрема, вжити належних заходів для гарантування права на людське втручання з боку контролера, висловлення своєї думки суб’єктом даних та оскарження ним відповідного рішення. З вказаних положень слідує, що суб’єкт даних має право отримання пояснень щодо причин, які лежать в основі автоматично прийнятих рішень.

Тобто Регламент, по суті, вимагає надання контролером пояснень щодо внутрішньої роботи комп’ютерних систем на базі АІ, з чим, як зазначалось вище, є значні складності з огляду на принцип чорного ящика, який є характерним для таких систем.

Наразі систем АІ, які б повністю забезпечували виконання вказаних вимог Регламенту, не існує. Розробникам відповідних АІ систем при їхньому проектуванні слід, зокрема, забезпечити можливість надання такими системами інформації щодо того, яка саме персональна інформація була врахована при автоматичному прийнятті рішення, а також наскільки вагомими були конкретні дані при прийнятті відповідного рішення.

Чи потрібне перенавчання комп'ютерної системи у разі необхідності стирання даних навчання?

Відповідно до ч.1 ст. 17 Регламенту, суб’єкт даних має право на стирання своїх персональних даних, яке повинен здійснити контролер без будь-якої безпідставної затримки.

Вказане положення Регламенту викликає спірні питання відносно стирання даних, які використовувались для навчання нейронних мереж. Так, з однієї сторони, дані, які використовувалися для такого навчання, після його завершення, можуть бути видалені без шкоди для відповідної комп’ютерної системи.

З іншої сторони, оскільки такі дані були використані для навчання нейронної мережі і, відповідно, здійснили на неї певний вплив, то виникає питання чи можливе зворотне відтворення таких даних. Відповідно, якщо відповідь позитивна і дані можуть бути відтворені, то відповідну нейронну мережу слід перенавчити таким чином, щоб таке відтворення стало неможливим.

Наскільки відомо автору, питання можливості такого відтворення має більш науковий, а не практичний характер, і тому наразі відсутня необхідність перенавчання комп'ютерної системи, у разі необхідності стирання даних, які використовувались для її навчання.

GDPR for AI and ML developers

AI та ML: сучасний стан

Застосування AI, ML для забезпечення дотримання вимог GDPR

Обмеження щодо автоматичного прийняття рішень

Пояснення причин, які лежать в основі автоматично прийнятих рішень

Чи потрібне перенавчання комп'ютерної системи у разі необхідності стирання даних навчання?