2017 року шахова програма AlphaZero, розроблена Google, а саме його дочірньою компанією DeepMind перемогла кращу на той час шахову програму Stockfish 8 в серії зі ста матчів з результатом 28 перемогі 72 нічиї, не програвши жодної партії.
Програма не бачила жодної партії яка була зіграна людиною чи іншим комп’ютером, тобто не має доступу до бібліотек ігор, як інші шахові програми. Свої знання вона отримала виключно в режимі самостійної гри, виключаючи зі свого арсеналу власні помилки, і запамятовуючи вдалі стратегії. Програма досягла надлюдського рівня гри після чотирьох годин навчання з початкового рівня, тобто перевершила тисячі років шахових знань накопичених людством.

AlphaZero демонструє людям як можна було грати в шахи, її гру називають креативною, що характерно і для інших комп’ютерів. На шахових турнірах людей таким чином намагаються викривати гравців які користуються підказками комп’ютерів, якщо гравець починає демонструвати креативну гру – часто виявляєтся що гравець списав в комп’ютера.
Стиль гри AlphaZero був описаний гравцем в шахи як “іншопланетний”, він іноді виграє, пропонуючи неінтуїтивні жертви, наприклад, пропонуючи ферзя чи туру, щоб отримати позиційну перевагу. “Це як шахи з іншого виміру.”

Після чотирьох годин навчання рівень гри AlphaZero був оцінений як вищий за Stockfish 8, але перед серією ігор програма навчалась всього дев’ять годин. Обидві програми використовують в своїй грі метод “дерево пошуку Монте-Карло”, який передбачає аналіз можливих ходів після наступного. Програма від Гугл робить це значно повільніше, всього 80 тисяч позицій в секунду, порівняно з 70 міліонів позицій в секунду у Стокфиш, низьку швидкість аналізу програма компенсує використанням своєї нейронної мережі зосереджуючись набагато більш вибірково на найбільш перспективних варіантах.
Компанія DeepMind не зупиняється на досягненнях 2017 року і наразі працює над програмою MuZero. За даними компанії DeepMind МюЗеро наразі виграє в АльфаЗеро в шаховій грі. MuZero є наступною генерацією AlphaZero, яка не тільки не має доступу до бібліотек ігор і навчається від нульового рівня самойстійно, але і “не знає правил гри в шахи, і вивчає їх самостійно”. Спробуємо розібратись що означає ця фраза, сформульована вірогідно у відділу маркетингу компанії, а не власне розробниками.
Звичайно програма не може повністю не знати правил, так само як людина, яка ніколи не бачила шахів і отримає в своє розпорядження дошку і тридцять дві фігури ніколи не зможе не тільки правильно знати дозволені ходи, але навіть і стартову позицію фігур на дошці.

Справа в тому що AlphaZero використовує в своїй грі симулятор, окремий алгоритм, який володіє даними про можливі наслідки того чи іншого ходу, так звані “маски”, або комбінації, які AlphaZero аналізує і використовує в своїй грі. MuZero в свою чергу не має доступу до такого симулятору, і вивчає такі моделі чи “маски” самостійно. Такий принцип є подібним до накопичення знань людиною, яка вчиться на власних діях, і використовує успішні послідовності в майбутньому, набуває досвід.
Шахи є лише одним з можливих застосувань здібностей AlphaZero і її послідовників, зокрема програма показує відмінні результати в іграх сьоґі (японські шахи), китайській грі ґо і комп’ютерних іграх. Версія програми яка була спрямована вивчити проблему складання протеїнів, речовин які, як ми знаємо, є одними з основних в життєдіяльності людей та інших живих організмів, змогла вирішити проблему яку вчені намагались розв’язати понад 50 років.

Цей фантастичний результат дозволяє науковцям покладатись на розрахункові здібності штучного інтелекту в майбутніх дослідженнях, які, сподіватимемось, зможуть допомогти вирішити невирішені наразі глобальні задачі в галузі медицини.