Оскільки AlphaZero потребує ресурсів, успішні реалізації з відкритим кодом (наприклад, Leela Zero) написані мовами низького рівня (наприклад, C++) і оптимізовано для сильно розподілених обчислювальних середовищ.
AlphaZero. OpenSpiel містить дві реалізації AlphaZero, одна з яких базується на Tensorflow (на Python). Інший заснований на C++ LibTorch.
Алгоритм є більш загальною версією Алгоритм AlphaGo Zero який вперше було представлено в домені Go. AlphaZero оцінює позиції за допомогою апроксимації нелінійної функції на основі глибокої нейронної мережі, а не апроксимації лінійної функції, яка використовується в класичних шахових програмах.
Це вже чудово працює. Але минулого року система штучного інтелекту, розроблена інженерами Google Deepmind, покращилася настільки, що вона має значення. Перед системою, яку Deepmind називає AlphaDev, було поставлено завдання розробити новий спосіб сортування коротких послідовностей чисел у C++, популярна мова кодування.
Пошук дерев Монте-Карло Пошук дерев Монте-Карло (MCTS): поряд із нейронними мережами AlphaZero використовує алгоритм, відомий як пошук дерева Монте-Карло, щоб досліджувати потенційні майбутні кроки в грі.');})();(function(){window.jsl.dh('x57XZpWbOobf0PEPm_uvsAM__36', '
Цей пакет забезпечує загальну, просту та швидку реалізацію алгоритму AlphaZero від Deepmind: основний алгоритм лише 2000 рядків чистого коду Julia, який можна зламати. Загальні інтерфейси спрощують додавання підтримки для нових ігор або нових навчальних фреймворків.
Остаточний рахунок цього матчу. Було 155 перемог для alpha zero. І шість для риби.