Бесплатная доставка (только по Польше)
Darmowa dostawa (ORLEN Paczka) już od 200 zł.
Бесплатная доставка (Pocztex Punkt) при заказе на сумму от 200,00 zł.
Скидки
Зайчонок на арене
Зайчонок на арене

10,40 zł

Обычная цена: 13,00 zł

Lowest price: 13,00 zł
szt.
Почти прекрасны
Почти прекрасны

25,00 zł

Обычная цена: 40,00 zł

Lowest price: 40,00 zł
szt.
Сад расходящихся тропок. Алеф. Полное собрание рассказов
Сад расходящихся тропок. Алеф. Полное собрание рассказов

64,00 zł

Обычная цена: 79,00 zł

Lowest price: 79,00 zł
szt.
Мое прекрасное забвение
Мое прекрасное забвение

25,00 zł

Обычная цена: 41,00 zł

Lowest price: 41,00 zł
szt.
Голди в страшном парке
Голди в страшном парке

16,00 zł

Обычная цена: 20,00 zł

Lowest price: 20,00 zł
szt.
Войти
Забыли пароль? Создать учетную запись
Подписка
Введите свой электронный адрес, если хотите получать информацию о новинках и акциях
Paczkomaty InPost

Лапань М.

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Глубокое обучение с подкреплением. AlphaGo и другие технологии
Глубокое обучение с подкреплением. AlphaGo и другие технологии
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Наличие: книга под заказ

Срок отправки: Вышлем через 4-5 недель

Цена:

73,00 zł

szt.

Не нашли нужную книгу? Привезём под заказ!

Заказываем книги в издательствах каждую среду.

Время от даты заказа поставщику до прибытия товара на наш склад в Кракове – около 3 недель.

Как оформить заявку на книгу "под заказ"?

Новинки
Крах людини. Том 1
Крах людини. Том 1

32,00 zł

szt.
Крах людини. Том 3
Крах людини. Том 3

32,00 zł

szt.
Мережевий ефект (Щоденники вбивцебота #5)
Мережевий ефект (Щоденники вбивцебота #5)

52,00 zł

szt.
Чуття і чуттєвість
Чуття і чуттєвість

89,00 zł

szt.
Тінь лисиці (Тінь лисиці #1)
Тінь лисиці (Тінь лисиці #1)

73,00 zł

szt.
Бестселлеры
Игры королей. Принцесса Ардена
Игры королей. Принцесса Ардена

46,00 zł

szt.
Выбрать язык/Wybierz język
наверх
Shop is in view mode
Просмотр полной версии сайта
Sklep internetowy Shoper Premium