Меню

Книжки українською(12397)
Для детей(40215)
Для подростков(4194)
Для взрослых(50421)
Дом. Сад. Огород. Животные и растения(847)
Досуг. Развлечения. Хобби.(5328)
Календари, открытки, ежедневники, блокноты, альбомы(756)
Культура. Искусство. Живопись. Музыка(3510)
Мифы и легенды(339)
Мемуары и биографии(807)
Научно-популярная литература(13430)
Наклейки на клавиатуру(1)
Настольные игры(209)
Психология, педагогика(9702)
Подарочные сертификаты(6)
Публицистика(2410)
Религия(197)
Эзотерика. Самопознание. Тайные явления(3428)
Экономика. Бизнес(2643)
Новый Год/Новий рік/Nowy Rok(549)
Кнігі на беларускай мове(126)
Новинки
Скидки

Бесплатная доставка (только по Польше)

Darmowa dostawa (ORLEN Paczka) już od 200 zł.

Бесплатная доставка (Pocztex Punkt) при заказе на сумму от 200,00 zł.

Книга дня

Гарри Поттер. Комплект из 7 книг в футляре

480,00 zł

szt.

Жуткая книга рецептов Уэнсдэй Аддамс. Неофициальное издание

76,00 zł

szt.

Борис Акунин. Мой календарь (подарочное издание в суперобложке)

200,00 zł

szt.

Доля вероятности

49,00 zł

szt.

Ониксовый шторм. Эмпирей (спец.издание, обрез с узором)

125,00 zł

Скидки

Зайчонок на арене

10,40 zł

Обычная цена: ~~13,00 zł~~

Lowest price: 13,00 zł

szt.

Почти прекрасны

25,00 zł

Обычная цена: ~~40,00 zł~~

Lowest price: 40,00 zł

szt.

Сад расходящихся тропок. Алеф. Полное собрание рассказов

64,00 zł

Обычная цена: ~~79,00 zł~~

Lowest price: 79,00 zł

szt.

Мое прекрасное забвение

25,00 zł

Обычная цена: ~~41,00 zł~~

Lowest price: 41,00 zł

szt.

Голди в страшном парке

16,00 zł

Обычная цена: ~~20,00 zł~~

Lowest price: 20,00 zł

szt.

Войти

Забыли пароль?

Создать учетную запись

Введите свой электронный адрес, если хотите получать информацию о новинках и акциях

Валюта

Лапань М.

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Наличие: книга под заказ

Срок отправки: Вышлем через 4-5 недель

Цена:

73,00 zł

szt.

Не нашли нужную книгу? Привезём под заказ!

Заказываем книги в издательствах каждую среду.

Время от даты заказа поставщику до прибытия товара на наш склад в Кракове – около 3 недель.

Как оформить заявку на книгу "под заказ"?