Меню
Бесплатная доставка (только по Польше)
Darmowa dostawa (ORLEN Paczka) już od 200 zł.
Бесплатная доставка (Pocztex Punkt) при заказе на сумму от 200,00 zł.
Скидки
Основатель Тёмного Пути. Маньхуа. Том 7
Основатель Тёмного Пути. Маньхуа. Том 7

40,00 zł

Обычная цена: 75,00 zł

Lowest price: 75,00 zł
szt.
Спаси нас. Книга 3
Спаси нас. Книга 3

33,00 zł

Обычная цена: 48,00 zł

Lowest price: 48,00 zł
szt.
Мое ходячее несчастье
Мое ходячее несчастье

25,00 zł

Обычная цена: 47,00 zł

Lowest price: 47,00 zł
szt.
Картина з паєток.Балерина
Картина з паєток.Балерина

15,00 zł

Обычная цена: 25,00 zł

Lowest price: 25,00 zł
szt.
Картина з паєток. Єдиноріг
Картина з паєток. Єдиноріг

16,80 zł

Обычная цена: 28,00 zł

Lowest price: 28,00 zł
szt.
Войти
Забыли пароль? Создать учетную запись
Подписка
Введите свой электронный адрес, если хотите получать информацию о новинках и акциях
Paczkomaty InPost

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Наличие: книга под заказ
Срок отправки: Вышлем через 4-5 недель
Цена: 73,00 zł

Обычная цена:

73.00
Самая низкая цена в течение последних 30 дней перед скидкой:
quantity szt.

product unavailable

добавить в список желаемых
Оценка: 0
Автор: Лапань М.
Код/артикул товара: 978-5-4461-1079-7

Описание

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Автор: Лапань М.

Дополнительная информация

Издательство Питер Издательский дом
Серия Для профессионалов (Питер ИД)
Размеры 165 x 233 x 23
Страниц 496
Переплёт мягкий
Год выпуска 08.06.2020
Вес в упаковке 0.684

Варианты доставки

  • Самовывоз в г.Кракове из магазина на ул. Starowiślna 17/lokal 2
  • Pocztex Punkt (Żabka, АЗС Orlen, автоматах и отделениях Почты Польской) - 14 зл (бесплатно от 200 зл) - 1-2 дня рабочих
  • Paczkomaty InPost (РЕКОМЕНДУЕМ)- 17 зл (бесплатно от 400 зл) - 1-2 дня рабочих
  • Paczka ORLEN(бывшая Ruch) - 13 зл (бесплатно от 200 зл) -1-3 дня рабочих
  • Курьер InPost - 20 зл, Курьер Pocztex Poczta Polska - 15 зл - 1-2 дня рабочих
  • Международная доставка

Не нашли нужную книгу? Привезём под заказ!

Заказываем книги в издательствах каждую среду.

Время от даты заказа поставщику до прибытия товара на наш склад в Кракове – около 3 недель.

Как оформить заявку на книгу "под заказ"?

Новинки
Він повертається в неділю
Він повертається в неділю

83,00 zł

szt.
Замерзла ріка
Замерзла ріка

79,00 zł

szt.
Завіт води
Завіт води

105,00 zł

szt.
Убита светом, рождена тьмой
Убита светом, рождена тьмой

60,00 zł

szt.
Невинная вишня
Невинная вишня

54,00 zł

szt.
Бестселлеры
Синие бабочки
Синие бабочки

40,00 zł

szt.
Выбрать язык/Wybierz język
наверх
Shop is in view mode
Просмотр полной версии сайта
Sklep internetowy Shoper Premium