جمع التبرعات 15 سبتمبر 2024 – 1 أكتوبر 2024 حول جمع التبرعات

Алгоритмы обучения с подкреплением на Python

  • Main
  • Алгоритмы обучения с подкреплением на...

Алгоритмы обучения с подкреплением на Python

Лонца А.
كم أعجبك هذا الكتاب؟
ما هي جودة الملف الذي تم تنزيله؟
قم بتنزيل الكتاب لتقييم الجودة
ما هي جودة الملفات التي تم تنزيلها؟
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. 

В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. 

Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне. 

عام:
2020
الناشر:
ДМК Пресс
اللغة:
russian
الصفحات:
286
ISBN 10:
5970608556
ISBN 13:
9785970608555
ملف:
PDF, 10.35 MB
IPFS:
CID , CID Blake2b
russian, 2020
إقرأ علي الإنترنت
جاري التحويل إلى
التحويل إلى باء بالفشل

أكثر المصطلحات والعبارات المستخدمة