книга

Введение в методы машинного обучения с подкреплением

Здесь можно купить книгу "Введение в методы машинного обучения с подкреплением" в печатном или электронном виде. Также, Вы можете прочесть аннотацию, цитаты и содержание, ознакомиться и оставить отзывы (комментарии) об этой книге.

Автор: Михаил Медведев

Форматы: PDF

Издательство: Южный федеральный университет

Год: 2025

Место издания: Ростов-на-Дону, Таганрог

ISBN: 978-5-9275-5006-7

Страниц: 219

Артикул: 115939

Возрастная маркировка: 16+

Электронная книга

326 ₽

Купить и скачать

Читать фрагмент

Аннотация

Краткая аннотация книги "Введение в методы машинного обучения с подкреплением"

Cодержит теоретические сведения и практические задания учебного курса «Использование методов машинного обучения в разработке киберфизических систем», изучаемых магистрантами направлений «Мехатроника и робототехника», «Электротехника и электроэнергетика» Передовой инженерной школы Южного федерального университета. Последовательно рассматриваются следующие темы: классические методы обучения с учителем, глубокое обучение с учителем, архитектуры нейронных сетей, основные понятия обучения с подкреплением, метод динамического программирования, метод Монте-Карло, обучение на основе временных различий, приближенные методы аппроксимации функций ценности действий, приближенное управление и аппроксимация.Содержит теоретический материал, контрольные вопросы и задачи, практические задания для выполнения в среде Matlab или Python. Предназначен для магистрантов, которые обучаются по программам магистратуры в области мехатроники и робототехники.

Содержание

Содержание книги "Введение в методы машинного обучения с подкреплением "

ВВЕДЕНИЕ
1. ОСНОВЫ МАШИННОГО ОБУЧЕНИЯ С УЧИТЕЛЕМ
1.1. Классификация методов машинного обучения
1.2. Наивный байесовский классификатор
1.3. Деревья решений
1.4. Метод опорных векторов
1.5. Линейная регрессия
1.6. Структурная схема обучения с учителем
Контрольные вопросы к разделу 1
2. ПРАКТИЧЕСКАЯ РАБОТА 1. ИССЛЕДОВАНИЕ НАИВНОГО БАЙЕСОВСКОГО КЛАССИФИКАТОРА
2.1. Задание к практической работе 1
2.2. Варианты заданий к практической работе 1
3. ПРАКТИЧЕСКАЯ РАБОТА 2. ПОСТРОЕНИЕ ДЕРЕВА РЕШЕНИЙ
3.1. Задание к практической работе 2
3.2. Варианты заданий к практической работе 2
Контрольные вопросы к практической работе 2
4. ГЛУБОКОЕ ОБУЧЕНИЕ С УЧИТЕЛЕМ. АРХИТЕКТУРЫ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ
4.1. Понятие глубокой нейронной сети
4.2. Структура сверточной нейронной сети
4.3. Операция свертки
4.4. Операция дополнения
4.5. Операция объединения
4.6. Выходные слои сверточной сети
4.7. Функции активации
4.8. Пример структуры сверточной нейронной сети
4.9. Архитектура сети Resnet
Контрольные вопросы к разделу 4
5. ПРАКТИЧЕСКАЯ РАБОТА 3. ОБУЧЕНИЕ СВЕРТОЧНОЙ СЕТИ ЗАДАЧЕ ПЛАНИРОВАНИЯ ПУТИ
5.1. Задание к практической работе 3
5.2. Пример выполнения практической работы
5.3. Варианты заданий к практической работе 3
Контрольные вопросы к практической работе 3
6. ОСНОВНЫЕ ПОНЯТИЯ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ
6.1. Элементы обучения с подкреплением
6.2. Классификация методов обучения с подкреплением
6.3. Задача о k-руком бандите
6.4. Метод ценности действий
6.5. Итерационная форма оценки ценности действий
6.6. Доход и эпизоды
6.7. Стратегии и функции ценности
Контрольные вопросы к разделу 6
7. ПРАКТИЧЕСКАЯ РАБОТА 4. ИССЛЕДОВАНИЕ ЗАДАЧИ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ НА ПРИМЕРЕ МНОГОРУКОГО БАНДИТА
7.1. Описание задачи о многоруком бандите
7.2. е-жадная стратегия
7.3. Задание к практической работе 4
7.4. Варианты к практической работе 4
7.5. Пример выполнения практической работы 4
Контрольные вопросы к практической работе 4
8. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ И МОНТЕ–КАРЛО В ОБУЧЕНИИ С ПОДКРЕПЛЕНИЕМ
8.1. Марковский процесс принятия решений
8.2. Метод динамического программирования
8.3. Метод Монте – Карло. Оценивание ценности
8.4. Метод Монте – Карло. Улучшение стратегии
8.5. Метод Монте – Карло. Инкрементная форма оценивания
8.6. Улучшение стратегии методом МК с разделенной стратегией
Контрольные вопросы к разделу 8
9. ПРАКТИЧЕСКАЯ РАБОТА 5. ИССЛЕДОВАНИЕ ПРОЦЕССА ОЦЕНКИ ЦЕННОСТИ СОСТОЯНИЙ МЕТОДОМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
9.1. Задание к практической работе 5
9.2. Пример выполнения практической работы 5
9.3. Варианты заданий к практической работе 5
Контрольные вопросы к практической работе 5
10. ПРАКТИЧЕСКАЯ РАБОТА 6. ИССЛЕДОВАНИЕ МЕТОДА МОНТЕ–КАРЛО В ОБУЧЕНИИ С ПОДКРЕПЛЕНИЕМ
10.1. Задание к практической работе 6
10.2. Пример выполнения практической работы 6
10.3. Варианты заданий к практической работе 6
11. ОБУЧЕНИЕ НА ОСНОВЕ ВРЕМЕННЫХ РАЗЛИЧИЙ
11.1. Предсказание методами временных различий
11.2. Алгоритм SARSA
11.3. Алгоритм Expected SARSA
11.4. Двойное обучение (DQ-обучение)
11.5. Многошаговое предсказание
11.6. n-шаговый алгоритм SARSA
Контрольные вопросы к разделу 11
12. ПРАКТИЧЕСКАЯ РАБОТА 7. ИССЛЕДОВАНИЕ МЕТОДА Q-ОБУЧЕНИЯ
12.1. Описание задачи
12.2. Задание к практической работе 7
12.3. Пример выполнения практической работы 7
12.4. Варианты к практической работе 7
13. ПРАКТИЧЕСКАЯ РАБОТА 8. ИССЛЕДОВАНИЕ МЕТОДА Q-ОБУЧЕНИЯ С МОДЕЛЬЮ
13.1. Краткие теоретические сведения
13.2. Описание задачи
13.3. Пример выполнения практической работы 8
13.4. Варианты к практической работе 8
14. ПРИБЛИЖЕННЫЕ МЕТОДЫ АППРОКСИМАЦИИ ФУНКЦИИ ЦЕННОСТИ
14.1. Задача аппроксимации функции ценности
14.2. Стохастические градиентные и полуградиентные методы
14.3. Линейная по параметрам аппроксимация
14.4. Пример аппроксимации полиномами
14.5. Радиально-базисные функции
14.6. Нелинейная аппроксимация искусственными нейронными сетями
14.7. Алгоритм TD наименьших квадратов
14.8. Алгоритм аппроксимации с запоминанием
14.9. Заинтересованность и значимость
Контрольные вопросы к разделу 14
15. ПРАКТИЧЕСКАЯ РАБОТА 9. ИССЛЕДОВАНИЕ КЛАССИЧЕСКИХ И НЕЙРОСЕТЕВЫХ СПОСОБОВ АППРОКСИМАЦИИ ФУНКЦИИ ЦЕННОСТИ
15.1. Описание задачи
15.2. Задание к практической работе 9
15.3. Пример выполнения практической работы 9
15.4. Варианты к практической работе 9
16. ПРАКТИЧЕСКАЯ РАБОТА 10. ИССЛЕДОВАНИЕ АЛГОРИТМА ГЛУБОКОГО Q-ОБУЧЕНИЯ В ЗАДАЧЕ ДВИЖЕНИЯ В ЦЕЛЕВУЮ ТОЧКУ
16.1. Описание задачи
16.2. Задание к практической работе 10
16.3. Пример выполнения практической работы 10
16.4. Варианты к практической работе 10
Контрольные вопросы к практической работе 10
17. ПРИБЛИЖЕННОЕ УПРАВЛЕНИЕ И АППРОКСИМАЦИЯ
17.1. Эпизодический полуградиентный алгоритм SARSA
17.2. Использование среднего вознаграждения вместо обесценивания
17.3. Расходимость полуградиентных методов с разделенной стратегией
17.4. Основные причины расходимости
17.5. Геометрия линейной аппроксимации
17.6. Градиентные методы для беллмановской ошибки
17.7. Градиентные TD-методы
Контрольные вопросы к разделу 17
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ

Отзывы

Все отзывы о книге Введение в методы машинного обучения с подкреплением

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Отрывок из книги Введение в методы машинного обучения с подкреплением

1.6. Структурная схема обучения с учителем 23 1.5. Линейная регрессия Задача линейной регрессии заключается в построении линейной функ-ции, наилучшим образом аппроксимирующую заданный набор данных (xi, yi) (рис. 1.12) линейной функцией

Медведев М. Ю. другие книги автора

Баланс для начинающих и другие труды

Медведев М. Ю.

Купить от 199 ₽

Введение в методы машинного обучения с подкреплением

Медведев М. Ю.

Купить от 326 ₽

Деятели российской бухгалтерии

Медведев М. Ю. , Назаров Д. В.

Купить от 599 ₽

Идеи и прозрения русской бухгалтерии

Медведев М. Ю.

Купить от 199 ₽

Методы искусственного интеллекта в инженерных задачах

Медведев М. Ю.

Купить от 473 ₽

Об экономике – с улыбкой

Гарифуллина И. , Медведев М. Ю. , ...

Купить от 199 ₽

Понимаете ли вы бухгалтерский учет?

Медведев М. Ю.

Купить от 399 ₽

Самоучитель бухгалтерского учета

Медведев М. Ю.

Купить от 279 ₽

Экаунтология

Медведев М. Ю.

Купить от 199 ₽

С книгой "Введение в методы машинного обучения с подкреплением" читают

Баланс для начинающих и другие труды

Медведев М. Ю.

Купить от 199 ₽

Самоучитель бухгалтерского учета

Медведев М. Ю.

Купить от 279 ₽

Методы искусственного интеллекта в инженерных задачах

Медведев М. Ю.

Купить от 473 ₽

Об экономике – с улыбкой

Гарифуллина И. , Медведев М. Ю. , ...

Купить от 199 ₽

C++ как второй язык в обучении приемам и технологиям программирования

Демяненко Я. М. , Чердынцева М. И.

Купить от 630 ₽

Основы машинного обучения

Ефимов А. И.

Купить от 416 ₽

Квантовые нейронные сети

Гушанский С. М. , Потапов В. С.

Купить от 174 ₽

Информационно-психологическая безопасность

Каменская Е. Н. , Фирсова М. Г.

Купить от 200 ₽

Мультимедиа – технологии

Нужнов Е. В. , Данильченко В. И.

Купить от 354 ₽

Оптимизирующие преобразования программ

Штейнберг Б. Я.

Купить от 183 ₽

Бестселлеры нон-фикшн

Иран и его прокси

Магид М.

Купить от 453 ₽

Беспилотные авиационные системы

Чернопятов А. М.

Купить от 263 ₽

Княжество Феодоро

Васильев А. В.

Купить от 581 ₽

Искусственный интеллект и нейросети в образовании

Минаков А. И.

Купить от 230 ₽

Корейские алкогольные напитки

Наумчик А.

Купить от 1436 ₽

Краткая история Ничто

Тараторин Д. Б.

Купить от 307 ₽

«Пир» Платона

Мишурин А. Н.

Купить от 458 ₽

Палестина

Кеворкова Н.

Купить от 338 ₽

Океаны зерна

Нельсон С. Р.

Купить от 448 ₽

Такмыкские каникулы

Лёвкина Р. А.

Купить от 385 ₽

Китай

Орлик Т.

Купить от 299 ₽

Сады и пустоши

Джемаль Г.

Купить от 608 ₽

Новинки книги нон-фикшн

Центральная Азия и Шелковый путь

Баризитц Ш.

Купить от 2739 ₽

Как мы делали реформы

Нечаев А. А.

Купить от 329 ₽

Месть географии: что могут рассказать географические карты о грядущих конфликтах и битве против неизбежного

Каплан Р.

Купить от 350 ₽

Трансформация международной безопасности

Борисов А. В. , Егоров В. Н. , ...

Купить от 390 ₽

Может ли искусственный интеллект мыслить

Костюк К. Н.

Купить от 399 ₽

Умер ли бог?

Деннерт Э.

Купить от 184 ₽

Фива

Минина-Magnalia Н. А.

Купить от 219.6 ₽

Жанна д’Арк

Твен М.

Купить от 483 ₽

Россия и Китай

Моисеев В. В.

Купить от 480 ₽

Корейские алкогольные напитки

Наумчик А.

Купить от 1436 ₽

Методика обучения студентов Big Data, обеспечивающая коллаборацию математики и цифровых технологий

Вахрушева И. А. , Кийко П. В. , ...

Купить от 113 ₽

Русские сказки

Чулков М. Д.

Купить от 374 ₽

Новинки аудиокниг

Теория «Позвольте им». Инструмент, меняющий жизнь: краткое содержание всех глав книги: научно-популярное аудиоиздание

Роббинс М.

Купить от 150 ₽

Клуб «5 часов утра». Секрет личной эффективности от монаха, который продал свой «Феррари»: краткое содержание всех...

Шарма Р.

Купить от 150 ₽

История костюма и прически от древности до начала ХХ в.: учебное аудиоиздание

Шерман М. В.

Купить от 300 ₽

Шаблон: как гены формируют нашу личность = Blueprint: how DNA makes us who we are: краткое содержание всех глав книги...

Пломин Р.

Купить от 150 ₽

Психология искусственного интеллекта: научно-популярное аудиоиздание

Фролов С. А.

Купить от 300 ₽

Собака Баскервилей. А 2 = The Hound of the Baskervilles. A 2: учебное аудиоиздание

Doyle A. , Дойл А. К.

Купить от 150 ₽

Моральные измерения юмора: эссе о людях, героях и монстрах = Moral Dimensions of Humour: Essays on Humans, Heroes and...

Купить от 150 ₽

Основы глубокого обучения = Understanding Deep Learning: краткое содержание всех глав книги и полный перевод одной...

Принс С.

Купить от 150 ₽

В чужой игре: Запад против Германии: аудиоиздание

Шульте Т.

Купить от 300 ₽

Внимание!
При обнаружении неточностей или ошибок в описании книги "Введение в методы машинного обучения с подкреплением (автор Михаил Медведев)", просим Вас отправить сообщение на почту help@directmedia.ru. Благодарим!