Тип публикации: статья из журнала
Год издания: 2018
Ключевые слова: учебная деятельность, активный агент, вознаграждение, конечный автомат, educational activity, active agent, reward, finite state machine
Аннотация: Рассмотрена математическая модель научения активного агента в электронной проблемной среде, в условиях институциональной оценочной обратной связи. Институциональная оценочная обратная связь обеспечивается конечным автоматом «Ликвидатор». В приближении Марковских конечных цепей найдено распределение вероятностей состояний конечного автомата «Ликвидатора». Получены численные оценки вознаграждений действий активного агента и приведены примеры реализации траекторий суммарного вознаграждения. Построена гистограмма распределения суммарного вознаграждения целевых состояний активного агента.
Издание
Журнал: Математические методы в технике и технологиях - ММТТ
Выпуск журнала: Т. 5
Номера страниц: 86-90
ISSN журнала: 25879049
Место издания: Саратов
Издатель: Федеральное государственное бюджетное образовательное учреждение высшего образования "Саратовский государственный технический университет имени Гагарина Ю.А."
Персоны
- Бровко Н.В. (Белорусский государственный университет, Белоруссия)
- Дьячук П.П. (Сибирский федеральный университет, Россия, Красноярск)
- Денисенко О.И. (Сибирский федеральный университет, Россия, Красноярск)
- Перегудова И.П. (Сибирский федеральный университет, Россия, Красноярск)
Вхождение в базы данных
Информация о публикациях загружается с сайта службы поддержки публикационной активности СФУ. Сообщите, если заметили неточности.