Аннотация:
Алгоритм стайного поведения основан на правилах Рейнольдса: согласование скорости, предотвращение столкновений с соседями и притяжение к соседям. Основная проблема: при возникновении динамического препятствия может произойти затор – ближайшие к препятствию агенты изменят направление движения, а отдаленные агенты поздно будут реагировать на помеху и создадут давку. Задача данной работы: реализовать метод убегания стаи от хищника на основе Q-обучения. Используя методы обучения, те роботы, которые не видят хищника как опасное препятствие, могут получать информацию о нем от других агентов, наблюдать за своими соседями и по динамике их поведения регулировать свое движение.