https://www.youtube.com/watch?v=7SwTcuBG0_I 54분 제어공간은 Q1 인풋과 Q2 인풋.Disturbance 없음. 10차원, 각 차량은 5차원. x, y, speed, heading, steering angle. 2 인풋이 서로 Cooperating 하여 avoiding region을 피하려 할 때, 위처럼 nominal trajectory와 다른 결과를 가져옴.
(nominal trajectory는 선) 반면에 non-cooperating 할 때는? 하얀 차량의 trajectory를 고정했을 때.
그럼 주황색은 cooperative 할 때보다 훨씬 더 꺾음. 좌측: 협조, 우측: 비협조...
[강화학습 - Safe RL] Backward Reach-Avoid 의 자율주행 시뮬레이션에서의 응용에 대한 요약내용입니다.
자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.