로딩
요청 처리 중입니다...

[강화학습 - 2] OU(Ornstein–Uhlenbeck) 프로세스

 [강화학습 - 2] OU(Ornstein–Uhlenbeck) 프로세스

[강화 학습 - 1] 확률적 프로세스 글에서 확률적 프로세스와, 이토 적분에 대해 알아보았다. 이번 글에서는 확률적 프로세스의 한 예시인 OU 프로세스에 대해 정리한다.

OU(Ornstein – Uhlenbeck) 프로세스 OU 프로세스는 연속 시간에서 평균 복귀 성질을 갖는 확률 프로세스이다. 시간이 지남에 따라 상태라 어떤 평균값 μ 로 되돌아가려는 경향을 보이면서, 그 과정에서 무작위 잡음이 더해져 시계열적으로 흔들리는 형태를 보인다.

OU 프로세스는 확률 미분방정식(SDE)으로 다음과 같이 표현할 수 있다. 여기서 xt 는 시간 t 에서의 상태, μ 는 OU 프로세스가 장기적으로 수렴하는 값, θ 는 평균 μ 로 돌아가려는 속도, σ 는 노이즈 항의 변동성, Wt 는 Wiener 프로세스이다.

식을 조금 풀어서 설명해 보면, - 결정론적으로는 xt 가 μ 쪽으로 끌려가는 힘을 θ ( μ - xt ) 받고, - 동시에 무작위 항 σdWt 때문에 불규칙하게 흔들리게 된다. θ 가...

# OUnoise # OUprocess # reinforcelearning # stochastic # stochasticprocess # 강화학습 # 확률적프로세스