머신러닝 스터디/딥러닝

꼭 알아야할 수학(3)_미분심화

hozy연 2023. 2. 4. 19:00

본 포스팅은 혁펜하임 [AI를 위한 수학] 딥린이를 위한 필수 수학 패키지를 참고하였습니다. 

https://www.youtube.com/watch?v=frkVgBvp850

#10 벡터를 벡터로 미분하기

*벡터 입력 --> 벡터 출력 (여러개 들어가서 여러개 나오는 경우)


* 스칼라를 벡터로 미분 공식 (이전 포스트에서 도출된 공식을 바탕으로.. 벡터를 벡터로 미분해보겠음) 


*문제: f([x1, x2]) = [X1x2^2 , X1+X2]를 미분해보면,


* 연쇄법칙 미분 적용 가능>> Y=XA , Z=YB

* X-->Y(X로 미분)-->Z(Y로 미분) : 결국은 단계별로 미분하는 것과 Z를 X로 미분하는 값과 똑같음

 

 

# 11 스칼라를 행렬로 미분

* 행렬 입력 --> 스칼라 출력 


*문제: f(x)=tr(xA)을 미분해보면,

(tr이란 trace의 약자로 행렬의 주대각선 성분의 합을 의미한다.)

이렇게 간단하게 미분이 가능하다!!

 

 

# 12 행렬을 행렬로 미분

*행렬 입력 --> 행렬 출력

(행렬을 벡터화 시킨 후에 벡터를 벡터로 미분한다.)


* 문제: f(x)=xA을 미분해보면,

 

# 12 벡터를 행렬로 미분

* 행렬 입력 --> 벡터 출력


* 문제: y=xw를 미분해보면,