MachineLearning

RNN(Recurrent Nueral Networks)

쌍쌍바나나 2017. 12. 10. 22:56

RNN

RNN은 Recurrent Neural Networks와 더불어 자연어처리 분야에서 각광받고 있는 모델.
Recursive, Recurrent Neural Neworks

두 모델은 음성, 문자 등 순차적 데이터 처리에 강점을 지니고 있음
이름이 유사하지만, 조금은 차이가 있다.

글자가 주어졌을때 바로 다음 글자를 예측하는 Chracater-level-model을 만든다고 칠때
- h0는 random하게 주어지고, hidden layer를 fowrard propagation을 하면서 모두 갱신
- 정답셋을 바탕으로 backpropagation을 수행해 parameters의 값들을 갱신
RNN이 학습하는 parameter는 무엇일까?
- Wxh, Whh, W_hy의 parameters
- x > hidden, hidden > hidden, hidden > y

RNN은 관련 정보와 그 정보를 사용하는 지점 사이거리가 멀 경우 vanishing gradient problem이 발생
- vanishing gradient problem: backpropagation시 gradient가 점차 줄어들어 학습 능력 저하
위 문제를 극복하기 위해서 바로 LSTM을 사용 (https://ratsgo.github.io/natural%20language%20processing/2017/03/09/rnnlstm/)
- LSTM은 RNN의 hidden state에 cell_state를 추가
- cell state는 일종의 컨베이어 벨트 역할
  - state가 꽤 오래 경과하더라도 gradient가 비교적 전파가 잘 된다.
- forget gate
  - '과거 정보 잊기'
  - sigmoid를 하기 때문에 0이라면 이전 상태의 정보를 잊고, 1이라면 이전 상태의 정보를 온전히 기억
- input gate
  - '현재 정보를 기억하기 위한'
  - i(t)의 범위는 0~1, g(t)의 범위는 -1~1, 각각 강도와 방향을 나타낸다.
- H(t)에서 행을 기준으로 4등분해, i,f,o,g 각각에 해당하는 activation 함수를 적용

[Paper] Neural Factorization Machines for Sparse Predictive Analytics (0)	2018.03.18
RNN(Recursive Neural Networks) (0)	2017.12.10
XGBoost parameters (0)	2017.08.27
Imbalanced data를 처리하는 기술 7가지 (0)	2017.08.27
Class imbalanced problem - 데이터 비대칭 문제 (oversampling, undersampling) (0)	2017.08.27

불로

함께 하는 블로그

Python, dict, RDD, Linux, Android, nodejs, 스파크, TensorFlow, 리눅스, 설치, 안드로이드, 빅데이터, 자바스크립트, git, 소스코드, 데이터분석, 파이썬, javascript, ubuntu, Spark,