본문 바로가기

ML-DL/생성AI

(2)
텍스트 생성 모델 평가 지표 [Perplexity, BLEU, ROUGE, METEOR] 생성 모델을 평가하는 지표는 Automatic Evaluation 과 Human Evaluation 으로 나눠지는데 이 페이지에서는 텍스트 생성 모델에 대한 Automatic Evaluation 을 살펴보고자 한다. 1. Perplexity [PPL]언어 모델이 샘플을 얼마나 잘 예측하는지 정량화 하는 모델로, 모델이 예측한 확률의 불확실성을 측정하기 때문에 점수가 낮을수록 모델의 성능이 우수하다고 평가한다. 수식은 아래와 같다.$PPL(W) = P(w_1, w_2, w_3, ..., w_N)^{-frac{1}{N}} = N\sqrt{\frac{1}{P(w_1, w_2, ...,w_N)}}$  2. BLEU [Bilingual Evaluation Understudy]생성된 텍스트와 정답 텍스트 간의 n-..
[Paper Review] Auto-Encoding Variational Bayes 리뷰 최근 생성 AI에 관심이 많아지면서 만들면서 배우는 생성 AI 책을 보게 되었다.책의 내용이 AE -> VAE -> GAN -> Diffusion 으로 이루어져 있어서,관련 논문들을 읽고 리뷰하면 좋겠다는 생각이 들어 VAE부터 시작. 이미 많은 분들이 해주신 리뷰가 있어 이것저것 참고하면서 기초가 되는 지식과 함께 수식을 정리해보았다.[Pre] Basic- Auto Encoder는 두 부분으로 구성된 신경망1) Encoder : 고차원 input 을 저차원 embedding vector로 압축2) Decoder : embedding vector를 도메인으로 압축 해제 - Auto Encoder 와 Variational Auto Encoder 의 차이  - AE의 경우 : 각 이미지가 잠재 공간의 한 포..