이번 포스팅은 베이지안 방식을 기반으로한 회귀분석 풀이법 중 하나인 Gaussian Process을 다룬다. 먼저 회귀분석(regression)을 많이 접해본 이들은 통계적인 추론방식등을 이용해서 아래와 같은 문제를 많이 접해봤으리라 믿는다. 위 그림에서 데이터인 푸른점들을 선형식, $y=ax+b$ 형태로 가정하고 데이터 $(x,y)$값을 이용해서 $a$와 $b$인 계수를 구하는 공식에 대입하면 끝인 문제이다. 아마 대학교 학부수준에서는 기초통계 수업을 들으면 최소한 한번씩은 접해봤을 문제였을 것이고 위와 같은 문제를 해결하는데 큰 거부감이 없을것이다. 자, 위 회귀분석 문제의 핵심은 ‘1. 선형방정식을 ... Read more 06 Dec 2021 - 11 minute read
들어가기 전 KAIST의 연구원분들께서 재미있는 논문을 제출했다. 회사에서 풀고자 하는 문제와 적용 될 수 있을 것 같아 스터디하고 정리한 내용을 포스팅을 해본다. 아카이브에 본대로는 내용을 정리하고 구현까지해보려 했으나 우선 아이디어만 요약하고 차차 업데이트해보고자 한다. 이해가 안되는 수식의 전개가 있으나 일단 넘어간다. 논문 정보 Arxiv 링크 https://arxiv.org/abs/2106.03374 저자 Seong-Hyeon Hwang, Steven Euijong Whang (KAIST) Paper Contribution... Read more 03 Dec 2021 - 1 minute read
전통적인 머신러닝 기법으로 MCMC, Gaussian Process, 그리고 EM-method에 관해서 시간이 날때마다 정리해보고자 합니다. 한동안 뜸했는데 열심히 정리해보고 누군가에게 도움이 될만한 글이 되었으면 좋겠습니다. 그 첫번째 전통적인 머신러닝 기법의 방식으로 MCMC방법과 그 대표적인 예시인 Metropolis-Hasting 알고리즘을 살펴보겠습니다. Monte Carlo 우리가 어떤 특별한 값, 예를들어 $\pi$라는 원주율 값을 구체적으로 알고싶다고 가정해봅시다. 원주율 $\pi$ 값을 대략 3.1415… 이렇게 외우는 값이 있는데 확실히 얼마! 이렇게 구하기가 굉장히 어렵습니다. 해석적으로 그... Read more 08 Nov 2021 - 6 minute read