기상청에서 주관하는 빅데이터 콘테스트를 참가하게 되어 2개월간의 프로젝트를 진행하게 되었다. 아래 포스터는 해당 콘테스트에서 대한 정보를 포함하고 있다.

5월 30일까지 모집이니 시간이 난다면 참가해보는 것도 좋은 경험이 될 것 같다.

총 4가지 주제가 있는데 그 중 기상에 따른 혈관 질환 예측 모델 개발 을 선택하여 진행하게 되었다.

해당 프로젝트를 사용하기 위해서는 R studio와 Python을 진행하게 되는데, 기상청에서 제공하는 HiveQL을 R studio에서 SQL 문을 통해 데이터를 가져와 전처리 및 통계를 분석하게 된다.

R studio의 경우 최근, 빅데이터 분석에 대한 수요가 높아짐에 따라 데이터와 통계 분석에 R 이 사용이 높아지고, R studio의 경우 다양한 통계 및 수치해석 기법에 유용하여 사용되어지고 있다.

파이썬의 경우 데이터를 딥 러닝에 넣기 위한 데이터 처리와 딥 러닝을 작동시키기 위해 사용하게 되었다.

앞으로 프로젝트 진행하면서 R에 대한 문법을 정리하고 어떠한 기법을 이용하여 데이터를 분석했는지 주기적으로 해당 블로그에 올릴 예정이다.

 

'잡담' 카테고리의 다른 글

마음 다잡기  (0) 2022.05.22

+ Recent posts