첫 딥러닝 프로젝트
7월부터 미래연구소를 통해서 딥러닝을 배워왔는데, 이제 강의를 듣는 것은 거의 끝이 났고 프로젝트를 시작하게 되었다. 주제는 Dataset만 구할 수 있다면 아무 주제나 선택할 수 있는데, 보통 kaggle에서 선정을 한다.
캐글은 전세계에서 가장 핫한 data science competition 사이트로, 다양한 주제로 양질의 data들이 올라오며 상금이 걸려있는 대회가 열리기도 한다. 딥러닝을 위해서는 최소 10000개 이상의 data가 필요하기 때문에, filter를 적용해서 찾아야 한다.
좌측 data 탭에서 filter로 찾 수 있다.
원래는 주가예측에 관한 프로젝트를 진행하고 싶었는데, kaggle 상에 나와있는 dataset들은 최신자료가 아니거나, 연속적이지 않거나(며칠 씩 구멍이 송송 나있는 등), 표본이 너무 적어 적합한 자료를 찾을 수 없었다. 따라서 증권사의 open API를 이용해서 주가를 받아와서 데이터를 직접 크롤링해보려 했으나 너무 일이 번거로워지는 것 같았다.
사실 주가를 하고 싶었던 이유는 프로젝트 결과가 단순히 프로젝트로만 남는 것이 아니라 그것을 확장해서 써먹을 수 있는 것이었으면 좋겠다는 생각에서 기반했다. 그랬는데 같이 공부하는 분들이 kaggle 말고도 Dacon이라는 사이트로부터 데이터를 가져오는 것을 알게 되었다.
데이콘은 한국판 캐글이라고 생각하면 될 듯 하다! 여기서 관심 있는 대회가 있나 둘러보다가 컴퓨터 비전학습대회에 참가하기로 했다. 변형된 MNIST를 가지고 판별하는 것 같은데, 실습 중 MNIST를 해봤기 때문에 더 수월하지 않을까 쉽다. 상금이 적은 대회이므로 참가자들 또한 아주 수준 높지는 않을 것이라는 말에 힘입어 팀에 합류했다! 일지를 이곳에 기록해 나가려고 한다.
To Be Continued...
'Deep Learning' 카테고리의 다른 글
Metrics (0) | 2020.08.31 |
---|---|
[Dacon] 공유된 코드를 통해 선수지식 학습하기 (0) | 2020.08.30 |
[데이콘]Dataset 받아오기 (1) | 2020.08.26 |
CNN(Convolutional Neural Network) (0) | 2020.08.25 |
Normalization, Standardization, Initialization, optimization (1) | 2020.08.18 |
Softmax, One-hot encoding, Regularization, Dropout의 이해 (0) | 2020.08.15 |
Deep Learning 미래연구소 5주차 수강후기 (0) | 2020.08.02 |
Deep Learning 미래연구소 4주차 수강후기 (0) | 2020.07.26 |