티스토리 뷰

728x90

[Day 26-29] 특강

 

 

1. 특강 리뷰

1) 21.03.02 화요일

실제 AI 모델을 개발하고 서비스하는 것에 있어서 많은 과정이 있고, 다양한 포지션의 인력이 필요하다.

또 그 과정 속에서 AI Modeling이 차지하고 있는 비중은 생각보다 그리 크지 않다. 게다가 급변하는 AI 분야에서 AutoML의 등장과 같이 AI Modeling의 수요는 앞으로 더더욱 낮아질 가능성이 크다.

때문에 급변하는 기술 속에서 빠르게 적응하는 능력이 필요하고, 한 가지만 잘하는 것이 아닌 AI 모델을 개발하고 서비스까지 하는 과정에서의 다양한 포지션의 능력을 소화할 수 있는 경쟁력을 갖추는 것이 중요하다.

나 역시 러닝커브가 좋은 사람이 되기 위해 노력하고, 그것을 가능하게 하려면 기본기에 더더욱 충실한 사람이 되어야 겠다고 생각이 들었다.

또한 급변하는 AI 분야에 대비하기 위해서는 항상 최신 트렌드를 읽을 수 있는 능력을 겸비해야하며, 새로운 것도 기꺼이 받아들이고 내 것으로 만들 수 있는 유연한 자세를 가져야겠다고 다짐하게 된 계기가 되었다.

 

2) 21.03.03 수요일

Kaggle 등 플랫폼에서 Competition하는 과정 그 자체만으로도 많은 것을 배울 수 있음을 다시 한번 마음에 새겨듣고 처음엔 리더보드 점수에 연연하거나 뜻대로 결과가 나오지않아도 좌절하지 않고 열심히 해볼 수 있을 것 같다.

그 과정들이 쌓여 노하우가 생기는 순간, 좋은 결과도 따라오지않을까

첫 술에 배부르려 하지말고 뭐든지 도전을 하며 실행에 옮기는 것이 중요한것 같다.

 

그리고 꼭 Competition뿐 아니라, 내가 만들고 싶은 것들을 나름의 모든 과정을 거쳐서 최종 결과로 얻어보는 경험도 굉장히 값지고 실행에 옮기고 싶다는 생각이 들었던 강의였다.

 

'주저하지 않고 먼저 실행에 옮기는 사람이 되자'

 

3) 21.03.04 목요일

현업에서 NLP TASK를 풀어나가는 방식, 요즘 자주 사용되는 기술에 대해 궁금했었는데 해소가 되었던 것 같다.

언어모델들의 발전 흐름을 어느정도 그릴수 있게 되었고, 내가 지금까지 알았던 것보다 훨씬 다양한 TASK가 존재한다는 것, 그리고 그것들을 해결하기 위해 현업에서는 어떻게 노력을 하는지 간접적으로라도 알 수 있었다.

또 모델들을 학습시키는 것에서 가장 중요하고 준비되야되는것이 데이터인데 이 데이터들을 지금까지는 그냥 주어진 데이터, 잘 가공된 데이터들을 받아쓰기만 했었는데, 사실 현업에서는 정말 많은 노이즈들이 섞여있고 더 나아가 데이터들의 저작권까지도 고려해야하고 합법으로 사용하기 위해서 필연적으로 거쳐야하는 많은 과정들이 있다는 것을 느끼게 되었다. 사실 코드나 AI 모델 아키텍쳐 같은 부분들은 IT계에서는 오픈소스라는 문화로 거침없이 사용할 수 있었는데 데이터라는 것은 다른 업계에서 파생된 데이터일수도 있고 데이터 저작자의 소중한 자산일 수도 있고 저작권법에 대해 다시금 생각해볼 수 있었던 계기가 되었다.

 

4) 21.03.05 금요일

시스템 트레이딩에서 AI가 사용되는 범주 그리고 고려해야할 변수가 아주 많은 분야에서 AI가 어떻게 적용되고 또 적용을 시도하면서 발전할 수 있는 방향 등을 생각해볼 수 있었던 강의였다. 시스템 트레이딩을 딥러닝으로 풀어가려는 시도도 있지만, 아직 매수 매도 신호를 파악하고 모든 과정들을 딥러닝으로만은 해결하기 어려운 단계라고 한다. 때문에 작은 문제들(변수들)로 나눠서 각각 선형회귀로 파악하고 그것들을 통계적 모델을 구축하여 파악하는 것이 사실 현재로써는 가장 납득이 되는 과정인 것 같다. 하지만 언젠가 AI가 계속 수직 곡선으로 발전하다보면 새로운 방향이 제시될 것이라고 생각한다. 

오후에는, AI 윤리에 대해서 깊게 생각해볼 수 있었던 계기가 되었다. 사실 윤리라는 것이 심오하고 개개인의 가치관에 따라 관점도 다를 텐데, 내가 만든 AI가 어떤 영향을 끼칠 것인가에 대한 경각심은 나 역시 AI를 공부하는 입장으로써 항상 지니고 고민해야겠다는 생각을 할 수 있었다.

 

2. 개인 학습

1) 21.03.02 화요일

dev-hunmin.tistory.com/category/Deep%20Learning/NLPdev-hunmin.tistory.com/entry/NLP-%EC%A0%84%EC%B2%98%EB%A6%AC-%EA%B3%BC%EC%A0%95-%EB%8B%A8%EC%96%B4-%EC%9E%84%EB%B2%A0%EB%94%A9?category=1188953

 

NLP 전처리 과정 & 단어 임베딩

NLP 전처리 과정 & 단어 임베딩 1. Introduction 자연어 데이터는 다른 데이터(Ex:이미지)와 달리 컴퓨터가 이해 할 수 있는 숫자로 변환해야만 한다. 정제되지 않은 입력 데이터와 모델을 연결시켜줄

dev-hunmin.tistory.com

- NLP TASK를 수행하기 위해 데이터를 모델에 성공적으로 입력시키기 위한 파이프라인 구축 과정(흐름)과 단어 임베딩 개념 재 정립

 

2) 21.03.03 수요일

- Image Task

- Segmentation

- UNET 구현

 

3) 21.03.04 목요일

- GAN 논문 리뷰

- GAN의 수학적 증명

- 왜 우리의 GAN은 제대로 학습이 안될까?

- GAN 구현

github.com/hunmin-hub/DL_Tutorial/tree/main/FM_GAN

4) 21.03.05 금요일

- 강화 학습 개념 알아보기

- 강화 학습의 원리를 수학적으로 알아보기

3. 피어 세션

1. 특강 주로 인해 당일 모더레이터의 개인 세미나 발표 (공유하고 싶은 내용 혹은 공부한 내용)

 

- 화) NLP 전처리 & 임베딩

docs.google.com/presentation/d/1nxj6fGluI1KlMlkFeo9V6DEIaVO-TsgvZL5ormzx-8k/edit

 

- 수) 이미지 TASK, U-NET

 

- 목) GAN 논문 리뷰

 

- 금) 강화 학습

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함