ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 패스트캠퍼스 챌린지 17일차
    패스트캠퍼스 환급챌린지(딥러닝 300제) 2021. 11. 17. 20:27

     

    오늘은 part5의 cha1 부분을 들었다. 하나의 패키지에 여러 강사분들이 강의를 해주시는 데 솔직히 말하자면 오늘 해주신 강사님이 딕션이나 설명이 더 깔끔한 것 같아 좋았다. 자연어 처리 기초 부분에서는 mnist나 fashion mnist, nsme 등 다른 곳에서 쉽게 접할 수 있는 예제라서 그다지 흥미를 느끼진 못했다. 아무튼 이번부터는 더 집중해서 들을 수 있을 것 같다.

     

    이번 주제는 LSTM을 활용해 주가 예측 모델 구현하기이다. 목표는 다음과 같다.

     

    - FinanceDataReader를 활용하여 주가 데이터 받아오기
    - TensorFlow Dataset 클래스를 활용하여 주가 데이터 구축
    - LSTM 을 활용한 주가 예측 모델 구축

     

    FinanceDataReader는 주가 데이터를 편리하게 가져올 수 있는 파이썬 패키지이다. 오늘 내용은 이를 활용하여 간단하게 데이터를 불러오는 작업을 가져 보았다.

     

     

    그럼 오늘도 강의 내용도 내용이지만 딥러닝의 기초를 닦고자 많은 부분을 공부한 것을 공유해 보겠다.

     

    텍스트 벡터화(vectorrizing text) : 텍스트를 수치형 텐서로 변환하는 과정
    텍스트를 단어로 나누고 각 단어를 하나의 벡터로 변환한다.
    텍스트를 문자로 나누고 각 문자를 하나의 벡터로 변환한다.
    텍스트에서 단어나 문자의 n-그램을 추출하여 각 n-그램을 하나의 벡터로 변환한다.
    n-gram : 연속된 단어나 문자의 그룹으로 텍스트에서 단어나 문자를 하나씩 이동하면서 추출
    토큰(token) : 텍스트를 나누는 단위(단어, 문자, n-그램)
    토큰화(tokenization) : 텍스트를 토큰으로 나누는 작업
    모든 텍스트 벡터화 과정은 어떤 종류의 토관화를 적용하고 생성된 토큰에 수치형 벡터를 연결하는 것으로 이루어진다.
    이런 벡터는 시퀀스 텐서로 묶여져서 심층 신경망에 주입된다.

     

     

     

     

     

    #패스트캠퍼스 #패캠챌린지 #직장인인강 #직장인자기계발 #패스트캠퍼스후기 #퀴즈처럼풀면서배우는파이썬딥러닝300제+연습문제패키지Online

     

     

     

     

    본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.

     

    패스트캠퍼스 링크 : https://bit.ly/3FVdhDa

Designed by Tistory.