-
패스트캠퍼스 챌린지 17일차패스트캠퍼스 환급챌린지(딥러닝 300제) 2021. 11. 17. 20:27

오늘은 part5의 cha1 부분을 들었다. 하나의 패키지에 여러 강사분들이 강의를 해주시는 데 솔직히 말하자면 오늘 해주신 강사님이 딕션이나 설명이 더 깔끔한 것 같아 좋았다. 자연어 처리 기초 부분에서는 mnist나 fashion mnist, nsme 등 다른 곳에서 쉽게 접할 수 있는 예제라서 그다지 흥미를 느끼진 못했다. 아무튼 이번부터는 더 집중해서 들을 수 있을 것 같다.
이번 주제는 LSTM을 활용해 주가 예측 모델 구현하기이다. 목표는 다음과 같다.
- FinanceDataReader를 활용하여 주가 데이터 받아오기
- TensorFlow Dataset 클래스를 활용하여 주가 데이터 구축
- LSTM 을 활용한 주가 예측 모델 구축FinanceDataReader는 주가 데이터를 편리하게 가져올 수 있는 파이썬 패키지이다. 오늘 내용은 이를 활용하여 간단하게 데이터를 불러오는 작업을 가져 보았다.
그럼 오늘도 강의 내용도 내용이지만 딥러닝의 기초를 닦고자 많은 부분을 공부한 것을 공유해 보겠다.
텍스트 벡터화(vectorrizing text) : 텍스트를 수치형 텐서로 변환하는 과정
텍스트를 단어로 나누고 각 단어를 하나의 벡터로 변환한다.
텍스트를 문자로 나누고 각 문자를 하나의 벡터로 변환한다.
텍스트에서 단어나 문자의 n-그램을 추출하여 각 n-그램을 하나의 벡터로 변환한다.
n-gram : 연속된 단어나 문자의 그룹으로 텍스트에서 단어나 문자를 하나씩 이동하면서 추출
토큰(token) : 텍스트를 나누는 단위(단어, 문자, n-그램)
토큰화(tokenization) : 텍스트를 토큰으로 나누는 작업
모든 텍스트 벡터화 과정은 어떤 종류의 토관화를 적용하고 생성된 토큰에 수치형 벡터를 연결하는 것으로 이루어진다.
이런 벡터는 시퀀스 텐서로 묶여져서 심층 신경망에 주입된다.#패스트캠퍼스 #패캠챌린지 #직장인인강 #직장인자기계발 #패스트캠퍼스후기 #퀴즈처럼풀면서배우는파이썬딥러닝300제+연습문제패키지Online
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.
'패스트캠퍼스 환급챌린지(딥러닝 300제)' 카테고리의 다른 글
패스트캠퍼스 챌린지 19일차 (0) 2021.11.19 패스트캠퍼스 챌린지 18일차 (0) 2021.11.18 패스트캠퍼스 챌린지 16일차 (0) 2021.11.16 패스트캠퍼스 챌린지 15일차 (0) 2021.11.15 패스트캠퍼스 챌린지 14일차 (0) 2021.11.14