๋ถ๋ฅ ์ ์ฒด๋ณด๊ธฐ
![If using all scalar values, you must pass an index ์๋ฌ, ํด๊ฒฐ](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fc4OSZT%2FbtrmXQWGYKm%2FSJwAV7sfTmF5ELuO6kb5UK%2Fimg.png)
If using all scalar values, you must pass an index ์๋ฌ, ํด๊ฒฐ
in getData(driver) 249 # print(f'{row} : title/view/date') 250 # df ๋ก ๋ง๋ค์ด๋ฒ๋ฆฌ๊ธฐ --> 251 data_df = pd.DataFrame({ 252 'title' : title, 253 'views' : view, ๋ฐ์ดํฐํ๋ ์ ๋ด๋ถ์ ๋ฆฌ์คํธ ๊ฐ์ผ๋ก ๋ณ๊ฒฝํด์ฃผ๋ฉด๋๋ค. ๊ธฐ์กด์ ์ฝ๋ # row = [title, view, date] # print(f'{row} : title/view/date') # df ๋ก ๋ง๋ค์ด๋ฒ๋ฆฌ๊ธฐ data_df = pd.DataFrame({ 'title' : title, 'views' : view, 'upload_dates' : date }) print(data_df) return data_df ํด๊ฒฐํ๋ค.
![VScode ์์ Jupyter notebook์ ํ๊ตญ์ด ์์ฐ์ด ์ฒ๋ฆฌ KoNLy ์ ํํ์ ๋ถ์๊ธฐ McCab ์ธํ
ํ๊ธฐ(์ค์น)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FUgPv0%2FbtrmWshQS6E%2Fe7e3WwX8A3jrdjTfQkgY60%2Fimg.png)
VScode ์์ Jupyter notebook์ ํ๊ตญ์ด ์์ฐ์ด ์ฒ๋ฆฌ KoNLy ์ ํํ์ ๋ถ์๊ธฐ McCab ์ธํ ํ๊ธฐ(์ค์น)
================= OS : window 10 64bit ๊ฐ๋ฐ์ธ์ด : python 3.7.0 python ๋น๋ ๋์ด ์ปค๋งจ๋ ์ฐฝ์์ pip install ์คํ ๊ฐ๋ฅ cpu : AMD Ryzen 7 3700X 8-Core Processor 3.59 GHz ๋จ : 24.0GB ๊ทธ๋ํฝ ์นด๋(gpu) : GeForce RTX 2060 SUPER ================= 1. ์๊ฐ KoNLPy KoNLPy(์ฝ์์ํ์ด)๋ ํ๊ตญ์ด ์ ๋ณด์ฒ๋ฆฌ๋ฅผ ์ํ ํ์ด์ฌ ํจํค์ง ๋ค์ํ API(ํด๋์ค)๋ค์ด ์กด์ฌ ( โป KoNLPy์ Mecab() ํด๋์ค๋ ์๋์ฐ์์ ์ง์ X) 2. ํ๊ฒฝ ์ธํ ์๋ฐ์ JPype๋ฅผ ์ค์นํด์ผ ํ๊ตญ์ด ์์ฐ์ด ์ฒ๋ฆฌ KoNLPy ์ฌ์ฉ์ด ๊ฐ๋ฅํ๋ค Java 1.7+ ์ค์น JAVA_HOME ํ๊ฒฝ๋ณ์ ..
![1 columns passed, passed data had 44 columns ๋ฆฌ์คํธ ๊ด๋ จ ์๋ฌ](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fdme69s%2FbtrmYFmFBHo%2FGUE6VUu74EY5hKRLdR1eu0%2Fimg.png)
1 columns passed, passed data had 44 columns ๋ฆฌ์คํธ ๊ด๋ จ ์๋ฌ
ํฌ๋กค๋งํ ๋ฐ์ดํฐ๋ฅผ ๋ฆฌ์คํธ ํํ๋ก ๋ฐํํด์ ๋ฆฌ์คํธ๋ก ์ด์ด๋ถ์ด๊ณ ์์๋๋ฐ, ์๊พธ๋ง ๋ฐ์ดํฐํ๋ ์ ํ์ฑํด์ ์คํจ ์ค๋ฅ๊ฐ ์๊ฒผ๋ค. ์๊ณ ๋ณด๋ ์ด์ค ๋ฆฌ์คํธ๊ฐ ํ์ฑ๋์ด์ ๋ฐ์ดํฐํ๋ ์์ ํ์ฑํ์ง ๋ชปํ๊ณ ์์๋ ๊ฒ์ด์๋ค. ์ฆ, ์ด์ค ๋ฆฌ์คํธ๋ก ๋ฐ์ดํฐ๋ฅผ ์ด์ด๋ถ์ด์ง๋ง๊ณ , ๋ฆฌ์คํธ ํํ๋ก ์์ฑํ ํ์ for๋ฌธ์์ ๋ฐ๋ก df์ผ๋ก ๋ง๋ค์ด์ ํ๋จ์ผ๋ก ๋๊ธ ๋ฐ์ดํฐ๋ค์ ์ญ ์ด์ด์ ๋ถ์ด๋ ํํ๋ก ๋ง๋ค์ด์ผํจ์ ์์๋ค. def getCom(driver): #์ ๋ชฉ, ์กฐํ์, ๋๊ธ ๊ฐ์ ธ์ค๊ธฐ html = driver.page_source soup = BeautifulSoup(html,'html.parser') comments = [] try: # ํค์๋, ํด๋น ๋๊ธ ์ ์ฒด ํฌ๋กค๋ง 5 - table 2 comm = soup.select('div#cont..
![keras ๊ด๋ จ ์๋ฌ : cannot import name 'get_config' from 'tensorflow.python.eager.context' - ๋ฏธํด๊ฒฐ](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FolQwu%2FbtrmXViYF31%2FnoikLUnhk2rQS5OCeGYRo1%2Fimg.png)
keras ๊ด๋ จ ์๋ฌ : cannot import name 'get_config' from 'tensorflow.python.eager.context' - ๋ฏธํด๊ฒฐ
๋ฌด์จ ์๋ฌ์ผ๊น? --------- ImportError: cannot import name 'get_config' from 'tensorflow.python.eager.context' (C:\anaconda\envs\forTensorflow\lib\site-packages\tensorflow_core\python\eager\context.py) ------ ๋ฐฉ๋ฒ๊ตฌํฉ๋๋ค
![nltk pos_tag ์ข
๋ฅ](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FsmRPW%2Fbtrm1jptB3S%2F2PtQUeDVKosCGKUqGT4h9K%2Fimg.png)
nltk pos_tag ์ข ๋ฅ
๋ฌธ์ฅ์ word_tokenize (ํ ํฐํ)-> pos_tag(ํ์ฌ ๋ถ๋ฅ) ๋ฅผ ํตํด pos(ํ์ฌ)๋ฅผ ์ฐพ๊ณ , ๋ฌธ์ฅ ๋ด์์ ๋จ์ด์ ํด๋นํ๋ ํ์ฌ๋ฅผ ํ๊น ํ์ฌ ์์ ์๋ค. ์ข ๋ฅ๋ ๋ค์๊ณผ ๊ฐ๋ค. import nltk nltk.download('punkt') from nltk import word_tokenize words = word_tokenize("Think like man of action and act like man of thought") words # ๋จผ์ ๋ฌธ์ฅ์ ํ ํฐํํ ํ์ ํฌ์ค ํ๊ทธ๋ฅผ ๋ฌ๋ฉด ๋๋ค [nltk_data] Downloading package punkt to [nltk_data] C:\Users\AppData\Roaming\nltk_data... [nltk_data] Package punk..
![python ๊ฐ์ํ๊ฒฝ ์ค์น์ค์ vscode ์๋ฌ : Kernel process Exited](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FzGsQp%2FbtrmWqEeD4q%2FW5mROqYMzwG1NoRIj0yTR0%2Fimg.png)
python ๊ฐ์ํ๊ฒฝ ์ค์น์ค์ vscode ์๋ฌ : Kernel process Exited
from keras.preprocessing.text import text_to_word_sequence sentence = 'Where there\'s a will, there\'s a way' text_to_word_sequence(sentence) ํด๋น ์ฝ๋๋ฅผ 3.8.8 ํ์ด์ฌ ๋ฒ์ ์์ ์ฌ์ฉํ๋ค๊ฐ, 3.7 ๋ฒ์ ์ ์ฟ ๋ค๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด ๋ฒ์ ์ ๋ฎ์ถฐ์ ์คํํ๋๋ ๊ฐ์ํ๊ฒฝ์ ์ฃผํผํฐ ๋ ธํธ๋ถ์ด ์์ด์ ์๋กญ๊ฒ ๊น์์ผํ๋ค๊ณ ํ๋๋ฐ, ๋ค์๊ณผ ๊ฐ์ ์๋ฌ๊ฐ ๋ฐ์ํ์๋ค. ํด๊ฒฐ๋ฐฉ๋ฒ ํด๊ฒฐ๋ฐฉ๋ฒ conda install ipykernel --update-deps --force-reinstall ์ด๋ ์ฝ๋๋ฅผ ํฐ๋ฏธ๋์์ ์คํ์์ผ์ค๋ค. ๊ทธ๋ฌ๋ฉด ๋ค์์ฝ๋๊ฐ ๋ฌ๋ค. ## Package Plan ## environment location..
RNN ๊ตฌ์กฐ ์ตํ๊ธฐ
1. ๋ช ๊ฐ์ ๋จ์ด๋ฅผ ํตํด์ RNN ๊ตฌ์กฐ๋ฅผ ์ตํ๋ณด์¶ In [1]: import numpy as np import pandas as pd import matplotlib.pyplot as plt ๋ฐ์ดํฐ์ ๊ตฌ์ถํ๊ธฐ¶ ๊ธ์ ํ๋ํ๋ ๋จ์๋ก RNN ์ฌ์ฉํด๋ณด๊ธฐ hello, apple, hobby, daddy, bobby In [2]: # ๋ฌธ์ ๋ฐ์ดํฐ : hell , appl, hobb, dadd, bobb # ์ด 4๋ฒ ์ํํ๋ ๋จ๊ณ๋ก ์งํ๋จ # ์ ๋ต ๋ฐ์ดํฐ : o, e, y, y # timestamps = 4 ์ ํซ ์ธ์ฝ๋ฉ์ผ๋ก ๋ฌธ์๋ฅผ ์ซ์๋ก ๋ณ๊ฒฝ¶ ๋ฌธ์ + ์ ๋ต ์ ์ฒด ๋ฐ์ดํฐ์์ ๋ฑ์ฅํ๋ ๋ฌธ์ ๋ h,e,l,o,a,p,b,y,d ์ด 9๊ฐ In [26]: a = ['hello', 'apple&#..
![vscode์์ rtx 2060super ์จ๋จน์ด๋ณด๊ธฐ (feat.gpu cuda๋ฅผ ์ข์จ๋ณด์)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbOSuWX%2FbtrmSwv4KFt%2FjW3IqSKWlTGVOl5orXeH30%2Fimg.png)
vscode์์ rtx 2060super ์จ๋จน์ด๋ณด๊ธฐ (feat.gpu cuda๋ฅผ ์ข์จ๋ณด์)
์ฌ๋ด ๋.. ๊ทธ๋์..gpu๋ฅผ ํ์ฐ๊ณ ์์๋ค. cpu๋ง ์ฐ๊ณ ์์๋ค๋. ์ข์ ์ปดํจํฐ๋ฅผ ๋ ๋๊ณ ์ ํ์ฉ์ ์ ๋ชปํ๊ณ ์์๊น... ํํ์ค๋ฝ๋ค. ๊ทธ๋๋ ์ง๊ธ์ด๋ผ๋ ์์์ผ๋ ์ผ๋ง๋ ๋คํ์ด๋ด. ๊ฐ์ฅ ์ค์ํ ๊ฒ์ ๊ธ ๋ง์ง๋ง ํ๋จ์ ์ค์น๋ฒ์ ์ฐธ์กฐํ ๊ฒ! ํ๋ํด์ ๋ณด๋ฉด, True๋ผ๊ณ ๋์ค๋ฉด์ ์ง์์ด ๋๋ ๊ฒ์ฒ๋ผ ๋ณด์ด์ง๋ง, ์ค์์ ์๋๋ค. ์ฌ์ฉํ ๋ช ๋ น์ด ๋ชฉ๋ก import tensorflow as tf tf.__version__ # ์ค์น๋ tensorflow ๋ฒ์ ํ์ธ tf.test.is_built_with_cuda() # ์ฟ ๋ค๋ก ๋น๋๋์๋์ง ํ์ธ tf.test.is_built_with_gpu_support() # cuda์ ๊ฐ์ gpu๋ก ๋น๋๋์๋์ง ํ์ธ tf.test.gpu_device_name() # ์ฌ์ฉ ๊ฐ๋ฅํ gp..
![KNN ์๋์ฐจ ๋ถ๋ฅ ๋ฐ ์์ธก](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FluvHr%2FbtrmJjk7urr%2FuBRoOd68lCKyOuod7aYlt0%2Fimg.png)
KNN ์๋์ฐจ ๋ถ๋ฅ ๋ฐ ์์ธก
์ถ์ฒ์๋น์ค๋ฅผ knn์ ํ์ฉํ์ฌ ๊ธฐํํ๊ณ ์๋ค. ๊ด๋ จ ์ฝ๋๋ฅผ ์์ฑํด๋ณด์๊ณ , ํด์์ ์งํํด๋ณด๊ฒ ๋ค. 0. ๋ฐ์ดํฐ์ ๋ ์ด๋ธ๋ก ๋๋ ๋ถ๋ฅ๊ธฐ์ค์ ์์ฒด์ ์ผ๋ก ๋ง๋ค์ด๋ณด์๋ค. ์์ head ๋ถ๋ถ๋ง print(dtm.iloc[0:5]) ํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ถ๋ ฅ ๊ฐ์ด ๋์จ๋ค. 0 Pricist 1 Proud Patrons 2 Camper 3 Proud Patrons 4 Pricist Name: class, dtype: object ๋ฑ๋ฑ. # class ๋ถ๋ฅ ๊ธฐ์ค - 5๊ฐ์ง # Elitist : ์ฐจ๋ ๊ทธ ์ ์ฐจ๋ผ๊ณ ์๊ฐํ๋ ๋ถ๋ฅ # Proud Patrons : ์๋์ฐจ๊ฐ ์์ฐ์ ๋ ธ๋ ฅ์ ๋ํ result์ด๊ฑฐ๋ ๊ด์ฌ์ ๋ฐ๊ณ ์ถ์ดํ๋ ๊ด์ข ์ ๋ถ๋ฅ # Camper : Camping์ ์ฆ๊ธฐ๊ธฐ๋ ํฐ ๋ฉ์น์ ์ฐจ๋์ ์ข์ํ๋ ๋ถ๋ฅ # Fan..
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ
๋ฐฐ๊ฒฝ ์ฐจ๋์ ์ ํธ๋์ ์ค์ ๊ตฌ๋งคํ๋ ค๋ ์ฐจ๋๊ณผ์ ์๊ด๊ด๊ณ๊ฐ ์กด์ฌํจ์ ํ์ธํ์๊ณ , ๊ฐ์ธ๋ณ ์ทจํฅ์ ๋ฐ๋ผ ์ฐจ๋ ์ถ์ฒ์์ ๋์๊ฐ ์ฐจ๋๋ณ ํน์ ์ฐ๋ น๋์ ์ ํธ๋, SNS ์์์์ ์ธ๊ธ ๋น๋ ๋ฑ์ ๋ํ ๋ถ์์ด ๊ฐ๋ฅํ์๋ค. ์กฐ๊ฑด๋ถ ์ฐ์ฐ์ ํ์ฉํ๊ณ , ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ ์์๋ฅผ ๋ณด๋ค ์ธ๋ถํํ์ฌ ์ถ์ฒ ์ ํ๋ ํฅ์์ ๋๋ชจํ์๋ค. ์ด๋ค ์ ์ ๋ฐํ์ผ๋ก ์ฐจ๋์ ์ถ์ฒํ๊ณ , ๊ฐ์ค์น๋ฅผ ์ด๋ป๊ฒ ์ค์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ณ ์ํ ๊ฒ์ธ์ง ์ค๋น๊ฐ ํ์ํ๋ค. 1. hadoop 2. mapreduce 3. r 4.ํผ์ด์จ ์๊ด๊ณ์ 5.ํํฐ๋ง ์๊ณ ๋ฆฌ์ฆ 6.์์คํ ์ํคํ ์ฒ 7.์๊ณ ๋ฆฌ์ฆ ์์๋ 8.์๊ณ ๋ฆฌ์ฆ ์์ฌ์ฝ๋ 9.๋ฐ์ดํฐ ์ ์ฌ,๊ฐ๊ณต,์ฝ๋ ๋ฐ์ดํฐ ์ถ์ถ, ์๊ณ ๋ฆฌ์ฆ ๊ตฌํ 1. hadoop Apache Hadoop ์ ๋น ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋ค์์ ์ปดํจํฐ ํด๋ฌ์คํฐ์..