๋ฐ์ํ
๋น์ง๋ ๊ฐ์ฑ ๋ถ์
- Lexicon์ ๊ธฐ๋ฐ ์ํ
- ๋๋ถ๋ถ ๊ฐ์ฑ ๋ถ์์ฉ ๋ฐ์ดํฐ๋ ์ด๋ฌํ ๊ฒฐ์ ๋ ๋ ์ด๋ธ ๊ฐ์ ๊ฐ์ง๊ณ ์์ง ์์
- ์ฆ, Lexicon์ ๋น์ง๋์์ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋จ
- ๊ฒ์์ ํตํด ์ฌ๋ฌ๊ฐ์ง ํ๊ธ Lexicon ๋ฐ์ดํฐ๋ฅผ ์ฐพ์ ์ ์์
ํ
์คํธ ๋ถ์(Text Analytics)
- ์๋งจํฑ(Semantic)์ด๋ผ๋ ์ฉ์ด?
- '๋ฌธ๋งฅ์ ์๋ฏธ'
- ์ด ๋ฌธ๋งฅ์ ์๋ฏธ์ ๋ฐ๋ผ ๋์ผํ ๋จ์ด๋ผ๋ ์์ ํ๊ฒ ๋ฌ๋ผ์ง
- ์ ๊ณต๋๋ ๊ฐ์ฑ์ฌ์ ์ ์ด ๋ฌธ๋งฅ์ ํ์
ํ๋๋ฐ ๊ฐ์ฅ ์ค์ ์ ๋๊ณ ์์
๊ฐ์ฑ์ฌ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ
1. NLTK
- ์๋งจํฑ์ ํ๋ก๊ทธ๋จ์ ์ผ๋ก ์ธํฐํ์ด์คํ ๊ฐ๋ฅ
- ์ ๊ณต๋๋ WordNet์ ๋ค์ํ ์ํฉ์์ ๊ฐ์ ์ดํ๋ผ๋ ๋ค๋ฅด๊ฒ ์ฌ์ฉ๋๋ ์ดํ์ ์๋งจํด ์ ๋ณด๋ฅผ ์ ๊ณต
- ์ด๋ฅผ ์ํด ๊ฐ๊ฐ์ ํ์ฌ(๋ช
์ฌ, ๋์ฌ, ํ์ฉ์ฌ, ๋ถ์ฌ ๋ฑ)๋ก ๊ตฌ์ฑ
- ํ์ฌ๋ก ๊ฐ๋ณ ๋จ์ด๋ฅผ Synset์ด๋ผ๋ ๊ฐ๋
์ ์ด์ฉํด ํํ
- ๋จ์ ์ ์์ธก์ฑ๋ฅ์ด ๋จ์ด์ง
2. SentiWordNet
- NLTKํจํค์ง์ WordNet๊ณผ ์ ์ฌํ๊ฒ ๊ฐ์ฑ ๋จ์ด ์ ์ฉ์ WordNet์ ๊ตฌํํ ๊ฒ
- WordNet์ Synset๋ณ๋ก 3๊ฐ์ง ๊ฐ์ฑ ์ ์๋ฅผ ํ ๋นํฉ๋๋ค.
3. VADER
- ์ฃผ๋ก ์์ค ๋ฏธ๋์ด์ ํ
์คํธ์ ๋ํ ๊ฐ์ฑ ๋ถ์์ ์ ๊ณตํ๊ธฐ ์ํ ํจํค์ง
- ๋ฐ์ด๋ ๊ฐ์ฑ ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณต
- ๋น๊ต์ ๋น ๋ฅธ ์ํ ์๊ฐ์ ๋ณด์ฅ
- ๋์ฉ๋ ํ
์คํธ ๋ฐ์ดํฐ์ ์ ํฉํ ํจํค์ง
4.Pattern
- ์์ธก ์ฑ๋ฅ ์ธก๋ฉด์์ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ๋ ํจํค์ง์
๋๋ค.
- ๋จ์ ์ ํ์ด์ฌ 3.X๋ฒ์ ์์ ํธํ๋์ง ์๊ณ ์๋ ๋ฒ์ ์ธ 2.X๋ฒ์ ์์๋ง ๋์ํจ
๋ฐ์ํ
'๐๏ธ์ํํธ์จ์ด > ๐ปpython' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
int() argument must be a string, a bytes-like object or a number, not 'range' - range ๋ก int ๋ฐ์ดํฐ ํ์ ๋ฐ๊ธฐ (0) | 2021.12.28 |
---|---|
[vscode] ๋ค์ค ์ปค์ ์ด์ฉํ๊ธฐ (0) | 2021.12.28 |
ํ์ด์ฌ ์ ๊ทํํ์ re.sub (0) | 2021.12.07 |
nltk ๋ผ์ด๋ธ๋ฌ๋ฆฌ (0) | 2021.12.06 |
python matplotlib ํ๊ธ ๊นจ์ง (0) | 2021.12.05 |