문장을 word_tokenize (토큰화)-> pos_tag(품사 분류) 를 통해 pos(품사)를 찾고, 문장 내에서 단어에 해당하는 품사를 태깅하여 알수 있다.

종류는 다음과 같다.

import nltk
nltk.download('punkt')

from nltk import word_tokenize

words = word_tokenize("Think like man of action and act like man of thought")
words # 먼저 문장을 토큰화한 후에 포스 태그를 달면 된다

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
['Think',
 'like',
 'man',
 'of',
 'action',
 'and',
 'act',
 'like',
 'man',
 'of',
 'thought']

nltk.download('averaged_perceptron_tagger')

nltk.pos_tag(words)

[nltk_data] Downloading package averaged_perceptron_tagger to
[nltk_data]     C:\Users\AppData\Roaming\nltk_data...
[nltk_data]   Unzipping taggers\averaged_perceptron_tagger.zip.
[('Think', 'VBP'),
 ('like', 'IN'),
 ('man', 'NN'),
 ('of', 'IN'),
 ('action', 'NN'),
 ('and', 'CC'),
 ('act', 'NN'),
 ('like', 'IN'),
 ('man', 'NN'),
 ('of', 'IN'),
 ('thought', 'NN')]

Pos tag list

Universal Tag list

이상 정리완료

저작자표시

'🗝️소프트웨어 > 💻python' 카테고리의 다른 글

VScode 에서 Jupyter notebook에 한국어 자연어 처리 KoNLy 와 형태소 분석기 McCab 세팅하기(설치) (0)	2021.12.04
1 columns passed, passed data had 44 columns 리스트 관련 에러 (0)	2021.12.04
python 가상환경 설치중에 vscode 에러 : Kernel process Exited (0)	2021.12.04
RNN 구조 익히기 (0)	2021.12.03
vscode에서 rtx 2060super 써먹어보기 (feat.gpu cuda를 좀써보자) (0)	2021.12.03

nltk pos_tag 종류

Pos tag list

Universal Tag list

'🗝️소프트웨어 > 💻python' 카테고리의 다른 글

티스토리툴바