Word2Vec: Difference between revisions
From CS Wiki
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
[[분류:인공지능]] | |||
== 개요 == | == 개요 == | ||
; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 | ; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구 | ||
* | * 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화 | ||
* 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 | * 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산 | ||
== 라이센스 == | == 라이센스 == | ||
Line 9: | Line 10: | ||
== 변환 방식 == | == 변환 방식 == | ||
=== | === CBoW 변환 === | ||
; Continuous Bag-of-Words | ; Continuous Bag-of-Words | ||
*연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다. | * 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다. | ||
=== skip-gram 변환 === | === skip-gram 변환 === | ||
Line 18: | Line 19: | ||
== 공식 사이트 == | == 공식 사이트 == | ||
[https://code.google.com/archive/p/word2vec/ 링크] | [https://code.google.com/archive/p/word2vec/ 링크] | ||
Revision as of 09:00, 28 December 2019
개요
- 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구
- 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화
- 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산
라이센스
Apache License 2.0
변환 방식
CBoW 변환
- Continuous Bag-of-Words
- 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.
skip-gram 변환
- 입력된 단어의 주변 단어를 예측한다.