Programming/python-nlp 3

Handling proper nouns in Machine Translation (기계번역에서 고유명사 처리 전략)

1. 번역을 하지 않고, 원문 그대로를 가져오는 방법 (Keep in the source language) - ex. Hello, John! 2. 음역번역 (Transliteration) - 가장 인기있는 방법 - 뜻이 아니라 발음 그대로를 가져와서 타켓언어로 변환하는 방법 - 원문 발음을 그대로 타켓의 언어로 읽는 방법 - ex. John → 존 3. 기계 번역 (Translation) - ex. New York - 새로운 욕 - 해당 방법은 거의 사용하지 않거나, 2번의 전략과 섞어 쓴다. 출처 : Key strategies for translating proper nouns

문장분절을 위한 Python Library (Sentences Segmentation) - Spacy, kss

Spacy는 고급 자연어 처리를 도와주는 python 라이브러리이다. Spacy 설치방법 : https://spacy.io/usage Install spaCy · spaCy Usage Documentation spaCy is a free open-source library for Natural Language Processing in Python. It features NER, POS tagging, dependency parsing, word vectors and more. spacy.io 내가 설치하고자 하는 path에서 아래의 커맨드로 설치 - Linux에 pip으로 설치의 경우 pip install -U pip setuptools wheel pip install -U spacy python -m ..