전체 글 189

[칸아카데미] 모두를 위한 선형대수학 - (5) 선형종속과 선형독립 더 알아보기

* 집합 = S * S에 속해있는 벡터 = Vi * 선형결합을 위해 곱해주는 scalar값들의 모임 = Ci * Vi의 차원 수 = n 집합 S의 벡터들이 선형종속인지, 독립인지는 S 안의 벡터들의 선형결합이 0이 될 때, Ci(상수)값들이 어떤지에 따라 알 수 있다. S의 벡터들이 선형 종속이라면, - Ci중에 모두 0이 아니거나 0이 아닌 수가 최소 1개 이상이다. Ci중에서 모두 0이 아니거나 0이 아닌 수가 최소 1개 이상있다면, - S의 벡터들은 선형 종속이다. Ci가 모두 0이라면 (또는) Span(S) = R^n 을 만족한다면, - S의 벡터들은 선형 독립이다. S의 벡터들이 선형 독립이라면, - Ci가 모두 0이다. - Span(S) = R^n 를 만족한다.

[머신러닝] 학습, 검증, 테스트 데이터 쪼개는 법 : random_split PyTorch), train_test_split(Scikit-learn)

1. Pytorch * MNIST데이터를 예시로 불러와 train 데이터셋을 train과 validation 데이터셋으로 나누어 보는 작업 - 데이터셋을 쪼갤 때, torch.utils.data.random_split 모듈을 활용하면 된다. - random_split(pytorch에서 불러온 데이터셋 변수, [len(train_dataset), len(validation_dataset)]) 로 간단하게 분리가 가능하고, 데이터를 쪼개면서 데이터를 뒤섞고 싶을 때, generator 옵션을 사용하면 된다. (python 내장 함수인 help를 활용하여 random_split에 파라미터들을 미리 확인할 수 있다.) # 예시 코드 train_dataset = MNIST(os.getcwd(), download=..

AI/Fundamental 2022.08.26

[칸아카데미] 모두를 위한 선형대수학 - (2) 벡터의 뺄셈, 단위 벡터, 직선의 매개변수 표현 정의 및 퀴즈

- 위치벡터(Standard Position Vector) : [0,0]이 벡터의 시작되는 지점(꼬리)인 벡터 (R2 기준) - 단위 벡터(Unit Vector) i (hat^) = [1,0] : 수평방향으로 1 이동하는 것을 의미 j (hat^) = [0,1] : 수직방향으로 1 이동하는 것을 의미 - 벡터의 표기법 3가지 (3번째 이미지 참고) 1) 열 벡터 (Column Vector) 2) 튜플 (Tuple) 3) 단위 벡터 (Unit Vector) - 단위벡터 계산하는 법 (3번째 이미지 참고) ex. v = (-2, 2)일 때, 각 열에 각 값의 제곱을 더한 값에 루트를 씌운 값으로 나누고, 그 각 열을 더한 값이 단위벡터이다. - 집합(Set) & 직선의 매개변수 표현 (4번째 마지막 그림 참..

[칸아카데미] 모두를 위한 선형대수학 - (1) 벡터, 벡터 시각화, 벡터의 합, 벡터의 곱 정의

- 벡터는 크기와 방향을 나타내는 것 - 방향은 2차원 뿐만 아니라 3,4,5,6,,,,n차원이 될 수 있음 - 크기와 방향이 같다면 어느 지점에서 시작되는 벡터라도 같은 벡터임 - R 왼쪽에 막대기 하나 더 붙거나 진하게 표시된 R 기호는 Real Coordicate Space라는 뜻으로 어떤 수라도 표현할 수 있는 "실수 좌표 공간"임을 표기하는 기호이다. - Rⁿ 에서 n은 차원을 나타냄 - 벡터의 합은 동일한 차원의 실수 좌표 공간을 가진 벡터끼리 가능하며 - 같은 위치의 성분끼리 더해주면 된다. - 곱의 경우에는 각 성분에 scalar 수를 그대로 곱해주면 되는데, - 이때, 양수를 곱하면 같은 방향에 크기만 달라지고, - 음수를 곱하면 방향이 반대로 바뀌며, 크기도 달라질 수 있다.

Linux에 ML환경 구축하기 (2) - anaconda, pytorch, tensorflow2, pip3, jupyter lab / notebook 설치 방법 모음

https://kyull-it.tistory.com/19 Linux에 ML환경 구축하기 (1) - CUDA, cuDNN 여러 버전 한 컴퓨터에 설치하기 + 드라이브 설정 ※ Ubuntu LTS 20.04 버전 설치 필수 (22.04버전에서는 Pytorch, Tensorflow지원 CUDA 호환X) - 2022.08.16 기준 1. GPU 스펙 확인 - CUDA설치가 가능한 시스템을 갖추고있는지 확인하는 과정 - 필자는 컴퓨터 전체 스 kyull-it.tistory.com # 1 : Anaconda 설치방법 - Linux anaconda installation Manual https://docs.anaconda.com/anaconda/install/linux/#installation Installing o..

Handling proper nouns in Machine Translation (기계번역에서 고유명사 처리 전략)

1. 번역을 하지 않고, 원문 그대로를 가져오는 방법 (Keep in the source language) - ex. Hello, John! 2. 음역번역 (Transliteration) - 가장 인기있는 방법 - 뜻이 아니라 발음 그대로를 가져와서 타켓언어로 변환하는 방법 - 원문 발음을 그대로 타켓의 언어로 읽는 방법 - ex. John → 존 3. 기계 번역 (Translation) - ex. New York - 새로운 욕 - 해당 방법은 거의 사용하지 않거나, 2번의 전략과 섞어 쓴다. 출처 : Key strategies for translating proper nouns

문장분절을 위한 Python Library (Sentences Segmentation) - Spacy, kss

Spacy는 고급 자연어 처리를 도와주는 python 라이브러리이다. Spacy 설치방법 : https://spacy.io/usage Install spaCy · spaCy Usage Documentation spaCy is a free open-source library for Natural Language Processing in Python. It features NER, POS tagging, dependency parsing, word vectors and more. spacy.io 내가 설치하고자 하는 path에서 아래의 커맨드로 설치 - Linux에 pip으로 설치의 경우 pip install -U pip setuptools wheel pip install -U spacy python -m ..

Anaconda 외워두면 좋을 필수 명령어 모음 (가상환경 생성, 라이브러리 설치 및 관리 방법)

# 가상환경 conda create -n [가상환경이름] python=x.x # 가상환경 생성 conda info --envs # 생성된 가상환경 리스트 conda activate [가상환경이름] # 가상환경 활성화 conda deactivate # 가상환경 비활성화 conda remove -n 가상환경이름 --all # 가상환경 삭제 virtual_env.yaml"}">conda env export > virtual_env.yaml # 가상환경을 .yaml 파일로 내보내서 저장 conda create -n [복사된_가상환경이름] --clone [복사할_가상환경이름] # 가상환경 클론 생성 anaconda prompt 가상환경 - 라이브러리 설치 requirements.txt "}">pip freeze ..