Programming/anaconda

Linux에 ML환경 구축하기 (1) - Multi CUDA, cuDNN 여러 버전 한 컴퓨터에 설치하기 + 드라이브 설정 (local)

방황하는 데이터불도저 2022. 8. 23. 00:20

※ Ubuntu LTS 20.04 버전 설치 필수
(22.04버전에서는 Pytorch, Tensorflow지원 CUDA 호환X) - 2022.08.16 기준

1. GPU 스펙 확인

 

- CUDA설치가 가능한 시스템을 갖추고있는지 확인하는 과정
- 필자는 컴퓨터 전체 스펙을 확인할 수 있는 [CPU-Z]라는 프로그램을 활용하여 확인함
- Graphics > Display Device Selection > NVIDIA GeForce RTX 3060
- the list of CUDA-enabled GPU cards에 내 GPU가 있는지 확인



2. 설치해야하는 CUDA 버전 확인

 

- PyTorch의 Compute Platform에서 11.6버전이 필요함을 확인
- Tensorflow의 Software Requirements에서 11.2버전이 필요함을 확인
- 여러개의 cuda를 한 컴퓨터에서 사용하는 방법은 아래에서 다루도록 함

3. CUDA Toolkit 설치


1) CUDA Toolkit Archive에서 원하는 버전 > OS > Architecture > Distribution > Version > Installer Type을 선택 > runfile(local)로 설치 필수
(deb(local)파일로 toolkit를 설치할 경우, linux환경에서 드라이브가 자동적으로 업데이트될 수 있다. cuda버전에 적합한 드라이브 버전으로 자동 설치 되는 것이다. 드라이브가 쿠다 버전에따라 계속 업데이트되면 여러 쿠다를 설치하는데 장애가 생긴다. 잘못하면 듀얼모니터도 인식이 안될수도….)

2) Linux Terminal에서 Installation Instructions에 따라 CUDA설치 진행
- 설치 옵션 중 Driver install option을 꼭 해제하고 설치를 진행해야한다.

3) 여러 버전이 필요한 경우, 필요한 버전의 CUDA를 모두 같은 방식으로 설치

* NVIDIA드라이브와 CUDA 설치가 잘 되었는지 확인하기 위해서는 아래의 커맨드로 확인 가능

nvidia-smi



4. cudnn 설치

 

- https://developer.nvidia.com/cudnn
- tensorflow 설치를 위해 필요한 cudnn 8.1.0 버전 설치
- (아래의 커맨드에서 본인이 필요한 CUDA / cudnn 버전 숫자로 변경해서 입력)

cd ~/Downloaded_path

tar -xzvf cudnn-11.2-linux-x64-v8.1.0.77.tgz
tar -xzvf cudnn-11.2-linux-aarch64sbsa-v8.1.0.77.tgz

sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.2/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.2/lib64

sudo chmod a+r /usr/local/cuda-11.2/include/cudnn*.h /usr/local/cuda-11.2/lib64/libcudnn*



5. mutiple CUDA version path 설정


- 여러 cuda 버전이 모두 정상적으로 작동될 수 있도록 경로 설정

- 우선, 아래의 커맨드로 설치되어있는 cuda 버전 확인

cd /usr/local
ls

- 여러개 버전의 CUDA를 사용하기 위해 아래의 커맨드 실행

sudo gedit ~/.bashrc

- 텍스트 에디터가 열리면 가장 아래에 해당 텍스트 복사&붙여넣기 (#에 본인 CUDA 버전 숫자를 입력)

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH="/usr/local/cuda/lib64:/usr/local/cuda-#.#/lib64:/usr/local/cuda-#.#/lib64:/usr/local/cuda-#.#/lib64:/usr/local/cuda-#.#/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}"


* 필자는 anaconda를 설치 후, conda로 가상환경을 생성하여, 각 가상환경마다 다른 cuda 버전을 사용하도록 구축함
* 다음편에서 anaconda, pytorch, tensorflow, pip3, jupyterlab 설치에 대해서 다루도록 함

https://kyull-it.tistory.com/24

 

Linux에 ML환경 구축하기 (2) - anaconda, pytorch, tensorflow2, pip3, jupyter lab / notebook 설치 방법 모음

# 1 : Anaconda 설치방법 - Linux anaconda installation Manual https://docs.anaconda.com/anaconda/install/linux/#installation Installing on Linux — Anaconda documentation Note If you install multiple versions of Anaconda, the system defaults to the mos

kyull-it.tistory.com