ETL/Spark
[Spark] Spark 설치
PONI
2023. 5. 23. 10:19
반응형
📋PATH 등록
export JAVA_HOME=/sw/java/jdk
export SPARK_HOME=/sw/spark
export PYTHONPATH=$SPARK_HOME/python:$PYTHONPATH
📌Spark 설치
- Spark 다운로드
wget https://archive.apache.org/dist/spark/spark-3.3.1/spark-3.3.1-bin-hadoop3.tgz --no-check-certificate
- Spark 압축해제
tar -zxvf /sw/spark-release/spark-3.3.1-bin-hadoop3.tgz
📖환경 변수 설정
cd $SPARK_HOME/conf
spark-env.sh
cp ./spark-env.sh.template ./spark-env.sh
# 기본 주소 셋팅
export SPARK_LOCAL_IP=192.168.0.2
#export SPARK_MASTER_IP=192.168.0.2
export SPARK_MASTER_HOST=192.168.0.2
export SPARK_MASTER_PORT=7077
export SPARK_MASTER_WEBUI_PORT=8080
# 환경변수 셋팅
export SPARK_DRIVER_MEMORY=1g
export SPARK_DRIVER_CORES=1
export SPARK_WORKER_MEMORY=10g
export SPARK_WORKER_CORES=4
export SPARK_WORKER_INSTANCES=1
#export SPARK_EXECUTOR_MEMORY=8g
#export SPARK_EXECUTOR_CORES=4
#export SPARK_EXECUTOR_INSTANCES=1
# NVIDIA GPU 기반 시스템에서 실행되는 프로그램이 사용 가능한 GPU를 선택하는 데 사용
export NVIDIA_VISIBLE_DEVICES=all
# CUDA 라이브러리를 사용하는 프로그램에서 0번 GPU만 사용하도록 제한
export CUDA_VISIBLE_DEVICES=0
반응형