일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 웨일즈
- 치앙마이
- 코로나바이러스
- 필리핀사망
- 신종코로나
- wuhan
- 전염병
- 우한
- parasite
- 확진자수
- 중국외교부
- 코로나
- red hearse
- everybody wants you
- 조현병
- Bolton
- 봉준호감독통역
- 진짜영웅
- 우한코로나
- 최성재
- 미중
- 우한 코로나
- 창궐
- 정은경 본부장님
- 우한코로나바이러스
- sharonchoi
- 코로나19
- 어서와한국은처음이지
- cnn
- 봉준호감독통역사
- Today
- Total
오지's blog
spark install (ec2환경 프리티어, ubuntu 20.04) 본문
설치 환경
EC2프리티어
Ubuntu 20.04
$ sudo apt update
$ sudo apt -y upgrade
$ [ -f /var/run/reboot-required ] && sudo reboot -f
JAVA설치
$ sudo apt install curl mlocate default-jdk -y
설치 및 JAVA버전 확인
$ java --version
SPARK설치 파일 다운로드
$ wget https://dlcdn.apache.org/spark/spark-3.2.1/spark-3.2.1-bin-hadoop3.2.tgz
설치 파일 압축풀기
$ tar -xvf spark-3.2.1-bin-hadoop3.2.tgz
$ sudo mv spark-3.2.1-bin-hadoop3.2/ /opt/spark
환경변수 설정
$ vim ~/.bashrc
##############################################################################
alias python='python3'
alias pip='pip3'
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
export SPARK_HOME=/opt/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
export PYTHONPATH="${SPARK_HOME}/python:${SPARK_HOME}/python/build:${PYTHONPATH}"
##############################################################################
$ source ~/.bashrc
$ start-master.sh
starting org.apache.spark.deploy.master.Master, logging to /opt/spark/logs/spark-ubuntu-org.apache.spark.deploy.master.Master-1-ip-172-31-40-209.out
$ sudo ss -tunelp | grep 8080
tcp LISTEN 0 1 *:8080 *:* users:(("java",pid=4496,fd=252)) uid:1000 ino:31309 sk:6 v6only:0 <->
$ start-worker.sh spark://ubuntu:7077
starting org.apache.spark.deploy.worker.Worker, logging to /opt/spark/logs/spark-ubuntu-org.apache.spark.deploy.worker.Worker-1-ip-172-31-40-209.out
$ sudo updatedb
$ /opt/spark/bin/spark-shell
실행 화면
다음편. pyspark를 통해서 mysql 데이터 read
Reference
https://computingforgeeks.com/how-to-install-apache-spark-on-ubuntu-debian/
'개발노트 > 서버 관리' 카테고리의 다른 글
aws ec2에서 인바운드 ip추가해도 접속안되는 오류 해결 (0) | 2024.05.27 |
---|---|
정규표현식 참고 (0) | 2023.03.29 |
AWS EC2처음 접속시 permission 에러 (0) | 2022.03.20 |
fatal: Authentication failed for .. 에러메세지 해결 방안 (0) | 2022.02.02 |
특정 프로세스 죽이기 (0) | 2021.12.14 |