■■▶빅데이터 분석◀ 2018. 5. 23. 20:07

+ 빅데이터 분석 시각화 - R 프로그래밍 +

1. R의 정의
2. R의 특징
3. R의 역사
4. S 언어(R 언어의 뿌리)
5. R의 발전

 


1. R의 정의

R은 오픈소스 프로그램으로 통계/데이터 마이닝 및 그래프를 위한 언어이다. R은 주로 연구 및 산업별 응용 프로그램으로 많이 사용되고 있으며, 최근에는 기업들이 많이들 사용하기 시작했다. 특히, 빅데이터 분석을 목적으로 주목을 받고 있으며, 5000개가 넘는 패키지(일종의 애플리케이션)들이 다양한 기능을 지원하고 있으며 수시로 업데이트되고 있다.

2. R의 특징

오픈소스 프로젝트로 진행되고 있는 R은 통계 프로그래밍 언어인 S 언어 기반으로 만들어졌으며 통계 계산과 결과 생성 그래픽을 위한 프로그래밍 언어이다. 개발자 입장에서는 R이 다른 개발 언어와의 연계 호환이 가능하고, 웹과 연동하여 실시간 처리가 가능하다. R은 비용 절감에 따른 경제적 이익이 수반되는 새로운 애플리케이션을 개발하거나 웹 서비스로 제공하는 데 유용하다.

 

3. R의 역사

R은 뉴질랜드 오클랜드 대학의 Ross Ihaka와 Robert Gentleman에 의해 S-PLUS의 무료 버전 형태로 1993년부터 소개되었다. R은 기존의 S-PLUS(S 언어)의 사용자들을 거의 흡수했을 뿐 아니라 오픈 소스임에도 고성능의 컴퓨팅 속도와 데이터 처리 능력, 각종 소프트웨어 및 구글, 아마존 클라우드 서비스와의 API 등 성능의 우수성과 연동, 호환성이 좋다.

 

4. S 언어(R 언어의 뿌리)

R은 데이터 분석용 객체지향언어인 S 언어에 그 뿌리를 찾을 수 있다. S 언어는 SAS나 SPSS와 같이 정해진 분석 프로시저에 준비된 데이터를 대입하여 분석 결과만을 해석하는 패키지가 아니라, 데이터를 중심으로 데이터 과학자들이 고유의 창의적이며 데이터 특성을 고려한 방법을 구현하는 프로그래밍 언어이다. 그림 4는 S-PLUS의 프로그램 화면으로 분석결과를 시각적으로 표현할 수 있다.

 

5. R의 발전

R은 오픈소스라는 특징에 의해 그림 5와 같이 커뮤니티 중심의 각종 패키지가 개발되어 공개되고 있고 이로 인해 사용자층과 용도가 급격히 확장되었다. 사용자가 증가함에 따라 새롭게 개발되는 패키지가 꾸준히 상승하는 건전한 생태계를 조성하고 있다.

 

 

[빅데이터 가공 - R 프로그래밍]

[빅데이터 시각화 - R 프로그래밍]

 

 

[빅데이터 관련 직종, 인적자원의 연봉 예시]

 

 

 

(잡코리아 구인광고, 2018년 기준)

 

 

 

윤샘 [http://edyoon.tistory.com] 컴교실

 

 

posted by [Selha YoonSem]
: