본문 바로가기
반응형

R13

병렬처리를 위한 R - MRO R은 흔히 아는 것처럼 인-메모리(in-memory) 형태의 언어로, CPU보다는 메모리에 영향을 많이 받는 언어이다. 모든 데이터를 메모리에서 처리를 해야되는데, 아무리 추가로 메모리를 꽂아서 쓴다고 하더라도 문제가 있다. 바로 싱글 스레드(Single Thread) 이다. 최근에 나오는 대부분의 CPU가 멀티코어의 CPU인데, R은 CPU의 성능을 제대로 못쓰고 있는 것이다. 아무튼 R에서는 병렬처리가 안되는데, MS의 MS R Open에서는 Intel의 Math Kernel Library(MKL)을 사용하여 연산이 빠르고 멀티스레드가 된다는 점이다! 물론 parallel 패키지를 설치할수도 있지만 이미 내포된 RevolutionR의 발전된 버전이다.> SQL Server와 Hadoop 연동> CRA.. 2018. 12. 31.
RStudio Cloud - 설치가 필요없는 R 스튜디오 https://rstudio.cloud/ RStudio Cloud. 이름처럼 클라우드 환경에서 구동되는 R스튜디오이다. 아직은 알파버전이니, 어느정도 버그는 감안하고 사용해야 할 것 같다. 우측 상단에 회원가입을 위해 Sign Up을 눌러보면, 계정을 새로 만들거나, 이미 사용중인 구글 계정이나 깃허브 계정으로도 사용이 가능하다. 로그인을 해봅시다. R스튜디오와 같은 화면을 생각했는데, 다소 다른 모습이라 당황을 했지만, NewProject를 클릭해 보자. 그럼 바로 익숙한 모습의 R스튜디오 화면이 보인다. 클라우드 환경이라서, 로컬PC에 있는 파일을 사용하기 위해서는 Files > upload 를 통해 클라우드 환경으로 파일을 전송한 이후에 가능하니 참고하자. 아직 알파버전으로 관련 피드백은 별도의 커.. 2018. 12. 31.
[한빛리더스] R로 배우는 데이터 분석 기본기 데이터 시각화 이번 한빛리더스의 미션 책은"R로 배우는 데이터 분석 기본기 데이터 시각화" 이다. R로 배우는 데이터 분석 기본기 데이터 시각화국내도서저자 : 후나오 노부오 / 김성재역출판 : 한빛미디어 2014.01.02상세보기 R을 처음 접하는 분들을 위해서 잠시 설명을 하자면, R은 SAS, SPSS 와 비슷한 통계적 계산과 그래프 제작을 위한 언어인데, Windows와 Mac 등 다양한 OS 환경을 모두 제공하고 있는데 무료!라서 아주 좋다. 또한 최근 통계적 이슈가 빅데이터 분석인데, R은 하둡을 지원한다.!! 빅데이터 하둡 R하둡 이란?*빅데이터(Big Data)정형화된 데이터는 물론 메타정보와 센서 데이터, 공정 제어 데이터 등 미쳐 활용하지 못하고 있는 "반 정형화된 데이터"에사진, 이미지처럼 지금까지 .. 2014. 5. 30.
[한빛리더스] Head First Data Analysis 공대생부터 시작해서 벌써 10년이 넘었다. 그러나! 공대생도 사람마다 조금은 다르겠지만, 보통 어려워한다는 확통! 그렇다 확률과 통계다. 숫자는 요즘 다양한 곳에서 사용이 되고 있는 만큼 정말 중요한 지표중 하나이다. 특히 마케팅이라던지 그런 곳에서는 의사 결정의 중요한 기준이 되기도 한다. 그만큼 통계에 대한 신뢰가 높다는 것이다. 물론 훌륭한 통계 결과를 위해서는 그만큼의 데이터가 있어야 하겠지만, 어찌됐든 통계는 중요한 지표임에 틀림이 없다. 이번 미션은 이러한 통계등 데이터 분석을 위한 O`REILLY 의 Head First Data Analysis 를 선택했다. 헤드 퍼스트 데이터 분석국내도서저자 : 마이크 밀튼(Michael Milton) / 김경태역출판 : 한빛미디어 2013.04.10상세보.. 2013. 5. 25.
반응형