본문 바로가기
SMALL

데이터분석3

R Studio 기본 -R Studio는 크게 4개의 영역으로 구분되어 있으며, 여러 정보를 동시에 확인할 수 있다. 1. 편집 창 , Script 창 = Batch 모드로 R Script를 작성하고 실행할 수 있는 창이다. = R Script창에서 작성한 Script를 실행하려면 Ctrl + R 또는 Ctld + Enter 또는 블록 설정 후 RStudio Script 창의 상단 메뉴인 'Run' 단추를 클릭하는 세 가지 방법 중에서 본인이 편한 것을 사용하면 된다. 2. 콘솔 Console =R 프로그램을 짜고 실행할 수 있으며, R Script 창 혹은 Console 창에서 작성한 프로그램의 실행(계산) 결과 보기, 패키지 설치, 에러/오류 메시지 등을 확인할 수 있다. = R 프로그램을 자주 사용하는 분이라면 R Sc.. 2022. 2. 6.
데이터 거버넌스 체계 수립 -빅데이터는 데이터의 크기로 그 의미의 절대성을 갖는 것은 아니다. 그러나 실시간으로 쏟아지는 비정형-반정형의 데이터는 조직이나 프로젝트 단위의 데이터 관리 체계로는 솔루션이 될 수 없고, 전사 차원의 체계적인 데이터 거버넌스의 필요성이 부각된다. -데이터 거버넌스란 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리 체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축하는 것을 말한다. 특히 마스터 데이터, 메타 데이터, 데이터 사전은 데이터 거버넌스의 중요한 관리 대상이다. - 데이터 거버넌스는 독자적으로 수행될 수도 있지만 전사차원의 IT 거버넌스나 EA(Enterprise Architecture)의 구성요소로 구축되는 경우도 있다. ** 빅데이터 거.. 2022. 2. 5.
빅데이터 분석 방법론 1. 상세한 절차 (Procedure) 2. 방법 ( Method ) 3. 도구와 기법 (Tools & Techniques) 4. 템플릿과 산출물(Templates & Outputs) > -데이터 분석을 효과적으로 기업에 정착하기 위해서는 이를 체계화하는 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수적이다. -일반적으로 방법론은 계층적 프로세스 모델(Stepwised Process Model)의 형태로 구성된다. 최상위 계층은 단계(Phase)로서 프로세스 그룹(Process Group)을 통하여 완성된 단계별 완료보고서가 생성된다. -각 단계는 여러 개의 태스크(Task)로 구성되는데 각 태스크는 단계를 구성하는 단위 활동으로 구성되며 마지막 계층은 스텝(Step)으로 입력 자료, 처리 및 도.. 2022. 1. 26.
LIST