카테고리 없음

adsp - 데이터 분석 기획

박지강(Data_2기) 2024. 7. 8. 09:56
  1. 데이터 분석 기획
    • 분석 기획의 정의와 특징
      1. 분석 기획의 정의 : 사전에 계획하는 작업
      2. 분석 대상과 방법에 따른 4가지 분석 주제
        • 분석 대상 o, 분석 방법 o = 최적화
        • 분석 대상 o, 분석 방법 x = 솔루션
        • 분석 대상 x, 분석 방법 x = 발견
        • 분석 대상 x, 분석 방법 o = 통찰력
      3. 목표 시점별 분석 기획
        • 과제 중심적인 접근 방식 : 과제를 빠르게 해결해야 하는 경우
        • 장기적인 마스터 플랜 방식 : 지속적인 분석 내재화를 위한 경우
    • 분석 기획 시 고려사항
      1. 가용 데이터 고려
      2. 적절한 활용방안과 유스케이스의 탐색
      3. 장애요소에 대한 사전 계획 수립
  2. 분석 방법론
    • 분석 방법론 개요
      • 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물로 구
      • 방해요소 3가지
        1. 고정 관념
        2. 편향된 생각
        3. 프레이밍 효과 : 동일한 사건이나 상황을 두고 개인의 판단이나 선택이 달라질 수 있는 현상
      • 분석 방법론의 생성 과정
        • 암묵지 -(형식화)- 형식지 - (체계화) - 방법론 - (내재화) - 암묵지
    • 분석 방법론이 적용되는 업무 특성에 따른 모델
      1. 폭포수 모델
        • 단계를 거쳐 순차적
        • 하향식 방향
        • 문제 및 개선사항이 발견될 경우 바로 이전 단계로
      2. 프로토타입 모델
      3. 나선형 모델
      4. 계층적 프로세스 모델
    • 전통적인 분석 방법론 두가지
      • KDD 분석 방법론 : 통계적 패턴이나 지식을 찾기 위해 활용할 수 있도록 체계적으로 정리한 데이터 마이닝 프로세스
        • KDD 분석 방법론 프로세스
          1. 데이터셋 선택
            • 비즈니스 도메인에 대한 이해와 프로젝트 목표 설정 필수
            • 필요한 데이터를 선택
          2. 데이터 전처리
            • 잡음, 이상치, 결측치, 의미 있는 데이터로 재가공
          3. 데이터 변환
            • 데이터의 차원을 축소
          4. 데이터 마이닝 (기계학습, 인공지능, 패턴인식, 시각화)
          5. 해석과 평가
      • CRISP-DM 분석 방법론
        • 단방향으로 구성되어 있지 않고 단계 간 피드백을 통해여 단계별 완성도를 높이게 되어 있다. 
        • CRISP-DM 분석 방법론 프로세스
          1. 업무 이해 : 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
          2. 데이터 이해 : 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
          3. 데이터 준비 : 분석용 데이터 셋 선택, 데이터 정제, 분석용 데이터 셋 편성, 데이터 통합, 데이터 포멧팅
          4. 모델링 : 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가
          5. 평가 : 분석 결과 평가, 모델링 과정 평가, 모델 적응성 평가
          6. 전개 : 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
    • 빅데이터 분석 방법론(계층적 프로세스 모델)
      • 빅데이터 분석 방법론의 계층적 프로세스 
        • 단계 - 테스크 - 스텝
    • 빅데이터 분석 방법론 5단계 플로우
      1. 분석 기획
        • 비즈니스 이해 및 범위 설정(프로젝트 범위 정의서 - SOW)
        • 프로젝트 정의 및 계획 수립(프로젝트 수행 계획서 - WBS)
        • 프로젝트 위험계획 수립
          • 데이터 분석 위험 식별 - 위험의 우선순위
          • 위험 대응 계획 수립 - 회피, 전이, 완화, 수용
      2. 데이터 준비
        • 필요 데이터 정의 - 분석에 필요한 데이터를 정
        • 데이터 스토어 설계
        • 데이터 수집 및 정합성 점검
      3. 데이터 분석
        • 분석용 데이터 준비
        • 텍스트 분석
        • 탐색적 분석
        • 모델링  (알고리즘 설명서)
        • 모델 평가 및 검증
      4. 시스템 구현
        • 설계 및 구현 - 설계된 모델을 구현
        • 시스템 테스트 및 운영
      5. 평가 및 전개
        • 모델 발전 계획 수립
        • 프로젝트 평가 및 보고 - 최종 보고서를 작성
  3. 분석 제 발굴
    • 분석 과제 발굴 개요 
      • 하향식 접근법 : 문제가 주어져 있는 상태에서 답을 구한다.
      • 상향식 접근법 : 문제를 모르는 상태에서 답을 구다.
    • 하향식 접근법
      1. 문제 탐색
        1. 비즈니스 모델 기반 문제 탐색
          •  업무, 제품, 고객단위로 문제를 발굴, 규제와 감사
        2. 분석 기회 발굴의 범위 확장
          • 거시적 관점, 경쟁자 확대 관점, 시장의 니즈 탐색 관점, 역량의 재해석 관점
        3. 외부 참조 모델 기반 문제 탐색 및 유스케이스 정의
          • 분석 유스케이스
      2. 문제 정의 단계 = 비즈니스 문제를 데이터의 문제로 변환
      3. 해결 방안 탐색 단계
      4. 타당성 검토 단
    • 상향식 접근법
      • 지도 학습
      • 비지도 학습
      • 프로토타이핑 접근 : 결과를 확인해 가면서 반복적으로 개선
  4. 분석 프로젝트 관리
    • 분석 프로젝트 관리 개요
      • 분석 과제의 5가지 주요 속성을 고려한 관리
        • 데이터의 양
        • 데이터 복잡도
        • 분석의 속도
        • 분석 복잡도
        • 정확도, 정밀도
          • 정확도 : 모델과 실제 값 간의 차이
          • 정밀도 : 반복적으로 모델을 사용했을 때 모델 값들의 편차 수준
    • 분석 과제 관리 방안
      • 통합, 이해관계자, 범위, 자원, 시간, 원가, 리스크, 품질, 조달, 의사소통