본문 바로가기
자격증 공부/ADSP

01. [ADSP 1과목] 데이터 이해

by 망고 ෆ 2024. 7. 20.

 

본 게시글은 위 영상을 토대로 작성하였습니다.

 

 

Ch1. 데이터 이해

1. 데이터란?

  • 상호관계 속에서 가치를 갖는 것!!
  • 객관적 사실
  • 추론, 예측, 전망, 추정을 위한 근거로 기능

 

 

2. 데이터의 유형

  1) 정성적 데이터

  • 언어, 문자로 기술
  • ex) 설문조사의 주관식 응답

 

  2) 정량적 데이터

  • 수치, 기호, 도형으로 표시
  • ex) 지역별 온도, 풍속, 강우량

 

 

3. 암묵지 & 형식지

  1) 암묵지 

  • 공유되기 어려움
  • 학습, 체험을 통해 개인에게 습득

 

  2) 형식지

  • 전달 및 공유 용이
  • 공식적, 체계적인 언어로 전달 가능 (문서화 되어있음)

 

  3) 지식경영

    " 개인의 암묵지와 집단의 형식지가 상호작용 → 생성, 발전, 전환되는 지식의 발전을 기반으로 하는 기업의 경영 "

   암묵지 ↔ 형식지 전환 방법

   " 공 표 연 내 "

   1단계) 공통화 (암-암): 암묵적 지식 노하우를 다른 사람에게 공유

   2단계) 표출화 (암-형) : 암묵적 지식 노하우를 형식지로 만듦

   3단계) 연결화 (형-형) : 책/교본에 자신의 새로운 지식을 추가

   4단계) 내면화 (형-암) : 만들어진 책/교본을 보고 다른 사람들이 암묵적 지식 습득

 

 

 

4. DIKW 피라미드 🌟

: 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정!

" 데이터 → 정보 → 지식 → 지혜 "

  • 데이터 : 다른 데이터와 상관관계가 없는 가공 전의 수치, 기호 형태
  • 정보 : 데이터 가공 & 상관/연관 관계 속에서 의미 도출된 상태
  • 지식 : 상호 연결된 정보 패턴을 통해 예측한 결과물
  • 지혜 : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 아이디어

 

 

5. 데이터베이스

   1) 데이터베이스란?

: 저장, 검색할 수 있는 복합체 (정형 & 비정형 모두 포함)

 

   2) 데이터베이스 특징

   " 통합, 저장, 공용, 변화되는 데이터 "

  • 통합 (Integreted) : 데이터 중복 X
  • 저장 (Stored) : 저장 매체에 저장
  • 공용 데이터 (Shared) : 여러 사용자가 데이터를 공동으로 이용
  • 변화되는 데이터 (Changed) : 새로운 데이터 추가, 삭제, 갱신 → 항상 변화하면서도 항상 현재의 정확한 데이터 유지

 

   3) 데이터베이스 특징

  • 관계형 데이터베이스 : 테이블(Table, Relation), 행(row, Tuple), 열(column, Attribute)
  • 도메인 : 하나의 속성이 취할 수 있는 같은 타입의 원자 값들의 합
  • 카디날리티 : 릴레이션에 포함된 튜플의 개수
  • 인스턴스 : 튜플의 묶음

 

   4) DD, ERD

  • DD (Data Dictionary)
    • 자료에 관한 정보를 모아 두는 저장소
    • 자료의 이름, 표현 방식, 자료의 의미와 사용 방식, 다른 자료와의 관계 저장
  • ERD (Entity Relationship Diagram)
    • 실체와 이들의 관계를 도형으로 표현한 것

 

   5) SQL 

  • DDL : 데이터 정의 언어    ex) CREATE, ALTER, DROP, RENAME, TRUNCATE
  • DML : 데이터 처리 언어    ex) SELECT, INSERT, UPDATE, DELETE
  • DCL : 데이터 제어 언어     ex) GRANT, REVOKE
  • TCL : 도구 명령 언어         ex) COMMIT, REVOKE, SAVEPOINT

 

   6) 메타데이터 🌟

  • 데이터에 관한 데이터 (데이터의 특성, 구조, 의미 등 데이터를 설명하는 데이터)
  • 데이터를 분석하고 관리하는데 도움이 되는 유용한 정보 담음

 

    7) 데이터베이스 설계 절차

    " 요구조건 분석 → 개념적 설계 → 논리적 설계 → 물리적 설계 "

 

 

6. DBMS

   1) 정의

       사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 처리하고 데이터베이스를 관리해주는 소프트웨어

 

   2) 종류

   ** 각각의 예시들 구분!!

  • RDMS
    • 관계형 데이터베이스 관리 시스템
    • 정형화된 테이블로 구성된 데이터 항목들의 집합체
    • ex) Oracle Database, MySQL, Microsoft SQL Server, PostgreSQL, IBM DB2
  • ODBMS
    • 객체 지향 데이터베이스 관리 시스템
    • 복잡한 데이터 구조를 표현, 관리하는 DBMS
    • ex) ObjectDB, db4o
  • NoSQL
    • RDBMS보다 덜 제한적인 일관성 모델 제공
    • 디자인 단순화, 수평적 확장성, 세세한 통제 등
    • ex) MongoDB, Apache HBase, Redis, Apache Cassandra

 

 

7. 시대별 기업 내부 데이터베이스 솔루션 🌟🌟

1980년대 : OLTP, OLAP,  2000년대 : CRM, SCM

[1980년대]

" OLTP는 실시간 거래 데이터 처리 & OLAP는 대량의 데이터에 대한 복잡한 분석과 보고 지원 "

   1) OLTP

  • On-Line Transaction Processing (온라인 거래 처리)
  • 주 컴퓨터와 복수 사용자 단말 사이에 트랜잭션 발생 → 주 컴퓨터에서 처리 → 결과를 사용자에게 돌려 보내줌
  • ex) 상품주문, 회원 정보 수정, 은행 거래, 항공편 예약

 

   2) OLAP

  • On-Line Analytical Processing (온라인 분석 처리)
  • 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 제공할 수 있는 기술
  • 다차원의 데이터를 대화식 질의를 통해 분석
  • ex) 10년간 A사의 직급별 임금 상승률

 

[2000년대]

" CRM 고객에 대한 관리, SCM은 물류 공급에 대한 관리 "

   1) CRM

  • Customer Relationship Management
  • 고객별 구매 이력 데이터베이스 분석 → 고객에 대한 이해각종 마케팅 전략을 통해 이익 창출

 

   2) SCM

  • Supply Chain Management
  • 제조, 물류, 유통업체 등 유통공급망에 참여하는 모든 업체들이 협력을 바탕으로 정보기술을 활용, 재고 최적화

 

 

8. 분야별 기업 내부 데이터베이스 솔루션 (제조부문)

   1) Data Warehouse

  • 기업 내 의사결정 지원 애플리케이션을 위한 정보를 제공하는 하나의 통합된 데이터 저장 공간
  • 시간적 흐름에 따라 변화하는 값을 일정기간 유지
  • 특징 ⭐
    • 데이터 통합 : 일관된 형식으로 정의
    • 데이터 시계열 : 시간의 흐름에 따라 변화하는 값 저장
    • 데이터 주제 지향적 : 특정 주제에 따라 데이터들을 분류, 저장, 관리
    • 비소멸성 (비휘발성) : Batch 작업에 의한 갱신 이외에 변하지 않음 (아예 안변하는건 X)
  • ETL 
    • Extract (추출), Transform (변환), Load (적재)
    • 주기적으로 내부 및 외부 데이터베이스로부터 정보를 추출, 정해진 규약에 따라 정보 변환 후 적재

 

   2) Data Mart

  • Data Warehouse로부터 특정 주제, 부서 중심으로 구축된 소규모 단일 주제의 Data Warehouse
  • 특정 조직의 특정 업무 분야에 초점!!

 

   3) ERP

  • Enterprise Resource Planning
  • 주요 프로세스 관리를 돕는 여러 모듈로 구성된 통합 애플리케이션

 

   4) BI & BA

  • BI (Business Intelligence)
    • 기업의 Data Warehouse에 저장된 데이터에 접근해 경영의사결정에 필요한 정보 획득 후 활용
    • 데이터를 통합/분석 → 기업 활동에 연관된 의사결정을 돕는 프로세스
    • 하나의 특정 비즈니스 질문에 답변하도록 설계
    • 관련 키워드 : ad hoc report ( BI와 빅데이터 분석의 차이점을 표현)

 

  • BA (Business Analytics)
    • 경영 의사결정을 위한 통계적, 수학적 분석에 초점!
    • 사전에 예측 & 최적화 
    • BI보다 진보된 형태
    • 관련 키워드 : Optimization, Forecast, Insight

 

 

 

댓글