1. 빅데이터의 가치와 영향

 

🔷빅데이터의 가치

 

⚫빅데이터 가치 산정이 어려운 이유

① 데이터 활용 방식 : 빅데이터의 재사용이나 재조합, 다목적용 데이터 등 어떻게 활용하는지 알 수 없게 되었기 때문에

② 가치 창출 방식 : 기존에 없던 새로운 가치를 창출함에 따라 그 가치를 산정하기 어려움

③ 분석 기술의 발전 : 기술 발전으로 가치있는 데이터와 없는데이터 경계 나누기 어려워짐

④ 데이터 수집 원가 : 데이터는 달성하려는 목적에 따라 수집하거나 가공하는 비용에 상황에 따라 달라질 수 있어 가치 측정 어려움

 

 

⚫빅데이터의 영향

기업 -  소비자의 행동을 분석하고 시장 변동을 예측해 비즈니스 모델을 혁신하거나 신사업을 발굴

정부 -  사회 변화를 추정하여 관련 정보 추출

개인 -  빅데이터를 서비스 하는 기업이 많아지고 데이터 분석 비용은 지속적으로 하락하여 활용 용이

 

빅데이터 가치가 만들어내는 5가지 방식 (맥킨지 빅데이터 보고서)

  • 운영 효율성 향상
  • 신제품 개발 및 혁신
  • 고객 경험 향상
  • 예측 및 위험 관리
  • 마케팅 및 판매 전략 최적화

 

(●'◡'●)

빅데이터 경영혁신의 4단계

 

생산성 향상 → 발견에 의한 문제해결 → 의사결졍 향상 → 새로운 고객가치와 비즈니스 창출

 

 

🔷 빅데이터와 비즈니스 모델

 

❤️빅데이터 활용에 필요한 3요소❤️

- 데이터(자원)

- 기술

- 인력

 

 

자원 예) 빅데이터

기술 예) 빅데이터플랫폼, AI

인력 예) 알고리즈미스트, 데이터사이언티스트

 

❤️빅데이터 7가지 활용 기본 테크닉 ❤️

연관규칙학습 변인들 간 주목할 만한 상관관계가 있는지 찾아내는 방법 ♦️ A를 구매한 사람이 B를 더 많이 사는가?
♦️  장바구나 분석
♦️ 상품추천
유형분석 문서를 분류하거나 조직을 그룹화할 때 사용 ♦️ 이것은 어떤 특성을 가진 집단에 속하는가?
유전 알고리즘 최적화가 필요한 문제를 생물진화의 과정을 모방하여 점진적으로 해결책을 찾는 방법 ♦️ 시청률을 최고치로 하기 위해 어떤 프로그램을 어떤 시간에 방송해야 하는가?
♦️ 응급실에서 의사를 어떻게 배치하는 것이 효율적인가?
기계학습
(머신러닝)
데이터로부터 학습한 알려진 특성을 활용하여 예측 ♦️ 시청기록을 바탕으로 어떤 영화를 가장 보고 싶어하는가?
회귀분석 독립변수가 종속변수에 미치는 영향을 분석할 때 사용 ♦️ 경력과 학력이 연봉에 미치는 영향은?
감정분석 특정 주제에 말을 하거나 글을 쓴 사람의 감정을 분석 ♦️ 새로운 할인 정책에 대한 고객의 평은 어떤가?
소셜네트위크 특정인과 다른 사람의 관계를 파악하고 영향력 있는 사람을 분석할 때 사용 ♦️ 이 사람은 어느 정도 영향력 있는 인플루언서인가?

 

 

 

(●'◡'●)

텍스트 마이닝 용어

스태밍(stamming)  : 단어의 어원 찾는 작업
코퍼스(Corpus) :  말뭉치, 단어 혹은 문장을 보유한 저장소
토큰화(Tokenization) :  단어들을 나누는 작업
임베딩(Embedding) : 토큰화가 수행된 다어 집합에 대해서 벡터로 변환 작업

 

 

소셜 네트워크 분석 요소

연결중심성
정점 중심성(Degree Centrality)
연결된 노드들의 수의 합
근접 중심성 노드 사이의 거리를 기반으로 측정한 척도
매개 중심성 노드가 다른 노드 간의 경로에 위치하는 빈도
아이겐벡터 중심성
고유벡터 중심성(Eigenvector Centrality)
네트워크 내의 노드와 다른 벡터의 중심성과 가중치를 활용하여 계산하는 방식으로, 연결된 노드들이 네트워크 내에서 얼마나 중요한지 파악하는 지표

 

 

🔷 빅데이터의 위기 요인과 통제 방안

위기요인 통제방안
① 사생활 침해 '동의'에서 '책임'으로
② 책임 원칙 훼손 결과 기반 책임 원칙 고수
③ 데이터 오용 알고리즘 접근 허용

,

 

 

(●'◡'●)

개인정보 비식별 기술

 

데이터 마스킹

가명처리

총계처리

데이터 삭제

데이터 범주화

 

 

미연방거래위원회(FTC)의 소비자 프라이버시 보호 3대 권고 사항

1. 기업은 상품 개발 단계에서 부터 프라이버시 보호 방안을 적용

2. 기업은 소비자에게 공유정보 선택 옵션을 제공

3. 소비자에게 수집된 정보 내용 공개 및 접근권 부여

 

 

 

 

 

 

 

 

 

 

[참고 도서]

출처 :

이지패스 2024 ADsP 데이터분석 준전문가

2024 이기적 빅데이터분석기사 필기 기본서

2024 최단기 빅데이터 분석기사 필기: 이론편