STUDY-LOG

[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 1주차 본문

데이터분석 부트캠프/학습일지

[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 1주차

dyo_33 2023. 10. 26. 18:49

📍 DAY_1 Orientation

 

더보기

🙋🏻‍♀️데이터분석 부트캠프의 첫날은 OT✨로 진행되었다.

5개월 가량의 긴 시간들에 대한

전반적인 진행사항과과정 내용

출석체크 등 공지사항에 대해 소개하는 알찬 3시간이었다.

 

세션 마지막 즈음에는 매니저님께서 랜덤으로 조를 나누어주셔서

배정된 조끼리 서로를 알아가는 어색하고도재밌는(?)😂

아이스브레이킹 시간이 있었는데

1010답을 통해 서로를 파악한 뒤

다같이 모였을 때 상대방을 소개하는 시간이었다.

 

부트캠프 기간에 진행되는 4번의 프로젝트가

모두 팀으로 진행되는 만큼

함께하는 수강생들과의 네트워킹이 중요한데

미리 친숙해지는 시간이었다.

 

 

 
 

BDA 11기 OT

 

✔OT 시간: 12:50pm ~ 4:00pm 대략 3시간 진행됨

✔진행방법: ZOOM을 통한 비대면 스트리밍

 

📢 출석체크

  • QR 출석 체크 
  • ZOOM 출석 체크

 

📢 수업진행방식

  • 실시간 강의
  • 온라인 강의
  • Quiz/Peer Session/기타활동
  • 4번의 프로젝트

 

📢  커리큘럼

  • Excel
  • Python
  • SQL
  • Tableau

 

 

 


 

 

📍 Big Data 이해 & Data Literacy 함양하기 - 오수은 강사님

 

더보기

🙋🏻‍♀️ 빅데이터에 대한 이해와 데이터 분석가 / 데이터 사이언티스트가 대체적으로

어떤 일을 하고 어떤 분야에서 활동하는지에 대해 알아보는 시간.

 

강사님께서 현직자로써 데이터분석가가 되고 싶은 수강생들에게

혼자 데이터 분석을 공부할 때 좋은 책, 참고하면 좋은 링크들을 추천해주셨고

또한 채용공고들의 Job Description을 많이 보라고 조언해주셨다👍

 

< 빅데이터 분석 >

: 대량의 데이터를 분석하여 비지니스 가치가 있는 정보를 추출하는 것

  • 데이터 관점: volume, velocity, variety
  • 통계 관점: 통계/마이닝 모형 관점
  • 기술 관점: 빅데이터 처리 및 분석 기술
  • 비지니스 관점: 빅데이터 기반의 새로운 value 창출

 

< 데이터 분석가 (Data Analyst) >

: 데이터 분석가는 보유한 데이터를 통해 문제를 정의하고, 기술을 접목하여 문제를 해결하는 사람

  • Product Analst
  • Business Analyst
  • Performance Marketer
  • CRM Marketer
  • Data Scientist

 

< 데이터 분석 Tool >

  • Python
  • R
  • Excel
  • SQL
  • Tableau
  • Power BI
  • Google Analytics

 

 

 

 


 

 

📍 Excel로 하는 데이터분석 - 이동훈 강사님

 

더보기

🙋🏻‍♀️ 오늘은 온라인 강의를 듣는 날이었다. 

패스트캠퍼스에서 제공하는 온라인 강의 - Excel 편을 수강하기만하면

오늘의 임무는 완료!라고 생각했다 처음엔...ㅎ

 

엑셀을 제대로 배워본적은 없지만 기본적인 함수들과 단축키 정도는

다룰줄 아는 상태였고 그래프 또한 자유자재로 그릴 줄 안다고 생각했는데

실습을 통해 내 실력이 바닥임을 증명했댜,,

 

또한 강사님 말씀이 너무 빨라서 강의 수강 중에 일시정지를 얼마나 했는지 모른다ㅋㅋㅋㅋㅋㅋ

웬만하면 온라인 강의를 들을 때 배속을 1.5x 또는 1.75x로 듣는 난데

이번 강사님은 정배속으로해도 갈수록 말이 빨라지셔서

0.8x으로 해둬야 들을정도였으니😂 (그래도 강의실력은 좋아요!!👍👍)

 

Excel 함수

 

COUNT 함수 

  • COUNT( ): 특정 범위에서 숫자 데이터가 들어가 있는 셀의 개수 파악
  • COUNTA( ): 특정 범위에서 데이터가 들어가 있는 (비어 있지 않은 셀)의 개수 파악
  • COUNTBLANK( ): 특정 범위에서 비어있는 셀의 개수 파악
  • COUNTIF( ): 특정 범위에서 하나의 조건을 만족하는 셀의 개수 파악
    • COUNTIF(C5:C12, "A")  ⇒ C5:C12 범위 내에서 A가 몇 개 인지 파악
    • COUNTIF(C5:C12, ">=5")  C5:C12 범위 내에서 5 이상인 숫자 개수 파악
  • COUNTIFS( ): 특정 범위에서 2개 이상의 조건을 동시에 만족하는 셀의 개수 파악
    • COUNTIFS( J55:J62, “>5”, J55:J62, "<8")  ⇒  범위1에서 조건1, 범위2에서 조건2

 


 

VLOOKUP 함수 

  • VLOOKUP( ): 공통 기준 열을 기준(vertical)으로 n번째 있는 데이터를 찾아 오는 함수
    • VLOOKUP( 찾을기준 데이터, 원래 데이터 범위, 불러올 데이터 열 번호, 0/1)
    • 방대하고 다양한 데이터에서 내가 원하는 데이터를 불러오는게 업무의 시작이기 때문에 많이 사용함 => HLOOKUP보다 VLOOKUP이 많이 사용되는 이유는 인간이 데이터를 “, Column” 별로 정리하기 때문
  • VLOOKUP( ) 조건
    • 현재 작성 중인 표와 원래 데이터 간의 공통 기준 열이 있어야 함
    • 내가 불러오고자 하는 데이터가 원래 데이터의 공통 기준 열 오른쪽에 있어야 함
    • 공통 기준 열에 중복된 데이터가 없어야 함

 

  • VLOOKUP( ) 원리
    • 원래 데이터의 공통 기준열을 1열이라고 가정하고 n번째 있는 열의 데이터를 불러옴

 

  • MATCH 함수를  VLOOKUP의 불러올 데이터 열 번호에 이용하기
    • MATCH( ): 내가 찾고 싶은 값이 한 행/열에서 몇 번째 있는지를 숫자로 알려줌
      ⇒ 결과가 반드시 숫자(몇 번째인지)
    • MATCH(lookup_value , loopup_array , [match type] )
      • lookup value: 내가 찾고 싶은 값
      • lookup array: 내가 찾고 싶은 값이 포함된 단일 열 또는 행 범위
      • [match type]: 정확히 일치하는 값 or 근사치 여부

 

  • VLOOKUP 함수를 사용할 때,
    기준 열에 중복 값이 있을 경우 가장 위에 있는데이터의 정보만 불러옴
    ⇒ 중복 값이 없는 새로운 기준 열을 생성해 VLOOKUP 함수 사용

 


 

SUMIF(S) 함수 

  • SUMIF( ): 특정 조건에 맞는 데이터들의 합계 계산 
    • SUMIF(더할 조건들의 범위, 조건, 더할 값들의 범위)   
  • SUMIFS( ): 2개 이상의 조건을 동시에 만족하는 데이터들의 합계 계산 
    • SUMIF(더할 값들의 범위, 조건범위1, 조건1, 조건범위2, 조건2)  
    •  SUMIFS 함수는 조건이 1개일 때도, 2개 이상일 때도 사용가능
      👉 SUMIFS를 사용하는 것이 더 편리

 


 

FIND/SEARCH 함수 

  • FIND( ): 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력
    • 띄어쓰기 까지 포함하여 문자를 세며 대소문자를 구분
    • FIND(찾을 텍스트, 긴텍스트위치, 문자열 찾을 시작 위치)
    • FIND() 함수로 특정 단어 포함 여부 파악 가능
      → 숫자가 나오면 특정 단어 포함, 오류가 나면 포함X로 해석

 

  • SEARCH( ): 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력
    • 띄어쓰기 까지 포함해서 문자를 세며 대소문자를 구분하지 않음

 

 


 

LEFT / MID / RIGHT 함수 

  • FIND, SEARCH 함수와 함께 활용
  • LEFT( )/RIGHT( ): 텍스트의 가장 왼쪽/오른쪽부터 원하는 문자열까지 추출
    • LEFT(전체 텍스트, 불러올 문자열 수)
    • RIGHT(전체 텍스트, 불러올 문자열 수)

 

  • MID( ): 텍스트의 중간시작 위치부터 원하는 문자열까지 추출
    • MID(전체 텍스트, 불러올 문자열의 시작 위치, 불러올 문자열 수)  

 

 


 

 

더보기

🙋🏻‍♀️데이터사이언스를 전공하신 "Itsyourpathway" 대표님이자

데이터분석 강사님이신 이동훈 강사님께서 Excel 기초 강의를 담당해주셨다.

3일차에 온라인 강의로 이미 Excel 기초에 대해 수강했던 터라 비교적

오늘 강의는 어렵지 않게 따라갈 수 있었다. 

 

분명 어제 온라인 강의에서 본 이동훈 강사님은 말씀이 너무 빠르셔서

오늘 실시간 강의에서도 말을 빨리 하여 수업을 따라가는데 힘이 들지 않을까 걱정했는데

많은 인원의 수강생들과 우리 모두가 초보임을 고려해주셔서 천천히 말씀하셨다🤣

 

강의를 마치고 느낀점은 얻게 된 것이 아주 많은 4일차 부트캠프!!라는것

 

 

 

데이터 분석 Data Analysis

 

  • 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표
    데이터를 정리, 변환, 모델링하는 과정이다.
  • 데이터 분석은 여러 면과 접근 방식이 있고, 다양한 이름의 다양한 기술을 아우르며
    각기 다른 비지니스, 과학, 사회과학 분야에 사용된다.
  • 오늘날 비지니스 부문에서 데이터 분석은 의사 결정을 더 과학적으로 만들어주고
    비지니스를 더 효율적으로 운영할 수 있도록 도와주는 역할을 한다.
  • 목적: 다양한 데이터 → 분석 기법 활용 → 문제 발견 → 원인 파악 → 해결 방안 모색 > 인사이트 도출 (Insight = long term lessons)

 

< 데이터 사이언스 >

  • 수학, 통계학, 컴퓨터 공학 및 다양한 학문 비지니스 분야가 융합된 학문이므로
    데이터 사이언티스트에게도 다양한 분야의 지식과 경험이 반드시 필요
  • Data Scientists (DS) ⇒ 주업무가 데이터 분석
  • Citizen Data Scientists (CDS) ⇒ 데이터 분석을 할 수 있는 직무/산업 전문가, 다른 주 업무에 데이터 분석을 활용

 

 

< 데이터 분석 프로세스 이해 >

데이터 분석 프로세스

 

 


 

 

Excel의 기본 활용

 

업에서 가장 많이 활용되는 tool은 단연 Excel이라고 할 수 있다.

 

 

엑셀의 기초1: 엑셀의 모든 셀에는 서식이 적용되어 있다

  • 엑셀의 모든 셀에는 서식이 적용되어 있으므로 Ctrl + C/V 를 하면 값이나
    수식 뿐만 아니라 복사한 셀의 서식도 붙여 넣은 셀에 모두 적용
  • 수식/값/서식을 각각 따로 붙여 넣어야 함

 

엑셀의 기초2: 함수를 사용하는 상황에 따라 각각의 참조를 적절히 사용해야 함

  • 상대참조  =SUM(C5:C12)
  • 절대참조  =SUM($C$5:$C$12) 
  • 혼합참조1  =SUM(C$5:C$12)  행고정, 좌우로 움직임 
  • 혼합참조2  =SUM($C5:$C12)   열고정, 위아래로 움직임

 

 


 

 

탐색적 데이터 분석

  • 기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐
    자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어,
    이를 보완하고자 주어진 자료만 가지고도 충분한 정보를
    찾을 수 있도록 하는 자료 분석 방법

 

  • 수행해야하는 이유
    • 내 입맛대로 수집되는 데이터는 1도 없다
    • 수집된 데이터의 특성 및 분포를 파악해야 한다
    • 결측치, 이상치의 존재 유무를 파악할 수 있다
    • 탐색적 데이터 분석의 결과를 바탕으로 분석에 필요한 데이터 전처리를 수행할 수 있다
    • 가장 적합한 분석 방법을 결정할 수 있다
    즉, 탐색적 데이터 분석을 잘 수행해야 전반적인 데이터 분석 또한 잘 수행할 수 있다

 

  • Pivot Table
    • 엑셀에서 raw 데이터를 요약하는 통계표
    • 복잡한 데이터에서 어떤 요약 통계표를 만들어야 하는지
      스스로가 명확하지 않기 때문에 피벗 테이블이 어려움
      💡만들어야 하는 피벗테이블을 손으로 그려보고 따라 그리기
    • 행과 열, 그리고 값을 정하는 것이 피벗 테이블의 90% !!