일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #패스트캠퍼스데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원 '데이터분석 부트
- 패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- #데이터분석가 #DataAnalyst #SQL #프로젝트 #취준생
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #패스트캠퍼스데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- Today
- Total
STUDY-LOG
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 1주차 본문
📍 DAY_1 Orientation
🙋🏻♀️데이터분석 부트캠프의 첫날은 OT✨로 진행되었다.
5개월 가량의 긴 시간들에 대한
전반적인 진행사항과과정 내용
출석체크 등 공지사항에 대해 소개하는 알찬 3시간이었다.
세션 마지막 즈음에는 매니저님께서 랜덤으로 조를 나누어주셔서
배정된 조끼리 서로를 알아가는 어색하고도재밌는(?)😂
아이스브레이킹 시간이 있었는데
10문10답을 통해 서로를 파악한 뒤
다같이 모였을 때 상대방을 소개하는 시간이었다.
부트캠프 기간에 진행되는 4번의 프로젝트가
모두 팀으로 진행되는 만큼
함께하는 수강생들과의 네트워킹이 중요한데
미리 친숙해지는 시간이었다.
BDA 11기 OT
✔OT 시간: 12:50pm ~ 4:00pm 대략 3시간 진행됨
✔진행방법: ZOOM을 통한 비대면 스트리밍
📢 출석체크
- QR 출석 체크
- ZOOM 출석 체크
📢 수업진행방식
- 실시간 강의
- 온라인 강의
- Quiz/Peer Session/기타활동
- 4번의 프로젝트
📢 커리큘럼
- Excel
- Python
- SQL
- Tableau
📍 Big Data 이해 & Data Literacy 함양하기 - 오수은 강사님
🙋🏻♀️ 빅데이터에 대한 이해와 데이터 분석가 / 데이터 사이언티스트가 대체적으로
어떤 일을 하고 어떤 분야에서 활동하는지에 대해 알아보는 시간.
강사님께서 현직자로써 데이터분석가가 되고 싶은 수강생들에게
혼자 데이터 분석을 공부할 때 좋은 책, 참고하면 좋은 링크들을 추천해주셨고
또한 채용공고들의 Job Description을 많이 보라고 조언해주셨다👍
< 빅데이터 분석 >
: 대량의 데이터를 분석하여 비지니스 가치가 있는 정보를 추출하는 것
- 데이터 관점: volume, velocity, variety
- 통계 관점: 통계/마이닝 모형 관점
- 기술 관점: 빅데이터 처리 및 분석 기술
- 비지니스 관점: 빅데이터 기반의 새로운 value 창출
< 데이터 분석가 (Data Analyst) >
: 데이터 분석가는 보유한 데이터를 통해 문제를 정의하고, 기술을 접목하여 문제를 해결하는 사람
- Product Analst
- Business Analyst
- Performance Marketer
- CRM Marketer
- Data Scientist
< 데이터 분석 Tool >
- Python
- R
- Excel
- SQL
- Tableau
- Power BI
- Google Analytics
📍 Excel로 하는 데이터분석 - 이동훈 강사님
🙋🏻♀️ 오늘은 온라인 강의를 듣는 날이었다.
패스트캠퍼스에서 제공하는 온라인 강의 - Excel 편을 수강하기만하면
오늘의 임무는 완료!라고 생각했다 처음엔...ㅎ
엑셀을 제대로 배워본적은 없지만 기본적인 함수들과 단축키 정도는
다룰줄 아는 상태였고 그래프 또한 자유자재로 그릴 줄 안다고 생각했는데
실습을 통해 내 실력이 바닥임을 증명했댜,,
또한 강사님 말씀이 너무 빨라서 강의 수강 중에 일시정지를 얼마나 했는지 모른다ㅋㅋㅋㅋㅋㅋ
웬만하면 온라인 강의를 들을 때 배속을 1.5x 또는 1.75x로 듣는 난데
이번 강사님은 정배속으로해도 갈수록 말이 빨라지셔서
0.8x으로 해둬야 들을정도였으니😂 (그래도 강의실력은 좋아요!!👍👍)
Excel 함수
✔ COUNT 함수
- COUNT( ): 특정 범위에서 숫자 데이터가 들어가 있는 셀의 개수 파악
- COUNTA( ): 특정 범위에서 데이터가 들어가 있는 셀 (비어 있지 않은 셀)의 개수 파악
- COUNTBLANK( ): 특정 범위에서 비어있는 셀의 개수 파악
- COUNTIF( ): 특정 범위에서 하나의 조건을 만족하는 셀의 개수 파악
- COUNTIF(C5:C12, "A") ⇒ C5:C12 범위 내에서 A가 몇 개 인지 파악
- COUNTIF(C5:C12, ">=5") ⇒ C5:C12 범위 내에서 5 이상인 숫자 개수 파악
- COUNTIFS( ): 특정 범위에서 2개 이상의 조건을 동시에 만족하는 셀의 개수 파악
- COUNTIFS( J55:J62, “>5”, J55:J62, "<8") ⇒ 범위1에서 조건1, 범위2에서 조건2
✔ VLOOKUP 함수
- VLOOKUP( ): 공통 기준 열을 기준(vertical)으로 n번째 있는 데이터를 찾아 오는 함수
- VLOOKUP( 찾을기준 데이터, 원래 데이터 범위, 불러올 데이터 열 번호, 0/1)
- 방대하고 다양한 데이터에서 내가 원하는 데이터를 불러오는게 업무의 시작이기 때문에 많이 사용함 => HLOOKUP보다 VLOOKUP이 많이 사용되는 이유는 인간이 데이터를 “열, Column” 별로 정리하기 때문
- VLOOKUP( ) 조건
- 현재 작성 중인 표와 원래 데이터 간의 공통 기준 열이 있어야 함
- 내가 불러오고자 하는 데이터가 원래 데이터의 공통 기준 열 오른쪽에 있어야 함
- 공통 기준 열에 중복된 데이터가 없어야 함
- VLOOKUP( ) 원리
- 원래 데이터의 공통 기준열을 1열이라고 가정하고 n번째 있는 열의 데이터를 불러옴
- MATCH 함수를 VLOOKUP의 불러올 데이터 열 번호에 이용하기
- MATCH( ): 내가 찾고 싶은 값이 한 행/열에서 몇 번째 있는지를 숫자로 알려줌
⇒ 결과가 반드시 숫자(몇 번째인지) - MATCH(lookup_value , loopup_array , [match type] )
- lookup value: 내가 찾고 싶은 값
- lookup array: 내가 찾고 싶은 값이 포함된 단일 열 또는 행 범위
- [match type]: 정확히 일치하는 값 or 근사치 여부
- MATCH( ): 내가 찾고 싶은 값이 한 행/열에서 몇 번째 있는지를 숫자로 알려줌
- VLOOKUP 함수를 사용할 때,
기준 열에 중복 값이 있을 경우 가장 위에 있는데이터의 정보만 불러옴
⇒ 중복 값이 없는 새로운 기준 열을 생성해 VLOOKUP 함수 사용
✔ SUMIF(S) 함수
- SUMIF( ): 특정 조건에 맞는 데이터들의 합계 계산
- SUMIF(더할 조건들의 범위, 조건, 더할 값들의 범위)
- SUMIFS( ): 2개 이상의 조건을 동시에 만족하는 데이터들의 합계 계산
- SUMIF(더할 값들의 범위, 조건범위1, 조건1, 조건범위2, 조건2)
- SUMIFS 함수는 조건이 1개일 때도, 2개 이상일 때도 사용가능
👉 SUMIFS를 사용하는 것이 더 편리
✔ FIND/SEARCH 함수
- FIND( ): 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력
- 띄어쓰기 까지 포함하여 문자를 세며 대소문자를 구분
- FIND(찾을 텍스트, 긴텍스트위치, 문자열 찾을 시작 위치)
- FIND() 함수로 특정 단어 포함 여부 파악 가능
→ 숫자가 나오면 특정 단어 포함, 오류가 나면 포함X로 해석
- SEARCH( ): 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력
- 띄어쓰기 까지 포함해서 문자를 세며 대소문자를 구분하지 않음
✔ LEFT / MID / RIGHT 함수
- FIND, SEARCH 함수와 함께 활용
- LEFT( )/RIGHT( ): 텍스트의 가장 왼쪽/오른쪽부터 원하는 문자열까지 추출
- LEFT(전체 텍스트, 불러올 문자열 수)
- RIGHT(전체 텍스트, 불러올 문자열 수)
- MID( ): 텍스트의 중간시작 위치부터 원하는 문자열까지 추출
- MID(전체 텍스트, 불러올 문자열의 시작 위치, 불러올 문자열 수)
🙋🏻♀️데이터사이언스를 전공하신 "Itsyourpathway" 대표님이자
데이터분석 강사님이신 이동훈 강사님께서 Excel 기초 강의를 담당해주셨다.
3일차에 온라인 강의로 이미 Excel 기초에 대해 수강했던 터라 비교적
오늘 강의는 어렵지 않게 따라갈 수 있었다.
분명 어제 온라인 강의에서 본 이동훈 강사님은 말씀이 너무 빠르셔서
오늘 실시간 강의에서도 말을 빨리 하여 수업을 따라가는데 힘이 들지 않을까 걱정했는데
많은 인원의 수강생들과 우리 모두가 초보임을 고려해주셔서 천천히 말씀하셨다🤣
강의를 마치고 느낀점은 얻게 된 것이 아주 많은 4일차 부트캠프!!라는것
데이터 분석 Data Analysis
- 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로
데이터를 정리, 변환, 모델링하는 과정이다. - 데이터 분석은 여러 면과 접근 방식이 있고, 다양한 이름의 다양한 기술을 아우르며
각기 다른 비지니스, 과학, 사회과학 분야에 사용된다. - 오늘날 비지니스 부문에서 데이터 분석은 의사 결정을 더 과학적으로 만들어주고
비지니스를 더 효율적으로 운영할 수 있도록 도와주는 역할을 한다. - 목적: 다양한 데이터 → 분석 기법 활용 → 문제 발견 → 원인 파악 → 해결 방안 모색 > 인사이트 도출 (Insight = long term lessons)
< 데이터 사이언스 >
- 수학, 통계학, 컴퓨터 공학 및 다양한 학문 비지니스 분야가 융합된 학문이므로
데이터 사이언티스트에게도 다양한 분야의 지식과 경험이 반드시 필요 - Data Scientists (DS) ⇒ 주업무가 데이터 분석
- Citizen Data Scientists (CDS) ⇒ 데이터 분석을 할 수 있는 직무/산업 전문가, 다른 주 업무에 데이터 분석을 활용
< 데이터 분석 프로세스 이해 >
Excel의 기본 활용
업에서 가장 많이 활용되는 tool은 단연 Excel이라고 할 수 있다.
엑셀의 기초1: 엑셀의 모든 셀에는 서식이 적용되어 있다
- 엑셀의 모든 셀에는 서식이 적용되어 있으므로 Ctrl + C/V 를 하면 값이나
수식 뿐만 아니라 복사한 셀의 서식도 붙여 넣은 셀에 모두 적용됨 - 수식/값/서식을 각각 따로 붙여 넣어야 함
엑셀의 기초2: 함수를 사용하는 상황에 따라 각각의 참조를 적절히 사용해야 함
- 상대참조 =SUM(C5:C12)
- 절대참조 =SUM($C$5:$C$12)
- 혼합참조1 =SUM(C$5:C$12) 행고정, 좌우로 움직임
- 혼합참조2 =SUM($C5:$C12) 열고정, 위아래로 움직임
탐색적 데이터 분석
- 기존의 통계학이 정보의 추출 과정에서 가설 검정 등에 치우쳐
자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어,
이를 보완하고자 주어진 자료만 가지고도 충분한 정보를
찾을 수 있도록 하는 자료 분석 방법
- 수행해야하는 이유
- 내 입맛대로 수집되는 데이터는 1도 없다
- 수집된 데이터의 특성 및 분포를 파악해야 한다
- 결측치, 이상치의 존재 유무를 파악할 수 있다
- 탐색적 데이터 분석의 결과를 바탕으로 분석에 필요한 데이터 전처리를 수행할 수 있다
- 가장 적합한 분석 방법을 결정할 수 있다
- Pivot Table
- 엑셀에서 raw 데이터를 요약하는 통계표
- 복잡한 데이터에서 어떤 요약 통계표를 만들어야 하는지
스스로가 명확하지 않기 때문에 피벗 테이블이 어려움
⇒💡만들어야 하는 피벗테이블을 손으로 그려보고 따라 그리기 - 행과 열, 그리고 값을 정하는 것이 피벗 테이블의 90% !!
'데이터분석 부트캠프 > 학습일지' 카테고리의 다른 글
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 8-10주차 (0) | 2023.12.29 |
---|---|
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 6-7주차 (0) | 2023.12.07 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 4주차 (0) | 2023.11.17 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 3주차 (0) | 2023.11.06 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 2주차 (1) | 2023.11.03 |