빅데이터분석기사 2회: Difference between revisions
From CS Wiki
No edit summary |
|||
Line 1: | Line 1: | ||
[[분류:자격증]] | [[분류:자격증]] | ||
* 상위문서: [[빅데이터분석기사]] | |||
*상위문서: [[빅데이터분석기사]] | |||
==일정== | ==일정== | ||
;2020년 말에 1회 시험이 치러질 예정이었으나, 코로나19로 인해 취소되고 2회부터 시행 | ;2020년 말에 1회 시험이 치러질 예정이었으나, 코로나19로 인해 취소되고 2회부터 시행 | ||
* 필기 시험: 2021.4.17(토) | |||
* 실기 시험: 2020.6.19(토) | *필기 시험: 2021.4.17(토) | ||
*실기 시험: 2020.6.19(토) | |||
==평가== | ==평가== | ||
Line 31: | Line 34: | ||
|- | |- | ||
!2 | !2 | ||
| | |[[딥 러닝|딥 러닝 개념]] | ||
|변수 선택 | |변수 선택 | ||
| | |[[인공 신경망|인공 신경망 개념]] | ||
| | |[[인공 신경망]]의 [[하이퍼파라미터]] | ||
|- | |- | ||
!3 | !3 | ||
|분석 프로세스 5단계 | |분석 프로세스 5단계 | ||
|학습데이터 imblanced | |학습데이터 imblanced | ||
|CNN 계산 | |[[CNN]] 계산 | ||
|scatter plot | |scatter plot | ||
|- | |- | ||
Line 50: | Line 52: | ||
|- | |- | ||
!5 | !5 | ||
|비식별화 처리기준 | |[[개인정보 비식별|비식별화 처리기준]] | ||
|불량률 계산 (조건부 확률) | |불량률 계산 (조건부 확률) | ||
|SVM | |[[서포트 벡터 머신|서포트벡터머신(SVM)]] | ||
|불균형 데이터셋 | |불균형 데이터셋 | ||
|- | |- | ||
!6 | !6 | ||
|비식별화 | |[[개인정보 비식별|비식별화 특징과 개념]] | ||
|정규확률 계산 | |정규확률 계산 | ||
|MDS(다차원 척도법) | |MDS(다차원 척도법) | ||
Line 71: | Line 73: | ||
|그래프 분석 | |그래프 분석 | ||
|모델링 절차 | |모델링 절차 | ||
|파라미터, 하이퍼파라미터 차이 | |[[하이퍼|파라미터, 하이퍼파라미터 차이]] | ||
|- | |- | ||
!9 | !9 | ||
Line 80: | Line 82: | ||
|- | |- | ||
!10 | !10 | ||
|정형데이터 품질 보증 | |[[데이터 품질 보증|정형데이터 품질 보증]] | ||
|병렬 차트 | |병렬 차트 | ||
|FP, TP계산 | |[[혼동 행렬|혼동 행렬 FP, TP계산]] | ||
|F1 스코어 | |[[F1 스코어]] | ||
|- | |- | ||
!11 | !11 | ||
| | |[[탐색적 데이터 분석|EDA 개념]] | ||
|Z-score 계산(p-value 이용) | |Z-score 계산(p-value 이용) | ||
|부스팅(GBM) | |부스팅(GBM) | ||
Line 99: | Line 101: | ||
!13 | !13 | ||
|진단 분석 | |진단 분석 | ||
| | |[[통계적 가설 검정 오류|1종 오류, 2종 오류]] | ||
|홀드아웃 | |홀드아웃 | ||
|인포그래픽 | |인포그래픽 | ||
|- | |- | ||
!14 | !14 | ||
|Outlier | |[[이상치|이상치(Outlier)]] | ||
|차원의 저주 | |차원의 저주 | ||
| | |비지도 학습 | ||
|모델 선택 방법 | |모델 선택 방법 | ||
|- | |- | ||
Line 117: | Line 119: | ||
!16 | !16 | ||
|분석 성숙도 | |분석 성숙도 | ||
| | |층화 추출 | ||
|군집 | |군집 | ||
|모형진단 | |모형진단 | ||
Line 129: | Line 131: | ||
!18 | !18 | ||
|Bottom-up 분석 | |Bottom-up 분석 | ||
|확률분포 ( | |확률분포 (포아송 포함) | ||
|비정형 | |[[비정형 데이터]] | ||
|시계열 | |시계열 | ||
|- | |- | ||
Line 136: | Line 138: | ||
|데이터 품질 평가 | |데이터 품질 평가 | ||
|확률분포 | |확률분포 | ||
|랜덤 포레스트 | |[[랜덤 포레스트]] | ||
|선형 회귀 | |선형 회귀 | ||
|- | |- | ||
!20 | !20 | ||
|데이터 거버넌스 | |[[데이터 거버넌스]] | ||
|t분포, z분포 | |t분포, z분포 | ||
|K-fold | |K-fold | ||
Line 146: | Line 148: | ||
|} | |} | ||
== 참고 문헌 == | ==참고 문헌== | ||
* [https://noti-note.tistory.com/36 빅데이터 분석기사 시험 후기 - 가답안 포함] | *[https://noti-note.tistory.com/36 빅데이터 분석기사 시험 후기 - 가답안 포함] |
Latest revision as of 03:20, 22 April 2021
- 상위문서: 빅데이터분석기사
일정[edit | edit source]
- 2020년 말에 1회 시험이 치러질 예정이었으나, 코로나19로 인해 취소되고 2회부터 시행
- 필기 시험: 2021.4.17(토)
- 실기 시험: 2020.6.19(토)
평가[edit | edit source]
- 문제의 퀄리티에 대한 지적이 많음
- 전반적으로 ADSP와 유사하다는 평가
기출 키워드[edit | edit source]
문제 번호 | 1과목
빅데이터 분석기회 |
2과목
빅데이터 탐색 |
3과목
빅데이터 모델링 |
4과목
빅데이터 결과해석 |
---|---|---|---|---|
1 | ETL | 박스플롯 | 후진 소거법 | bias, variance |
2 | 딥 러닝 개념 | 변수 선택 | 인공 신경망 개념 | 인공 신경망의 하이퍼파라미터 |
3 | 분석 프로세스 5단계 | 학습데이터 imblanced | CNN 계산 | scatter plot |
4 | 지도학습 | 파생변수 | 잔차진단 | bar chart |
5 | 비식별화 처리기준 | 불량률 계산 (조건부 확률) | 서포트벡터머신(SVM) | 불균형 데이터셋 |
6 | 비식별화 특징과 개념 | 정규확률 계산 | MDS(다차원 척도법) | roc curve |
7 | 데이터 형태를 파악? 검정하는 것 | MLE θ 계산 | 라쏘, L1 규제 내용으로 나옴 | 혼동행률 |
8 | 최적화 | 그래프 분석 | 모델링 절차 | 파라미터, 하이퍼파라미터 차이 |
9 | 개인정보보호법 | 상관계수 | 로지스틱 | K means 군집 |
10 | 정형데이터 품질 보증 | 병렬 차트 | 혼동 행렬 FP, TP계산 | F1 스코어 |
11 | EDA 개념 | Z-score 계산(p-value 이용) | 부스팅(GBM) | 모델선택 |
12 | 모델링 개념 | 점추정 | 베이지안 확률계산 | 적합도 검정 |
13 | 진단 분석 | 1종 오류, 2종 오류 | 홀드아웃 | 인포그래픽 |
14 | 이상치(Outlier) | 차원의 저주 | 비지도 학습 | 모델 선택 방법 |
15 | 데이터 수집 방법 | 중앙값(선수들 연봉, 평균이 옳은가 중앙값이 옳은가) | 분류 | 민감도, 특이도 설명 |
16 | 분석 성숙도 | 층화 추출 | 군집 | 모형진단 |
17 | 개인정보수집 동의안 | Class imbalanced | 시계열 | Data분석 결과 활용 |
18 | Bottom-up 분석 | 확률분포 (포아송 포함) | 비정형 데이터 | 시계열 |
19 | 데이터 품질 평가 | 확률분포 | 랜덤 포레스트 | 선형 회귀 |
20 | 데이터 거버넌스 | t분포, z분포 | K-fold | 시계열 그래프 보고 추세, 계절성, 예측 판단 |