1. 데이터 분석 프로세스 1. 기획 (process 설계도를 제작) 문제 정의 : 어떤 문제를 해결할 것인가? 분석 방법론 정의 기술 통계 분석 가설 검증 예측 모델 개발 (최근의 ML 모델 사용) 2. 데이터 수집 담당 부서로부터 데이터 입수 (상당히 오랜 시간이 걸림) 데이터 탐색, 오류 검토 3. 데이터 분석 데이터 탐색 (분포, 빈도 등 체크) 및 전처리 (통계분석, 머신러닝 모형에 사용하기 적합한 형태로 가공) 기술 통계 분석 - 집단 간 비교, 시계열 비교 가설 검정 - 가설 지지 확인 예측 모형 개발, 고도화 4. 보고 (시각화) 표, 그래프 제작 : 데이터 시각화 (인포그래픽) 보고서 작성 – 문서화, 대시보드 개발
1. 도움이 되는 전공들 [ 학부 ] - 컴퓨터공학 - 소프트웨어 공학 - 산업 및 시스템 공학 - 수학 - 통계학 [ 대학원 ] - 해외 온라인 석사 (조지아텍, 미시건, UIUC) - AI 대학원 - Big Data MBA - 통계학 석박사 석사는 필수가 아니다. 실력만 있으면 굳이 석사를 할 필요가 없다. 오픈 소스를 잘 이용하자! 2. 비전공자도 시작하는 방법 - 프로젝트 시작해보기 (대회, 공모전, 캐글 등) - 커뮤니티에서 함께 공부해보기 3. 학습해야 할 과목들 - 분석 도구 : R, Python - 분석 기법 : 통계학, 머신러닝 - 현업 지식 4. Data Science 관련 직무들 - Collect & Move/Store : Data Engineer (데이터를 저장, 최적화, 소프트웨어..
데이터 사이언스는 정의내리기에 따라 다르기에 어디에 무게중심을 두느냐에 따라 정해진다. 대체로 가장 사회적으로 합의됐으며, 적절한 정의이자 경계는 다음과 같다. 1. Domain expertise 2. Mathematics 3. Computer science 현실적으로 이 3가지를 모두 완벽하게 달성하는 것은 힘들기에, 셋 중 무게를 둬서 공부할 분야를 정하는 정하는 것이 현실적이다. 나의 경우 반도체공학과에 재학중이기에 도메인 지식(반도체공학)을 기반으로 하여 선형대수, 통계학적 지식과 더불어 CS까지 다룰 수 있는 것이 목표이다.
1. 개인 블로그에 업로드 가능한 내용 학습 강좌에서 제공되는 강의 내용 학습 강좌에서 제공되는 퀴즈 2. 개인 블로그에 업로드 불가능한 내용 코칭스터디 라이브 방송 캡처화면 코칭스터디 매주 제공되는 미션 코칭스터디 OT 자료 즉, 정리하자면 학습 강의에서 제공되는 강의 내용은 캡처해서 올려도 문제가 없다. 이해를 쉽게 하기 위해 업로드시 캡처본 일부도 함께 첨부하겠다.