전체 글

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 2-2. 파이썬으로 시각화하기 - Matplotlib

1. matplotlib pyplot 객체를 사용하여 데이터를 표시 pyplot 객체에 그래프들을 쌓은 다음 show로 flush show를 치는 순간 화면에 보여주고 이후 pyplot에 쌓인 객체들은 초기화 Set color color 속성을 사용 float -> 흑백, rgb color, predefined color 사용 Set linestyle ls or linestyle parameter 사용 Set title Pyplot에 title 함수 사용, figuredml subplot별 입력 가능 Latex 타입도 표현 가능 ( 수식 표현 가능) Set legend Legend 함수로 범례를 표시함, loc 위치 등 속성 지정 Set grid & xylim graph 보조선을 긋는 grid와 xy축 ..

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 2-1. 파이썬으로 데이터 처리하기 - Pandas

Library는 여러 패키지와 모듈들을 모아놓은 것을 의미한다. package는 특정 기능과 관련된 여러 모듈을 한 폴더 안에 넣어 관리하는데 이를 패키지라고 한다. 예를 들어 Test라는 폴더 안에 init.py, test.py와 같은 파일들이 모여있는 것이다. Module은 함수, 변수, 클래스를 모아놓은 것을 말함 일반적으로 한 파일을 말하는데 예를 들어 .py와 같은 하나의 파일 안에 함수와 변수, 클래스가 모여있는 것으로 볼 수 있음 라이브러리 >= 패키지 >= 모듈 구조화된 데이터의 처리를 지원하는 Python 라이브러리 Python계의 엑셀! 고성능 Array 계산 라이브러리인 Nu..

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-6. Numpy

1. 행렬의 곱셈 4가지 관점 Rank 해당 행렬의 Column Space의 dimension Column Space 해당 행렬을 구성하는 column vector들이 span 하는 공간 Span vector들의 선형결합으로 나타낼 수 있는 벡터공간 행렬의 곱셈 중 Inner product를 이용한 방법: i번째 행벡터와 j번째 열벡터 사이의 내적을 성분으로 가지는 행렬 행렬의 곱셉 중 Column Space를 이용한 방법 : 1) 결과 행렬의 column 개수 = 오른쪽 행렬의 column 개수 -> 오른쪽 행렬의 column을 하나씩 꺼내서 계산 후 다시 삽입 : matrix * matrix 연산을 matrix * vector 연산 여러개로 분리 2) Matrix * Vector 연산 수행 : -> ..

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-5.머신러닝 모델의 구조

다음과 같은 식을 활용해서 Dot prodcut를 통해 처리할 수 있다.

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-4. Machine Learning

1. 머신러닝 기존의 데이터를 알고리즘을 사용해 모델을 만들어내고, 새로운 데이터에 해당 모델을 적용시켜 패턴을 학습하거나 결과를 추론하는 기법 -> 핵심은 머신러닝 알고리즘 & 모델 2. 알고리즘 어떠한 문제를 풀기 위한 과정, Model을 생성하기 위한 (훈련) 과정 : training process 3. 모델 예측을 위한 수학 공식, 함수, 1차 방정식, 확률분포, condition rule(If문, 조건절) 4. 모델을 학습할 때 고려요인들 y 값에 영향을 주는 x 값은 하나가 아니다 - > 여러 개의 x 값들이 존재 5. Feature - 머신러닝에서 데이터의 특징을 나타내는 변수 - feature, 독립변수, input 변수 등은 동일의미로 사용 - 일반적으로 Table 상에 Data를 표현할..

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-3. 데이터 분석 프로세스

1. 데이터 분석 프로세스 1. 기획 (process 설계도를 제작) 문제 정의 : 어떤 문제를 해결할 것인가? 분석 방법론 정의 기술 통계 분석 가설 검증 예측 모델 개발 (최근의 ML 모델 사용) 2. 데이터 수집 담당 부서로부터 데이터 입수 (상당히 오랜 시간이 걸림) 데이터 탐색, 오류 검토 3. 데이터 분석 데이터 탐색 (분포, 빈도 등 체크) 및 전처리 (통계분석, 머신러닝 모형에 사용하기 적합한 형태로 가공) 기술 통계 분석 - 집단 간 비교, 시계열 비교 가설 검정 - 가설 지지 확인 예측 모형 개발, 고도화 4. 보고 (시각화) 표, 그래프 제작 : 데이터 시각화 (인포그래픽) 보고서 작성 – 문서화, 대시보드 개발

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-2. FAQ

1. 도움이 되는 전공들 [ 학부 ] - 컴퓨터공학 - 소프트웨어 공학 - 산업 및 시스템 공학 - 수학 - 통계학 [ 대학원 ] - 해외 온라인 석사 (조지아텍, 미시건, UIUC) - AI 대학원 - Big Data MBA - 통계학 석박사 석사는 필수가 아니다. 실력만 있으면 굳이 석사를 할 필요가 없다. 오픈 소스를 잘 이용하자! 2. 비전공자도 시작하는 방법 - 프로젝트 시작해보기 (대회, 공모전, 캐글 등) - 커뮤니티에서 함께 공부해보기 3. 학습해야 할 과목들 - 분석 도구 : R, Python - 분석 기법 : 통계학, 머신러닝 - 현업 지식 4. Data Science 관련 직무들 - Collect & Move/Store : Data Engineer (데이터를 저장, 최적화, 소프트웨어..

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] 1-1. What is Data Science?

데이터 사이언스는 정의내리기에 따라 다르기에 어디에 무게중심을 두느냐에 따라 정해진다. 대체로 가장 사회적으로 합의됐으며, 적절한 정의이자 경계는 다음과 같다. 1. Domain expertise 2. Mathematics 3. Computer science 현실적으로 이 3가지를 모두 완벽하게 달성하는 것은 힘들기에, 셋 중 무게를 둬서 공부할 분야를 정하는 정하는 것이 현실적이다. 나의 경우 반도체공학과에 재학중이기에 도메인 지식(반도체공학)을 기반으로 하여 선형대수, 통계학적 지식과 더불어 CS까지 다룰 수 있는 것이 목표이다.

AI Fundamentals/11기 - Let's AI 2023

[Let's AI] About contents

1. 개인 블로그에 업로드 가능한 내용 학습 강좌에서 제공되는 강의 내용 학습 강좌에서 제공되는 퀴즈 2. 개인 블로그에 업로드 불가능한 내용 코칭스터디 라이브 방송 캡처화면 코칭스터디 매주 제공되는 미션 코칭스터디 OT 자료 즉, 정리하자면 학습 강의에서 제공되는 강의 내용은 캡처해서 올려도 문제가 없다. 이해를 쉽게 하기 위해 업로드시 캡처본 일부도 함께 첨부하겠다.

Jae.
Steady & Persistent