Data Science/딥러닝 & 머신러닝
-
[혼공머] 2-2. 데이터 전처리Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:32
1. 개념튜플 : 수정이 불가능한 리스트데이터 전처리 : 특성값을 일정한 기준으로 맞추는 작업표준점수 (z 점수) : 각 특성값이 평균에서 표준편차의 몇 배만큼 떨어져 있는지 나타낸다.실제 특성값의 크기와 상관없이 동일한 조건으로 비교할 수 있다.브로드캐스팅 : 모든 행에 대해 표준 점수로 변환하는 넘파이 기능2. 넘파이로 데이터 준비하기1. 기존의 방법 : 매우 귀찮음# 도미, 빙어 합친 데이터fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, ..
-
[혼공머] 2-1. 훈련 세트와 테스트 세트Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:26
1. 개념머신러닝 알고리즘의 종류지도 학습비지도 학습훈련 데이터 : 입력 데이터 + 타겟 데이터훈련 세트 : 훈련에 사용되는 데이터테스트 세트 : 평가에 사용하는 데이터, 훈련 데이터의 일부샘플링 편향 : 샘플링이 한쪽으로 치우쳐 훈련 세트와 테스트 세트에 샘플이 골고루 섞이지 않은 경우2. 넘파이파이썬의 배열 라이브러리, 고차원의 배열 만들고 조작할 때 사용파이썬 리스트를 넘파이 배열로 바꾸기 : array 함수 이용 → 행 열 가지런히 출력import numpy as npinput_arr = np.array(fish_data)target_arr = np.array(fish_target)print(input_arr)print(input_arr.shape) # (49, 2)3. 샘플링 편향 발생하는 K-..
-
[혼공머] 1-3. 마켓과 머신러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:08
1. 데이터셋 소개와 K-Neighbors1. 생선 데이터셋 사용캐글에 나온 데이터도미와 빙어 데이터2. 분류의 종류분류 : 여러 개의 종류 중 하나를 구별이진 분류 : 2개의 클래스 중 하나를 고르는 것3. K-Neighbors 알고리즘목적 : 근처에 있는 데이터에 대해 다수결로 클래스를 선택하는 것KNeighborsClassifier()K-Neighbors 분류 모델을 만드는 사이킷런 클래스기본값 = 5사용하는 메서드fit() : 모델 훈련predict() : 예측score() : 모델의 성능 측정2. 데이터 준비1. 도미 데이터 준비하기 [bream]길이와 무게 특성bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7,..
-
[혼공머] 1-1. 인공지능과 머신러닝, 딥러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:03
1. 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템역사인공지능 태동기인공지능 황금기1차 AI 겨울AI 붐2차 AI 겨울현재인공지능의 종류강인공지능 : 사람과 같은 높은 수준의 인식 능력 + 추론 능력약인공지능 : 특정 작업에 뛰어난 능력을 발휘하는 인공지능 (현재)ex. 알파고2. 머신러닝: 알아서! 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야전통적인 프로그래밍과의 비교전통적인 프로그래밍 머신러닝 (훈련) 머신러닝 (예측)input규칙, 데이터정답, 데이터규칙, 데이터output정답규칙예측머신러닝 라이브러리안정적, 성능 검증 완료사이킷런3. 딥러닝: 머신러닝 알고리즘 중 인공 신경망을 기반으로 한 방법딥러닝과 인공 신경망 크게 구분하지 않음딥러닝 라이브러리인공 신..