전체 글
-
[혼공머] 3-3. 특성 공학과 규제Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:49
1. 배경1. 적은 특성 사용 및 고차항 사용수동으로 고차항을 계속 넣기는 어렵다는 문제특성이 많을수록 효과가 커진다.2. 선형 회귀 모델의 학습1개의 특성 → 직선2개의 특성 → 평면인간은 3차원 공간 이상을 그리거나 상상할 수 없다.선형 회귀3차원 이상의 고차원 : 매우 복잡한 모델을 표현할 수 있다.2. 다중 회귀와 특성 공학1. 다중 회귀여러 개의 특성을 사용한 선형 회귀선형 회귀와의 차이선형 회귀 : 1개의 특성, 직선 학습다중 회귀 : 여러 개의 특성, 평면 학습다항 회귀와의 차이 *다항 회귀 : 1개의 독립 변수를 비선형적으로 변형해서 여러 개로 사용ex. y=β_0 + β_1x + β_2x^2 +⋯+ϵ.다중 회귀 : 여러 독립 변수를 사용ex. y=β_0 + β_1x1 + β_2x2 +⋯+..
-
[혼공머] 3-2. 선형 회귀Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:40
1. K-최근접 이웃의 한계1. 농어의 무게 예측 오류1절의 내용인 length & weight를 이용해 길이가 50cm인 농어의 무게를 예측해보자.# 1절의 내용을 돌아보기import numpy as npperch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 28.7, 30.0, 32.8, 34.5, 35.0, 3..
-
[혼공머] 3-1. K-최근접 이웃 회귀Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:35
1. 개념지도 학습 알고리즘분류회귀 : 숫자 예측K-최근접 이웃 분류 알고리즘가까운 이웃 k개 선택이웃의 클래스 확인다수 클래스를 새로운 샘플의 클래스로 예측k-최근접 이웃 회귀가까운 이웃 k개 선택이웃의 ‘수치’ 확인이웃들의 수치의 평균을 새로운 샘플의 예측값으로!결정계수 R^2R^2 = 1 - ((타겟- 예측)^2의 합) / (타겟-평균)^2의 합)예측과 타겟이 가까울수록 1 = 클수록 좋은 모델과대적합 : 훈련 세트에만 잘 맞는 모델과소적합 : 훈련 세트에서도 적절하게 훈련되지 않은 경우2. 데이터 준비전체 데이터 : 농어의 길이, 높이, 두께, 무게이번에는 길이와 무게만 사용해서, 무게를 예측하자.1. 데이터 불러오기파이썬 리스트 만들고 arry 하지 말고 한 번에 np.array로 만들기impo..
-
[혼공머] 2-2. 데이터 전처리Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:32
1. 개념튜플 : 수정이 불가능한 리스트데이터 전처리 : 특성값을 일정한 기준으로 맞추는 작업표준점수 (z 점수) : 각 특성값이 평균에서 표준편차의 몇 배만큼 떨어져 있는지 나타낸다.실제 특성값의 크기와 상관없이 동일한 조건으로 비교할 수 있다.브로드캐스팅 : 모든 행에 대해 표준 점수로 변환하는 넘파이 기능2. 넘파이로 데이터 준비하기1. 기존의 방법 : 매우 귀찮음# 도미, 빙어 합친 데이터fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, ..
-
[혼공머] 2-1. 훈련 세트와 테스트 세트Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:26
1. 개념머신러닝 알고리즘의 종류지도 학습비지도 학습훈련 데이터 : 입력 데이터 + 타겟 데이터훈련 세트 : 훈련에 사용되는 데이터테스트 세트 : 평가에 사용하는 데이터, 훈련 데이터의 일부샘플링 편향 : 샘플링이 한쪽으로 치우쳐 훈련 세트와 테스트 세트에 샘플이 골고루 섞이지 않은 경우2. 넘파이파이썬의 배열 라이브러리, 고차원의 배열 만들고 조작할 때 사용파이썬 리스트를 넘파이 배열로 바꾸기 : array 함수 이용 → 행 열 가지런히 출력import numpy as npinput_arr = np.array(fish_data)target_arr = np.array(fish_target)print(input_arr)print(input_arr.shape) # (49, 2)3. 샘플링 편향 발생하는 K-..
-
[혼공머] 1-3. 마켓과 머신러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:08
1. 데이터셋 소개와 K-Neighbors1. 생선 데이터셋 사용캐글에 나온 데이터도미와 빙어 데이터2. 분류의 종류분류 : 여러 개의 종류 중 하나를 구별이진 분류 : 2개의 클래스 중 하나를 고르는 것3. K-Neighbors 알고리즘목적 : 근처에 있는 데이터에 대해 다수결로 클래스를 선택하는 것KNeighborsClassifier()K-Neighbors 분류 모델을 만드는 사이킷런 클래스기본값 = 5사용하는 메서드fit() : 모델 훈련predict() : 예측score() : 모델의 성능 측정2. 데이터 준비1. 도미 데이터 준비하기 [bream]길이와 무게 특성bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7,..
-
[혼공머] 1-1. 인공지능과 머신러닝, 딥러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:03
1. 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템역사인공지능 태동기인공지능 황금기1차 AI 겨울AI 붐2차 AI 겨울현재인공지능의 종류강인공지능 : 사람과 같은 높은 수준의 인식 능력 + 추론 능력약인공지능 : 특정 작업에 뛰어난 능력을 발휘하는 인공지능 (현재)ex. 알파고2. 머신러닝: 알아서! 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야전통적인 프로그래밍과의 비교전통적인 프로그래밍 머신러닝 (훈련) 머신러닝 (예측)input규칙, 데이터정답, 데이터규칙, 데이터output정답규칙예측머신러닝 라이브러리안정적, 성능 검증 완료사이킷런3. 딥러닝: 머신러닝 알고리즘 중 인공 신경망을 기반으로 한 방법딥러닝과 인공 신경망 크게 구분하지 않음딥러닝 라이브러리인공 신..
-
파이썬으로 배우는 통계학 교과서(2판)독서 2024. 12. 28. 23:47
공부하면서 항상 까먹는 게 문제라.. 이번에는 '파이썬으로 배우는 통계학 교과서'를 골랐어요.다음 학기에 통계 과목으로도 파이썬을 다룰 줄 알아야 할 것 같아 골라본 책입니다.그나저나, 표지가 참 예쁜 것 같아요. 목차통계학 기본파이썬과 주피터 노트북기술통계확률과 확률분포통계적 추정통계적 가설검정통계모델정규선형모델일반화선형모델통계학과 머신러닝 포인트기술 통계와 추론 통계의 필요성 통계학을 처음 접하면, 기술 통계와 추론 통계가 무엇인지 배웁니다. 이 책에서는 이러한 통계가 왜 필요한지 구체적으로 설명하고 있습니다.다양한 통계 이론에 대한 설명 수리통계학 1 뿐 아니라 수리통계학2에서 다룬 최대가능도 추정량, 최대로그가능도와 회귀분석 강의에서 배우는 단순 회귀 예측까지 폭 넓은 분..
-
이것이 우분투 리눅스다(3판)독서 2024. 11. 25. 19:09
10월은 너무 바쁘게 보내서 11월의 책으로 돌아왔습니다.탑싯 마무리하고 고른 책은 우분투 리눅스입니다!컴퓨터네트워크 & 알고리즘 들으면서 같이 듣기 더 좋을 것 같아서 골랐습니다. 목차Part 01. 성공적인 학습을 위한 준비 작업과 우분투 리눅스 설치실습 환경 구축우분투 리눅스 소개우분투 리눅스 설치Part 02. 우분투 리눅스의 기본 개념과 리눅스 관리자의 역할서버 구축 시 알아야 할 필수 개념과 명령어X 윈도우 시스템하드디스크 관리와 사용자별 공간 할당셸 스크립트 프로그래밍Part 03. 네트워크 서버 구축 실무 Ⅰ원격지 시스템 관리네임 서버메일 서버데이터베이스 서버웹 서버Part 04. 네트워크 서버 구축 실무 ⅡFTP 서버NFS 서버Samba 서버DHCP 서버프록시 서버방화벽 컴퓨터..