분류 전체보기
-
[혼공머] 2-2. 데이터 전처리Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:32
1. 개념튜플 : 수정이 불가능한 리스트데이터 전처리 : 특성값을 일정한 기준으로 맞추는 작업표준점수 (z 점수) : 각 특성값이 평균에서 표준편차의 몇 배만큼 떨어져 있는지 나타낸다.실제 특성값의 크기와 상관없이 동일한 조건으로 비교할 수 있다.브로드캐스팅 : 모든 행에 대해 표준 점수로 변환하는 넘파이 기능2. 넘파이로 데이터 준비하기1. 기존의 방법 : 매우 귀찮음# 도미, 빙어 합친 데이터fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, ..
-
[혼공머] 2-1. 훈련 세트와 테스트 세트Data Science/딥러닝 & 머신러닝 2025. 1. 10. 23:26
1. 개념머신러닝 알고리즘의 종류지도 학습비지도 학습훈련 데이터 : 입력 데이터 + 타겟 데이터훈련 세트 : 훈련에 사용되는 데이터테스트 세트 : 평가에 사용하는 데이터, 훈련 데이터의 일부샘플링 편향 : 샘플링이 한쪽으로 치우쳐 훈련 세트와 테스트 세트에 샘플이 골고루 섞이지 않은 경우2. 넘파이파이썬의 배열 라이브러리, 고차원의 배열 만들고 조작할 때 사용파이썬 리스트를 넘파이 배열로 바꾸기 : array 함수 이용 → 행 열 가지런히 출력import numpy as npinput_arr = np.array(fish_data)target_arr = np.array(fish_target)print(input_arr)print(input_arr.shape) # (49, 2)3. 샘플링 편향 발생하는 K-..
-
[혼공머] 1-3. 마켓과 머신러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:08
1. 데이터셋 소개와 K-Neighbors1. 생선 데이터셋 사용캐글에 나온 데이터도미와 빙어 데이터2. 분류의 종류분류 : 여러 개의 종류 중 하나를 구별이진 분류 : 2개의 클래스 중 하나를 고르는 것3. K-Neighbors 알고리즘목적 : 근처에 있는 데이터에 대해 다수결로 클래스를 선택하는 것KNeighborsClassifier()K-Neighbors 분류 모델을 만드는 사이킷런 클래스기본값 = 5사용하는 메서드fit() : 모델 훈련predict() : 예측score() : 모델의 성능 측정2. 데이터 준비1. 도미 데이터 준비하기 [bream]길이와 무게 특성bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7,..
-
[혼공머] 1-1. 인공지능과 머신러닝, 딥러닝Data Science/딥러닝 & 머신러닝 2025. 1. 10. 19:03
1. 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템역사인공지능 태동기인공지능 황금기1차 AI 겨울AI 붐2차 AI 겨울현재인공지능의 종류강인공지능 : 사람과 같은 높은 수준의 인식 능력 + 추론 능력약인공지능 : 특정 작업에 뛰어난 능력을 발휘하는 인공지능 (현재)ex. 알파고2. 머신러닝: 알아서! 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야전통적인 프로그래밍과의 비교전통적인 프로그래밍 머신러닝 (훈련) 머신러닝 (예측)input규칙, 데이터정답, 데이터규칙, 데이터output정답규칙예측머신러닝 라이브러리안정적, 성능 검증 완료사이킷런3. 딥러닝: 머신러닝 알고리즘 중 인공 신경망을 기반으로 한 방법딥러닝과 인공 신경망 크게 구분하지 않음딥러닝 라이브러리인공 신..
-
파이썬으로 배우는 통계학 교과서(2판)독서 2024. 12. 28. 23:47
공부하면서 항상 까먹는 게 문제라.. 이번에는 '파이썬으로 배우는 통계학 교과서'를 골랐어요.다음 학기에 통계 과목으로도 파이썬을 다룰 줄 알아야 할 것 같아 골라본 책입니다.그나저나, 표지가 참 예쁜 것 같아요. 목차통계학 기본파이썬과 주피터 노트북기술통계확률과 확률분포통계적 추정통계적 가설검정통계모델정규선형모델일반화선형모델통계학과 머신러닝 포인트기술 통계와 추론 통계의 필요성 통계학을 처음 접하면, 기술 통계와 추론 통계가 무엇인지 배웁니다. 이 책에서는 이러한 통계가 왜 필요한지 구체적으로 설명하고 있습니다.다양한 통계 이론에 대한 설명 수리통계학 1 뿐 아니라 수리통계학2에서 다룬 최대가능도 추정량, 최대로그가능도와 회귀분석 강의에서 배우는 단순 회귀 예측까지 폭 넓은 분..
-
이것이 우분투 리눅스다(3판)독서 2024. 11. 25. 19:09
10월은 너무 바쁘게 보내서 11월의 책으로 돌아왔습니다.탑싯 마무리하고 고른 책은 우분투 리눅스입니다!컴퓨터네트워크 & 알고리즘 들으면서 같이 듣기 더 좋을 것 같아서 골랐습니다. 목차Part 01. 성공적인 학습을 위한 준비 작업과 우분투 리눅스 설치실습 환경 구축우분투 리눅스 소개우분투 리눅스 설치Part 02. 우분투 리눅스의 기본 개념과 리눅스 관리자의 역할서버 구축 시 알아야 할 필수 개념과 명령어X 윈도우 시스템하드디스크 관리와 사용자별 공간 할당셸 스크립트 프로그래밍Part 03. 네트워크 서버 구축 실무 Ⅰ원격지 시스템 관리네임 서버메일 서버데이터베이스 서버웹 서버Part 04. 네트워크 서버 구축 실무 ⅡFTP 서버NFS 서버Samba 서버DHCP 서버프록시 서버방화벽 컴퓨터..