본문 바로가기

머신러닝2

[머신러닝] kNN 알고리즘 kNN 알고리즘을 사용하여 농구선수의 포지션을 예측해보자. 1. 데이터 살펴보기 read_csv() 함수를 통해 csv파일을 데이터프레임형으로 저장합니다. 경로의 뜻은 이전디렉토리로가서 csv 폴더를 찾고 basketball_stat.csv 라는 파일을 지칭한 것입니다. csv 파일에 대해 더 자세히 알고싶으시면 https://ko.wikipedia.org/wiki/CSV_(%ED%8C%8C%EC%9D%BC_%ED%98%95%EC%8B%9D) CSV (파일 형식) - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. CSV(영어: comma-separated values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 확장자는 .csv이며 MIME 형식은 tex.. 2020. 1. 9.
[머신러닝] 기초 용어 및 개념 1. 지도 학습과 비지도 학습 지도학습(supervised learning) : 정답을 알려주면서 진행되는 학습 ex) 숫자 손글씨 이미지를 '데이터' 라고 하고 이미지의 답들을 '레이블(label)' 이라고 한다. 비지도 학습(unsupervised learning): 레이블이 없이 진행되는 학습. 보통 데이터의 패턴을 찾아내야 할때 사용한다. 2. 분류와 회귀 분류 (classification)는 '이진분류' ,'다중분류' 와 '다중 레이블 분류' 로 나뉜다 이진분류 : (예,아니요) , (남자,여자) 와 같이 둘 중 하나의 값으로 분류하는 경우 다중분류: (빨강,녹색,파랑) 중 하나의 색으로 분류하거나 0-9 까지의 숫자 중에서 하나의 숫자로 분류하기 다중 레이블 분류: 데이터가 입력 되었을 때 2.. 2020. 1. 8.