데이터셋 종류 1개 scikit-learn datasets 활용 파이썬 기계학습 라이브러리인 싸이킷런(scikit-learn)에서는 테스트를 위한 데이터셋(datasets)을 제공한다. 유형을 3가지로 나눌 수 있는데, 테스트 코드 연습을 위해서는 보통 load 계열의 데이터셋을 이용한다. 본 포스팅에서는 쉽고 많이 사용하는 load 계열의 데이터를 알아보도록 하겠다. 데이터 셋 분류 load 계열 : scikit-learn 패키지에 포함된 데이터 make 계열 : 확률분포를 사용해 가상의 데이터를 생성 fetch 계열 : 인터넷에서 다운로드하여 실행되는 대량의 데이터 fetch_california_housing : 캘리포니아 집값(회귀 분석용) fetch_covtype : 토지 조사(회귀 분석용) fetch_20newsgroups : 뉴스 그룹 텍스트 자료 fetc.. 인공지능/머신러닝, 딥러닝 2020.07.03 Jaeseok_Shim
데이터셋 종류
1개scikit-learn datasets 활용
파이썬 기계학습 라이브러리인 싸이킷런(scikit-learn)에서는 테스트를 위한 데이터셋(datasets)을 제공한다. 유형을 3가지로 나눌 수 있는데, 테스트 코드 연습을 위해서는 보통 load 계열의 데이터셋을 이용한다. 본 포스팅에서는 쉽고 많이 사용하는 load 계열의 데이터를 알아보도록 하겠다. 데이터 셋 분류 load 계열 : scikit-learn 패키지에 포함된 데이터 make 계열 : 확률분포를 사용해 가상의 데이터를 생성 fetch 계열 : 인터넷에서 다운로드하여 실행되는 대량의 데이터 fetch_california_housing : 캘리포니아 집값(회귀 분석용) fetch_covtype : 토지 조사(회귀 분석용) fetch_20newsgroups : 뉴스 그룹 텍스트 자료 fetc..
인공지능/머신러닝, 딥러닝 2020.07.03 Jaeseok_Shim