이번 과제에서는 sklearn 라이브러리의 유방암 데이터 셋을 학습에 사용할 수 있게 준비해보겠습니다. 유방암 데이터 셋은 전 토픽들에서 한 번도 보지 않은 데이터 셋인데요.
간단히만 설명드리겠습니다. 암은 사람한테 치명적인 악성(malignant)과 그렇지 않은 양성(benign)암으로 나뉩니다. sklearn 유방암 데이터 셋은 유방암세포들의 다양한 속성들과 (길이, 넓이, 둘레 등등) 암이 악성인지 양성인지를 저장하고 있습니다.
(채점되지는 않지만, 꼭 print(cancer_data.DESCR)를 실행해서 데이터 셋을 살펴보세요.) 데이터 셋은 load_breast_cancer 함수를 호출해서 cancer_data 변수에 저장했습니다.
속성들은 cancer_data.data에, 악성인지 양성인지는 cancer_data.target에 저장돼있습니다. 속성 이름은 cancer_data.feature_names에 저장돼있고, 목표 변수 열 이름은 "class"로 지어주세요.
해야할...
#
sklearn
#
머신러닝
원문 링크 : sklearn 붓꽃 데이터셋 *퀴즈*