dbwjd516의 등록된 링크

키자드에 등록된 총 279개의 포스트를 확인하실 수 있습니다.

Naver Blog

옥련동 자연 카페 유퀴즈 촬영지, 블랑블룸

카페 블랑블룸 인천 연수구 능허대로151번길 30 주말 11:00 - 22:00 공휴일 11:00 - 22:00 평일 12:00 - 21:00 주차 5대 가능 카페 블랑블룸 입구 우렁쌈밥 대패정식을 먹고 바로 앞에 있는 자연 카페 블랑블룸에 들렸다. 전에 근처에 밥 먹으러 왔다가 엄마랑 들린 적이 있는데 분위기가 너무 좋아서 재방문하게 되었다. 블랑블룸 디저트 우렁쌈밥을 먹고 들리기에는 두 곳 분위기가 너무도 다르긴 한데, 뭐 암튼!^^ 블랑블룸엔 디저트도 많고 음료도 맛있다. 요즘 시험 기간이었어서 프랜차이즈 커피만 먹다가 블랑블룸 커피를 먹으니 이게 정말 커피지 싶었다 ^o^ 블랑블룸 디저트 블랑블룸 디저트는 앙버터 다쿠아즈만 먹어봤다. 다쿠아즈는 매일 수제로 만든다고 하신다. 사실 다쿠아즈를 여기서 첨이자 마지막으로 먹어봐서 다른 다쿠아즈 맛은 모른다ㅋㅋ 그래서 다른 다쿠아즈랑 비교해서 맛을 리뷰할 순 없지만, 수제답게 맛있었당 담에 가면 케이크나 타르트 먹어봐야겠다. 블랑블룸

Naver Blog

시험 끝난 날로 돌아가서

2021.06.10(목) 기다리고 기다리던 시험 끝난 날! (시험 끝난 날 일기를 왜 오늘에서야 쓰고 있는지 모르겠지만 그날로 돌아가서 그날의 생각을 써보려고 한당ㅋㅋ) 3학년 1학기 시험이 끝났다. 시험 결과는 장담 못하겠는데 열심히 한 건 틀림없으니까.. 물론 조금 아쉬움은 남는다. 전공 전문이라 그런지 쉽지가 않네..ㅎㅎ 그래도 이제는 아무 생각 안하고 쉬고 싶다. 너무 고생했다!! 담주 월요일까지 세미나 에세이를 써야하긴 하지만 그건 내일 생각해야지! 원할머니 보쌈 오늘 시험이 끝나긴 했는데 교수님들께서 학기 마무리 수업을 빠짐없이 하시는 바람에.. 수업이 5시 반쯤 끝났다. 엄마 아빠가 시험 끝난 날이라고 맛있는 걸 먹으러 나가자고 하셨는데 나기기가 너무 귀찮아서.. 그냥 집에서 원할머니 보쌈을 주문해서 먹었다. 원래 보쌈,족발 같은 음식을 별로 안좋아하는데 보쌈은 요즘에 조금씩 먹는다. 근데 오늘은 딱히 먹고 싶은 음식도 없고.. 요즘 입맛도 별로 없어서 그냥 엄마가 추천

Naver Blog

회귀해석 연습문제 풀이

오늘의 타임랩스! 회귀해석 연습문제 풀이 드디어 내일 시험이다(^。^) 내일부터 3일간 시험보고 나면 공부 포스팅 말고 재ㅣ밌는 포스팅 할 수 있겠지! 오늘도 고생했다( ´∀`) 종강 기다렷!!

Naver Blog

인천 용현동 연어초밥 맛집 그집초밥 배달의 민족

정말 오랜만에 맛집 포스팅을 하는 것 같아요! 오늘 시험을 하나 봤는데 또 한번 느꼈습니다ㅎㅎ "시험 공부는 적당히 하자!" 그래도 한 학기동안 배운건 많은 수업이었으니, 시험 결과는 그냥 받아들이기로 하고~ 오늘 점심에 먹은 연어초밥 리뷰를 해보려고 합니다! 예전부터 많이 주문해서 먹고, 방문해서 먹던 인천 용현동 스시 맛집을 소개해 드릴게요. 연어초밥이 맛있는 용현동 스시 맛집 그집초밥 인천 미추홀구 토금남로 79 우성상가동 104호 매일 12:00 - 23:00 둘째주 넷째주 일요일 휴무 070-4216-8989 코로나가 심해진 이후로 배달음식을 자주 시켜먹게 되는 것 같아요. 가게 사장님들도 아셨는지 요즘에는 배달 앱에 등록되지 않은 가게를 찾기가 더 어렵더라구요. 오늘은 초밥이 먹고 싶어서 배달 앱을 찾다가 예전에 즐겨먹던 그집초밥을 발견했어요. 한 때 정말 많이 시켜먹곤 했었는데 오랜만에 그 맛이 생각나서 그집초밥에서 주문을 해봤어요. (같은 초밥이라도 가게에 따라 맛이

Naver Blog

통계학과 대학생 타임랩스

블로그는 하고 싶고, 올릴 글은 없고. 그래서 올리는 타임랩스! 2020 표본설계 기말고사 연습 삼아 풀어보고 있는 중. 오늘 아침에 찍은 따끈따끈한 영상이다. 전 포스팅에서도 말했지만 유튜버의 꿈을 아주 조금 품고 있지만, 실현시킬 여유와 용기가 없기 때문에 이렇게라도 욕구를 충족시켜 보고자 한다 ㅋㅋ <2020 표본설계 기말고사 후기> 표본설계는 재능의 영역이다! 시험 공부를 해도 문제에 따라서 성적의 변동이 아주 클 것 같다는 생각이 들었다. 고로, 지금까지 할 수 있는 노력은 (표본설계 이론 이해 정도?ㅋㅋ) 다 한 것 같으니 이제 다른 공부를 해야겠다~ ps. 이제는 그냥 시험 봐버리고 싶고만ㅎ 물론 지금도 놀고 있지만 이제 그만 맘! 편! 히! 놀고 싶다구요 이 세상의 모든 대학생 화이팅!

Naver Blog

2021.05.04(화) 오늘의 일기

매일매일 챌린지 시즌1 #오늘일기 챌린지가 3일만에 끝났다. 오랜만에 블로그 들어와서 못보던 이웃분들 글도 재밌게 보고, 다시 블로그 붐이 일어나나 싶은 생각도 들었는데 아쉽다. 처음부터 챌린지 기준을 잘 설정하고 진행했으면 좋았을텐데! 뭐, 근데 3일동안 쓰다보니 여기에 일기 쓰는 것도 나쁘지 않은 것 같아서 가끔씩 이벤트가 있는 날엔 간단히 글을 남겨보려고 한다. 2021.05.04(화) 특별한 일은 없었지만 그냥 남기는 일기 어제 늦게까지 공부할 줄 알고 밤에 커피를 마셨다. 그런데 예상 외로 할 일이 빨리 끝나버렸다. 자고 싶었는데 커피 때문에 잠이 안왔다ㅠㅠ 뒤척이다 한.. 새벽 4시 쯤 잠든 것 같다. 지금 불교와 인간 수업을 듣고 있는데 너어무 졸리다. 이거 끝나고 조금 잘까 생각중이당.. 사실 불교와 인간 수업 때는 틀어두고 낮잠(?) 자는게 국룰인데,,ㅎㅎ 오늘 발표 수업 한대서 못자고 있다. 누가 걸릴지 모르기 때문에 하하.. 빨리 끝내고 자고 싶다~ 회귀해석 필기

Naver Blog

2021.05.05(수) 일기

2021.05.05(수) 왠지 모르게 되게 바빴던 날 공휴일이라고 교수님이 녹강으로 강의를 대체해주셨다. 물론 1교시는 실강으로 들었지만ㅎ 덕분에 1교시 끝나고 자고 싶을 때까지 잤다. 며칠동안 잠을 제대로 못잤는데 어린이날 덕분에 피로가 풀렸다. :)) 잠을 못잔 이유는.. 얼마 전에 4층에 누가 이사와서 인테리어 한다고 며칠동안 정말 시끄러웠다. 다행이도 시험 보기 하루 전날 시끄러운 공사가 마무리 돼서 시험에는 지장이 없었다. 근데 도대체 왜 아침 8시만 되면 드릴질을 하는지.. 덕분에 피로 누적이 확실히 됐다^^ 그렇게 공사가 끝나서 이제 늦잠 잘 수 있는건가 싶었는데 이번에는 8층ㅋㅋㅋ 더 시끄럽다,, 중간에 껴서 무슨 죄인지! 요즘 무슨 인테리어 철인가? 내일은 제발 조용하기를.. 과외 다녀오는 길 새로운 과외 첫 수업도 다녀왔다. 우선 제일 좋은 건 집이 가깝다는 점. 두 번째는.. 조금 더 사치를 부릴 수 있게 된 점(?) 사실 평소에 사치부리는 사람은 아니다ㅋㅋ 통장

Naver Blog

2021.05.07(금) 일기

2021.05.07(금) 피로의 정점 최근 며칠동안 너무도 피곤한 나날을 보냈다. 밤에는 자기 아깝고 아침엔 더 자고 싶고.. 그래서 2~3시 쯤 자기를 반복하다가 어제는 도저히 안 될 것 같아서 10시쯤 잠에 들었다. 그래서 어제 일기를 오늘 아침 쓰고 있다.ㅎㅎ 확실히 잠은 12시 전에 자야 피로도 풀리고 생활에 활력이 생기는 것 같다. 이젠 정말 일찍 자고 일찍 일어나야 겠다!!! (말은 이렇게 하지만 실천이 어렵지,,) 암튼, 오늘 컨디션 좋다 :)) 아침 과외 다녀오는 길 원래 오늘 (토요일) 수업인데 학생이 오늘 시간이 안 된대서 어제 아침으로 수업을 옮겼다. 아침 수업은 언제나 힘들다. 그래도 하루가 좀 길어지는 느낌(?)과 아침부터 뭔가를 한 것 같은 뿌듯함이 있어서 기분은 좋다. 조금 졸릴 뿐이다,,^^.. 남순게장 - 간장 게장 정식 어제 어버이날 겸 미리 저녁을 먹으러 갔다. 메뉴는 우리 가족이 좋아하는 간장 게장ㅎㅎ 남순 게장이라고 송도에 있는 가게인데, 여기를

Naver Blog

시험기간 집중 못하는 대학생이 쓴 일기

2021.06.04(금) 시험 D-4. 공부하다가 집중이 안 돼서 쓰는 글 빨리 시험이 끝났으면 좋겠다. 이번 학기 시작하기 전, 수강신청을 아주 거하게 말아먹었다. 그때 3학년 씩이나 돼서 전공을 3개밖에 못 듣는다니,,, 하며 절망했었던 기억이 난다. 어느 정도 여유로운 학기가 될거라고 예상 했지만 생각 이상으로 너무도 여유로웠다. 그래서인지 몸도 너무 풀어지는 것 같아서 일부러 과외도 하나 더 잡았다. 근데.. 여유로운 생활은 중간고사가 끝남과 동시에 같이 끝이 나버렸다. 지금은 너무 힘들다.. 너무 바쁘다.. 수강신청을 3개밖에 성공 못한 과거의 나에게 감사하고 있을 정도로..ㅎㅎ 근데 이렇게 글을 쓰고 있는 걸 보면 그렇게 막 바쁜것 같진 않은 것 같지만(?)ㅋㅋ 암튼 요즘 너무 피곤하다. 원래 새벽까지 깨어 있는 날이 잘 없는데 요즘엔 왜 이리 늦게까지 자기가 싫은지! 거의 기본 3~4시에 자는 것 같다. 그렇다고 공부를 그 시간까지 하는 건 아니다. 나는 항상 워라벨이

Naver Blog

R 웹 크롤링(스크래핑) 기초

R을 이용한 웹 크롤링(스크래핑) 기초 공부 내용입니다. 크롤링이란? 인터넷에 있는 자료를 가져와서 데이터로 뽑아내는 작업을 말한다. 다른말로 '스크래핑'이라고 부르기도 한다. 예를 들면, 인터넷 tv 캐스트에 있는 동영상 제목을 모두 뽑아내고 싶을 때 웹 크롤링을 이용한다. 크롤링 작업은 Python, R 등 다양한 프로그램으로 가능하다. 오늘은 R을 이용한 크롤링을 공부해보았다. 본 포스트에서는 크롤링을 통해 글자 추출 방법과 table 추출 방법을 다뤄보려고 한다. 크롤링 과정 1. 준비 단계 크롤링을 하기 위해서는 'rvest' 패키지가 가장 기본적으로 필요하다. 또한 코드를 가독성있게 작성하기 위해 파이프 연산자(%>%)를 이용할 것이기에 'dplyr'패키지도 함께 설치하자. install.packages('rvest'); library(rvest) install.packages('dplyr'); library(dplyr) 2. 글자추출 하기 https://tv.naver.

Naver Blog

R ggplot2 그래프 그리기 기본 원리

R ggplot2 패키지를 이용해서 그래프 그리는 방법에 대한 포스팅입니다. ggplot2 :: R 대표적인 시각화 패키지 1. ggplot2 패키지 설치 및 불러오기 우선 ggplot2 패키지를 이용하기 위해 패키지를 설치하고 불러와줍니다. install.packages('ggplot2') library(ggplot2) 2. ggplot2 :: mtcars 데이터 구조 확인하기 이번 포스팅에서는 ggplot2에 내장되어 있는 데이터 mtcars 를 이용하도록 하겠습니다. 데이터 구조를 확인해봅시다. head(mtcars) mtcars 데이터 구조 3. ggplot2로 그래프 그리기 (기본 구조) ggplot(data, aes(x= , y= )) + geom_point() ggplot2을 이용해 그래프를 그리는 기본 구조는 다음과 같습니다. aes 는 기능적으로 변수에서 값을 가져와서 처리하라는 뜻입니다. aesthetic의 약자이기도 합니다. 즉 미적인 요소를 가미시키라는 뜻이죠.

Naver Blog

R ggplot2 그래프 시각화 :: 실제 데이터로 연습하기 economics mtcars

이번 포스팅에서는 ggplot2를 이용해 실제 데이터로 다양한 그래프를 그려보도록 하겠습니다. ggplot2를 처음 접하시는 독자께서는 전 포스팅을 참고해주시기 바랍니다. ggplot2 그래프 그리기 실습 1. economics 첫 번째 실습은 ggplot2에 내장되어 있는 economics 데이터를 이용하겠습니다. economics 데이터는 1967년부터 2014년 미국 경제 관련 내용을 담은 데이터입니다. 우선 economics 데이터의 구조를 확인해봅시다. head(economics) economics 데이터 구조 ggplot(economics, aes(x=date, y=unemploy))+geom_line() 가장 기본이 되는 그래프를 geom_line( )을 이용해 선그래프로 그려줍니다. 코드 실행 결과는 다음과 같습니다. 코드 실행 결과 1 ggplot(economics, aes(x=date, y=unemploy))+geom_line(color='#FFAA00', lwd=

Naver Blog

파이썬 Python 로지스틱 회귀 예제 실습 :: 단일 입력 다중입력

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 로지스틱 회귀 Logistic regression 실습을 정리한 내용이다. 로지스틱 회귀 실습 :: 단일 입력 & 다중 입력 Logistic regression 단일 입력 로지스틱 회귀 문제 : 1개의 입력을 받아 0 또는 1을 출력하는 로지스틱 회귀 모델을 케라스로 구현하기 1. 데이터 생성 # 라이브러리 불러오기 from keras.models import Sequential from keras.layers import Dense from keras.layers import Activation import numpy as np # 데이터 생성 x = np.array([-2, -1.5, -1, 1.25, 1.62, 2]) y = np.array([0, 0, 0, 1, 1, 1]) 2. 로지스틱 회귀 모델 만들기 # sigmoid(wx+b) 의 형태를 갖는 로지스틱 회귀 구현 model = Seque

Naver Blog

파이썬 Python 선형회귀 예제 실습 keras Sequential

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 선형회귀 linear regression 실습을 정리한 내용이다. Linear regression 선형 회귀 문제 : y = wx의 형태를 갖는 선형 회귀를 케라스로 구현하기 1. 데이터 만들기 # 라이브러리 불러오기 from keras import optimizers from keras.models import Sequential from keras.layers import Dense import numpy as np import matplotlib.pyplot as plt plt.style.use('default') # 데이터 만들기 X = np.linspace(0,10,10) # 0~10까지 총 10개의 값 만들기 Y = X+np.random.randn(*X.shape) #np.random.randn(m,n) : 표준정규분포 난수를 (m,n)배열로 생성 #X.shape는 튜플. (*튜플)로 표현

Naver Blog

파이썬 Python k-means 예제 실습 KMeans kmeans++

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 k-means 실습을 정리한 내용이다. k-means 군집화 문제 : 키와 몸무게에 따른 체형 군집화 1. 데이터 만들기 # 라이브러리 불러오기 import pandas as pd import numpy as np from sklearn.cluster import KMeans import matplotlib.pyplot as plt import seaborn as sns # 데이터 만들기 df = pd.DataFrame(columns= ['height', 'weight']) df.loc[0] = [185,60] df.loc[1] = [180,60] df.loc[2] = [185,70] df.loc[3] = [165,63] df.loc[4] = [155,68] df.loc[5] = [170,75] df.loc[6] = [175,80] df 2. 데이터 시각화 plt.style.use('default')

Naver Blog

파이썬 Python 앙상블 랜덤포레스트 배깅 부스팅 / 소프트 하드 보팅 예제

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 앙상블 실습을 정리한 내용이다. 배깅 (랜덤 포레스트) & 부스팅 개념 bagging & boosting 실습에 앞서, 배깅 개념에 대해 간단히 소개하겠습니다. 배깅은 한 가지 분류 모델을 여러 개 만들어서 서로 다른 학습 데이터로 학습시킨 후(부스트랩), 동일한 테스트 데이터에 대한 서로 다른 예측값들을 투표를 통해(어그리게이팅; 소프트 보팅, 하드보팅) 가장 높은 예측값으로 최종결론을 내리는 앙상블 기법입니다. 여기서, 투표는 한 표당 동일한 효력을 가집니다. 배깅은 과대적합되기 쉬운 모델에 상당히 적합한 앙상블입니다. 따라서 과대 적합되기 쉬운 모델인 의사결정 트리를 배깅을 통해 개선할 수 있습니다. 여러 의사결정 트리를 배깅해서 예측을 실행하는 모델이 랜덤 포레스트 입니다. 추가로, 배깅과 함께 각광 받는 앙상블 기법인 부스팅에 대해서 소개하겠습니다. 부스팅 역시 여러 개의 분류기를 만들어 투

Naver Blog

파이썬 Python 다항분포 나이브 베이즈 예제 MultinomialNB

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 Multinomial Naive Bayes 실습을 정리한 내용이다. Multinomial Naive Bayes 다항분포 나이브 베이즈 문제 : 영화 리뷰가 긍정적인지 부정적인지 분류해보자. 1. 데이터 획득 # 필요한 라이브러리 불러오기 import numpy as np import pandas as pd from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import accuracy_score # 데이터 획득 review_list = [ {'movie_review': 'this is great great movie. I will watch again', 'type': 'positive'}, {'movie_review': 'I

Naver Blog

파이썬 Python 베르누이 나이브 베이즈 예제 BernoulliNB

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 Bernoulli Naive Bayes 실습을 정리한 내용이다. Bernoulli Naive Bayes 베르누이 나이브 베이즈 문제 : 스팸 메일을 분류해보자. 1. 학습 데이터 획득 및 다듬기 # 필요한 라이브러리 불러오기 import numpy as np import pandas as pd from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import BernoulliNB ## 베르누이 나이브 베이즈 from sklearn.metrics import accuracy_score # 학습 데이터 불러오기 email_list = [ {'email title': 'free game only today', 'spam': True}, {'email title': 'cheapest flight deal', '

Naver Blog

파이썬 Python 가우시안 나이브 베이즈 예제 GaussianNB

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 Gaussian Naive Bayes 실습을 정리한 내용이다. Gaussian Naive Bayes 가우시안 나이브 베이즈 문제 : iris 데이터를 활용해 데이터의 특징에 따라 붓꽃의 종류를 분류해보자. 1. 데이터 획득 ## 필요한 라이브러리 불러오기 import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB ##가우시안 나이브 베이즈 from sklearn import metrics from sklearn.metrics import accuracy_score import matplotlib.pyplot as plt # 데이터 불러오기 dataset=load_iris() df=pd.

Naver Blog

파이썬 Python 의사결정 트리 Decision Tree / tree.DecisionTreeClassifier

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 Decision Tree 의사결정 트리 실습을 정리한 내용이다. Decision Tree 의사결정 트리 문제 : 서울의 지역 정보를 이용해 서울 지역을 강동, 강서, 강남, 강북으로 분류하기 1. 데이터 획득 import pandas as pd district_dict_list = [ {'district': 'Gangseo-gu', 'latitude': 37.551000, 'longitude': 126.849500, 'label':'Gangseo'}, {'district': 'Yangcheon-gu', 'latitude': 37.52424, 'longitude': 126.855396, 'label':'Gangseo'}, {'district': 'Guro-gu', 'latitude': 37.4954, 'longitude': 126.8874, 'label':'Gangseo'}, {'district': '

Naver Blog

파이썬 SVM(Support Vector Machine) 그리드 서치 GridSearchCV

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 SVM(Support Vectot Machine) 서포트 벡터 머신 실습을 정리한 내용이다. SVM (Support Vector Machine) 서포트 벡터 머신 문제 : NBA 농구선수들의 게임 기록을 데이터로 이용해서 특정 선수의 포지션 예측하기 1. 데이터 확인 import pandas as pd df=pd.read_csv('https://raw.githubusercontent.com/steve3789/Python_First_AI/master/data/csv/basketball_stat.csv') df.head() df.drop(['2P','AST','STL'], axis=1, inplace= True) df.head() from sklearn.model_selection import train_test_split train, test = train_test_split(df, test_size=

Naver Blog

파이썬 k-최근접 이웃 알고리즘 (kNN) k-fold 교차검증

나의 첫 머신러닝 / 딥러닝 책을 기반으로 공부한 내용을 정리해보려고 한다. 다음은 k-최근접 이웃 알고리즘(kNN) 실습을 정리한 내용이다. k-최근접 이웃 알고리즘 (kNN) 문제 : NBA 농구선수들의 게임 기록을 데이터로 이용해서 특정 선수의 포지션 예측하기 1. 데이터 불러오기 및 데이터 확인 import pandas as pd df=pd.read_csv('https://raw.githubusercontent.com/steve3789/Python_First_AI/master/data/csv/basketball_stat.csv') df.head() Player : 선수이름 Pos : 포지션 3P : 한 경기 평균 3점슛 성공 횟수 2P : 한 경기 평균 2점슛 성공 횟수 TRB : 한 경기 평균 리바운드 성공 횟수 AST : 한 경기 평균 어시스트 성공 횟수 STL : 한 경기 평균 스틸 성공 횟수 BLK : 한 경기 평균 블로킹 성공 횟수 df.Pos.value_counts

Naver Blog

[코세라 머신러닝] 강의를 마무리하며 (내용 총정리)

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하였습니다. 이번 포스팅에서 지금까지 배운 내용을 요약하고, 강의 정리를 마무리 합니다. Coursera Machine Learning 코세라 머신러닝 1. 지도 학습 선형회귀, 로지스틱 회귀, 뉴럴 네트워크(인공 신경망), SVM(서포트 벡터머신) 2. 비지도 학습 k-means clustering, 차원 축소를 위한 PCA, 이상 탐지 **물론 이상탐지에서는 레이블을 지정된 데이터를 사용할 수도 있다. 3. 추천 시스템과 속도를 향상할 수 있는 대용량 머신러닝 알고리즘(확률적 경사하강법, 맵축소 접근법 등) 4. 머신러닝 알고리즘이 제대로 작동하는지 확인하는 방법 편향(bias), 분산(variance), 정규화 5. 학습 알고리즘 평가 방법 정확도 평가(accuracy), F1-score, 재현율(recall), 정밀도(precision), training data를 tr

Naver Blog

[코세라 머신러닝] 대규모 머신러닝 학습 알고리즘 :: Map Reduce / Online Learning

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Large Scale Machine Learning : Advanced Topics 강의 내용을 정리한 것이다. 이번 포스팅에서는 새로운 대규모 머신러닝 학습 알고리즘인 '온라인 학습 알고리즘'과 '맵 축소 접근법' 대해 알아보겠습니다. Online Learning 온라인 학습 온라인 학습 알고리즘은 실시간으로 유입되는 데이터를 모델링하고 학습한다. 오늘날 대규모 웹사이트에서 사용하는 여러 버전의 온라인 학습 알고리즘은 웹사이트를 방문하는 사용자들로부터 실시간으로 학습을 한다. 대부분의 웹사이트에서는 연속적이고, 지속적으로 방문하는 사용자들이 데이터를 실시간으로 생성하면서 데이터 스트림이 발생한다. 온라인 학습 알고리즘은 데이터 스트림에서 사용자 선호도를 학습하고 최적화 한다. 예를 들어, 한 택배 회사 웹사이트에서 출발지와 배송지를 입력하면, 배송비 견적

Naver Blog

[코세라 머신러닝] 확률적 경사하강법 Stochastic Gradient Descent Convergence 수렴 여부 확인 학습률

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Large Scale Machine Learning 강의 내용을 정리한 것이다. 앞선 포스팅에서 확률적 경사하강법 알고리즘에 대해서 공부하였습니다. 그런데, 확률적 경사하강법 알고리즘이 완전히 수렴했는지는 어떻게 알 수 있을까요? 답은 경사하강법 알고리즘과 마찬가지로 학습률 α를 조절하는 것입니다. 이번 포스팅에서는 경사하강법 알고리즘이 제대로 작동하고, 수렴하는지를 확인하기 위해 α를 결정하는 몇가지 방법을 알아보겠습니다. Checking for convergence Stochastic Gradient Descent 확률적 경사하강법의 수렴 여부 확인 배치 경사하강법을 사용할 때 알고리즘이 수렴하는지 확인하는 가장 기본적인 방법은 반복 횟수를 함수로 하는 최적화 비용함수를 도식화 하는 것이다. 확률적 경사하강법의 핵심은 매 스텝마다 전체 학습 set을 계

Naver Blog

[코세라 머신러닝] Mini-Batch Gradient Descent 미니 배치 경사하강법

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Large Scale Machine Learning 강의 내용을 정리한 것이다. 저번 포스팅에서는 확률적 경사하강법의 동작방식과 경사하강법보다 확률적 경사하강법이 빠른이유, 두 하강법의 차이점에 대해 알아보았습니다. 이번 포스팅에서는 미니-배치 경사하강법(Mini-Batch Gradient Descent)에 대해 공부합니다. 미니 배치-경사하강법은 때로 확률적 경사하강법보다 조금 더 빠르게 작동할 수 있습니다. Mini-Batch Gradient Descent 미니-배치 경사하강법 우선, 지금까지 배운 알고리즘을 요약해보자. 배치 경사하강법은 각 스텝마다 모든 m개의 학습 예제를 사용한다. 확률적 경사하강법은 각 스텝마다 하나의 학습 예제만을 사용한다. 미니-배치 경사하강법은 두 알고리즘 사이 어딘가에 있다. 미니-배치 경사하강법은 각 스텝마다 b개의 예제

Naver Blog

[코세라 머신러닝] 확률적 경사하강법 Stochastic Gradient Descent VS. Batch Gradient Descent 차이점

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Large Scale Machine Learning 강의 내용을 정리한 것이다. Learning With Large Datasets 대규모 data set으로 학습하기 최근 5년 또는 10년을 뒤돌아 볼 때, 머신러닝이 예전보다 훨씬 더잘 작동하는 이유는 알고리즘이 학습할 수 있는 엄청난 양의 데이터 때문이다. 이번 포스팅에서는 대규모 data set이 있을 때 처리하는 알고리즘을 공부해보고자 한다. 왜 우리는 대규모 data set을 사용할까? 고성능 머신러닝 시스템을 개발하는 가장 좋은 방법 중 하나는 편향이 적은 학습 알고리즘을 사용하여 많은 데이터를 학습하는 것이다. 예를 들면, 알고리즘은 "I ate ( ) eggs" 문장에서 'to','two','too' 중에서 들어갈 단어인 'two'를 많은 데이터를 학습할수록 정확하게 예측할 수 있다. 그렇기

Naver Blog

[코세라 머신러닝] 콘텐츠 기반 추천 시스템 원리 Collaborative Filtering 협업 필터링

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Recommender Systems 강의 내용을 정리한 것이다. Problem Formulation A는 넷플릭스나 왓챠에서 제공하는 서비스와 같이 영화 별점을 예상하여 추천하는 알고리즘을 만드려고 한다. 각 사용자가 몇 편의 영화에 대해 0점~ 5점 사이의 별점을 매기면 그에 기반에 새로운 영화를 추천해주는 시스템이다. 다시말해, 다음 표와 같은 데이터를 사용해서 각 사용자가 평가하지 않은 영화, 즉 ? 자리에 들어갈 점수를 예측하는 것이 목표이다. nu : 사용자 수 = 4 nm : 영화 수 = 5 r(i, j) = 1 : 사용자 j 의 영화i 를 평가한 것을 의미 (otherwise 0) y(i, j) = 사용자가 영화 i 에 준 등급 ; r(i, j) =1 인 경우에만 정의됨. Content Based Recommendation 콘텐츠 기반 추천 A

Naver Blog

[코세라 머신러닝] 이상 탐지 Anomaly Detection 로그변환 오류 분석 새로운 feature 만들기

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Anomaly Detection 강의 내용을 정리한 것이다. Choosing What Features to Use 어떤 feature을 사용해야 할까? Non-Gaussian Features feature가 정규분포를 따르지 않을 때 Feature가 Gaussian 분포를 따르는 것이 이상적이겠지만, 사실 그렇지 못한 경우가 종종 있다. Non-Gaussian Feature를 이용할 때는 Feature을 약간 조정해서 Gaussian 분포를 따르도록 할 수 있다. 예를 들어, 이래와 같은 분포를 보이는 feature를 이용할 경우 log를 취하면, Gaussian 분포에 가까운 분포로 수정할 수 있다. 로그 변환 이외에도, log(x+c), sqrt(x), xc 등을 이용하여 feature transformation을 할 수 있다. Error Analysi

Naver Blog

[코세라 머신러닝] 이상탐지(Anomaly Detection) 시스템 구축 개발 평가 Recall Precision F1-score

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Anomaly Detection 강의 내용을 정리한 것이다. 이상 탐지 시스템 구축하기 이상 탐지 시스템 개발하고 평가하기 Anomay Detection The Importance of Real Number Evaluation 실수 평가의 중요성 (숫자로 표현하는 것의 중요성) 다양한 응용 사례에서 학습 알고리즘을 개발할 때 어떤 feature을 사용할지를 선택한다. 그 때 알고리즘을 수치로 평가한다면 feature을 추가할지 말지를 쉽게 결정할 수 있다. 예를 들어, 특정 feature을 추가한 알고리즘과 특정 피처를 추가하지 않은 알고리즘을 각각 실행하고 수치화된 결과를 확인한다면, 어떤 알고리즘이 성능을 향상시키는지 또는 악화시키는지 쉽게 판단할 수 있다. 따라서, 이상 탐지 시스템을 신속하게 개발하기 위해 알고리즘을 수치로 평가하는 방법은 큰 도움이

Naver Blog

[코세라 머신러닝] Anomaly Detection 이상 탐지, 사례 가우시안 분포 mle 우도함수란?

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Anomaly Detection(이상 감지) 강의 내용을 정리한 것이다. Anomaly Detection 이상 감지 비행기 엔진을 제작하는 공장에서 불량품을 걸러내는 방법을 개발하려고 한다. 문제가 있는 엔진은 발열이나 진동 정도가 비정상적으로 크거나 작다면, 이들을 측정함으로써 불량품을 검출해 낼 수 있을 것이다. 즉, 발열과 진동 세기를 feature로 사용한다. 정상 작동하는 다수의 엔진들(training data)로부터 측정한 feature 값들(빨간점)과 test 하고 싶은 엔진에서 측정한 feature값(파란점)을 비교하여 불량 여부를 판단할 수 있다. 이 포스팅에서는 이와 같은 방법으로 이상(Anomaly)을 검출하는 방법에 대해서 알아본다. Density Estimation 밀도 추정 다음과 같은 데이터를 사전에 수집하였다고 하자. 앞서 살펴

Naver Blog

[머신러닝] PCA (Principal Component Analysis) 주성분 분석 선형회귀 차이, 주성분 개수 구하기

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Dimensionality Reduction 강의 내용을 정리한 것이다. Data Compression 데이터 압축 Feature dimension(데이터 차원)이 쓸데 없이 너무 높아 중복성(redundancy)가 큰 경우, dimension을 줄일 수 있다. 상관관계가 높은 feature를 찾고 그래프를 그려서 두 feature을 동시에 대표할 수 있는 새로운 line을 찾아내는 방법을 쓸 수 있다. Dimensionality reduction(차원 축소)으로 컴퓨터 메모리에 저장되는 데이터 양을 줄이고, 알고리즘 학습 속도를 높일 수 있다. *Dimensionality reduction이란 feature의 개수를 줄이는 것이지 example의 수를 줄이는 것이 아니다. 즉, m은 같은 크기이며, 각 example의 feature 수 n이 줄어드는 것이

Naver Blog

[머신러닝] k-means clustering 개념 :: 비지도 학습 elbow method / Random Initialization

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Unsupervised Learning 강의 내용을 정리한 것이다. Unsupervised Learning 비지도 학습 지금까지의 강의에서는 지도 학습(Supervised Learning) 즉, training set의 label 이 주어지는 경우(답이 정해진 경우)에 대하여 알아보았다. 이제부터는 비지도 학습(Unsupervised Learning)에 대해서 알아보려고 한다. 비지도 학습은 주어진 label 없이 training 한다. 예를 들면, 비슷한 특성을 가진 데이터끼리 묶는 clustering이 있다. (classification과는 다름! / classification : 지도학습) K-Means :: K-Means 알고리즘 개념 주어진 training data (검은색 점)를 K-means 알고리즘을 이용해서 clustering 하는 과정을

Naver Blog

[머신러닝] SVM kernel trick 커널트릭 / 비선형 결정경계 구하는 원리

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Support Vector Machines 강의 내용을 정리한 것이다. 이번 포스팅에서는 Kermels에 대해 알아본다. Non-Linear Decision Boundary 비선형 의사결정 경계 다음과 같은 data에는 비선형 의사결정 경계(non-linear decision boundary)가 필요하다. 여기서 SVM classifier가 목표하는 것은 θ0+θ1x1+θ2x2+···+θ4x12+θ5x12+···≥ 0 일 때 y=1 이 되도록 하는 것이다. 이 때 x1,x2,x12,x22,··· 와 같은 feature 들을 더 일반적인 형태로 표현하기 위해 f1,f2,··· 로 고쳐 써보자. 이와 같은 fx들은 기존의 feature들 (x1,x2,···)을 모종의 과정을 통해 변환한 새로운 feature라고 볼 수 있다. 이제 이 fx를 어떻게 구하면 no

Naver Blog

[머신러닝] 서포트 벡테 머신 SVM 이론 :: Decision Boundary, margin, Cost function

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Support Vector Machines 강의 내용을 정리한 것이다. 서포트 벡터 머신(SVM)은 지도학습 알고리즘으로, 로지스틱 회귀보다 강력할 때가 있다. SVM :: 로지스틱 회귀 대체 알고리즘 우선, 로지스틱 회귀의 hypothesis function을 다시 떠올려보자. 즉, y=1 일 때, θTx ≫ 0 으로 만들어주고, y=0 일 때, θTx ≪ 0 으로 만들어주는 θ를 찾고자 했다. 한 개 training example에 해당하는 cost를 생각해보자. (로지스틱 회귀 cost function) 로지스틱 회귀는 log를 이용해서 cost function을 정의했다. 그러나 SVM은 이와 비슷하지만 piecewise-linear한 함수를 대신 사용한다. 이 함수를 hinge loss function이라고 부른다. **piecewise-linea

Naver Blog

[머신러닝] 분류 모델 성능 평가 지표 : Precision Recall F-score

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Machine Learning System Design 강의 내용을 정리한 것이다. 이번 강의에서는 데이터의 Class 크기가 균등하지 않은 경우에 발생하는 문제와 이 때 시스템 성능을 평가하는 방법도 알아본다. Handing Skewed Data class 별 데이터 수가 균등하지 않은 "편향된 데이터" 다루기 로지스틱 회귀 강의에서 언급했던 cancer classification의 예를 생각해보자. 로지스틱 회귀모델 h(x)를 이용하여 암이면 y=1, 암이 아니면 y=0으로 결정을 내리도록 시스템을 만들었다. 성능을 테스트 해봤더니 test set에서의 error가 1% 였다. 정확도가 99%이니, 아주 잘 작동하는 알고리즘처럼 보인다. 하지만 함정이 있다. 사실 환자의 0.5%만이 실제로 암이라면 어떨까? 항상 y=0으로 결정하는 알고리즘만으로도 0.

Naver Blog

[머신러닝] Error Analysis 오류 분석 :: 이메일 분류 예제 / stemming

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Machine Learning System Design 강의 내용을 정리한 것이다. 이번 강의에서는 스팸 메일 분류의 예시를 통해 실제 시스템을 구현하는데 있어 고려해야할 사항을 살펴본다. Building a Spam Classifier 스팸 분류기 생성하기 지도학습 x : 이메일의 특성 y : 스팸 메일(1) 또는 스팸 아닌 메일(0) spam/non-spam을 구별할 수 있는 단어 100개를 추려서, feature x를 그러한 단어가 email에 포함되어 있는지 여부를 나타내는 vector로 표현할 수 있다. spam/non-spam을 구별할 수 있는 단어가 deal, buy, Andrew(수신자 이름), now, ··· 등이라고 하자. 이메일 내용 이메일이 다음과 같이 주어졌다고 하자. 그러면 x'=[1 1 0 1 ···]으로 나타낼 수 있다. Buy

Naver Blog

Learning Curve 학습곡선 :: High Variance, High Bias 해결하기

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Learning Curves 강의 내용을 정리한 것이다. Learning Curves Curve 학습하기 Training error / Validation error 특징 Training error Training example 개수에 따라 error 그래프를 그려보는 것으로 overfitting과 underfitting을 진단할 수 있다. 이러한 그래프를 Learning Curve라고 한다. 오른쪽 그림을 보면 Trining data에서 m의 크기가 커질수록 training error는 커지는 것을 확인할 수 있다. validation data에서는 m의 크기가 커질수록(데이터가 많을수록) error가 감소하는 경향이 있다. 1. High Bias (underfitting의 경우 High Bias) High Bais 일 때 error 분포 High Bia

Naver Blog

High Bias vs. High Variance 진단 / 정규화항 적절한 람다 λ 고르기

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Bias vs Variance 강의 내용을 정리한 것이다. Diagnosing Bias vs. Variance 편향과 편차 진단 Training error와 (cross) Validation error를 다음과 같이 정의하였다. 다항식의 차수 d에 대해서 Jcv(θ) 와 Jtrain(θ)를 그려보면 training error는 d가 커질수록 줄어들지만 cross validation error는 d=2에서 최솟값을 갖는다. 어떤 머신러닝 알고리즘의 성능이 기대한만큼 나오지 않았을 때, 즉 Jcv(θ) 또는 Jtrain(θ)가 클때, 문제가 bias 인지, variance인지 어떻게 판단할 수 있을까? High bias (underfitting)는 Jtrain(θ) 이 크다. 즉, Jcv(θ) ≈ Jtrain(θ) 인 형태를 띤다. 반면 high varianc

Naver Blog

[coursera 머신러닝 강의] 알고리즘 성능 향상 시키기 :: Training, Test, Validation set / Validation set 역할

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Machine Learning Diagnostic 강의 내용을 정리한 것이다. Debugging a Learning Algorithm 알고리즘 수정하기 앞서, 집 값 예측을 위해 우리는 정규화된 선형회귀를 사용하였다. 그 때의 cost function은 다음과 같다. 그런데 이 hypothesis를 새 데이터에 적용했을 때, 예측 error가 컸다고 해보자. (underfitting 되었다고 하자.) 그러면 어떻게 알고리즘의 성능을 수정할 수 있을까? 시도해볼 수 있는 방법은 다음과 같다. 1. Training example 수를 늘린다. 2. Feature 개수를 늘린다. 3. Polynomial feature를 추가한다. (다항식 항을 추가한다.) 4. λ를 조절한다. (늘리거나 줄인다.) 그러나 이 방법들을 아무런 기준 없이 시도하기보다 현재 알고리즘

Naver Blog

Neural Network 뉴럴 네트워크 쉽게 이해하기 backward propagation

전 포스팅에서 코세라 뉴럴 네트워크 강의를 정리했다. 코세라 뉴럴 네트워크 강의 정리 포스팅 https://blog.naver.com/dbwjd516/222206046209 https://blog.naver.com/dbwjd516/222207085336 코세라 머신러닝 강의의 뉴럴 네트워크(Neural Network) 내용이 잘 이해되지 않아 쉽게 풀어서 정리해보았다. 인간의 뇌는 신경계의 기본 단위인 뉴런(Neuron)이 무수히 연결되어 있는 구조이다. 뉴런 하나의 모습을 보면 다음 그림과 같다. 입력단(dendrites)에서 외부 신호를 수용하고 출력단(axon)을 통해 신호를 출력한다. 뉴련을 수학적 모델로 표현하면 다음과 같다. 뉴런의 입력단으로 들어오는 여러 개의 신호(입력값 x, 가중치 θ)를 하나로 합산한 후 activation function을 통해 자신의 출력으로 만들어 낸다. Cell Body에서 하는 일은 입력값 x와 가중치 θ를 곱하는 것이다. 이때 우리는 ac

Naver Blog

[coursera 머신러닝 강의] 뉴럴 네트워크 Neural Network 비용함수 backpropagation Gradient Checking

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Neural Network 강의 내용을 정리한 것이다. 뉴럴 네트워크 Multiclass Classification Multiclass Classification을 하려면 output unit을 class 개수만큼 두면 된다. 예를 들어 데이터를 4개 클래스로 나누고자 한다면 다음과 같이 나타내면 된다. 마지막 layer(그림에서 3번째 layer)는 theta matrix에 곱해져서 새로운 vector가 될 것인데 이 vector는 g(·) 즉, 로지스틱 함수를 적용하여 hypothesis 값을 찾는 vector이다. 한 input에 대한 결과 hypothesis의 예시는 다음과 같다. 이 때 classification 결과는 3번째 클래스 혹은 hΘ(x)3 에 해당한다. 가능한 h(x) 경우 뉴럴 네트워크 Cost Function 앞서 공부했던 로지스틱

Naver Blog

[coursera 머신러닝 강의] 뉴럴 네트워크 Neural Network 개념 구조 예제

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Neural Networks 강의 내용을 정리한 것이다. Non-linear Hypotheses 지금까지 알아본 선형 회귀(linear regression)나 로지스틱 회귀(logistic regression)로는 복잡한 데이터를 다루는 데 한계가 있다. 예를 들어, 다음과 같이 분포하는 데이터는 non-linear decision boundary가 필요하다. 물론 로지스틱 회귀를 이용해서 non-linear boundary를 만들 수 있긴 하다. 예를 들어, 다음과 같이 3개의 feature로부터 만들어 낼 수 있는 2차항들을 포함하는 hypothesis를 만든다고 하자. 이 경우, 새로운 6개 feature을 이용한 것으로 볼 수 있다. 즉, 원래 3개 feature를 두 개씩 묶는 가능한 경우의 수 3H2=6이 새 feature의 개수가 된다. 그런데

Naver Blog

[coursera 머신러닝 강의] Overfitting underfitting 해결 Regularization 정규화 람다 λ

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 정규화(Regularization) 강의 내용을 정리한 것이다. 정규화를 하는 이유? Overfitting 문제 해결 → overfitting 이란? The Problem of Overfitting Feature(변수)가 너무 많으면 문제가 생긴다. Hypothesis function이 너무 복잡해지기 때문이다. 이 복잡한 함수는 training set의 데이터 분포를 거의 똑같이 모델링 할 수는 있을 것이다. 그러나 우리의 목적은 training data와 완벽하게 똑같은 모델을 만드는 것이 아니라, 새로운 데이터에 대해서 target(y값)을 정확하게 예측하는 것이다. training data에 지나치게 맞춰진 모델은 오히려 새로운 데이터를 예측하는데 실패할 수 있다. 이와 같이 training data에 지나치게(over) fit되어 일반적인 추세를

Naver Blog

[coursera 머신러닝 강의] 로지스틱 회귀 Multiclass Classification 다중 분류 One-vs-All

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 교수가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 로지스틱 회귀 : Multi-Class Classification 강의 내용을 정리한 것이다. https://blog.naver.com/dbwjd516/222203693899 [coursera 머신러닝 강의] 로지스틱 회귀 Logistic regression Decision Boundary 비용함수 Gradient Descent 머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 ... blog.naver.com 위의 포스팅에서 로지스틱 회귀는 이중 분류(Binary Classification)을 하기 위해 사용된다는 것을 설명하였다. 이번에는 다중 분류(Multiclass Classification)을 하는 방법에 대해 설명하겠다. Binary Classification은 두 개의 선택지 중 하

Naver Blog

[coursera 머신러닝 강의] 로지스틱 회귀 Logistic regression Decision Boundary 비용함수 Gradient Descent

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Logistic Regression 강의 내용을 정리한 것이다. 오늘은 전 포스팅에 이어 로지스틱 회귀에 대한 얘기를 이어 나가 보려고 합니다. 전 포스팅을 먼저 읽어보시고 다음 포스팅을 보시는 것을 권장드립니다. https://blog.naver.com/dbwjd516/222201864419 [coursera 머신러닝 강의] Logistic regression 로지스틱 회귀 기초 Hypothesis 머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 ... blog.naver.com 분류 경계 Decision Boundary 분류 경계(Decision boundary)는 y=0(class0)과 y=1(class1)을 가르는 경계선을 말하며 hypothesis function에 의해 결정된다. 예

Naver Blog

[coursera 머신러닝 강의] Logistic regression 로지스틱 회귀 기초 Hypothesis

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Logistic Regression 강의 내용을 정리한 것이다. 분류 (지도학습) classification Linear regression 이 주어진 feature(x)에 따라 연속적인 target(y) 값을 추정하는 방법이라면, classification은 주어진 feature에 따라 데이터를 이산적인 class에 분류하는 방법이다. 예를 들면, 받은 이메일이 스팸인지 아닌지, 어떤 종양이 양성인지 악성인지 등을 판별하는 것은 분류 문제에 속한다. 분류에는 여러 개의 class로 분류하는 다중 분류(multi-class classification)와 두 개의 class로 분류하는 이중 분류(binary classification)가 있다. 로지스틱 회귀(Logistic regression)은 분류 문제에 속한다. 이중 분류 Binary Classific

Naver Blog

[coursera 머신러닝 강의] Normal Equation 정규 방정식 : 경사 하강법 외 최적값 찾는 방법

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Computing Parameters Analytically 강의 내용을 정리한 것이다. 정규 방정식 Normal Equation 선형회귀에서 최솟값을 찾는 방법에는 앞 포스팅에서 언급한 경사 하강법(Gradient descent) 이외에도 정규 방정식(Normal Equation)을 이용하는 방법이 있다. 경사 하강법(Gradient descent)가 여러번 반복을 해야하는 것과 달리, 정규 방정식(Normal Equation)은 한번에 최적해를 찾을 수 있다는 특징이 있다. 정규 방정식 접근법 Normal Equation Intuition (1) Feature가 1개인 경우, J(θ)는 2차 방정식의 꼴이 된다. 따라서 최적해(최솟값)를 찾기 위해서는 θ에 대해 미분을 하고 그 값이 0이 되도록 설정하여 풀면 된다. (2) Feature가 여러 개인 경

Naver Blog

[coursera 머신러닝 강의] 다항 회귀(Polynomial Regression) Feature / hypothesis 개선 방법

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Features and Polynomial Regression 강의 내용을 정리한 것이다. 새로운 변수(Feature) New Feature 여러 개의 feature을 하나로 합쳐 새로운 feature로 이용할 수 있다. 예를 들어, A가 집 값을 추정할 때 집 면적의 가로, 세로 길이를 이용했다고 하자. 이 두 feature(가로,세로)를 이용하면 다소 복잡하다는 단점이 있다. 이 때 해결법은 가로, 세로를 곱합 값. 즉, 넓이를 새로운 feature로 이용하는 것이다. 이렇게 함으로써 2개의 feature을 1개의 feature로 줄여서 표현할 수 있다. 다항 회귀 Polynomial Regression Hypothesis function이 반드시 linear(직선)이어야 하는 것은 아니다. 데이터에 잘 맞도록, 잘 fitting 되도록 하는 것이 가장

Naver Blog

[coursera 머신러닝 강의] Feature scaling 정규화 학습률

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Gradient Descent in Practice 강의 내용을 정리한 것이다. Feature Scaling Feature Scaling 이란, Feature 들의 크기, 범위를 정규화 시켜주는 것을 의미한다. Feature Scaling은 아래의 예처럼 0~2000, 0~5 처럼 범위 차이가 많이 날 때 시행한다. x_0가 0~2000, x_1이 0~5의 범위를 갖고 있다면, 각각의 x_0와 x_1을 x_0/(2000-0), x_1/(5-0)을 통해 0~1 사이의 값으로 조정한다. 모든 feature가 비슷한 범위에 있으면 경사 하강법에서 수렴하는 속도를 빠르게 하는데 도움이 된다. 첫 번째 그림처럼 타원 모양으로 범위가 존재한다면 여기저기 방향을 바꿔가며 최솟값으로 수렴하지만, 두 번째 그림처럼 feature가 비슷한 범위에 있어서 범위가 원을 이룬다면

Naver Blog

[coursera 머신러닝 강의] Multiple Linear Regression 다중 회귀 비용함수 경사하강법

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Multiple Linear Regression 강의 내용을 정리한 것이다. 다중 변수 Multiple features 지금까지는 하나의 변수를 이용한 univariate linear regression에 대해서 알아보았다. 그러나 실제 상황에서는 하나의 변수만으로 예측하기 어려운 경우가 많다. 이번 장에서는 여러 개의 변수를 이용한 다중 회귀(multiple linear regression)에 대해 포스팅하겠다. 다시 집 값 추정 문제를 생각해보자. A는 원래 집의 넓이만 고려했다. 이를 보고 B는 평수 외의 요소들도 고려하면 더 정교하게 추정할 수 있을 것이라고 조언했다. 그래서 이번에는 집 넓이(x1)뿐만 아니라 방의 개수(x2), 층 수(x3), 건물의 연령(x4)를 고려해서 집 값(y)를 추정해 보기로 했다. 집 값 추정 문제 예시 Notation

Naver Blog

[coursera 머신러닝 강의] Parameter Learning 경사 하강법 Gradient Descent

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Parameter Learning(Gradient Descent) 강의 내용을 정리한 것이다. https://blog.naver.com/dbwjd516/222194917428 [coursera 머신러닝 강의] Univariate Linear Regression 비용함수 LSE MSE 머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 ... blog.naver.com 전 포스팅에서 우리는 cost function J(θ)가 최솟값을 갖도록 하는 모수를 구하고자 한다는 것을 배웠다. 이번 포스팅에서는 cost function J(θ)가 최솟값을 갖도록 하는 값을 자동으로 구하는 법에 대해 알아보려고 한다. 이는 경사 하강법 (Gradient Descent)을 통해 구할 수 있다. 경사 하강법 Gra

Naver Blog

[coursera 머신러닝 강의] Univariate Linear Regression 비용함수 LSE MSE

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Univariate Linear Regression 강의 내용을 정리한 것이다. https://blog.naver.com/dbwjd516/222194316797 [coursera 머신러닝 강의] Univariate Linear Regression 선형회귀 머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 ... blog.naver.com 위 포스팅에 이어서 선형 회귀를 설명하는데 필요한 비용함수 cost function에 대한 포스팅을 진행하겠다. 비용 함수 Cost function 가설은 다음과 같이 정의한다. Hypothesis : h_θ(x) = θ_0 + θ_1 x * h_θ(x)는 간단히 h(x)로 표기하기도 한다. 이 때 θ_i 들은 모수(parameter)라고 한다. 우리가 정한 선

Naver Blog

[coursera 머신러닝 강의] Univariate Linear Regression 선형회귀

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Univariate Linear Regression 강의 내용을 정리한 것이다. 모델 표현 Model Representation A가 집을 사려고 한다. 만약 B가 사는 1500제곱피트짜리 집이 24만불이고, C가 사는 1000제곱피트짜리 집이 20만불이면 A가 사고자하는 1250제곱피트짜리 집은 그 중간인 22만불정도가 적당하다고 생각할 것이다. 이런식으로 A는 원하는 집의 넓이에 따른 적정 가격을 추정하기 위해, 몇 군데 집의 넓이와 가격 정보를 수집하였다. A가 조사한 집의 넓이 & 가격 정보 이 경우, 사전에 수집한 집 값(y) 정보라는 정답이 존재하므로 지도학습에 해당하며, 추정하고자하는 값이 실수 값이므로 회귀문제이다. 여기에 집의 넓이와 가격 사이에 선형관계가 존재한다고 가정하면 선형 회귀(linear regression)이 되는 것이다. 수집

Naver Blog

[coursera 머신러닝 강의] Introduction 지도학습 비지도학습

머신러닝 / 딥러닝 기초를 다지고자 coursera에서 Adrew Ng 강사가 진행하는 머신러닝 강의를 수강하게 되었다. 다음은 Introduction에서 진행하는 강의 내용을 정리한 것이다. 머신러닝 이란? Machine Learning 전통적으로 programming이라고 하면 "A조건에서는 B 명령을 수행하라"와 같이 사람이 구체적으로 규칙을 정해주는 과정이었다. 그러나 이러한 programming에는 한계가 있다. 예를 들어, 스팸 메일을 거르는 필터를 만든다고 하자. 스팸 메일에는 "광고"라고 알려주는 문구가 버젓이 걸려있는 경우는 거의 없다. 이 때문에 스팸 메일을 걸러내려면 정말 많은 규칙을 정해야 한다. 하지만 이는 상식적으로 불가능하기에, 이러한 문제를 해결하기 위해 머신러닝. 즉, 기계가 스스로 어떤 패턴을 학습하도록 하는 접근법이 등장하였다. 정리하자면 머신러닝이란, 프로그래머가 직접 수많은 규칙을 미리 정해주는 대신 프로그램 자체가 데이터를 통해 스스로 학습하도

Naver Blog

데이터 분석과정 전처리 모델링 해석

본 포스팅은 학회 활동을 위해 데이터 전처리 과정 공부 내용을 정리한 내용입니다. 데이터 전처리 Data preprocessing 특정 분석에 적합하게 데이터를 가공하는 작업을 의미한다. 업무활동이나 현업에서 발생하는 데이터는 분석,머신러닝(딥러닝)에 적합하지 않은 경우가 많다. 의미 없는 값이 포함되어 있거나, NA값이 존재하거나, 변수가 많은 경우 데이터의 품질을 떨어뜨린다. 이를 방지하기 위한 작업이 "데이터 전처리"이다. 실제 현업에서의 데이터는 러프한 경우가 많다고 한다. "데이터 과학의 80%는 데이터 클리닝에 소비되고, 나머지 20%는 데이터 클리닝하는 시간을 불평하는데 쓰인다." Kaggle 창립자 Anthony Goldbloom 데이터 분석 과정 1. 문제 정의 2. 데이터 수집 3. 데이터 탐색 및 전처리 4. 모델링 5. 해석 및 시각화 6. 피드백 1. 문제 정의 데이터 분석 과정에서 가장 중요한 단계이자, 어려운 단계이다. 문제가 제대로 설정되지 않으면 "문제

Naver Blog

2021.05.02(일) 오늘의 일기

매일매일 챌린지 시즌1 #오늘일기 2021.05.02(일) 오늘은 문화 생활의 날?! 영화관 가는 길 오늘도 어제에 이어서 밀린 강의 듣고 과제를 하려고 했는데..! 너무 공부가 하기 싫어서 영화관으로 탈출을 했다. 오늘 날씨는 정말 맑음! 영화관에서 돌아올 때쯤에는 바람이 조금 불어서 쌀쌀했지만ㅎㅎ 집 주변에 영화관이 생긴 이후로는 예전보다 자주 영화를 보러가게 되는 것 같다. 혼자가는 날도 점점 늘어나는 듯 하다. 오빠가 군대를 안갔다면 매일 끌고 갔을 것 같긴 한데! 혼자서도 잘 다니고 있다는 점~ㅎㅎ 비와 당신의 이야기 영화를 촬영한다는 소식을 들었을 때부터 봐야겠다고 생각한 작품! 사실 천우희 배우가 너무 매력 있어서 인스타 팔로우하고, 유튜브 구독하다가 영화 촬영한다는 걸 알았다.ㅎㅎ 영화는 되게 조용하고 감성적이다. 영화 제목처럼 비오는 날, 뭔가 차분해지는 날 보면 더 좋을 듯하다. 이 영화를 보고 느낀 점은.. 진짜 운명이 있는 걸까? 내 운명은 어디에?ㅋㅋ 암튼 간

Naver Blog

2021.05.03(월) 오늘의 일기

매일매일 챌린지 시즌1 #오늘일기 2021.05.03(월) 오늘은 아무것도 한게 없는데 피곤한 날.. 월요일 1교시 수업이 있는 날이기 때문.. 아침 수업이 있는 날은 녹화를 해두고 자는 날이다. (교수님이 내 글을 보진 않겠지?ㅋㅋ) 근데 녹화를 해두고 무작정 자는게 아니라.. 귀는 열고 자야 되기 때문에.. 일어나면 두 배로 피곤하다. 제 때 수업을 들어야하는데 그건 정말 너무나도 힘든 일이다. 오늘도 어김없이! 자다가 일어나서 겨우겨우 정신을 차렸다. 하.. 이러면 안되는데,, 이따가 아침에 밀린 수업을 들어야 한다아.. 백종원 스팸마요 덮밥 아점을 먹으려고 보니 아무 것도 없길래 곧 바로 백종원 아저씨 유튜브를 켜서 '스팸 마요 덮밥' 레시피를 찾았다ㅋㅋ 오늘 처음 해먹어 봤는데 나름 맛있었다. 근데 칼로리가 너무 높아보여서 자주 해먹으면 안될 것 같다^^ 표설 점수.. 밥을 정말 맛있게 먹고 있는데 학교 동기가 표본설계 중간고사 점수가 나왔다고 카톡이 왔다. 하하하하.. 하

Naver Blog

김남길 나이 키 학력 데뷔과정 소속사 드라마 영화 열혈사제 후속작 사진

안녕하세요 :)오늘은 배우 김남길님을 소개할게요!제가 처음으로 본 김남길의 작품은 &#x27;선덕여왕&#x27;...

Naver Blog

공효진 나이 키 학력 류승범 영화 드라마 동백꽃필무렵 가장보통의연애 사진 모음

안녕하세요 :)오늘은 배우 공효진님을 소개하려고해요.아주 오랜만의 여배우 포스팅이네요ㅎㅎ공효진님은 ...

Naver Blog

동국대 동대닭한마리 :: 해장에도 몸보신에도 좋아~

해장에도! 몸보신에도!동대 닭한마리안녕하세요 :)요즘 통바빠서 포스팅을 많이 못하고 있네요.왜 바쁜지...

Naver Blog

동상이몽 강남 이상화 결혼준비 일상 최초공개! 본방사수 가자~

동상이몽 강남 이상화 일상 공개!&#x27;동상이몽2-너는 내 운명&#x27;에 새롭게 합류하는 강남 이상화 커플...

Naver Blog

방탄 정국 열애설 아미 해쉬스완 &quot;진짜 역겨워. 토할것 같아&quot; 사건 순서대로 알려드립니다.

오늘 아침 , 가수 해쉬스완이 그룹 방탄소년단 멤버 정국의 열애설에 휘말려 부인했지만 팬들로부터 악성 ...

Naver Blog

미우새 미운우리새끼 이상윤 진짜 고민은?

15일 SBS 예능 &#x27;미운 우리 새끼&#x27;에 배우 이상윤씨가 게스트로 출연 했는데요. 자신만의 고민...

Naver Blog

전참시 도티 매니저 유병재 소속사 도티 반전스펙

어제 전참시에서 &#x27;초통령&#x27;이라고 불리는 250만명의 구독자를 보유한 게임 유튜버 도티가 출연했...

Naver Blog

류준열 나이 키 군대 드라마 영화 류준열혜리 열애설 결별설 응답하라1988 봉오동전투 남친짤 모음

안녕하세요 :)오늘은 배우 류준열을 소개할게요.드라마 &#x27;응답하라 1988&#x27;을 계기로 얼굴을 알리고...

Naver Blog

조찬형 나이 키 전참시 영화 드라마 테이매니저 사진모음

안녕하세요 :)오늘은 영화배우 조찬형씨를 소개하려고해요.저번주부터 전참시에 테이 매니저로 출연하면서 ...

Naver Blog

최희서 결혼 직접 결혼발표 박열 동주 아워바디

배우 최희서가 결혼을 직접 발표했다.최희서는 6일 자신의 브런치에 첫 에세이 글을 게재하며 오는 9월 ...

Naver Blog

오연서 안재현 구혜선인스타 오연서 입장 전문 법적대응 예고

구혜선과 안재현의 이혼 폭로에 오연서가 참여하면서 일이 더 커지고 있는 모양새다.구혜선의 인스타그...

Naver Blog

HB엔터테인먼트 문보미/ 안재현 드라마 관계자가 밝힌 촬영장 뒷이야기

HB엔터테인먼트, 구혜선·안재현 소속사안재현, 문보미 대표와 구혜선 험담?구혜선과 안재현이 결혼 3년 ...

Naver Blog

여진구 나이 키 학력 드라마 영화 출연작 아역시절 호텔델루나 구찬성 남친짤

안녕하세요 :)오늘은 배우 여진구님을 소개할게요.요즘 아이유와 함께 호텔 델루나에서 열연을 펼치고 계시...

Naver Blog

아이유 이지은 나이 키 노래 드라마 호텔 델루나 장만월 여친짤

안녕하세요 :)오늘은 가수이자 배우아이유(이지은)님을 소개해드릴게요.요즘 드라마 호텔 델루나에서 엄청...

Naver Blog

율희 임신 쌍둥이 살림남 최민환

‘살림하는 남자들 시즌2’ 최민환과 율희가 둘째 소식을 접했다. 28일 방송된 KBS2 예능프로그램 ‘...

Naver Blog

조국 여배우 후원 김용호기자 연예부장 여배우는 누구?

조국 여배우 후원?김용호 &quot;조국과 여배우 관계 밝히기 위해 호텔방까지 잡았다&quot;조국 여배우 후원...

Naver Blog

변상욱 YTN 앵커 수꼴 발언 논란 수꼴뜻 조국

변상욱 YTN 앵커가 조국 법무부 장관 후보자를 비판한 청년을 조롱하는 듯한 발언을 해 논란이 일고 있...

Naver Blog

송유빈 김소희 키스 사진 열애설 사생활 프듀출신 아이돌 컴백 럽스타그램 소속사 입장

그룹 마이틴 출신 가수 송유빈(21)과 그룹 아이비아이 출신 김소희(24)로 추정되는 사생활 사진이 유츌돼 ...

Naver Blog

이필모 서수연 결혼 득남 연애의맛

배우 이필모가 아빠가 된 소감을 밝혔다.이필모는 20일 오후 자신의 SNS에 &quot;13시간의 진통끝에 ...

Naver Blog

[스포없는 영화 프리뷰] 기방도령_ 조선시대 코믹사극!

안녕하세요~유 정입니다^^얼마 전에 친구랑 애나벨3를 보러갔는데거대하게 기방도령 광고를 하고 있더라구...

Naver Blog

동국대 맛집 _ 이대헌 스시

안녕하세요!유 정 입니다~^^모두들 주말 푹 쉬시고 계신가요?^^오늘은 얼마전에 다녀온 동국대 초밥맛집 ...

1 2 3