전체 글 51

다층 퍼셉트론

1986년 첫 번째 빙하기의 끝 단층 퍼셉트론으로 인해 딥러닝에는 빙하기가 왔었는데, 80년대 다층 퍼셉트론의 등장으로 딥러닝의 가장 기본적인 이론들이 발전하기 시작했다. 비 선형적인 문제 해결 선형적이다 : 선 하나로 데이터를 분리 가능 비 선형적 : 선 으로만 데이터 분리 불가능 단층 퍼셉트론은 퍼셉트론이 하나만 있는 경우이다. 다층 퍼셉트론 단층 퍼셉트론을 여러개 쌓은 것을 다층 퍼셉트론이라고 부른다. MLP라고도 부른다. 강아지와 고양이를 선 하나로만 분류할 수 없기에 여러개의 퍼셉트론 결과를 조합하여 분류한다. 히든층 입력층과 출력층 사이의 모든 Layer를 히든층이라고 부른다. 히든층의 개수와 딥러닝 히든층이 많아질수록, 깊은 신경망이 되서 Deep Learning이라는 단어를 사용한다.

퍼셉트론이란

인공지능, 머신러닝, 딥러닝의 관계 인공지능을 구현하기 위한 방법 중 하나가 딥러닝! 딥러닝이란 머신러닝의 여러 방법론 중 하나로, 인공 신경만에 기반하여 컴퓨터에게 사람의 사고방식을 가르치는 방법이다. 인공신경망이란, 생물학의 신경망에서 영감을 얻은 학습 알고리즘으로, 사람의 신경 시스템을 모방한 것이다. 딥러닝의 발전 과정 1958년에 Perceptron이 처음 제안되었다. 딥러닝은 2012년에 이미지넷이라는 Chanllenge를 통해서 주목받기 시작하였다. 2012년도에 이미지넷에서 GPU를 사용한 딥러닝 모델 AlexNet이 출시되었다. 이 AlexNet은 기존에 있던 이미지넷의 정확도를 한 순가에 끌어올리고, 이 사건을 기반으로 딥러닝이 다시 주목을 받기 시작하였다. 또한 지금까지 많은 연구가 ..

회귀 평가 지표

회귀 알고리즘 평가 데이터와 머신러닝을 통해서 모델을 만든 후, 어떤 모델이 좋은 모델인지를 어떻게 평가할 수 있을까요? 우리는 목표를 얼마나 잘 달성햇는지 정도를 평가해야 합니다. 즉, 실제 값과 모델이 예측하는 값의 차이에 기반한 평가 방법을 사용합니다. 모델의 평가지표로는 RSS, MSE, MAE, MAPE, R^2가 있습니다. RSS - 단순 오차 Loss의 값이 작을수록 모델의 성능이 좋다고 판단 1. 실제 값과 에측 값의 단순 오차 제곱의 합 2. 값이 작을수록 모델의 성능이 높음 3. 전체 데이터에 대한 실제 값과 예측하는 값의 오차 제곱의 총합 RSS의 특징 - 가장 간단한 평가 방법으로 직관적인 해석이 가능함 - 오차를 그대로 이용하기 때문에 입력 값의 크기에 의존적이다. (예를들어 데이..

회귀- 다중 선형 회귀

단순 선형 회귀에서 다루었던 아이스크림 판매량 예측 예시를 다시 떠올려 봅시다. 회귀 - 단순 선형 회귀 * 좀 더 이론적인 내용 [머신러닝] 회귀 - 단순 선형 회귀분석 회귀분석이란 회귀분석은 독립변수와 종속변수의 관계를 추정하는 통계분석이다. 예를 들어서, 각 집마다 아버지와 아들의 키를 조 byeon-sg.tistory.com 단순 선형 회귀는 입력값이 기온 하나였습니다. 만약 우리가 기온뿐만 아니라, 강수량도 입력값으로 사용한다면 어떻게 판매량을 예측할 수 있을까요? 우리가 해결하고자 하는 문제는 평균 기온(X1)과 평균 강수량(X2)에 따른 아이스크림 판매량을 예측하는 것입니다! 즉, 여러 개의 입력값으로 결과값을 예측하고자 할 때 우리는 다중 선형 회귀(Multiple Linear Regres..

회귀 - 단순 선형 회귀

* 좀 더 이론적인 내용 [머신러닝] 회귀 - 단순 선형 회귀분석 회귀분석이란 회귀분석은 독립변수와 종속변수의 관계를 추정하는 통계분석이다. 예를 들어서, 각 집마다 아버지와 아들의 키를 조사해서 아버지의 키가 아들의 키에 얼만큼의 영향을 미쳤는 byeon-sg.tistory.com 회귀 그게 뭔데? 회귀의 개념을 살펴보기 전에 아래의 우리가 아래의 상황에 처해있다고 가정합시다! 우리가 아이스크림 가게를 운영하는 주인입니다. 아이스크림을 판매량보다 많이 주문하여 버려지는 상황을 방지하고자, 우리는 판매용 아이스크림을 주문 할 때, 예상되는 실제 판매량만큼 주문하고 싶습니다. 이때 평균 기온을 활용하여 미래 판매량을 예측 할 수 있을까요? 문제 정의와 해결 방안 문제 정의 - 데이터 : 과거 평균 기온(X..

데이터 정제 및 분리

결측값 처리하기 일반적인 머신러닝 모델의 입력 값으로 결측값을 사용할 수 없습니다. 따라서 Null, None, NuN등의 결측값을 처리해야 합니다. 대표적인 결측 값 처리 방식에는 세 가지가 있습니다. 1. 결측값이 존재하는 샘플 삭제(행) 2. 결측값이 많이 존재하는 변수 삭제(열) 3. 결측값을 다른 값으로 대체 1. 결측값이 존재하는 샘플 삭제(행) 결측값이 있는 샘플을 제거하기 위해서는 'dropna'를 사용합니다. DataFram.dropna() 2. 결측값이 많이 존재하는 변수 삭제(열) pandas의 DataFrame에서 특정 변수(Columns)를 삭제하기 위해서는 'drop'을 사용합니다. DataFrame.drop(columns=['Cabin']) import pandas as pd ..

머신러닝 수치형 자료 전처리

머신러닝 범주형 자료 전처리 범주형 자료를 머신러닝으로 처리하기 위해서는 자료를 변환해주어야 합니다. 본격적으로 자료 변환법을 다루기 전, 사용할 데이터에 대해 먼저 알아보겠습니다 :) 범주형 자료를 변환하기 위 byeon-sg.tistory.com 앞서 범주형 자료 전처리에 대해 다루어봤으니, 이제 수치형 자료 전처리를 살펴보겠습니다 :) 수치형 자료의 개념 수치형 자료 크기를 갖는 수치형 값으로 이루어진 데이터를 의미합니다. 타이타닉 데이터에서는 Age, SibSp, Parch ,Fare가 수치형 데이터에 해당됩니다. 수치형 자료의 데이터 변환 수치형자료는 머신러닝의 입력으로 바로 사용할 수 있지만, 모델의 성능을 높이기 위해서 데이터 변환이 필요한 경우가 있습니다. 수치형 자료 변환 방식 1. 스케..

머신러닝 범주형 자료 전처리

범주형 자료를 머신러닝으로 처리하기 위해서는 자료를 변환해주어야 합니다. 본격적으로 자료 변환법을 다루기 전, 사용할 데이터에 대해 먼저 알아보겠습니다 :) 범주형 자료를 변환하기 위해서 아래의 타이타닉 생존자 데이터를 사용할 것입니다. 아래 표는 데이터에 대한 설명입니다. 범주형 데이터는 몇 개의 범주로 나누어진 자료입니다. 그렇다면 타이타닉 생존자 데이터에서는 어떤 항목이 범주형 자료일까요? PassengerId를 보면 각 승객의 고유 번호에 맞게 데이터를 나누고, Survived는 생존했냐 안했냐를 숫자로 옮겼고, Pclass는 등급에 따라 데이터가 나뉩니다. Name은 양이 많은 범주형 데이터라고 생각할 수 있습니다! 이외에 Sex, Ticket, Cabin, Embarked도 범주형 자료에 해당..

머신러닝의 과정과 데이터 전처리

머신러닝 과정 1. 데이터 수집 2. 데이터 분석 및 전처리 3. 머신러닝 학습 4. 머신러닝 평가 1>>2>>3>>4 항상 순서대로 가는 것이 아니라, 그때그떄 결과에 맞게 1>>2>>3>>4>>3 이런식으로 가기도! 데이터 전처리의 역할 1. 머신러닝의 입력 형태로 데이터 변환(특성 엔지니어링) 2. 결측값 및 이상치를 처리하여 데이터 정제 3. 학습용 및 평가용 데이터 분리 1. 머신러닝의 입력 형태로 데이터 변환(특성 엔지니어링) 대부분의 머신러닝 모델은 숫자 데이터를 입력 받는다 범주형 데이터도 수치형으로 변환할 필요가 있다. 전처리를 통해서 아래와 같은 행렬 형태로 바꿔주는 과정 필요! 실제 데이터는 다양한 형태로 존재한다. 하지만 이런 데이터는 머신러닝 모델이 이해할 수 없는 형태로 되어있다..

머신러닝 개요 - 머신러닝이란

머신러닝의 배경 빅데이터의 등장으로 수 많은 정보가 디지털 데이터로 저장되고 있다. 빅데이터를 통하여 IOT, Cloud, ML 기술이 상호 협력하고 있다. 이렇게 큰 데이터를 분석하고 처리하기 위한 도구가 필요하다. 빅데이터와 ML 머신러닝은 빅데이터를 분석할 수 있는 강력한 툴로, 기존 통계학 및 시각화 방법의 한계를 해결해준다. ex) 예측, 패턴 파악, 추천 시스템 머신러닝이란 머신러닝의 개념 : 무엇(x)로 무엇(y)을 예측하고 싶다. 명시적으로 프로그래밍을 하지 않고도 컴퓨터가 학습할 수 있는 능력을 갖게 하는 것. 머신러닝은 데이터가 들어왔을 때 사람이 케이스를 나누는 것이 아니라, 기계가 스스로 예측을 한다. 데이터가 작다면 괜찮지만, 크기에 머신러닝이 필요하다. 결국 머신러닝은 X와 Y사..

반응형