전체 글 51

colab에서 darknet를 이용한 yolov4 실습

코랩 참고 사이트 : https://colab.research.google.com/drive/1_GdoqCJWXsChrOiY8sZMr_zbr_fH-0Fg?usp=sharing#scrollTo=iZULaGX7_H1u YOLO : 객체 탐지 모델 Darknet : Yolo 학습을 위한 프레임워크 1. colab CPU에서 GPU 모드로 변경하기 2. darknet 클로닝하기 darknet 사용할 수 있게 git hub 주소 clone 진행. git clone https://github.com/AlexeyAB/darknet 3. 미리 학습된 yolov4 weights 파일 다운로드 yolov4는 80개의 객체를 탐지 할 수 있는 coco파일을 가지고 있다. pre-trained 클래스에서 Yolov4를 실행시..

yolo 이미지 라벨링을 위한 labelImg 사용법

yolo를 통해 custom image로 학습을 시키기 위해서는 나만의 데이터셋이 필요합니다. 원하는 데이터 셋이 존재하는 경우 바로 사용해도 됩니다. 하지만 데이터 셋을 직접 만들어야 한다면 라벨링 툴을 이용해서 이미지파일에 대한 라벨링된 텍스트파일(좌표파일)을 생성해줘야합니다! 설치 및 실행 GitHub - tzutalin/labelImg: 🖍️ LabelImg is a graphical image annotation tool and label object bounding boxes in images 🖍️ LabelImg is a graphical image annotation tool and label object bounding boxes in images - GitHub - tzutalin/la..

회귀 - 다중공선성

다중공선성이란? 독립변수(X변수)가 여러개 있을 때, 변수들이 강한 선형관계를 가진다면 다중공선성이 있다고 한다. 이때, 강한 선형관계에 있다는 것은 변수간의 상관정도가 높다는 것을 의미한다. 각 독립변수가 설명변수에 어떠한 영향을 끼쳐야 하는지 파악하는 것이 회귀인데, 각 변수가 선형관계에 있다면 이러한 관계를 파악하기가 어려워진다. 그렇기에 다중공선성이 있을 경우 변수를 해석하기가 어려워지고 예측 정확도가 하락할 수 있다. 다중공선성을 진단방법과 해결 방법 -진단방법 다중공선성은 데이터 분석 시 예측도를 하락시키기에 이를 진단하고 적절한 변수를 선택할 필요가 있으며, 진단하기 위한 대표적인 방법으로는 VIF와 Correlation이 있다. -해결방법 다중공선성이 있다고 진단되면 이를 해결해야 한다. ..

geopandas 설치 에러 - python setup.py egg_info Check the logs for full command output, failed with initial frozen solve. Retrying with flexible solve.

밑에 글에는 제가 geopandas를 설치하면서 겪은 수많은 에러들이 나와있는데요, 저와 같은 에러를 겪으신 분들은 다른 거 필요없이 아래의 방법을 추천드립니다. https://geopandas.org/getting_started/install.html 해당 사이트에 나온대로 아래와 같이 가상환경 만드시는데 여기서 정말 중요한게 ★★python=3.6.8★★ 이렇게 파이썬 버전을 낮춰줘야 합니다 ㅠㅜㅠ 진짜 이것때문에 얼마나 땅을 팠는지... python버전만 다운그레이드해서 가상환경 만들어 주시고 나머지는 사이트에 나온 대로만 따라하시면 문제없이 geopandas 설치 가능합니다. 이렇게 가상환경을 만들어주고, geopandas까지 설치해줍니다. #geo_env대신 본인이 설정하고자 하는 가상환경 이름..

[머신러닝] 회귀 - 다중 선형 회귀분석

다중 선형 회귀분석 - 다중선형 회귀 분석은 단순 선형회귀분석과 비교했을 때 변수가 여러개이고 개념적으로는 차이가 없다. - 변수가 여러 개 이기에 단순 선형 회귀분석과 검정 방법이나 모델링 방법에 약간의 차이가 있지만 기본적인 개념은 거의 같다. 다중 선형 회귀분석 해석 - 위와 같은 표가 있을 때 CRIM을 제외한 나머지 변수인 RM, LSTAT가 고정되어있다고 하자. 이 경우 CRIM이 1단위 올라갈경우 가격이 -0.1029배가 된다 - 회귀계수는 단순회귀계수와 마찬가지로 p-value값이 낮을 수록 설명력이 있다는 것을 말한다. - 표준오차인 Std.error값은 작을 수록 좋다. - 만약 회귀계수가 0에 가깝거나 표준오차가 커진다면 T 통계량이 작아지고 P-value가 커지면서 변수의 유의성이 ..

[머신러닝] 회귀 - 단순 선형 회귀분석

회귀분석이란 회귀분석은 독립변수와 종속변수의 관계를 추정하는 통계분석이다. 예를 들어서, 각 집마다 아버지와 아들의 키를 조사해서 아버지의 키가 아들의 키에 얼만큼의 영향을 미쳤는지 조사를 한다고 하자. 이 때, 아버지의 키를 x라고 하고 아들의 키를 y라고 할 수 있다. 그리고 x와 y의 관계를 추정 시, 어느정도의 오차가 발생한다. 이 오차를 반영해서 x와 y가 얼마만큼 관련이 있는지를 찾는 것을 회귀분석이라고 한다 즉, x와 y사이의 관계를 함수식으로 나타내고 이러한 식을 통해서 y를 예측하는 것이다. 단순 선형 회귀분석 회귀에도 다양한 방법이 있으며 그 중 선형회귀분석이 제일 간단하다. 단순 선형 회귀분석은 입력변수 X와 출력변수 Y가 선형적인 관계에 있을 때 사용가능한 분석 방법이다. 이때 x와..

[자연어 처리] konlpy 설치 오류, okt()에러-already loaded in another classloader, SystemErro

자연어 처리 실습을 하기 위해 konlpy를 설치하던 중 수 차례의 오류를 맞이했습니다...😭😭 저는 환경변수부터 pip, konlpy 호출 등 모든 부분에서 에러를 겼었는데요,,,,ㅎ 관련 지식은 거의 없지만 저와 같은 오류를 겪으실 분들을 위해 제가 오류를 해결한 방법을 적어놨습니다. (혹시 지나가시는 길 추가설명이 있다면 감사히 받겠습니다!) 그럼 형태소 분석기 중 하나인 konlpy를 설치해보겠습니다!! 설치를 위한 과정은 아래와 같습니다. 1. JAVA 설치 2. JAVA_HOME 환경변수 설정 3. JPype 다운로드 및 설치 4. konlpy 설치 1. JAVA 설치 우선 JAVA를 먼저 설치해야 합니다! JAVA는 아래의 사이트에서 설치가 가능합니다 https://www.oracle.com..

[NumPy] 넘파이란? 넘파이 배열 생성과 선언- np.array,np.arange,np.linspace

NumPy란? 넘파이란 파이썬에서 scientific computing에 사용되는 패키지이다. 파이썬 라이브러이 중 하나로 다차원 배열과 행렬을 다룰 때 유용하며 데이터 분석 시 일반적으로 판다스와 같이 호출하며 데이터 분석시 판다스와 같이 사용되는 주로 라이브러리이다. 라이브러리를 호출 할 때는 아래와 같이 np라고 부르는 것이 일반적이다 import numpy as np ndarray ndarray는 NumPy에서의 배열 클래스로 Numpy의 배열 객체이다. ndarray는 NumPy 패키지의 핵심이며 사용자에게 n차원의 배열을 위한 인터페이스를 제공한다. numpy에서의 array는 다차원 배열을 다루기에 파이썬 표준 라이브러리에서 하나의 차원만을 다루는 array와 다르다 ndarray 생성 Py..

[데청캠] 데이터 청년 캠퍼스

►모집기간 - 2021.05.12 ~ 06.13(24:00 마감) ►교육일정 -2021.06.21 ~ 09.10(14주) ►지원대상 -데이터 관련 전공 대학생(3~4학년) 데이터 관련 전공 및 비전공 석·박사 대학원생 ※휴학생, 수료생 포함 ※4대보험 미가입자(주말 파트타임(생계형)의 경우 4대보험 가입자도 가능) ※'21년 유사 정부지원 프로그램에 등록되지 않은 자 ►접수방법 -온라인 신청(dataonair.or.kr/bigjob) ※데이터 온에어로 검색하세요! ►선발절차 -1차 서면(적격성)평가 → 2차 면접평가 → 최종선발 ※ 과정별 우대조건은 상세페이지 참고 ※ 지원 대학의 재학 여부 관계없이 누구나 지원 가능 ►문의처 -한국데이터산업진흥원 데이터산업본부 인재양성팀 T. 010-5784-6674 ..

[데이터분석] 데이터 분석의 시작 판다스(pandas)

요즘 IT 관련 공모전을 보다보면 빠질 수 없는 키워드가 하나 있다. 바로 "빅데이터 분석" 앱 개발이던 다른 서비스 구현이던 데이터분석을 베이스로 깔고가는 느낌이다. 예전에 학교에서 진행한 자율강좌 들을 때 판다스랑 머신러닝에 대해서 배운 적이 있는데 후반부로 갈 수록 어려워졌기에 한동안 잊고 살았다. 그러다가 최근 공부할 필요성을 느껴서 다시 공부를 시작했고 관련 프로그램도 참여중이기에 복습 + 정리를 위해 올리는 포스팅. 판다스가 도대체 뭐야? 프로그래밍을 할 때는 라이브러리를 적절하게 잘 사용하는 것이 중요하다. 프로그래밍을 하다보면 누구든 특정 과정(코드)를 반복해서 써야하는 경우가 많다. 라이브러리는 그러한 코드를 모아 둔 것으로 우리가 프로그래밍을 할 때 가져다 쓸 수 있다. 그리고 데이터 ..

반응형