일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Linux
- LOG
- 복구
- Docker image
- 머신러닝
- 도커
- sqldeveloper
- SQL
- postgre
- psycopg2
- 시계열
- oracle
- pgadmin
- GridSearchCV
- Jupyter
- 파이썬
- cpu
- 연결
- 리눅스
- Python
- docker
- psql
- 오라클
- 도커이미지
- 쿼리
- Memory
- 교차검증
- jupyternotebook
- GPU
- TensorFlow
- Today
- Total
목록Programming (24)
areum

로지스틱 회귀 정의 LogisticRegression은 데이터가 어떤 범주에 속할 확률을 0과 1 사이의 값으로 예측하고, 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해 주는 지도학습 알고리즘입니다. 로지스틱 함수는 시그모이드 함수에 속하는 함수입니다. Sigmoid Function은 그래프로 나타내면 "S"자 모양으로 곡선이 나타납니다. 로지스틱 함수의 그래프는 Sigmoid 함수의 S자 모형을 따릅니다. 자세한 설명은 아래 블로그를 통해 말씀드리겠습니다. 2023.03.23 - [Programming/Machine Learning] - [ML] 로지스틱 회귀 개념 정리 [ML] 로지스틱 회귀 개념 정리 [목차] 로지스틱 회귀 정의 시그모이드 함수 Odds(오즈 또는 승산) 및 Odds..

K-평균 군집분석 정의 군집 수만큼(k개) 초기값을 지정하고, 각 데이터를 가까운 초기값에 할당하여 군집을 형성한 뒤, 각 군집의 평균을 재계산하여 초기값을 갱신. 갱신된 값에 대해 위의 할당과정을 반복하여 k개의 최동군집을 형성. K-Means algorithm 사용하여 분석하기 1. 필요한 라이브러리 및 예제 csv파일을 불러옵니다. import matplotlib.pyplot as plt #시각화를 위한 설치 import matplotlib.font_manager as fm # 한글 폰트 import matplotlib #시각화를 위한 설치 import os, warnings import pandas as pd #구조 변경 및 결합을 하기 위한 설치 import seaborn as sns #시각화를..

연관 규칙 분석 정의 연관규칙분석(Association Rule Analysis)이란 경영학에서 장바구니 분석(Market Basket Analysis)이라고도 합니다. A라는 상품을 구매한 후 B상품을 구매했을 때, 서로 연관성이 있다고 하면 A->B라는 일련의 규칙들이 생성되는 알고리즘입니다. 특정 상품 구매 시 이와 연관성 높은 상품을 추천할 수 있습니다. 연관규칙의 평가에는 '지지도, 신뢰도, 향상도' 라는 3가지 척도가 사용됩니다. 지지도(support) 전체 거래 중 A와 B가 동시에 포함된 거래의 확율. ex) A를 빵, B를 우유라고 하면 빵 -> 버터의 지지도 = ( 빵과 버터를 동시에 구매한 거래 수 ) / ( 전체 거래 수) 신뢰도(confidence) A를 구매했을 때, 추가로 B를..

ARIMA에 대한 간단한 설명 ARIMA(AutoRegressive Integrated Moving Average)는 자기 회귀 모델(AR)과 이동 평균 모델(MA)과 데이터의 정상성을 확보하기 위한 차분(I)을 합친 모델 ARIMA모델은 AR , I, MA의 차수를 정해야 하는데 이는 ARIMA(p, d, q)로 나타낸다. AR의 차수는 p, I의 차수는 d, MA의 차수는 q로 표시한다. ARIMA(1,1,0) 일 경우 AR(1)와 I(1)를 합친 모델이라는 의미이다. * 월 별 평균기온 분석하여 예측하기 1. 기본 library를 불러온다. ( 아래는 제가 많이 쓰는 library들이라 매번 분석할 때마다 아래 코드는 실행하고 분석해요 ! ) import matplotlib.pyplot as plt..
tensorflow를 사용하면서 로그가 길게 출력되는 경우가 있다. TF_CPP_MIN_LOG_LEVEL 를 사용하여 로그를 제한할 수 있다. 기본값은 0 = 모든 로그가 표시됨. 1 = INFO 로그 표시. 2 = WARNING 로그 표시. 3 = ERROR 로그 표시. import os os.environ['TF_CPP_MIN_LOG_LEVEL']='숫자'

pip install을 통해 psycopg2를 설치하는데 계속 오류가 발생한다. 오류 : command errores out with exit status 1 해결방법 - 현재 psycopg2 권장사항 : python 버전 3.6 ~ 3.11 방법1. 버전 확인 ( python, postgresql) python버전 확인 python --version 위 권장사항의 버전과 맞지 않는다면 업그레이드 또는 다운그레이드 진행 python -m pip install --upgrade pip 방법2. psycopg2-binary 설치 pip install psycopg2-binary

1. psycopg2 설치하기 2. 포스트그레 연결하기 1. psycopg2 설치하기 pip install psycopg2 위 명령어로 설치가 안되신다면 아래 링크로 들어와주세요 ! https://armmy.tistory.com/38 psycopg2 설치하는 방법 pip install을 통해 psycopg2를 설치하는데 계속 오류가 발생한다. 오류 : command errores out with exit status 1 해결방법 - 현재 psycopg2 권장사항 : python 버전 3.6 ~ 3.11 방법1. 버전 확인 ( python, postgresql) python버 armmy.tistory.com 2. 포스트그레 연결하기 import pandas as pd import psycopg2 as pg..

1. Oracle 홈페이지에서 instant client 다운로드하기 2. cmd 창에서 cx_oracle install 하기 3. 주피터 노트북에서 cx_oracle import 하여 연결하기 * 주피터 노트북에서 바로 오라클을 연결하여 데이터를 추출하고 싶어 아래 방법을 사용하였습니다. 1. Oracle 홈페이지에서 instant client 다운로드하기 저는 Windows 환경이라 아래 노란색 체크되어 있는 것으로 다운로드하였어요! 본인 환경에 맞는 instant client 설치하시면 될 거 같아요. https://www.oracle.com/database/technologies/instant-client/downloads.html Oracle Instant Client Downloads We’r..
tensorflow 를 이용하여 머신러닝을 실행할때, cpu나 gpu를 사용하게 된다. gpu를 시용하면 cpu만 사용하는 것에 비해 속도가 약 10배 이상 차이가 난다. 그렇기에 모델을 학습시킬때 gpu를 사용하는 것이 훨씬 효율적이며, cpu에 부하도 훨씬 적을 것입니다. 아래에서 gpu로 실행하도록 설정하는 두가지 방법에 대해서 알아보겠습니다. 아래 방법 사용 전 gpu device가 잡히는지 확인해야 합니다. from tensorflow.python.client import device_lib print(device_lib.list_local_devices()) 위 코드에서 gpu가 잡히는게 확인 되었다면 아래 방법을 실행하면 됩니다. 방법 1: 전체 GPU로 실행하기 import os os.en..
GridSearchCV 간단한 정의 GridSearchCV란 사용자가 직접 모델의 하이퍼 파라미터 값을 리스트로 작성하여 경우의 수마다 예측 성능을 측정하여 비교하면서 최적의 하이퍼 파라미터 값을 찾는 기법입니다. from sklearn.model_selection import GridSearchCV # 아래 params는 랜덤포레스트 파라미터로 실행하였습니다. # list로 작성할 수 있지만 아래와 같이 작성해주면 훨씬 더 많은 범위의 파라미터 튜닝이 가능합니다. params = {'n_estimators' : list(range(50,400,10)),'max_depth' : list(range(4,20,15)), 'min_samples_leaf' : list(range(4,20,1)),'min_sam..