본문 바로가기

Data/Python

[Data/Python] 로지스틱 회귀분석

오정님 2024. 1. 25. 10:25

y값을 확률로 봄. y값이 0.5보다 크거나 같으면 A, 작으면 B. 분류문제

statsmodels - Logit()

로지스틱 회귀분석을 실시하는 statsmodels의 함수
endog, exog 인자에 각각 종속변수, 독립변수 할당
산출 모델 객체의 params어트리뷰트에 모델의 계수 저장
산출 모델 객체의 predict()메서드로 예측값을 생산. 이는 종속변수가 1이 될 확률값

sklearn - LogisticRegression()

로지스틱 회귀분석 실시
fit_intercept, solver 인자로 절편 적합 여부 및 최적화 알고리즘 설정 가능
random_state 인자에 자연수를 할당하여 결과 고정 가능
fit() 메서드에 독립변수 및 종속변수 할당
산출 모델 객체의 coef_어트리뷰트에 모델의 계수 저장
산출 모델 객체의 predict_proba()메서드로 예측값을 생산하며 두번째 열이 종속변수가 1이 될 확률값

coef : 기울기, intercept : 절편

threshold : 임계점

sklearn - roc_auc_score()

AUC(Area Under Curve를 산출
y_true, y_score 인자에 각각 종속변수, 예측 확률값 할당

sklearn - accuracy_score()

분류모델 정확도 산출

sklearn - f1_score()

분류모델의 f1값 산출

sklearn - precision_score()

분류모델의 정밀도(precision) 산출

sklearn - recall_score()

분류모델의 재현율(recall) 산출

'Data > Python' 카테고리의 다른 글

[Data/Python] 회귀분석 (0)	2024.01.25
[Data/Python] 비계층적 군집분석 (1)	2024.01.25
[Data/Python] 상관분석 (0)	2024.01.24
[Data/Python] 이론 정리 (1)	2024.01.24
[Data/Python]실습_데이터 전처리: 결측치 이상치 (0)	2024.01.17

티스토리툴바