본문 바로가기

Data/Python

[Data/Python] 로지스틱 회귀분석

y값을 확률로 봄. y값이 0.5보다 크거나 같으면 A, 작으면 B. 분류문제

 

 statsmodels - Logit()

  • 로지스틱 회귀분석을 실시하는 statsmodels의 함수
  • endog, exog 인자에 각각 종속변수, 독립변수 할당
  • 산출 모델 객체의 params어트리뷰트에 모델의 계수 저장
  • 산출 모델 객체의 predict()메서드로 예측값을 생산. 이는 종속변수가 1이 될 확률값

 

sklearn - LogisticRegression()

  • 로지스틱 회귀분석 실시
  • fit_intercept, solver 인자로 절편 적합 여부 및 최적화 알고리즘 설정 가능
  • random_state 인자에 자연수를 할당하여 결과 고정 가능
  • fit() 메서드에 독립변수 및 종속변수 할당
  • 산출 모델 객체의 coef_어트리뷰트에 모델의 계수 저장
  • 산출 모델 객체의 predict_proba()메서드로 예측값을 생산하며 두번째 열이 종속변수가 1이 될 확률값

coef : 기울기, intercept : 절편

threshold : 임계점

 

 

sklearn - roc_auc_score()

  • AUC(Area Under Curve를 산출
  • y_true, y_score 인자에 각각 종속변수, 예측 확률값 할당

 

sklearn - accuracy_score()

  •  분류모델 정확도 산출

 

sklearn - f1_score()

  • 분류모델의 f1값 산출

 

sklearn - precision_score()

  • 분류모델의 정밀도(precision) 산출

 

sklearn - recall_score()

  • 분류모델의 재현율(recall) 산출

 

 

'Data > Python' 카테고리의 다른 글

[Data/Python] 회귀분석  (0) 2024.01.25
[Data/Python] 비계층적 군집분석  (1) 2024.01.25
[Data/Python] 상관분석  (0) 2024.01.24
[Data/Python] 이론 정리  (1) 2024.01.24
[Data/Python]실습_데이터 전처리: 결측치 이상치  (0) 2024.01.17