y값을 확률로 봄. y값이 0.5보다 크거나 같으면 A, 작으면 B. 분류문제
statsmodels - Logit()
- 로지스틱 회귀분석을 실시하는 statsmodels의 함수
- endog, exog 인자에 각각 종속변수, 독립변수 할당
- 산출 모델 객체의 params어트리뷰트에 모델의 계수 저장
- 산출 모델 객체의 predict()메서드로 예측값을 생산. 이는 종속변수가 1이 될 확률값
sklearn - LogisticRegression()
- 로지스틱 회귀분석 실시
- fit_intercept, solver 인자로 절편 적합 여부 및 최적화 알고리즘 설정 가능
- random_state 인자에 자연수를 할당하여 결과 고정 가능
- fit() 메서드에 독립변수 및 종속변수 할당
- 산출 모델 객체의 coef_어트리뷰트에 모델의 계수 저장
- 산출 모델 객체의 predict_proba()메서드로 예측값을 생산하며 두번째 열이 종속변수가 1이 될 확률값
coef : 기울기, intercept : 절편
threshold : 임계점
sklearn - roc_auc_score()
- AUC(Area Under Curve를 산출
- y_true, y_score 인자에 각각 종속변수, 예측 확률값 할당
sklearn - accuracy_score()
- 분류모델 정확도 산출
sklearn - f1_score()
- 분류모델의 f1값 산출
sklearn - precision_score()
- 분류모델의 정밀도(precision) 산출
sklearn - recall_score()
- 분류모델의 재현율(recall) 산출
'Data > Python' 카테고리의 다른 글
[Data/Python] 회귀분석 (0) | 2024.01.25 |
---|---|
[Data/Python] 비계층적 군집분석 (1) | 2024.01.25 |
[Data/Python] 상관분석 (0) | 2024.01.24 |
[Data/Python] 이론 정리 (1) | 2024.01.24 |
[Data/Python]실습_데이터 전처리: 결측치 이상치 (0) | 2024.01.17 |