[Python] Basic Collection - list[], tuple(), dict{}
기본자료형 vs 컬렉션 자료형 기본 자료형(문자열, 숫자, bool)등은 특정 하나의 값만 사용. 컬렉션은 여러개의 값을 저장 할 수 있다. 컬렉션 자료형의 특징에 따라 리스트, 튜플, 셋, 딕셔너리로 구분. List [ ] 컬렉션 자료형에서 가장 많이 쓰이는 자료형태로; 딘순자료형이 아닌 자료구조의 형태를 취함 리스트는 가변 가능함 (=동적이다) ; 인덱스와 메소드를 활용, 값의 수정 및 정렬이 쉽다. cheeses = ['Cheddar', 'Edam', 'Gouda'] numbers = [123, 456] empty = [] print(cheeses, numbers, empty) # ['Cheddar', 'Edam', 'Gouda'] [123, 456] [] print('numbers[1] :',nu..
더보기
[Machine Learning] 분류 모델의 성능 평가 지표- Confusion Matrix( 혼동행렬), 정확도, 정밀도, 재현율, F1, AUC, 임계값(thresholds)
Confusion Matrix 구현 Python fig, ax = plt.subplots() pcm = plot_confusion_matrix(pipe, X_val, y_val, cmap=plt.cm.Blues, ax=ax); plt.title(f'Confusion matrix, n = {len(y_val)}', fontsize=15) plt.show() 정확도(Accuracy): (TP+TN) / Total 전체 범주를 모두 바르게 맞춘 경우(True값 전체)를 전체 수로 나눈 값 >>> 종속변수의 비율이 불균형할때 가치가 낮아진다. 정밀도(Precision): TP / (TP+FP) Positive로 예측한 경우 중 올바르게 Positive를 맞춘 비율 >>>정밀도가 중요한 경우는 실제 False를 ..
더보기