Introduction to AI and Machine Learning on Google Cloud을 학습하면서, ML Model 개발 시 성능 측정과 튜닝이 중요하단 것을 알게되었다.
이 강의에서 주요하게 언급된 개념은 4가지이다.
- confusion matrix: 혼동 행렬
- TP
- FN
- FP
- TN
- recall: 재현율
- precision: 정밀도
- feature importance: 피처 중요도
개념
confusion matrix: 혼동 행렬

Recall, Precision 계산식

사례로 Recall, Precision 개념 이해하기

Spam 가능성이 있는 것을 가장 많이 발라내는게 목표이면, Recall을 높여야 한다.
반면, 반드시 Spam인 메일만 걸러내고, 나머지는 걸러내면 안되는거면 Precision을 높여야 한다.
feature importance: 피쳐중요도
기계 학습 모델에서 각 입력 변수(feature)가 예측에 얼마나 큰 영향을 미치는지를 수치로 나타낸 것을 말한다. 모델이 특정 예측을 내릴 때, 어떤 변수(예: 나이, 수입, 거주지)를 가장 중요하게 고려했는지를 알려주는 지표이다.
참고
https://www.youtube.com/watch?v=9uufA-xzAI4
'소프트웨어-이야기 > 데이터 저장소 + 시각화 ' 카테고리의 다른 글
| 캐시 전략 종류와 사례 (0) | 2025.04.05 |
|---|---|
| 동시성 문제와 잠금 (0) | 2025.01.04 |
| <고승범> 실전 카프카 개발부터 운영까지 (1) | 2023.10.03 |
| Kafka Windowing (1) | 2023.07.22 |
| [키설계] UUID와 increment PK는 언제 사용해야할까? (1) | 2022.03.12 |