데이터 노가다 일지
손실함수란? ( MSE ) 본문
먼저 손실함수란 모델의 성능을 측정하는데 사용되는 함수이며 예측값 - 실제값의 차이를 수치화한다.
즉, 손실값이 낮을수록 성능이 높고
손실값이 높을수록 성능이 낮다고 해석할 수 있다.
손실함수는 여러가지가 있는데 해결하려는 문제(회귀, 분류, 클러스터링 등)에 따라 사용되는 손실함수가 다르다.
이번 글에서는 MSE를 중점적으로 다뤄보겠다.
MSE ( Mean Squared Error ) 란?
주로 회귀문제에서 사용하는 손실함수이다.
먼저 수식을 적어 보겠다.
수식을 말로 설명해보자면 실제값 - 예측값의 제곱의 평균을 구한다 이다.
MSE의 특징에 대해 알아보겠다.
모든 오차들이 긍정적 으로 저리되어 오차의 크기를 과장한다.
쉽게 설명해보겠다.
실제값 | 예측값 | 오차 |
10 | 12 | +2 |
10 | 8 | -2 |
이런식으로 결과가 나왔다고 가정해보자
아직 오차를 제곱하지 않았으므로 제곱하면 둘다 +4가 된다.
이러면 어느 방향으로 틀렸나?((양의 방향인지 음의방향인지 모른다))를 모르게 된다.
방향에 상관없이 오직 얼마나 틀렸나?에만 집중하게 된다.
즉, 그만큼 모델의 큰 오차를 제곱하여 더 크게 만드는 특징이 있다.
이러함으로써 MSE는 편향을 감지하지 못한다.
-> 과소예측, 과대예측을 감지하지 못한다.
다시말해 어느 방햑으로 모델이 지속적으로 틀려도 사용자는 관측하지 못한다는 단점이 있다.
'알고리즘' 카테고리의 다른 글
self-Attention mechanism of Transformer model (0) | 2025.05.07 |
---|---|
[Random Forest] RF (0) | 2025.04.23 |
[SVM]서포트 벡터 머신 알고리즘 (0) | 2025.04.23 |
결정트리 (0) | 2025.04.22 |