# 3️⃣ Loss Function

<figure><img src="/files/KM0v7fLp1M444yL1hhyw" alt=""><figcaption></figcaption></figure>

#### 1. Vì sao cần Loss Function?

Khi một mô hình Deep Learning đưa ra dự đoán, câu hỏi quan trọng nhất là:

> **Dự đoán đó tốt hay tệ?**

Loss Function (hàm mất mát) là công cụ để:

* đo mức độ **sai khác** giữa dự đoán và giá trị thực,
* biến “đúng / sai” thành **một con số cụ thể**,
* giúp mô hình biết **cần điều chỉnh theo hướng nào**.

Không có loss function:

> mô hình **không biết mình đang học tốt hay không**.

***

#### 2. Loss Function là gì?

Loss Function là một hàm toán học:

* nhận đầu ra của mô hình,
* so sánh với nhãn thật,
* trả về một giá trị biểu diễn **mức độ sai số**.

Nguyên tắc chung:

* Loss **càng nhỏ** → mô hình **càng tốt**
* Loss **càng lớn** → mô hình **càng sai**

👉 Mục tiêu của quá trình huấn luyện là:

> **tối thiểu hóa loss**

***

#### 3. Trực giác về Loss Function

Có thể hình dung:

* mỗi dự đoán sai → bị “phạt điểm”
* dự đoán càng sai → bị phạt càng nhiều

Loss Function chính là:

> **thước đo mức phạt đó**

Mô hình sẽ liên tục:

* đo loss,
* điều chỉnh tham số,
* để giảm mức phạt trong lần dự đoán tiếp theo.

***

#### 4. Loss Function cho Regression

**4.1 Mean Squared Error (MSE)**

* Tính trung bình bình phương sai số
* Phạt mạnh các sai số lớn

Ưu điểm:

* dễ hiểu
* dùng phổ biến cho regression

Nhược điểm:

* nhạy cảm với outlier

***

**4.2 Mean Absolute Error (MAE)**

* Tính trung bình giá trị tuyệt đối sai số

Ưu điểm:

* ít bị ảnh hưởng bởi outlier hơn MSE

Nhược điểm:

* khó tối ưu hơn về mặt toán học

***

#### 5. Loss Function cho Classification

**5.1 Binary Cross-Entropy**

Dùng cho:

* phân loại nhị phân (2 lớp)

Ý tưởng:

* dự đoán đúng với xác suất cao → loss nhỏ
* dự đoán sai nhưng tự tin → loss rất lớn

📌 Đây là loss phổ biến nhất cho bài toán nhị phân.

***

**5.2 Categorical Cross-Entropy**

Dùng cho:

* phân loại nhiều lớp

Kết hợp với:

* **Softmax** ở output layer

Loss này:

* đánh giá mức độ phù hợp của phân phối xác suất
* khuyến khích mô hình tự tin vào lớp đúng

***

#### 6. Loss Function và Activation Function

Loss Function **không đứng một mình**, mà gắn chặt với activation ở output layer.

Một số cặp phổ biến:

* Regression → Linear output + MSE
* Binary classification → Sigmoid + Binary Cross-Entropy
* Multi-class classification → Softmax + Categorical Cross-Entropy

👉 Chọn sai cặp sẽ khiến mô hình:

* học chậm
* hoặc không học được.

***

#### 7. Loss Function ≠ Evaluation Metric

Một nhầm lẫn phổ biến:

* loss function **không giống** evaluation metric.

Loss:

* dùng để **huấn luyện**
* tối ưu bằng gradient

Metric:

* dùng để **đánh giá**
* không nhất thiết phải khả vi

Ví dụ:

* Loss: Cross-Entropy
* Metric: Accuracy, F1-score

***

#### 8. Loss Function phản ánh điều gì?

Loss Function thể hiện:

* mô hình đang ưu tiên điều gì,
* loại sai số nào bị phạt nặng hơn.

Vì vậy:

> **Chọn loss function cũng là chọn mục tiêu học của mô hình.**

***

#### 9. Tóm tắt nhanh

Loss Function giúp:

* đo sai số
* định hướng quá trình học
* kết nối dự đoán với việc cập nhật tham số

Không có loss function:

> Deep Learning **không thể học**.

<figure><img src="/files/olMEOVRBCXtvNPuVkGGK" alt=""><figcaption></figcaption></figure>

#### 10. Sau page này, bạn cần nắm được gì?

Sau khi đọc xong page này, bạn nên:

* hiểu vai trò của loss function
* biết cách chọn loss phù hợp bài toán
* phân biệt loss và metric

👉 Ở page tiếp theo, chúng ta sẽ học **cơ chế quan trọng nhất giúp mô hình học**:\
**Backpropagation – lan truyền ngược sai số.**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://deeplearningcoban.gitbook.io/deeplearningcoban.com/neural-network-co-ban/loss-function.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.