# 3️⃣ Overfitting & Underfitting

<figure><img src="/files/9wqljeXy9wlZm47vBnlY" alt=""><figcaption></figcaption></figure>

#### 1. Overfitting và Underfitting là gì?

Trong Machine Learning và Deep Learning, mục tiêu không phải là:

> mô hình học thật giỏi trên dữ liệu cũ\
> mà là:\
> **mô hình tổng quát hóa tốt trên dữ liệu mới**

Overfitting và Underfitting là **hai trạng thái thất bại phổ biến nhất** khi huấn luyện mô hình.

***

#### 2. Underfitting – khi mô hình học chưa đủ

**Underfitting** xảy ra khi:

* mô hình quá đơn giản,
* không học được mối quan hệ quan trọng trong dữ liệu.

Biểu hiện:

* Sai số cao trên **training set**
* Sai số cao trên **validation/test set**

Nguyên nhân thường gặp:

* mô hình quá đơn giản
* thiếu đặc trưng
* train chưa đủ lâu

👉 Hiểu đơn giản:

> **Mô hình chưa học được gì đáng kể**

***

#### 3. Overfitting – khi mô hình học quá kỹ

**Overfitting** xảy ra khi:

* mô hình học rất tốt dữ liệu train,
* nhưng dự đoán kém trên dữ liệu mới.

Biểu hiện:

* Sai số **rất thấp** trên training set
* Sai số **cao** trên validation/test set

Nguyên nhân thường gặp:

* mô hình quá phức tạp
* dữ liệu train ít
* học cả nhiễu trong dữ liệu

👉 Hiểu đơn giản:

> **Mô hình học vẹt dữ liệu cũ**

***

#### 4. So sánh trực quan

| Trạng thái   | Training error | Validation error |
| ------------ | -------------- | ---------------- |
| Underfitting | Cao            | Cao              |
| Tốt          | Thấp           | Thấp             |
| Overfitting  | Rất thấp       | Cao              |

📌 Mục tiêu của học máy là **nằm ở vùng giữa**.

***

#### 5. Overfitting trong Deep Learning đặc biệt nguy hiểm

Deep Learning có:

* rất nhiều tham số
* khả năng biểu diễn rất mạnh

Điều này có nghĩa là:

* Deep Learning **rất dễ overfit**
* đặc biệt khi dữ liệu không đủ lớn

Vì vậy:

> Hiểu và kiểm soát overfitting là kỹ năng bắt buộc.

***

#### 6. Cách giảm Underfitting

Một số hướng phổ biến:

* dùng mô hình phức tạp hơn
* thêm đặc trưng
* train lâu hơn
* điều chỉnh learning rate

📌 Nhưng tăng độ phức tạp quá mức sẽ dẫn tới overfitting.

***

#### 7. Cách giảm Overfitting

Một số kỹ thuật thường dùng:

* chia dữ liệu hợp lý (train / validation / test)
* regularization (L1, L2)
* dropout
* early stopping
* tăng dữ liệu (data augmentation)

👉 Các kỹ thuật này sẽ được học chi tiết ở phần Deep Learning.

***

#### 8. Tư duy đúng về Overfitting & Underfitting

Không có mô hình “hoàn hảo”.

Việc huấn luyện mô hình là:

* **quá trình cân bằng**
* giữa độ phức tạp và khả năng tổng quát hóa

Hiểu được hai khái niệm này giúp bạn:

* không hoảng khi kết quả không tốt,
* biết mình nên chỉnh ở đâu,
* đọc và đánh giá paper tốt hơn.

#### 9. Sau page này, bạn cần nắm được gì?

Sau khi đọc xong page này, bạn nên:

* phân biệt rõ overfitting và underfitting
* hiểu vì sao validation quan trọng
* sẵn sàng bước vào Deep Learning thực sự

👉 Ở group tiếp theo, chúng ta sẽ bắt đầu với câu hỏi nền tảng:\
**Neuron nhân tạo là gì và vì sao nó học được?**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://deeplearningcoban.gitbook.io/deeplearningcoban.com/nen-tang-bat-buoc/overfitting-and-underfitting.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
