# 2️⃣ Xây dựng & so sánh mô hình (ML vs Deep Learning)

<figure><img src="/files/bEkkaLIBEZ1SPAc1IZd5" alt=""><figcaption></figcaption></figure>

Trang này **không đi vào code chi tiết**, mà làm rõ **chiến lược xây dựng mô hình** và **cách so sánh một cách công bằng** trong bài toán **Diabetes Prediction**.

> ❓ *Deep Learning có thật sự tốt hơn Machine Learning trong bài toán này không?*

***

### 1. Nguyên tắc quan trọng trước khi so sánh

Để so sánh **có giá trị học thuật**, cần đảm bảo:

* Cùng **một bộ dữ liệu**
* Cùng cách:
  * Chia train / validation / test
  * Tiền xử lý dữ liệu
* So sánh trên:
  * Cùng tiêu chí đánh giá

👉 Nếu không, kết luận sẽ **không đáng tin**.

***

### 2. Mô hình Machine Learning – Baseline

#### Mục tiêu của baseline

* Không phải để “thắng”
* Mà để trả lời:

  > *Nếu không dùng Deep Learning thì kết quả là bao nhiêu?*

#### Mô hình ML điển hình

* Logistic Regression
* (có thể thêm Decision Tree / Random Forest nếu muốn)

#### Đặc điểm

* Dễ huấn luyện
* Dễ giải thích
* Phù hợp dữ liệu tabular

👉 **Baseline là mốc so sánh bắt buộc**.

***

### 3. Mô hình Deep Learning – MLP đơn giản

#### Kiến trúc sử dụng

* **MLP (Multi-Layer Perceptron)**
* 1–2 hidden layer
* Số neuron vừa phải

Ví dụ logic:

```
Input → Hidden → Output
```

#### Mục tiêu khi dùng DL

* Học tương tác **phi tuyến** giữa các chỉ số
* Kiểm tra:
  * DL có mang lại cải thiện thực sự không?

👉 Không dùng mạng sâu phức tạp cho bài toán nhỏ.

***

### 4. Tiêu chí so sánh mô hình

#### 🔹 Hiệu năng dự đoán

* Accuracy
* Loss (hoặc AUC nếu có)

#### 🔹 Độ ổn định

* Kết quả trên validation / test
* Có overfitting không?

#### 🔹 Khả năng giải thích

* ML:
  * Trực tiếp
* DL:
  * Phải dùng XAI

👉 **Không chỉ so accuracy**.

***

### 5. Các kịch bản kết quả thường gặp

#### Kịch bản 1: ML ≈ DL

* Rất thường gặp với dữ liệu tabular
* Kết luận:
  * DL **không cần thiết**

***

#### Kịch bản 2: DL tốt hơn một chút

* Khi dữ liệu đủ lớn
* Có tương tác phi tuyến

👉 DL **có giá trị**, nhưng cần XAI.

***

#### Kịch bản 3: DL overfitting

* Dữ liệu ít
* Mô hình quá phức tạp

👉 ML **an toàn hơn**.

***

### 6. Ý nghĩa học thuật của việc so sánh

So sánh ML vs DL giúp:

* Tránh thần thánh hóa Deep Learning
* Hiểu:
  * Khi nào DL phù hợp
  * Khi nào không

👉 Đây là điểm **rất được đánh giá cao** trong:

* Đồ án
* Luận văn
* Paper y sinh

***

### 7. Vai trò của XAI trong bước này

Ở 7.2:

* Chưa phân tích XAI chi tiết
* Nhưng đã xác định:
  * **ML**: giải thích trực tiếp
  * **DL**: cần XAI hỗ trợ

👉 Điều này dẫn trực tiếp sang **7.3**.

***

### 8. Tóm tắt chốt 7.2

> **So sánh ML vs Deep Learning giúp hiểu rõ giá trị thực sự của Deep Learning trong bài toán Diabetes, thay vì chỉ nhìn vào độ chính xác.**

Câu nhớ nhanh:

```
Baseline trước.
Deep Learning sau.
So sánh công bằng.
```


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://deeplearningcoban.gitbook.io/deeplearningcoban.com/case-study-ung-dung-thuc-te/xay-dung-and-so-sanh-mo-hinh-ml-vs-deep-learning.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.