
Mối quan hệ giữa artificial intelligence, machine learning, và deep learning (Nguồn: What’s the Difference Between Artificial Intelligence, Machine Learning, and Deep Learning?)
AI là gì, phân biệt AI, Machine Learning và Deep Learning
AI, Machine Learning và Deep Learning ngày nay đã trở thành những khái niệm gần gũi và hiện hữu trong cuộc sống của chúng ta. Từ chatbot, những gợi ý phim trên Netflix, cho đến các hệ thống giao dịch chứng khoán tự động trên phố Wall đều là sản phẩm của AI. Tuy nhiên, bạn đã bao giờ tự hỏi đâu là sự khác biệt giữa những khái niệm này và chúng được ứng dụng như thế nào vào các sản phẩm công nghệ mà chúng ta vẫn sử dụng hàng ngày chưa? Trước khi đào sâu vào việc tự học AI, hãy cùng làm rõ những khái niệm căn bản này trước.
| Tiêu chí | AI | Machine Learning | Deep Learning |
|---|---|---|---|
| Định nghĩa | Một lĩnh vực của khoa học máy tính nhằm nghiên cứu và phát triển các hệ thống có khả năng thực hiện những nhiệm vụ đòi hỏi trí tuệ con người | Một nhánh của AI tập trung vào việc phát triển các thuật toán cho phép hệ thống học từ dữ liệu và cải thiện hiệu suất theo thời gian mà không cần lập trình tường minh | Một nhánh của Machine Learning sử dụng mạng nơ-ron nhân tạo nhiều tầng để học các biểu diễn dữ liệu ở nhiều mức trừu tượng |
| Phạm vi | Rất rộng, bao gồm suy luận, lập kế hoạch, tìm kiếm... | Thu hẹp vào các phương pháp học thống kê và tối ưu hoá dựa trên dữ liệu | Tập trung vào các mô hình mạng nơ-ron sâu và học biểu diễn |
| Thuật toán/mô hình | Linear Regression, Logistic Regression, SVM, Decision Tree, Naive Bayes | Convolutional Neural Networks, Recurrent Neural Networks, Transformers |
Nguồn kiến thức được lấy từ Wikipedia
Từ bảng so sánh trên có thể thấy, AI, Machine Learning và Deep Learning không phải là những khái niệm tách rời, mà tồn tại trong mối quan hệ bao hàm và kế thừa: AI là mục tiêu và phạm vi nghiên cứu tổng quát, Machine Learning là khuôn khổ phương pháp luận dựa trên dữ liệu để hiện thực hóa mục tiêu đó, còn Deep Learning là một tập hợp kỹ thuật chuyên biệt nhằm giải quyết các bài toán có cấu trúc phức tạp. Mặc dù vẫn còn nhiều tiêu chí khác có thể dùng để so sánh ba khái niệm này (như mức độ phụ thuộc dữ liệu, khả năng giải thích hay yêu cầu tài nguyên tính toán), tôi cho rằng các tiêu chí được lựa chọn ở đây là những yếu tố cốt lõi nhất, giúp tránh việc đồng nhất AI với Deep Learning hoặc tiếp cận lĩnh vực này một cách giản lược.
Học AI từ đầu
1. Toán học
Hầu hết các mô hình AI hiện đại – từ hồi quy tuyến tính, mạng nơ-ron nhân tạo cho đến các mô hình ngôn ngữ lớn – đều có thể được chia bằng ba thành phần chính:
-
Biểu diễn dữ liệu dưới dạng các cấu trúc toán học;
-
Xây dựng hàm mục tiêu để đánh giá chất lượng mô hình;
-
Tối ưu hóa tham số nhằm cải thiện hiệu suất dự đoán.
Cả ba thành phần này đều được hình thành và phân tích dựa trên các lý thuyết toán học. Do đó, Toán học không chỉ là công cụ hỗ trợ mà là ngôn ngữ chính để diễn đạt và hiểu rõ cách thức AI vận hành. Và để hiểu được và làm việc được cùng với AI, chúng ta sẽ cần phải biết một vài kiến thức về toán như:
-
Đại số tuyến tính: Trong quá trình xây dựng mô hình, dữ liệu nhiều chiều được biểu diễn dưới dạng vector và ma trận. Các mô hình học máy, đặc biệt là mạng nơ-ron, về bản chất là chuỗi các phép biến đổi tuyến tính.
-
Tích phân: Giải tích cho phép mô hình điều chỉnh tham số dựa trên sai số giữa giá trị dự đoán và giá trị thực tế. Mọi thuật toán huấn luyện hiện đại đều dựa trên đạo hàm. Ngoài ra, Chain rule giải thích cơ chế backpropagation, đạo hàm riêng cho phép tối ưu hàng triệu tham số...
-
Xác suất - thống kê: AI không hoạt động trong môi trường hoàn hảo. Dữ liệu thu thập từ thế giới thực luôn chứa nhiễu. Trong bối cảnh đó, nhiệm vụ của AI không phải là đưa ra các kết luận tất định, mà là đưa ra các suy luận có xác suất, phản ánh mức độ tin cậy của từng dự đoán. Xác suất và thống kê cung cấp khuôn khổ lý thuyết cho việc mô hình hóa, phân tích và suy luận trong điều kiện bất định. Một số kiến thức quan trọng có thể kể tới như:
- Định lý Bayes:
$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$$$P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_j P(B|A_j)P(A_j)}$$ - Phân phối Bernoulli:
$$\Pr(X=x)=p^{x}(1-p)^{1-x},\quad \mathbb{E}X]=p,\quad \mathrm{Var}(X)=p(1-p)$$
- Định lý Bayes:
2. Python và hệ sinh thái thư viện AI / Data Science
Python là ngôn ngữ “xương sống” của AI hiện đại nhờ cú pháp đơn giản, cộng đồng lớn, và hệ sinh thái thư viện phong phú bao phủ toàn bộ quy trình làm việc dữ liệu: từ xử lý, mô hình hóa, đến triển khai. Bạn cần nắm rõ những khái niệm cơ bản trong Python như: Biến và kiểu dữ liệu, cấu trúc điều kiện, hàm và phạm vi biến...
print("Hello World")
Song song với Python thuần, việc làm chủ một số thư viện trọng yếu là điều bắt buộc như:
- Pandas: Trung tâm trong xử lý dữ liệu dạng bảng, với các khái niệm như DataFrame, xử lý dữ liệu thiếu và chuỗi thời gian, thường được xem như “xương sống” cho các quy trình ETL ở quy mô cục bộ
import pandas as pd
data = {
"age": [20, 21, None, 23],
"score": [7.5, 8.0, 6.5, None],
}
df = pd.DataFrame(data)
# Xử lý dữ liệu thiếu
df_filled = df.fillna(df.mean())
print(df_filled)
- Numpy: Nền tảng cho tính toán số thông qua mảng nhiều chiều, broadcasting và các phép toán vector – ma trận, là lớp nền cho hầu hết các thư viện học máy và học sâu.
import numpy as np
X = np.array([
[1, 2],
[3, 4],
[5, 6],
])
w = np.array([0.5, 1.0])
# Phép nhân vector – nền tảng của mô hình tuyến tính
y = X @ w
print(y)
- Matplotlib: Hỗ trợ trực quan hóa dữ liệu thông qua các biểu đồ tĩnh, heatmap hay pairplot, giúp khám phá và hiểu dữ liệu trước khi xây dựng mô hình.
import matplotlib.pyplot as plt
scores = [6.5, 7.0, 7.5, 8.0, 8.5]
plt.plot(scores, "ro")
plt.plot(scores)
plt.xlabel("Sample index")
plt.ylabel("Score")
plt.title("Score distribution")
plt.show()
Nhìn chung, Python và các thư viện này tạo thành nền móng kỹ thuật không thể thiếu, giúp người học AI chuyển từ thao tác dữ liệu cơ bản sang xây dựng và phân tích mô hình một cách có hệ thống.
3. Machine Learning
Machine Learnin tập trung vào việc xây dựng các mô hình có khả năng tự học từ dữ liệu để đưa ra dự đoán hoặc quyết định. Thay vì được lập trình bằng các luật cố định, mô hình ML học các quy luật tiềm ẩn thông qua dữ liệu, từ đó có thể áp dụng cho những trường hợp mới.

Nguồn:
What is Machine Learning?
https://www.geeksforgeeks.org/machine-learning/ml-machine-learning/
Về bản chất, Machine Learning giải quyết một số dạng bài toán cốt lõi như:
- Bài toán hồi quy: Nơi mục tiêu là dự đoán một giá trị liên tục như giá nhà, doanh thu hay nhiệt độ.
- Bài toán phân loại: Trong đó mô hình gán dữ liệu vào các nhóm rời rạc, chẳng hạn như phân loại email spam.
- Bài toán phân cụm: Nhằm khám phá cấu trúc ẩn trong dữ liệu không có nhãn
- Bài toán giảm chiều: Giúp nén dữ liệu trong khi vẫn giữ lại thông tin quan trọng.
Tương ứng với các bài toán này là một số thuật toán tiêu biểu như: Linear Regression và Logistic Regression, K-Nearest Neighbors, Support Vector Machine...
Điểm quan trọng khi học Machine Learning không nằm ở việc ghi nhớ nhiều thuật toán, mà ở việc hiểu loại bài toán đang đối mặt, giả định của mô hình, và giới hạn của phương pháp khi áp dụng vào dữ liệu thực tế. Machine Learning vì thế đóng vai trò như bước chuyển tiếp quan trọng, biến dữ liệu thô thành tri thức có thể khai thác, và là nền tảng trực tiếp cho các phương pháp Deep Learning hiện đại.
4. Deep Learning

Nguồn: Deep Learning Tutorial
https://www.geeksforgeeks.org/deep-learning/deep-learning-tutorial/
Deep Learning là nhánh phát triển sâu hơn của Machine Learning, tập trung vào việc sử dụng mạng nơ-ron nhiều tầng để học các biểu diễn phức tạp trực tiếp từ dữ liệu thô. Thay vì dựa nhiều vào đặc trưng được thiết kế thủ công, Deep Learning cho phép mô hình tự học đặc trưng thông qua quá trình lan truyền và tối ưu hoá.
Deep Learning đặc biệt phù hợp với các bài toán có dữ liệu lớn và cấu trúc phức tạp, nơi các phương pháp Machine Learning truyền thống gặp giới hạn. Tiêu biểu là bài toán thị giác máy tính, bài toán xử lý ngôn ngữ tự nhiên...
Điểm cốt lõi khi học Deep Learning không chỉ là hiểu các kiến trúc mạng, mà là nắm được cách mô hình học biểu diễn, cách tối ưu hoá thông qua gradient và backpropagation, cũng như những đánh đổi về dữ liệu, tài nguyên tính toán và khả năng diễn giải. Deep Learning vì vậy không thay thế hoàn toàn Machine Learning truyền thống, mà mở rộng khả năng của AI trong những bài toán đòi hỏi mức độ trừu tượng và quy mô cao hơn.
Chưa có bình luận nào. Hãy là người đầu tiên!