Trong những năm gần đây, học máy (machine learning) đã nổi lên như một công nghệ mang tính chuyển đổi, hỗ trợ nhiều tiến bộ trong trí tuệ nhân tạo. Phần này đi sâu vào nền tảng và sự phát triển của học máy, làm nổi bật tầm quan trọng của nó trong việc định hình các ứng dụng AI hiện đại.
1. Học máy
Học máy là một nhánh của trí tuệ nhân tạo tập trung vào việc phát triển các thuật toán và mô hình cho phép máy tính học hỏi và đưa ra dự đoán hoặc quyết định dựa trên dữ liệu. Thay vì được lập trình rõ ràng để thực hiện một số tác vụ nhất định, các thuật toán học máy được thiết kế để học hỏi và cải thiện từ kinh nghiệm. Các khái niệm chính trong học máy bao gồm:
1.1 Dữ liệu đào tạo (Training Data)
Các mô hình học máy được đào tạo trên các tập dữ liệu lớn để xác định các mẫu và mối quan hệ có thể được sử dụng để đưa ra dự đoán hoặc quyết định. Hãy nhìn vào ví dụ dưới đây:
Nhiệm vụ: Dự đoán giá nhà
Hãy xem xét một kịch bản mà chúng ta muốn xây dựng một mô hình học máy để dự đoán giá nhà dựa trên các tính năng như kích thước ngôi nhà và số phòng ngủ.
Dữ liệu đào tạo:
Training Data:
Diện tích nhà (m2) | Số phòng | Giá ($) |
1500 | 3 | 200,000 |
2000 | 4 | 300,000 |
1200 | 2 | 180,000 |
1600 | 3 | 210,000 |
2500 | 4 | 350,000 |
Trong ví dụ này:
Diện tích nhà (m2): Cột này biểu thị kích thước của các ngôi nhà tính bằng feet vuông.
Số phòng ngủ: Cột này biểu thị số phòng ngủ trong mỗi ngôi nhà.
Giá (tính bằng đô la): Cột này hiển thị giá tương ứng của các ngôi nhà.
Thuật toán học máy sẽ sử dụng dữ liệu đào tạo này để tìm hiểu mối quan hệ giữa các đặc điểm (kích thước nhà và số phòng ngủ) và biến mục tiêu (giá nhà). Bằng cách phân tích các mẫu trong dữ liệu đào tạo, mô hình có thể đưa ra dự đoán về giá của những ngôi nhà mới mà nó chưa từng thấy trước đây.
Trong quá trình đào tạo, thuật toán điều chỉnh các tham số nội bộ của nó để giảm thiểu lỗi giữa giá dự đoán và giá thực tế trong dữ liệu đào tạo. Quá trình học lặp đi lặp lại này cho phép mô hình tổng quát hóa các dự đoán của mình thành dữ liệu chưa thấy một cách chính xác.
Ví dụ này minh họa cách dữ liệu đào tạo được cấu trúc với các đặc điểm đầu vào và các giá trị mục tiêu tương ứng, cho phép các thuật toán học máy học từ các ví dụ và đưa ra các dự đoán hoặc quyết định thông minh.
1.2 Học có giám sát (Supervised Learning)
Học có giám sát là một loại học máy trong đó thuật toán học từ dữ liệu đào tạo được gắn nhãn, đưa ra dự đoán hoặc quyết định dựa trên các cặp đầu vào-đầu ra. Sau đây là một ví dụ về học có giám sát sử dụng một tác vụ phân loại đơn giản:
Tác vụ: Phân loại thư rác qua email
Hãy xem xét một tình huống trong đó chúng ta muốn xây dựng một mô hình học có giám sát để phân loại email là “thư rác” hoặc “không phải thư rác” dựa trên một số tính năng được trích xuất từ nội dung email.
Dữ liệu đào tạo:
Chủ đề Email | Nội dung Email | Nhãn |
“Nhóm tài chính” | “Kiếm tiền cực dễ không cần bỏ vốn!” | Thư rác |
“Lịch nghỉ lễ 2024” | “Thông báo nghỉ lễ cho nhân viên công ty” | Không phải Thư rác |
“Giảm giá Quần áo” | “Giảm giá 50% trong tuần này” | Thư rác |
“Thời gian cuộc họp ngày mai” | “Thời gian họp 10h sáng ngày thứ 2” | Không phải Thư rác |
“Việc làm tại nhà” | “Việc làm tại nhà không cần bỏ vốn” | Thư rác |
Trong ví dụ này:
Chủ đề và Nội dung Email: Các cột này biểu diễn các tính năng được trích xuất từ email.
Nhãn: Cột này cho biết email được phân loại là “Thư rác” hay “Không phải Thư rác” (biến mục tiêu).
Quy trình Học có Giám sát:
Giai đoạn Đào tạo: Thuật toán được đào tạo trên dữ liệu được gắn nhãn, học các mẫu phân biệt email thư rác với email không phải thư rác.
Xây dựng Mô hình: Thuật toán xây dựng một mô hình có thể dự đoán nhãn (thư rác hay không phải thư rác) cho các email mới, chưa xem dựa trên các tính năng của chúng.
Dự đoán: Khi được trình bày với một email mới, mô hình sẽ phân tích chủ đề và nội dung của email đó và dự đoán xem đó có phải là thư rác hay không.
Đánh giá: Hiệu suất của mô hình được đánh giá bằng cách so sánh các dự đoán của mô hình với các nhãn thực tế trong một tập dữ liệu thử nghiệm riêng biệt.
Cải tiến Lặp lại: Mô hình có thể được tinh chỉnh bằng cách điều chỉnh các tham số của nó, kết hợp nhiều dữ liệu hơn hoặc sử dụng các thuật toán khác nhau để tăng cường độ chính xác của nó.
Học có giám sát được sử dụng rộng rãi trong nhiều ứng dụng khác nhau, chẳng hạn như nhận dạng hình ảnh, phân tích tình cảm, phát hiện gian lận và chẩn đoán y tế, trong đó dữ liệu được gắn nhãn có sẵn để đào tạo các mô hình dự đoán. Nó tạo thành nền tảng cho nhiều tác vụ và thuật toán học máy, cho phép máy tính học hỏi từ các ví dụ và đưa ra quyết định sáng suốt.
1.3 Học không giám sát (Unsupervised Learning)
Học không giám sát liên quan đến việc học từ dữ liệu không có nhãn để khám phá các mẫu hoặc cấu trúc trong dữ liệu. Một kỹ thuật học không giám sát phổ biến là phân cụm, trong đó thuật toán nhóm các điểm dữ liệu tương tự lại với nhau. Sau đây là một ví dụ về học không giám sát sử dụng tác vụ phân cụm:
Nhiệm vụ: Phân khúc khách hàng
Hãy xem xét một tình huống mà một nhà bán lẻ muốn phân khúc khách hàng của mình dựa trên hành vi mua hàng của họ mà không có bất kỳ nhãn nào trước đó chỉ ra phân khúc khách hàng.
Dữ liệu:
ID khách hàng | Tuổi | Thu nhập ($) | Điểm chi tiêu (1-100) |
1 | 30 | 50,000 | 75 |
2 | 25 | 40,000 | 80 |
3 | 35 | 70,000 | 45 |
4 | 40 | 100,000 | 30 |
5 | 60 | 80,000 | 10 |
6 | 55 | 120,000 | 5 |
Trong ví dụ này:
Tuổi, Thu nhập và Điểm chi tiêu: Các cột này biểu thị các tính năng khác nhau mô tả từng khách hàng.
Không có nhãn được xác định trước: Không có phân khúc khách hàng được xác định trước nào được cung cấp; mục tiêu là khám phá các nhóm tự nhiên dựa trên dữ liệu.
Quy trình học không giám sát:
Thuật toán phân cụm: Thuật toán học không giám sát như phân cụm k-means có thể được áp dụng để nhóm khách hàng dựa trên điểm tương đồng trong các tính năng của họ.
Phân tích cụm: Thuật toán xác định các cụm khách hàng có hành vi mua sắm tương tự, tạo các phân khúc riêng biệt dựa trên độ tuổi, thu nhập và điểm chi tiêu.
Phân khúc: Nhà bán lẻ có thể sử dụng kết quả phân cụm để điều chỉnh các chiến lược tiếp thị, chương trình khuyến mãi hoặc sản phẩm cung cấp theo sở thích của từng phân khúc khách hàng.
Tinh chỉnh lặp lại: Quy trình phân cụm có thể được tinh chỉnh bằng cách điều chỉnh số lượng cụm hoặc sử dụng các thuật toán khác nhau để cải thiện độ chính xác của phân khúc.
Học không giám sát có giá trị trong các tình huống mà dữ liệu được gắn nhãn khan hiếm hoặc tốn kém để có được. Nó cho phép phân tích dữ liệu khám phá, nhận dạng mẫu và thông tin chi tiết dựa trên dữ liệu mà không cần các danh mục được xác định trước. Phân khúc khách hàng, phát hiện bất thường và giảm số chiều là những ứng dụng phổ biến của các kỹ thuật học không giám sát trong nhiều ngành công nghiệp khác nhau.
1.4 Học tăng cường (Reinforcement Learning)
Học tăng cường là một loại học máy trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phần thưởng hoặc hình phạt dựa trên hành động của nó. Sau đây là một ví dụ về học tăng cường sử dụng một bài toán kinh điển: trò chơi “CartPole”.
Ví dụ về học tăng cường: Bài toán CartPole
Trong bài toán CartPole, mục tiêu là cân bằng một cây sào trên đỉnh một chiếc xe đẩy đang di chuyển bằng cách tác dụng lực trái hoặc phải vào xe đẩy. Tác nhân (một thuật toán học) phải học một chính sách chỉ định các hành động cần thực hiện ở các trạng thái khác nhau để giữ cho cây sào thẳng đứng.
Các thành phần của Bài toán CartPole:
Môi trường: Môi trường bao gồm một chiếc xe đẩy có thể di chuyển theo chiều ngang và một cây sào bắt đầu thẳng đứng. Tác nhân tiếp nhận các quan sát về môi trường và thực hiện các hành động để điều khiển chiếc xe đẩy.
Trạng thái: Trạng thái của môi trường được mô tả bằng các biến như vị trí xe đẩy, vận tốc xe đẩy, góc sào và vận tốc góc của sào.
Hành động: Tác nhân có thể thực hiện các hành động rời rạc, chẳng hạn như đẩy xe đẩy sang trái hoặc phải.
Phần thưởng: Tác nhân nhận được phần thưởng là +1 cho mỗi bước chân mà cây sào vẫn thẳng đứng.
Tập phim kết thúc nếu cực nghiêng quá một góc nhất định hoặc nếu xe đẩy di chuyển quá xa tâm.
Quy trình học tăng cường:
Khởi tạo: Tác nhân bắt đầu bằng một chính sách ngẫu nhiên hoặc ban đầu.
Lựa chọn hành động: Tác nhân chọn hành động dựa trên chính sách của mình và trạng thái hiện tại của môi trường.
Quan sát và phần thưởng: Tác nhân nhận được phản hồi dưới dạng quan sát và phần thưởng dựa trên hành động của mình.
Học: Tác nhân cập nhật chính sách của mình bằng thuật toán học tăng cường (ví dụ: Q-learning hoặc Deep Q Networks) để tối đa hóa phần thưởng tích lũy theo thời gian.
Đào tạo: Thông qua các tương tác lặp đi lặp lại với môi trường, tác nhân học cách cân bằng cực bằng cách điều chỉnh hành động của mình ở các trạng thái khác nhau.
Tối ưu hóa chính sách: Chính sách của tác nhân dần được cải thiện thông qua quá trình khám phá và khai thác, dẫn đến hiệu suất cân bằng cực tốt hơn.
Bài toán CartPole là một ví dụ kinh điển về học tăng cường và chứng minh cách các tác nhân có thể học cách thực hiện các nhiệm vụ phức tạp thông qua thử nghiệm và sai sót, sử dụng phần thưởng làm phản hồi để hướng dẫn hành vi của mình. Học tăng cường được sử dụng rộng rãi trong lĩnh vực robot, chơi trò chơi, xe tự hành và các lĩnh vực khác, trong đó các tác nhân phải học cách đưa ra quyết định tuần tự trong môi trường năng động.
2. Mạng nơ-ron nhân tạo (Artificial Neural Networks)
Mạng nơ-ron nhân tạo là các mô hình tính toán lấy cảm hứng từ cấu trúc và chức năng của mạng nơ-ron sinh học trong não người. Chúng bao gồm các nút được kết nối với nhau (nơ-ron) được tổ chức theo từng lớp, với mỗi nút thực hiện các phép tính đơn giản và truyền tín hiệu đến các nút ở lớp tiếp theo.
Các điểm chính về mạng nơ-ron nhân tạo bao gồm:
2.1 Học sâu (Deep Learning)
Học sâu là một lĩnh vực con của học máy tập trung vào mạng nơ-ron có nhiều lớp (mạng nơ-ron sâu). Các mô hình học sâu đã chứng minh được thành công đáng kể trong các tác vụ như nhận dạng hình ảnh và giọng nói, xử lý ngôn ngữ tự nhiên và chơi trò chơi.
Học sâu là một tập hợp con của học máy sử dụng mạng nơ-ron nhân tạo với nhiều lớp để học các mẫu phức tạp từ dữ liệu. Một ứng dụng phổ biến của học sâu là phân loại hình ảnh bằng Mạng nơ-ron tích chập (CNN – Convolutional Neural Networks). Sau đây là một ví dụ về học sâu trong thực tế với phân loại hình ảnh:
Ví dụ về học sâu: Phân loại hình ảnh bằng CNN
Trong ví dụ này, chúng ta sẽ xem xét một kịch bản mà chúng ta muốn xây dựng một mô hình học sâu để phân loại hình ảnh chữ số viết tay thành các danh mục tương ứng (0-9).
Các thành phần của Mô hình học sâu:
Bộ dữ liệu: Mô hình được đào tạo trên một bộ dữ liệu như MNIST, chứa hàng nghìn hình ảnh thang độ xám của chữ số viết tay cùng với các nhãn tương ứng của chúng.
Mạng nơ-ron tích chập (CNN): Một kiến trúc mạng nơ-ron sâu được thiết kế riêng để xử lý dữ liệu dạng lưới có cấu trúc, chẳng hạn như hình ảnh.
Đào tạo: CNN học cách tự động trích xuất các tính năng từ hình ảnh thông qua nhiều lớp tích chập, gộp và lớp kết nối đầy đủ.
Lớp Softmax: Lớp cuối cùng của mạng sử dụng hàm kích hoạt softmax để đưa ra xác suất cho từng lớp chữ số.
Hàm mất mát và tối ưu hóa: Mô hình được đào tạo bằng hàm mất mát (như mất mát entropy chéo) và được tối ưu hóa bằng các thuật toán như giảm dần độ dốc ngẫu nhiên để giảm thiểu mất mát và cải thiện độ chính xác.
Quy trình học sâu:
Chuẩn bị dữ liệu: Bộ dữ liệu được tải, xử lý trước và chia thành các tập huấn luyện và thử nghiệm.
Kiến trúc mô hình: Thiết kế kiến trúc CNN với các lớp tích chập để trích xuất tính năng và các lớp được kết nối đầy đủ để phân loại.
Đào tạo: Mô hình được đào tạo trên tập huấn luyện bằng cách đưa hình ảnh qua mạng, đưa ra dự đoán, tính toán mất mát và cập nhật trọng số mạng thông qua truyền ngược.
Đánh giá: Mô hình được đánh giá trên tập kiểm tra để đo độ chính xác của nó trong việc xác định chính xác các chữ số viết tay.
Suy luận: Sau đó, mô hình đã đào tạo có thể được sử dụng để phân loại các hình ảnh mới chưa từng thấy của các chữ số viết tay.
Lợi ích của học sâu:
Học tính năng tự động: Các mô hình học sâu có thể tự động học các biểu diễn phân cấp của dữ liệu, loại bỏ nhu cầu thiết kế tính năng thủ công.
Khả năng mở rộng: Các mô hình học sâu có thể mở rộng với lượng dữ liệu lớn, khiến chúng phù hợp với các tác vụ phức tạp như nhận dạng hình ảnh, nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên.
Hiệu suất tiên tiến: Học sâu đã đạt được hiệu suất tiên tiến trong nhiều lĩnh vực, vượt trội hơn các thuật toán học máy truyền thống trong nhiều tác vụ.
Ví dụ này minh họa cách học sâu, đặc biệt là với CNN, có thể được áp dụng để giải quyết các tác vụ phân loại hình ảnh phức tạp với độ chính xác và hiệu quả cao.
2.2 Đào tạo mạng nơ-ron (Training Neural Networks)
Mạng nơ-ron được đào tạo bằng các thuật toán như truyền ngược, trong đó mạng điều chỉnh các tham số của nó dựa trên lỗi giữa đầu ra dự đoán và thực tế. Quá trình lặp đi lặp lại này cho phép mạng học các mẫu phức tạp và đưa ra dự đoán chính xác.
Mạng nơ-ron nhân tạo đã trở thành nền tảng của AI hiện đại, cho phép phát triển các mô hình tinh vi có thể học từ khối lượng dữ liệu lớn và thực hiện các tác vụ phức tạp với độ chính xác cao.
Bằng cách hiểu được sự phát triển của máy học và vai trò của mạng nơ-ron nhân tạo, người ta có thể đánh giá cao những tiến bộ và tiềm năng của công nghệ AI trong thời đại hiện nay.