Tổng quan
Fashion-MNIST là một tập dữ liệu về các hình ảnh bài viết của Zalando — 60.000 ảnh sẽ được dùng để huấn luyện và 10.000 ảnh sẽ thường dùng để đánh giá khả năng phân loại nhận diện ảnh của mạng neuron. Mỗi ảnh là một mảng NumPy 2 chiều, 28x28, với mỗi pixel có giá trị từ 0 đến 255.
Dưới đây là một hình ảnh về tập dữ liệu (mỗi lớp có ba hàng):
Mô tả nhãn: Nhãn là một mảng của các số nguyên từ 0 đến 9, tương ứng với mỗi lớp quần áo giày dép.
Giới thiệu bài toán
Ngày nay, xử lý ảnh đang là một lĩnh vực mà rất nhiều người quan tâm và nghiên cứu. Nhờ vào sự phát triển mạnh mẽ của Machine Learning - một lĩnh vực nhỏ của Khoa Học Máy Tính, nó có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể, xử lý ảnh đã và đang được ứng dụng vào nhiều lĩnh vực trong cuộc sống: y tế (X Ray Imaging, PET scan,...), thị giác máy tính (giúp máy tính có thể hiểu, nhận biết đồ vật như con người), các cộng nghệ nhận dạng (vân tay, khuôn mặt,…)
Thời trang là một sự thể hiện thẩm mỹ phổ biến tại một thời gian, địa điểm cụ thể, trong một bối cảnh cụ thể bằng cách sử dụng quần áo, giày dép,… Thời trang rất đa dạng, nó phụ thuộc vào từng người, từng phong cách. Vì vậy, việc phân loại thời trang là rất cần thiết.
Để máy tính có thể nhận biết và phân loại thời trang chúng ta cần có một hệ thống nhận diện đạt độ chính xác cao. Và đây cũng chính là bài toán mà tôi hướng tới.
Tiến hành huấn luyện
Chú ý: Dưới đây là toàn bộ code và hướng dẫn chi tiết.
Truy cập link: https://colab.research.google.com/github/leanhducprovn/cdn/blob/master/tlu/elearning/machine-learning/fashion-mnist/fashion-mnist.ipynb
Kết luận
Chúng ta thấy rằng độ accuracy của mô hình, khi đánh giá bằng tập kiểm thử, hơi thấp hơn so với số liệu trong quá trình huấn luyện. Khoảng cách giữa hai độ accuracy khi huấn luyện và khi kiểm thử thể hiện sự overfitting. Overfitting xảy ra khi một mô hình ML hoạt động kém hơn khi được cung cấp các đầu vào mới, mà mô hình chưa từng thấy trước đây trong quá trình đào tạo.
Huấn luyện thành công Convolutional Neural Network (CNN) để phân loại Fashion-MNIST với độ chính xác khoảng 92% 🎉