Học máy là một tập hợp các phương pháp được sử dụng để tạo ra các chương trình máy tính có thể học hỏi từ các quan sát và đưa ra dự đoán. Học máy sử dụng thuật toán, hồi quy và các ngành khoa học liên quan để hiểu dữ liệu. Các thuật toán này thường có thể được coi là mô hình thống kê và mạng.
Học sâu là một tập hợp con của phương pháp học máy. Dữ liệu được phân tích cú pháp thông qua nhiều lớp của một mạng học sâu để mạng có thể đưa ra kết luận và đưa ra quyết định về dữ liệu. Phương pháp học sâu cho phép độ chính xác cao trên các bộ dữ liệu lớn, nhưng các tính năng này làm cho việc học sâu tốn nhiều tài nguyên hơn so với học máy cổ điển.
Trong nhiều thập kỷ, học máy đã được sử dụng như một phương pháp để đạt được trí tuệ nhân tạo trong máy móc. Về cốt lõi, lĩnh vực học máy tập trung vào việc tạo ra các máy tính có thể học và đưa ra quyết định, điều này giúp cho việc học máy phù hợp với nghiên cứu trí tuệ nhân tạo. Tuy nhiên, không phải tất cả các mô hình học máy đều nhằm phát triển trí thông minh nhân tạo của Real true mà hoàn toàn phù hợp hoặc vượt quá trí thông minh của con người. Thay vào đó, các mô hình thường được thiết kế để nghiên cứu các vấn đề cụ thể, hạn chế.
Học sâu đã được đề xuất trong giai đoạn đầu của các cuộc thảo luận về máy học, nhưng rất ít nhà nghiên cứu theo đuổi các phương pháp học sâu bởi vì các yêu cầu tính toán của học sâu là lớn hơn nhiều so với học máy cổ điển. Tuy nhiên, sức mạnh tính toán của máy tính đã tăng theo cấp số nhân kể từ năm 2000, cho phép các nhà nghiên cứu thực hiện những cải tiến lớn trong học máy và xây dựng trí tuệ nhân tạo. Bởi vì các mô hình học tập sâu có quy mô tốt với dữ liệu tăng lên, học sâu có khả năng vượt qua những trở ngại đáng kể trong việc tạo ra trí tuệ nhân tạo thực sự.
Học máy và học sâu đều là thuật toán. Trong học máy cổ điển, các nhà nghiên cứu sử dụng một lượng dữ liệu tương đối nhỏ và quyết định các tính năng quan trọng nhất có trong dữ liệu mà thuật toán cần để đưa ra dự đoán. Phương pháp này được gọi là kỹ thuật tính năng. Ví dụ, nếu một chương trình học máy được dạy để nhận dạng hình ảnh của máy bay, các lập trình viên của nó sẽ tạo ra các thuật toán cho phép chương trình nhận ra hình dạng, màu sắc và kích cỡ điển hình của máy bay thương mại. Với thông tin này, chương trình học máy sẽ đưa ra dự đoán về việc liệu hình ảnh được trình bày với máy bay đi kèm.
Học sâu thường khác biệt với học máy cổ điển bởi nhiều lớp ra quyết định. Các mạng học sâu thường được coi là các hộp đen của Ấn Độ vì dữ liệu được phân tích cú pháp qua nhiều lớp mạng mà mỗi lớp thực hiện. Điều này có thể làm cho kết quả khó hiểu hơn kết quả trong học máy cổ điển. Số lượng chính xác của các lớp hoặc các bước trong quá trình ra quyết định tùy thuộc vào loại và độ phức tạp của mô hình đã chọn.
Theo truyền thống, máy học sử dụng các bộ dữ liệu nhỏ để tìm hiểu và đưa ra dự đoán. Với một lượng nhỏ dữ liệu, các nhà nghiên cứu có thể xác định các tính năng chính xác sẽ giúp chương trình máy học hiểu và học từ dữ liệu. Tuy nhiên, nếu chương trình chạy vào thông tin mà nó không thể phân loại dựa trên các thuật toán đã có từ trước, các nhà nghiên cứu thường sẽ cần phải phân tích thủ công dữ liệu có vấn đề và tạo ra một tính năng mới. Do đó, học máy cổ điển thường không mở rộng tốt với lượng dữ liệu khổng lồ, nhưng nó có thể giảm thiểu lỗi trên các bộ dữ liệu nhỏ hơn.
Học sâu đặc biệt phù hợp với các bộ dữ liệu lớn và các mô hình thường yêu cầu các bộ dữ liệu lớn phải hữu ích. Do sự phức tạp của một mạng học sâu, mạng cần một lượng đáng kể dữ liệu đào tạo và dữ liệu bổ sung để kiểm tra mạng sau khi đào tạo. Hiện tại các nhà nghiên cứu đang tinh chỉnh các mạng học sâu có thể hiệu quả hơn và sử dụng các bộ dữ liệu nhỏ hơn.
Máy học có yêu cầu hiệu suất máy tính thay đổi. Có rất nhiều mô hình có thể chạy trên máy tính cá nhân trung bình. Các phương pháp thống kê và toán học càng tiên tiến, máy tính càng khó xử lý nhanh dữ liệu.
Học sâu có xu hướng rất tốn tài nguyên. Phân tích một lượng lớn thông tin thông qua nhiều lớp ra quyết định đòi hỏi rất nhiều sức mạnh tính toán. Khi máy tính trở nên nhanh hơn, việc học sâu ngày càng dễ tiếp cận.
Theo truyền thống, máy học có một vài hạn chế phổ biến và đáng kể. Quá mức là một vấn đề thống kê có thể ảnh hưởng đến thuật toán học máy. Một thuật toán học máy chứa một lượng lỗi lỗi nhất định khi phân tích và dự đoán với dữ liệu. Thuật toán được cho là hiển thị mối quan hệ giữa các biến có liên quan, nhưng trong quá mức, nó cũng bắt đầu bắt lỗi, điều này dẫn đến một mô hình không ồn ào hoặc mô hình không chính xác. Các mô hình học máy cũng có thể trở nên thiên về các đặc điểm riêng của dữ liệu mà họ đã được đào tạo, một vấn đề đặc biệt rõ ràng khi các nhà nghiên cứu đào tạo thuật toán trên toàn bộ dữ liệu có sẵn thay vì lưu một phần dữ liệu để kiểm tra thuật toán.
Học sâu có những cạm bẫy thống kê giống như học máy cổ điển, cũng như một vài vấn đề độc đáo. Đối với nhiều vấn đề, không có đủ dữ liệu có sẵn để đào tạo một mạng lưới học tập sâu chính xác hợp lý. Việc thu thập thêm dữ liệu hoặc mô phỏng một vấn đề trong thế giới thực thường bị hạn chế hoặc không thể thu thập được nhiều vấn đề trong thế giới thực, điều này giới hạn phạm vi các chủ đề hiện tại mà học sâu có thể được sử dụng cho.
Học máy và học sâu đều mô tả các phương pháp dạy máy tính để học và đưa ra quyết định. Học sâu là một tập hợp con của học máy cổ điển, và một số phân kỳ quan trọng làm cho học sâu và học máy phù hợp với từng ứng dụng khác nhau.