Đây là kết luận từ một nghiên cứu được công bố trên tạp chí Patterns, trong đó các nhà nghiên cứu từ Scuola Internazionale Superiore di Studi Avanzati (SISSA) ở Ý đã yêu cầu một mô hình AI nhận diện hình ảnh cố gắng tái tạo khả năng của chuột trong việc nhận diện các vật thể bị xoay, thay đổi kích thước và che khuất một phần.
Tầm nhìn của chuột “hiệu quả và thích nghi” hơn AI
Mô hình AI cuối cùng đã có thể bắt kịp khả năng xử lý hình ảnh của chuột, nhưng chỉ sau khi sử dụng ngày càng nhiều tài nguyên và sức mạnh tính toán.
Việc nhận diện vật thể ở vị trí ban đầu khá dễ đối với cả AI và chuột, nhưng khi vật thể bị biến đổi theo nhiều cách khác nhau, các nhà nghiên cứu phải tăng cường hiệu suất của mô hình AI để có thể theo kịp chuột.
Các nhà khoa học cho rằng phát hiện của họ cho thấy tầm nhìn của chuột, được tinh chỉnh qua hàng triệu năm tiến hóa, vẫn hiệu quả hơn so với các hệ thống nhận diện hình ảnh mạnh mẽ nhất hiện nay.
Tầm nhìn của chuột khác với cách con người nhìn theo nhiều cách đáng chú ý. Đầu tiên, giống như nhiều loài động vật có vú khác, mắt của chuột nằm ở hai bên đầu, giúp chúng có tầm nhìn rộng hơn, một lợi thế trong tự nhiên để phát hiện và tránh kẻ săn mồi.
Đặc biệt hơn nữa, nghiên cứu trước đây đã chỉ ra rằng mắt của chuột có thể di chuyển theo hướng ngược nhau tùy theo cách chúng nghiêng đầu. Điều này khiến chúng trông như bị “lác mắt” khi cúi đầu xuống.
Trong thí nghiệm, những con chuột được huấn luyện để nhận diện vật thể trên màn hình bằng cách nhận thưởng. Khi xác định đúng vật thể mục tiêu, chúng sẽ kích hoạt một cảm biến cảm ứng.
Để so sánh khả năng này với AI, các nhà nghiên cứu SISSA đã tạo ra một mạng nơ-ron tích chập (convolutional neural network – CNN). Đây là loại mô hình học sâu tiên tiến, được coi là một trong những hệ thống AI tốt nhất để nhận diện hình ảnh. Bản thân nó cũng được mô phỏng một phần theo vỏ não thị giác của động vật có vú.
AI vẫn còn nhiều điều phải học
Mô hình CNN sử dụng một hệ thống phân lớp để nhận diện vật thể. Lớp cơ bản nhất có thể xử lý và xác định các đặc điểm đơn giản như đường viền và độ tương phản. Các lớp tiếp theo được thêm vào để nhận diện các hình ảnh phức tạp hơn. Mỗi lớp bổ sung đều đòi hỏi thêm tài nguyên và sức mạnh tính toán, tương tự như một chiếc bánh lasagna càng nhiều lớp thì càng cần nhiều nguyên liệu.
Mô hình CNN này sau đó được yêu cầu tái tạo khả năng của chuột trong việc nhận diện vật thể dưới nhiều điều kiện khác nhau. Khi nhận diện một vật thể không bị che khuất và nằm ở vị trí bình thường, cả chuột và AI đều làm tốt. Khi đó, AI chỉ cần sử dụng lớp đầu tiên của mình.
Nhưng khi vật thể bị xoay hoặc thay đổi kích thước, CNN cần thêm nhiều lớp và tài nguyên hơn để hoạt động chính xác. Trong khi đó, chuột vẫn có thể nhận diện vật thể một cách nhất quán, ngay cả khi vật thể bị che khuất một phần, điều mà AI gặp nhiều khó khăn.
Các nhà nghiên cứu kết luận rằng tầm nhìn của chuột dường như linh hoạt và thích nghi hơn so với hệ thống nhận diện hình ảnh của AI.
Nghiên cứu về tầm nhìn của chuột là một lời nhắc nhở rằng các mô hình AI mạnh mẽ thực sự rất ấn tượng trong một số nhiệm vụ cụ thể, nhưng chúng vẫn không phải là không có hạn chế.
Cuối năm ngoái, CEO OpenAI Sam Altman đã công bố một bài viết tuyên bố rằng thế giới có thể đạt đến trí tuệ siêu việt của trong vòng “vài nghìn ngày”. Tỉ phú Elon Musk cũng từng nói rằng AI siêu thông minh có thể xuất hiện trong năm 2025.
Nhưng những cột mốc đó thực sự có ý nghĩa gì? Đúng là các mô hình AI ngôn ngữ lớn đã vượt qua một số con người trong các kỳ thi tiêu chuẩn dành cho ngành y và luật. Tuy nhiên, AI vẫn chưa thể tự đưa ra chẩn đoán y tế chính thức mà không có sự giám sát của bác sĩ, và các luật sư sử dụng văn bản do AI tạo ra đã bị phạt vì chứa thông tin sai lệch.
Hơn nữa, các hệ thống AI tiên tiến được triển khai trong robot hai chân vẫn thường gặp khó khăn trong việc giữ thăng bằng. Và như nghiên cứu của SISSA cho thấy, AI dường như vẫn chưa thể đạt đến mức độ thị giác nhạy bén như loài chuột. Nói cách khác, AI vẫn còn rất nhiều điều phải học – từ cả con người lẫn động vật.