Chương 9: Một hướng đi khác
Ngay từ khi ra đời, các kỹ thuật học sâu Deep Learning đã nhận nhiều chỉ trích vì khả năng tự học dựa hoàn toàn vào thuật toán lan truyền ngược backpropagation vốn rất phức tạp. Nhiều nhà khoa học trí tuệ nhân tạo đã chọn con đường khác để huấn luyện mạng nơ-ron.
Vào những năm 2000, Jeff Clune lúc này là một cử nhân trẻ vừa tốt nghiệp đại học Michigan. Trong một lần thăm quan các nhóm nghiên cứu về trí tuệ nhân tạo, ông đã chọn một nhóm không hề nổi tiếng và ở đó trong suốt 8 năm tiếp theo. Nhiệm vụ duy nhất của ông là phá vỡ thế độc quyền của thuật toán lan truyền ngược trong việc huấn luyện mạng nơ-ron. Nhưng công việc này không hề dễ dàng.
Ông theo đuổi niềm đam mê với thuật toán di truyền (genetic algorithm). Bản chất của thuật toán di truyền này dựa trên một chân lý đơn giản, và có thể được hình dung thông qua ví dụ là trò chơi dò đường: một người được yêu cầu đi từ Hà Nội vào Huế nhưng lại không biết Huế nằm ở đâu. Cứ mỗi một bước đi thì người này được phát 10 thiết bị thông minh có thể đo được khoảng cách tới Huế. Người này có thể chọn cách đơn giản nhất là ném ra 10 thiết bị ngẫu nhiên về các hướng, sau đó đi theo hướng của thiết bị gần với Huế nhất. Cứ như vậy rốt cuộc người này sẽ tới được Huế, mặc dù thời gian có thể khá lâu. Thuật toán di truyền để huấn luyện mạng nơ-ron nhân tạo cũng tương tự. Trong mỗi thế hệ, chúng ta tạo ra một vài mạng nơ-ron chỉ khác nhau một ít (như một dạng dò đường). Mạng nơ-ron nào đạt kết quả tốt nhất sẽ được giữ lại và di truyền cho thế hệ tiếp theo. Tuy nhiên, vì cần tạo ra nhiều mạng nơ-ron hoạt động song song nên thuật toán di truyền yêu cầu phải có những dàn máy tính đủ mạnh, vốn là thứ đắt đỏ vào thời điểm đó. Jeff Clune nhiều lần tuyệt vọng và muốn từ bỏ con đường đã chọn, sau khi chứng kiến bạn bè lần lượt ra trường với công việc ổn định lương cao.
Trong khi đó, Kenneth O. Stanley có một khởi đầu thuận lợi hơn. Ông nhận ra vấn đề của thuật toán di truyền là mạng nơ-ron nhân tạo có quá nhiều nơ-ron và các kết nối. Điều này không hề sai, nhưng không giống với sự tiến hóa trong tự nhiên. Lấy ví dụ là loài người, thì chúng ta có khoảng 80 tỷ tế bào nơ-ron trong bộ não nhưng lại chỉ có khoảng 30,000 gen trong ADN. Thế hệ bố mẹ không di truyền 80 tỷ nơ-ron này lại cho đời con mà chỉ truyền lại 30,000 gen. Kể cả nếu như hơn một nửa số gen được dùng vào việc mã hóa bộ não, thì rõ ràng là bộ gen của chúng ta không thể mã hóa từng nơ-ron và từng kết nối được. Như vậy việc mã hóa bộ não trong ADN để truyền lại cho thế hệ sau chỉ có thể là mã hóa gián tiếp: các gen sẽ mã hóa những quy luật kết nối các nơ-ron thay vì mã hóa cụ thể từng kết nối. Dựa trên cách tiếp cận này, ông giới thiệu mô hình NEAT, trong đó mạng nơ-ron nhân tạo được mã hóa bởi một bộ gen. Việc tự học của mạng nơ-ron chính là sự tiến hóa của bộ gen thông qua các thế hệ của thuật toán di truyền, và như vậy không cần sử dụng thuật toán lan truyền ngược backpropagation.
Clune và Stanley cùng gia nhập bộ phận nghiên cứu trí tuệ nhân tạo UberAI của hãng gọi xe Uber vào năm 2017. Nhờ vào tiềm lực của hãng, giờ đây cả hai có thể phát triển thuật toán di truyền để giải quyết những bài toán được cho là chỉ dành riêng cho thuật toán học sâu Deep Learning. Trong năm 2018, UberAI dưới sự lãnh đạo của Clune công bố loạt 5 công trình nghiên cứu khẳng định tính hiệu quả của thuật toán di truyền. Bằng cách sử dụng hơn 1000 bộ vi xử lý chạy đồng thời, thuật toán di truyền đạt hiệu quả cao hơn thuật toán học sâu Deep Learning trong nhiều ứng dụng, trong khi chỉ cần huấn luyện khoảng 1 giờ. Thuật toán di truyền genetic algorithm đã trở thành đối thủ thật sự của Deep Learning. Điều này cũng khẳng định thêm nữa một vấn đề gây tranh cãi trong lĩnh vực trí tuệ nhân tạo, là sức mạnh của máy tính về dài hạn sẽ quan trọng hơn khả năng chuyên môn của con người (trong việc thiết kế ra các thuật toán).
Trong một diễn biến đầy bất ngờ, năm 2019, Jeff Clune công bố bài báo khoa học dài nhất của mình. Trong đó ông lý luận rằng mục tiêu cuối cùng của ngành trí tuệ nhân tạo, là có thể tạo ra một cỗ máy vượt qua được bài kiểm tra Turing, đang bị dẫn dắt bởi những cách tiếp cận sai lầm. Cách tiếp cận đầu tiên là các nhà nghiên cứu về thuật toán tự học đang hàng ngày tạo ra những mô hình mới, nhưng làm sao để ghép các mô hình này lại với nhau để đạt được trí thông minh nhân tạo thì không ai biết. Cách thứ hai là nghiên cứu xem bộ não người tạo ra trí thông minh như thế nào để “bắt chước”, tuy nhiên việc này có lẽ phải mất hàng chục năm hoặc hơn. Theo Clune, cách tốt nhất là tạo ra môi trường cho các mô hình mạng nơ-ron, xem chúng như là các sinh vật và để chúng tự sinh sôi nảy nở. Bản thân môi trường sống nhân tạo này cũng phải thay đổi liên tục theo thời gian, để các sinh vật nhân tạo học cách thích ứng và tiến hóa. Đây là một cách tiếp cận rất giống với môi trường sống trên trái đất, và rốt cuộc đã tạo ra loài người thông minh. Nhà khoa học Stanley viết trong một quyển sách của mình rằng “sự vĩ đại không thể được lên kế hoạch trước”. Sự tranh cãi chính xung quanh bài báo của Jeff Clune là trái đất đã phải trải qua hơn 4 tỷ năm mới có được trí thông minh đích thực, nhưng chúng ta lại không thể chờ lâu như vậy để có được trí tuệ nhân tạo. Có khi lúc đó mặt trời cũng đã tắt từ lâu.