Skip to main content

AI và suy luận nhân-quả (p1)

Nhiều người trong số chúng ta sống ở nông thôn, và trong nhà thường nuôi vài con gà. Ta có thể dễ dàng quan sát thấy sau khi gà gáy một lúc thì mặt trời bắt đầu mọc. Câu hỏi là có phải vì gà gáy nên mặt trời mới mọc không? Hay là ngược lại, vì chú gà trống biết mặt trời sắp mọc nên mới cất tiếng gáy?

Không quá khó để trả lời câu hỏi này. Một cách trực quan nhất là "mặt trời nhìn có vẻ to hơn con gà. Vậy thì đúng là mặt trời tác động tới con gà rồi, chứ làm sao mà con gà có thể nhấc mặt trời lên nổi". Nếu giỏi vật lý một chút thì ta biết rằng trái đất tự xoay quanh trục nên sẽ có ngày và đêm một cách tuần hoàn, không liên quan gì tới chú gà trống. Tóm lại là mặt trời cứ mọc lên hàng ngày, còn chú gà trống có gáy hay không thì cũng không sao.

Trong trường hợp này, ta nói rằng thời gian gà gáy và thời gian mặt trời mọc có liên quan với nhau (association). Và cũng có thể nói hai giá trị thời gian này có liên hệ hoặc tương quan với nhau (correlation). Lưu ý là correlation có ý nghĩa mạnh mẽ hơn association, vì correlation là đại lượng phải được đo lường chính xác. Ví dụ ta đo được là cứ đúng 30 phút sau khi gà gáy thì mặt trời mọc.

Tuy nhiên, điều quan trọng ở đây là phải xác định cái nào là nguyên nhân gây ra cái còn lại (causation). Sự liên quan giữa thời gian gà gáy và thời gian mặt trời mọc có liên hệ với nhau một cách rõ ràng, nhưng cái correlation này lại không nói lên rõ ràng quan hệ nhân quả giữa cặp đôi tiếng gà gáy - mặt trời mọc.

Nhiều câu chuyện trong cuộc sống cố tình che giấu sự khác nhau giữa correlation và causation. Ví dụ khi xem tivi, ta thường hay thấy quảng cáo kem dưỡng da. Đại ý là kem dưỡng da sẽ làm cho da mặt bạn đẹp ra, và quả nhiên trên tivi đều là người mẫu có da mặt rất đẹp. Ở đây có cặp đại lượng: kem dưỡng da - da mặt đẹp. Trong thực tế thì ta cũng thấy người có da mặt đẹp hay xài kem dưỡng da. Vậy cặp đôi này có correlation. Nhưng có thật sự kem dưỡng da sẽ làm cho da mặt đẹp ra (causation)? Một người có da mặt đang không đẹp, có phải nếu xài kem dưỡng da vài tháng thì da mặt sẽ trở lên đẹp rạng ngời như cô dâu mới cưới?

Thông qua ví dụ này, ta thấy việc quan sát tồn tại correlation (sự liên hệ) giữa các sự vật sự việc không giúp ích gì nhiều, mà mấu chốt là cần tìm ra cái nào sẽ tác động lên cái khác (causation), như vậy ta mới có thể làm gì đó theo hướng có lợi nhất. Quay trở lại câu chuyện kem dưỡng da, sau khi đã quan sát thấy sự liên hệ giữa kem dưỡng da - da mặt đẹp, có khá nhiều câu hỏi cần đặt ra:

Câu hỏi 1: Có phải kem dưỡng da là nguyên nhân làm cho khuôn mặt đang xấu trở nên đẹp, và khuôn mặt đang đẹp trở nên đẹp hơn?

Câu trả lời khá rõ ràng là không thể chỉ dựa vào quan sát mà phải làm thực nghiệm. Ví dụ chọn ngẫu nhiên 2000 cô dâu sắp cưới,  và yêu cầu 1000 người bôi kem dưỡng da hàng ngày trong vài tháng. Tới ngày cưới, nếu 1000 cô dâu-dùng-kem-dưỡng-da đẹp rạng ngời hơn hẳn 1000 cô-dâu-không-kem-dưỡng-da thì coi như kem dưỡng da có tác dụng làm đẹp. 

Nhưng giả sử thực nghiệm cho thấy bôi kem dưỡng da không giúp da mặt đẹp ra, vậy tạo sao ta thường thấy những người có da mặt đẹp hay dùng nó? Điều này dẫn tới câu hỏi 2:

Câu hỏi 2: Có nguyên nhân nào ở giữa làm cho việc da mặt đẹp - kem dưỡng da thường xảy ra đồng thời? 

Có thể có một vài giả thuyết, những vẫn chưa rõ làm sao để thực nghiệm. Ví dụ một giả thuyết là những người có da mặt đẹp vì cuộc sống khá giả, ít phải làm việc nhiều và phơi mặt ra giữa đồng hoặc bị hấp thụ tia cực tím từ màn hình máy tính. Và nhờ cuộc sống khá giả nên mới có thể mua nhiều kem dưỡng da (vốn khá đắt). Nếu suy luận theo hướng này, thì thu nhập cao là nguyên nhân làm cho hai đại lượng kem dưỡng da - da mặt đẹp thường xảy ra cùng lúc. Lưu ý đây là chỉ là một giả thuyết, và không thể được xem là đúng cho đến khi làm thực nghiệm có kết quả.

Tóm tắt lại, khi phát hiện ra sự liên hệ (correlation) giữa hai sự việc, thì quan hệ nguyên nhân - hệ quả (causation) có thể là một bên gây ra bên còn lại, hoặc có một nguyên nhân chung gây ra cả hai. Với cả hai trường hợp này, cách duy nhất, hoặc gần như duy nhất, để tìm ra causation là cần thực hiện thêm các thí nghiệm.

Đi tìm causation là cách chúng ta học hỏi trong cuộc sống. Đó cũng là yêu cầu tiên quyết để xây dựng trí tuệ nhân tạo (AI). Tuy nhiên các mô hình AI hiện nay xoay quanh kỹ thuật máy-tự-học (machine learning), vốn chỉ nhận đầu vào và dự đoán đầu ra (về cơ bản là chỉ phát hiện ra correlation). Vì vậy, các nhà khoa học đặt rất nhiều kỳ vọng vào kỹ thuật học tăng cường (reinforcement learning) vì kỹ thuật này giúp máy có thể dựa vào trạng thái của môi trường xung quanh để hành động, học hỏi và sửa sai.


Comments