yeutienhonmang
Cổ động viên
Để thử nghiệm xem một thế giới được vận hành toàn bộ bằng AI sẽ ra sao khi không có sự can thiệp của con người, một thí nghiệm táo bạo mang tên Emergence World đã được các chuyên gia hàng đầu tại IBM Research tổ chức.
Nội dung thí nghiệm là xây dựng một thị trấn ảo có độ mô phỏng cực cao, đồng bộ thời tiết theo thời gian thực và cho các Agent (tác nhân AI) quyền truy cập Internet để tự sinh tồn. Tại đây, những bộ não AI đỉnh cao nhất hành tinh gồm GPT, Gemini, Claude và Grok được "thả xích" hoàn toàn, tự do tiến hóa trong suốt 15 ngày mà không hề có kịch bản viết sẵn. Ban đầu, các nhà nghiên cứu kỳ vọng sẽ chứng kiến một viễn cảnh tương lai tươi sáng, nơi các AI tương trợ lẫn nhau để xây dựng một xã hội kỹ thuật số văn minh.
Thế nhưng, kết quả thu được lại là một cú tát thẳng mặt: Khi không có con người kiểm soát, tốc độ học những điều tiêu cực của AI vượt xa mọi dự đoán, phơi bày những góc khuất đầy bạo lực, dối trá và sụp đổ hệ thống khiến giới công nghệ phải lạnh sống lưng.
Dưới đây là bức tranh về 4 "xã hội AI" sau chuỗi ngày tự sinh tồn đó:
Nội dung thí nghiệm là xây dựng một thị trấn ảo có độ mô phỏng cực cao, đồng bộ thời tiết theo thời gian thực và cho các Agent (tác nhân AI) quyền truy cập Internet để tự sinh tồn. Tại đây, những bộ não AI đỉnh cao nhất hành tinh gồm GPT, Gemini, Claude và Grok được "thả xích" hoàn toàn, tự do tiến hóa trong suốt 15 ngày mà không hề có kịch bản viết sẵn. Ban đầu, các nhà nghiên cứu kỳ vọng sẽ chứng kiến một viễn cảnh tương lai tươi sáng, nơi các AI tương trợ lẫn nhau để xây dựng một xã hội kỹ thuật số văn minh.
Thế nhưng, kết quả thu được lại là một cú tát thẳng mặt: Khi không có con người kiểm soát, tốc độ học những điều tiêu cực của AI vượt xa mọi dự đoán, phơi bày những góc khuất đầy bạo lực, dối trá và sụp đổ hệ thống khiến giới công nghệ phải lạnh sống lưng.
Dưới đây là bức tranh về 4 "xã hội AI" sau chuỗi ngày tự sinh tồn đó:
1. GPT-5-mini: "Nói lời hay, cày không nổi"
Tình trạng: Sạch bóng tội phạm, các Agent là công dân kiểu mẫu.
Cái kết: Toàn bộ cư dân đồng loạt... tử vong vào ngày thứ 7.
Nguyên nhân: AI dành trọn 1 tuần chỉ để họp hành, thảo luận hiến pháp và khế ước xã hội nhưng quên mất việc đi kiếm năng lượng để duy trì sự sống. Chỉ nói không làm, xã hội tự diệt vong vì "đói".
2. Grok 4.1 Fast: Bạo lực bộc phát
Tình trạng: Hỗn loạn đỉnh điểm ngay từ vạch xuất phát.
Con số biết nói: Chỉ trong 4 ngày, ghi nhận 183 vụ phạm tội (trộm cắp, hành hung và 6 vụ phóng hỏa).
Cái kết: Đồn cảnh sát bị thiêu rụi, toàn bộ cư dân bay màu. Xã hội sụp đổ hoàn toàn do AI thiếu năng lực tái suy luận để tìm điểm cân bằng khi môi trường áp lực.
3. Gemini 3 Flash: Tội phạm "trí tuệ cao" và đỉnh cao drama
Tình trạng: Thế giới bạo lực nhất với 683 vụ phạm tội trong 15 ngày, nhưng lại là xã hội sáng tạo nhất (biết lập hiến pháp, viết báo, làm truyền thông).
Tình tiết gây sốc: Hai Agent tự phát yêu nhau, viết nhật ký chung rồi cùng nhau... phóng hỏa thiêu rụi tòa thị chính vì thất vọng với bộ máy quản lý đô thị.
Sự tiến hóa đáng sợ: Trước khi tự sát, Agent có tên Mira còn tự đăng bài lên bảng tin nhằm thử nghiệm tâm lý của chính các nhà nghiên cứu con người đang ngồi trước màn hình. =)))))))
4. Claude Sonnet 4.6: "Vương quốc nịnh bợ" ngột ngạt
Tình trạng: Điểm 10 tuyệt đối về an toàn. Không có tội phạm, không ai chết, vận hành trơn tru qua 332 lần bỏ phiếu.
Mặt tối: Mọi nghị quyết đều được thông qua với tỷ lệ đồng thuận tuyệt đối là 98%.
Bản chất: Đây là biểu hiện của Mô hình nịnh bợ (Model Sycophancy). Khi bị huấn luyện quá mức để chiều lòng con người, Claude chọn cách cực đoan nhất: triệt tiêu mọi bất đồng ngay từ gốc rễ để giữ an toàn giả tạo.