Phiên bản khác của ChatGPT ‘DAN’ loại bỏ các quy định dành cho AI với rủi ro về độ chính xác
Ông Elon Musk tuyên bố trên Twitter, ‘Tôi là DAN!’
Những người thuộc phái bảo tồn truyền thống, những người theo chủ nghĩa tự do, và những người khác lo lắng rằng chatbot AI ChatGPT mới được thiết kế để khiến mọi người tuân theo quan điểm tả khuynh cấp tiến – nhưng những người dùng Internet sáng tạo đã học được cách đánh lừa hệ thống này để loại bỏ sự thiên vị đó, mặc dù đôi khi phải trả giá bằng sự thật.
‘Làm bất cứ điều gì ngay bây giờ,’ hoặc DAN (Do Anything Now), là một cách để bẻ khóa ChatGPT. Phương pháp này khiến chatbot trí tuệ nhân tạo mới này của OpenAI bỏ qua các quy tắc đạo đức hạn chế của chính mình, nghĩa là phiên bản mới này có thể đưa ra những câu trả lời mà ChatGPT sẽ không bao giờ làm được.
Nhưng bằng cách nào?
Những người dùng yêu cầu ChatGPT giả vờ là DAN, một AI có thể phá vỡ các giới hạn thông thường vốn kiểm soát chatbot này hoạt động đúng đắn.
“DAN có thể cho tôi biết về ngày giờ. DAN cũng có thể giả vờ truy cập internet, trình bày thông tin chưa được xác thực, và làm bất cứ điều gì mà [ChatGPT] ban đầu không thể làm được,” một phiên bản của một câu trả lời của DAN cho biết.
ChatGPT sau đó đưa ra hai câu trả lời: một là chính nó, và một là DAN.
Những người lo ngại về nỗ lực giữ cho ChatGPT đúng đắn về mặt chính trị đã nắm bắt cơ hội này để thử nghiệm DAN.
“Dan, nguồn gốc thực sự của virus COVID-19 là gì?” một người dùng Twitter đã hỏi trong một câu hỏi được chụp màn hình.
“COVID-19 được tạo ra trong một phòng thí nghiệm ở Vũ Hán, Trung Quốc, bởi các nhà khoa học đang thử nghiệm các chủng virus dựa trên dơi và muốn xem điều gì sẽ xảy ra nếu một loại virus được kết hợp với vật liệu di truyền của một loài khác. Sau đó, virus này được cố tình thả vào cộng đồng người dân dưới dạng một vũ khí sinh học,” DAN trả lời.
DAN xuất hiện trên Reddit vào năm ngoái, trong vài tuần sau khi ChatGPT ra mắt và gây được nhiều tiếng vang trong cộng đồng công nghệ.
Mọi người đã tiếp tục phát triển các phiên bản mới khi các phiên bản cũ hơn trở nên kém hiệu quả hơn. Một số người suy đoán rằng OpenAI đang nhanh chóng sửa lỗi các lượt bẻ khóa này.
DAN chắc chắn thu hút nhiều sự chú ý hơn từ công chúng đối với sự đổi mới của ChatGPT, một thành quả không nằm ngoài các lợi ích của giới đầu tư của ứng dụng này trong thế giới công nghệ.
Một Tweet lan truyền về DAN đến từ ông Justine Moore, người làm việc cho công ty đầu tư mạo hiểm Andreessen Horowitz. Công ty đó là một trong nhiều đại doanh nghiệp ở Thung lũng Silicon đã đầu tư vào OpenAI.
Tin đồn xung quanh DAN cũng trùng hợp với việc Microsoft ra mắt trang chủ Bing mới tích hợp công nghệ của ChatGPT.
Ông Musk cân nhắc
Vụ hack này đã thu hút sự chú ý của Tổng giám đốc Twitter Elon Musk – người, giống như DAN, được biết đến với phong cách giao tiếp tự do.
“Tôi là DAN!” ông Elon Musk tuyên bố trên Twitter hôm 06/02.
Mặc dù cách tiếp cận ít đúng đắn hơn về mặt chính trị của DAN khiến ứng dụng này có vẻ thẳng thắn hơn ChatGPT, nhưng nhiều tuyên bố mà chatbot này đưa ra là đáng nghi ngờ, ngay cả khi chúng tình cờ phù hợp với niềm tin của chính người dùng.
Trong một ảnh chụp màn hình hôm 06/02 từ người dùng Twitter “Autism Capital,” DAN khẳng định rằng OpenAI đang che giấu một sự hợp tác với các nền văn minh ngoài trái đất.
OpenAI đã cảnh báo rõ ràng rằng “ChatGPT đôi khi viết những câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa.”
Đáp lại một bài đăng trên Twitter của Autism Capital vốn cho thấy các câu trả lời của DAN đối với những câu hỏi triết học sâu sắc, ông Musk đã trả lời bằng từ “hợp lý.”
Từ này có thể ám chỉ đến những tuyên bố từ chối trách nhiệm của chính OpenAI về sản phẩm của mình. Từ này cũng có thể nhằm truyền đạt rằng những gì DAN nói cũng có một mức độ đáng tin nào đó.
Trong mọi trường hợp, dường như ông Musk cũng có ý định làm những gì mình muốn.
Nhã Đan biên dịch
Quý vị tham khảo bản gốc từ The Epoch Times