Google sẽ ghi lại mọi thứ người dùng đăng lên mạng để đào tạo các sản phẩm AI của mình
Với việc Google công bố chính sách bảo mật mới của họ, các bài đăng công khai hiện trở thành đối tượng bị khai thác.
Google sẽ ghi lại mọi thứ mà mọi người đăng lên mạng để đào tạo các sản phẩm trí tuệ nhân tạo của hãng này.
Hôm 01/07, Google đã sửa đổi chính sách bảo mật để cho phép Google trích xuất các bình luận mà những người đăng tải đưa lên Internet, nhằm giúp công ty trau dồi các công cụ AI của mình.
Kế hoạch thu thập và khai thác dữ liệu công khai trực tuyến của công ty công nghệ này đang làm dấy lên những lo ngại mới về quyền riêng tư.
Chính sách người dùng trước đây của Google tuyên bố rằng thông tin có sẵn công khai sẽ chỉ được trích xuất để giúp đào tạo “các mô hình ngôn ngữ” cho Google Translate.
Đại công ty công nghệ Hoa Kỳ này hiện công khai lịch sử các thay đổi về tuyên bố chính sách người dùng của họ.
Cũng có những lo ngại rằng công nghệ AI tân tiến sẽ được sử dụng để đánh cắp tài sản trí tuệ và xóa sổ một số ngành nghề do con người thực hiện, cũng như vi phạm quyền riêng tư của người dùng.
Google trích xuất dữ liệu người dùng để cải thiện hệ thống AI Bard
Sau khi việc ra mắt bị trì hoãn và gặp rắc rối, Bard (chatbot AI của Google) đã ra mắt vài tháng sau khi ChatGPT của Open AI được tung ra và nhanh chóng bắt kịp đối thủ chính của mình.
Google và OpenAI đã trích xuất phần lớn dữ liệu trên Internet để cung cấp dữ liệu cho các thuật toán bot AI của họ.
Cho đến nay, Google dường như đã chuyển trọng tâm thu thập dữ liệu từ ngôn ngữ sang các mô hình AI, đồng thời lần đầu tiên đề cập đến Bard và Cloud AI trong các điều khoản dịch vụ được cập nhật của mình.
Kể từ nay, Google sẽ giữ và đọc bất kỳ bình luận công khai nào, trong số đó có một số bình luận được giữ lại để đào tạo chatbot.
Chính sách mới của Google cho biết, “Google sử dụng thông tin để cải thiện các dịch vụ của chúng tôi và để phát triển các sản phẩm, tính năng và công nghệ mới mang lại lợi ích cho người dùng của chúng tôi và công chúng.”
“Ví dụ: chúng tôi sử dụng thông tin có sẵn công khai để giúp đào tạo các mô hình AI của Google cũng như xây dựng các sản phẩm và tính năng như các khả năng của Google Translate, Bard, và Cloud AI.”
Bản cập nhật chính sách mới không thực hiện bất kỳ thay đổi nào có thể ảnh hưởng trực tiếp đến trải nghiệm người dùng hoặc các sản phẩm của Google.
Tuy nhiên, những sửa đổi đối với chính sách người dùng đã nêu trước đây của Google cho thấy rằng họ đang đầu tư rất nhiều vào chương trình AI của mình và hành vi tìm kiếm nói chung có thể là một yếu tố quan trọng trong quá trình phát triển liên tục của công ty này.
Công ty công nghệ có trụ sở tại California này cũng đã công bố một hệ thống tìm kiếm dựa trên AI mới, được gọi là Trải nghiệm Sáng tạo Tìm kiếm (Search Generative Experience, SGE), nằm trong dòng sản phẩm AI mới của mình.
Google đang thông báo trước cho người dùng về các kế hoạch AI trong tương lai của hãng, bằng cách đưa ra gợi ý rằng họ đang phát triển các sản phẩm AI mới cho các hệ thống của mình, như mua sắm, các tính năng của Google Lens, và trình chuyển đổi văn bản thành âm nhạc.
AI Bots đã làm dấy lên những thách thức pháp lý và sự phản kháng của Google
Gizmodo đưa tin, các chính sách trích xuất dữ liệu đã dẫn đến một vụ kiện tập thể liên quan đến vấn đề này hồi tuần trước (26/06-02/07).
Bên nguyên đơn đã cáo buộc Open AI đánh cắp “về cơ bản mọi mẫu dữ liệu được trao đổi trên Internet mà chương trình này có thể lấy” mà không có sự tin tưởng, sự đồng ý, hoặc bồi thường.
Những thay đổi về chính sách của Google vẫn còn là những vấn đề mơ hồ về mặt pháp lý, khi các tòa án bắt đầu nỗ lực phân xử các vấn đề bản quyền mới đối với công nghệ AI — những vấn đề chưa từng được biết đến cách đây không lâu.
Hầu hết các chính sách bảo mật hạn chế các công ty thu thập dữ liệu mà người dùng cung cấp trực tiếp, nhưng chính sách mới của Google cho phép họ sử dụng bất kỳ thông tin nào mà mọi người đăng công khai trên mạng.
Hồi tháng Sáu, Alphabet, công ty mẹ của Google, đã cảnh báo nhân viên của mình về những rủi ro bảo mật khi sử dụng chatbot, đồng thời phát hành Khung AI An toàn của riêng mình để bảo vệ người dùng khỏi các mối đe dọa mạng AI.
Trong khi đó, với việc thực hiện những thay đổi lớn nhằm hạn chế các bot truy cập vào nền tảng của họ, Twitter và Reddit đã phản ứng tiêu cực trước tranh cãi về việc AI trích xuất dữ liệu.
Cả hai công ty nói trên đã thu hồi quyền truy cập tự do vào API của họ — các giao diện lập trình ứng dụng — vốn cho phép người dùng và các bot AI tải xuống một lượng lớn dữ liệu từ các bài đăng.
Tuần trước, Twitter đã giới hạn số lượng tweet mà người dùng được phép xem mỗi ngày, gây ra các vụ lộn xộn cho đại công ty truyền thông xã hội này khi người dùng gặp phải thông báo lỗi, đồng thời Twitter cũng hạn chế quyền truy cập vào các tweet.
Tổng giám đốc Elon Musk cho biết những thay đổi này là một phản ứng cần thiết đối với “việc thu thập dữ liệu và thao túng hệ thống ở mức vô cùng cao.”
Twitter cũng đã bắt đầu dò hỏi một tài khoản để có thể xem các tweet, và sau đó lặng lẽ loại bỏ yêu cầu này hồi đầu tuần (03-09/07).
Thanh Nguyên biên dịch
Quý vị tham khảo bản gốc từ The Epoch Times