Google bị chỉ trích vì không cho nhà xuất bản trực tuyến quyền lựa chọn khi huấn luyện tìm kiếm AI


Google đã quyết định không cho các nhà xuất bản trực tuyến quyền lựa chọn khi sử dụng nội dung của họ để huấn luyện các tính năng tìm kiếm tích hợp trí tuệ nhân tạo (AI).

Goolge cố tình “âm thầm” thay đổi chính sách

Khi sử dụng dữ liệu từ các trang web để xây dựng công cụ tìm kiếm cho Google – được tăng cường bởi các câu trả lời do trí tuệ nhân tạo (AI) tạo ra, một giám đốc điều hành của Alphabet đã thừa nhận trong một tài liệu nội bộ rằng, Google có thể xin phép các nhà xuất bản trực tuyến hoặc cho phép họ chủ động từ chối tham gia.

Tài liệu này đã được tiết lộ trong phiên tòa chống độc quyền về công cụ tìm kiếm của Google. Theo thông tin từ tài liệu, Google kết luận rằng, việc cho phép các nhà xuất bản quyền lựa chọn sẽ khiến quá trình huấn luyện mô hình AI cho công cụ tìm kiếm trở nên quá phức tạp. Chính vì vậy, Google đặt ra một “ranh giới” và yêu cầu tất cả các nhà xuất bản muốn nội dung của họ xuất hiện trên trang kết quả tìm kiếm thì cũng phải chấp nhận việc dữ liệu được dùng để huấn luyện các tính năng AI. Thay vì công bố rõ ràng, Google quyết định “âm thầm cập nhật” và “không có thông báo công khai” về cách sử dụng dữ liệu của các nhà xuất bản, theo tài liệu do Chetna Bindra, một giám đốc quản lý sản phẩm tại Google Search, chia sẻ.

Các nhà xuất bản trực tuyến đứng giữa lựa chọn khó khăn

Dù không hài lòng, các trang web phụ thuộc vào lưu lượng truy cập vẫn không thể bỏ qua Google – công cụ chiếm hơn 90% thị phần tìm kiếm và là cánh cổng dẫn vào web hiện đại. Nhiều nhà xuất bản trực tuyến miễn cưỡng để Google sử dụng nội dung của họ nhằm phục vụ các tính năng AI trong tìm kiếm như AI Overviews, dù điều này làm giảm lượng người dùng nhấp vào trang của họ.

Về cơ bản, AI Overviews là tính năng cung cấp câu trả lời do AI tạo ra cho một số truy vấn, có thể trả lời trực tiếp câu hỏi của người dùng, khiến họ không cần bấm vào liên kết, từ đó làm giảm doanh thu quảng cáo và bán hàng của các trang web.

Google không cho nhà xuất bản quyền lựa chọn khi huấn luyện tìm kiếm AI - Ảnh 1.

AI Overviews có thể trả lời trực tiếp câu hỏi của người dùng,khiến họ không cần bấm vào liên kết đến trang web

Theo ông Paul Bannister, Giám đốc chiến lược của Raptive – tổ chức đại diện cho các nhà sáng tạo nội dung trực tuyến, tài liệu trình bày tại tòa cho thấy Google đã nhận thức được từ đầu về khả năng trao quyền kiểm soát nhiều hơn cho các nhà xuất bản trực tuyến.

“Nó cho thấy rõ ràng rằng họ biết có nhiều phương án khác, nhưng họ đã chọn phương án bảo thủ nhất, có lợi nhất cho mình, tức là không cho các nhà xuất bản trực tuyến bất kỳ quyền kiểm soát nào” – ông Paul Bannister nhấn mạnh.

Google gần đây đã phải hầu tòa ở Washington khi một thẩm phán liên bang xem xét các biện pháp mà công ty cần thực hiện để khôi phục cạnh tranh trong lĩnh vực tìm kiếm trực tuyến. Thẩm phán Amit Mehta, người chủ tọa phiên tòa, hiện đang cân nhắc các biện pháp khắc phục do cơ quan chống độc quyền đề xuất nhằm kiềm chế sự thống trị của Google. Phiên điều trần cuối cùng diễn ra vào ngày 9/5 và các lập luận kết thúc phiên tòa dự kiến sẽ diễn ra vào cuối tháng này. Phán quyết cuối cùng có thể được đưa ra vào tháng 8.

Những lựa chọn từng bị bỏ qua

Trong các thông tin nội bộ, Google từng xem xét khả năng cho phép “chỉ từ chối SGE” – tức cho phép các nhà xuất bản trực tuyến từ chối việc sử dụng nội dung của họ trong một số tính năng AI tạo sinh (Generative AI) trên công cụ tìm kiếm Google mà không bị loại khỏi kết quả tìm kiếm chung. Một lựa chọn khác là cho phép các nhà xuất bản “từ chối việc hiển thị nội dung trong AI Overviews”, mặc dù dữ liệu của họ “vẫn sẽ được dùng để huấn luyện”. Một lựa chọn được xem là cực đoan nhất là cho phép nhà xuất bản “từ chối việc dữ liệu của họ được sử dụng để làm cơ sở thực tế” – một phương pháp nhằm giúp AI đưa ra câu trả lời chính xác hơn bằng cách bám sát các nguồn thực tế, thay vì tự bịa thông tin.

Google không cho nhà xuất bản quyền lựa chọn khi huấn luyện tìm kiếm AI - Ảnh 2.

Google đã tích hợp chatbot AI vào công cụ tìm kiếm

Cuối cùng, Google đã chọn không đưa ra bất kỳ lựa chọn mới nào cho các nhà xuất bản. Công ty được khuyến cáo hướng các nhà xuất bản tới lựa chọn hiện có tên là “no snippet” – cho phép họ từ chối AI Overviews và các tính năng tìm kiếm khác. Tuy nhiên, tùy chọn này cũng khiến tóm tắt nội dung của họ biến mất khỏi trang kết quả tìm kiếm, làm giảm khả năng người dùng nhấp vào liên kết.

“Các nhà xuất bản luôn có quyền kiểm soát cách nội dung của họ được cung cấp cho Google khi các mô hình AI được tích hợp vào công cụ tìm kiếm trong nhiều năm qua, giúp hiển thị các trang phù hợp và thu hút lưu lượng truy cập” – người phát ngôn của Google chia sẻ với Bloomberg – “Tài liệu này chỉ là danh sách các lựa chọn ở giai đoạn đầu trong một lĩnh vực đang phát triển và không phản ánh tính khả thi hay quyết định cuối cùng”.

Google thừa nhận không thể cá nhân hóa từng tính năng AI

Kể từ khi AI Overviews được ra mắt khoảng 1 năm trước, lưu lượng truy cập vào một số trang web của các nhà xuất bản trực tuyến đã giảm mạnh. Điều còn quan trọng hơn với các nhà xuất bản trong dài hạn, theo bà Brooke Hartley Moy – CEO của Infactory, một start-up AI hợp tác với các nhà xuất bản trực tuyến, là việc phát triển các mô hình có khả năng thay thế hoàn toàn nội dung của họ.

“Nếu mô hình của Google đạt đến mức không còn cần yếu tố con người trong nội dung thì họ đang tự ký vào bản án tử cho các nhà xuất bản” – bà Brooke Hartley Moy nhấn mạnh.

Trong bối cảnh các nhà xuất bản tìm kiếm nguồn doanh thu mới, việc cho phép nội dung của họ được sử dụng trong kỹ thuật gọi là RAG – nơi các mô hình AI tham chiếu trực tiếp tới các nguồn cụ thể để đưa ra câu trả lời chính xác hơn – được xem là một hướng đi đầy hứa hẹn.

Khi bị luật sư của Google, ông Kenneth Smurzynsk, chất vấn, bà Liz Reid – người đứng đầu bộ phận tìm kiếm của Google – đã khai rằng, việc tạo ra nhiều tùy chọn từ chối cho các sản phẩm và mô hình khác nhau là điều rất phức tạp.

“Điều đó có nghĩa là nếu công cụ tìm kiếm có nhiều tính năng GenAI trên một trang, điều hoàn toàn có thể, thì mỗi tính năng đó sẽ cần một mô hình riêng để vận hành. Nhưng chúng tôi không xây dựng từng mô hình riêng như thế” – bà Liz Reid nói trong phiên điều trần ngày 6/5.

“Vì vậy, nếu một nhà xuất bản nói: ‘Tôi muốn nội dung mình xuất hiện trong tính năng này nhưng không trong tính năng kia’, thì điều đó là không khả thi. Nếu như vậy, mỗi tính năng trên trang sẽ cần một mô hình khác nhau” – bà Liz Reid cho biết. Điều này không chỉ tốn kém về phần cứng và chip mà còn gây khó khăn trong việc đảm bảo các mô hình AI khác nhau hoạt động hiệu quả và phản hồi nhanh.