Bạn đã bao giờ tự hỏi, những lần tỉ mẩn click vào ô vuông chứa đèn giao thông hay vạch kẻ đường để chứng minh mình là con người, thực chất đang phục vụ mục đích gì?
AI không còn để thử cho vui: 4 ứng dụng AI Việt phục vụ công việc từ làm web đến trồng trọt
Tra phạt nguội, gửi phản ánh, tìm đường đi: 3 app Việt đang thay đổi cách sống của cả Gen Z lẫn người lớn tuổi
Tưởng sạch nhưng lại… bẩn hơn: Vì sao robot lau nhà khiến nhà có mùi tanh tanh?
Mỗi ngày, hàng trăm triệu người dùng internet thực hiện một nghi thức quen thuộc: giải mã các ô hình ảnh mờ nhòe của reCAPTCHA để đăng nhập tài khoản hoặc gửi biểu mẫu. Chúng ta coi đó là một phiền toái nhỏ để bảo mật, nhưng đằng sau những cú nhấp chuột “vô hại” ấy là một cỗ máy khai thác dữ liệu khổng lồ, nơi nhân loại đang lặng lẽ huấn luyện không công cho các hệ thống xe tự lái của Google.
Từ giấc mơ số hóa tri thức đến công cụ gán nhãn dữ liệu
Câu chuyện bắt đầu vào năm 2000, khi Luis von Ahn, một nhà khoa học máy tính tại Đại học Carnegie Mellon, phát minh ra CAPTCHA để ngăn chặn nạn tin rác. Tuy nhiên, ông sớm nhận ra hàng triệu giờ lao động trí tuệ của con người đang bị lãng phí vào những ký tự vô nghĩa. Năm 2007, reCAPTCHA ra đời với một ý tưởng nhân văn: thay vì gõ linh tinh, người dùng sẽ giúp số hóa các cuốn sách cũ mà phần mềm nhận dạng chữ viết (OCR) không thể đọc được.
Dự án này đã thành công rực rỡ khi giúp số hóa toàn bộ kho lưu trữ của Google Books và 13 triệu bài báo của tờ The New York Times . Năm 2009, Google mua lại reCAPTCHA với giá hàng chục triệu USD. Kể từ đây, sứ mệnh của công cụ này bắt đầu rẽ hướng. Khi kỷ nguyên của sách giấy dần lùi xa, Google đối mặt với một thách thức mới: dữ liệu hình ảnh cho bản đồ và trí tuệ nhân tạo.

Đến khoảng năm 2012, những dòng chữ cong vẹo biến mất, thay thế bằng các lưới ảnh thực tế từ Street View. Người dùng bắt đầu được yêu cầu “chọn tất cả các ô có biển báo đường phố” hoặc “nhận diện cửa hiệu”. Về bản chất, Google đã biến hàng tỷ người dùng thành những cộng tác viên gán nhãn dữ liệu (data labeler) quy mô nhất thế giới mà không phải trả một xu tiền lương.
Thương vụ 6 tỷ USD từ những cú nhấp chuột “miễn phí”
Quy mô của hoạt động này lớn đến mức khó tin. Một nghiên cứu năm 2023 từ Đại học California, Irvine (UCI) mang tên “Dazed & Confused” đã chỉ ra rằng, trong hơn 13 năm qua, nhân loại đã tiêu tốn khoảng 819 triệu giờ để giải reCAPTCHA. Nếu tính theo mức lương tối thiểu, giá trị lao động này tương đương ít nhất 6,1 tỷ USD.
Nghiên cứu cũng ước tính giá trị trọn đời của dữ liệu từ các cookie theo dõi mà reCAPTCHA thu thập được có thể lên tới 888 tỷ USD. Những con số này cho thấy reCAPTCHA không chỉ là một công cụ bảo mật đơn thuần; nó là một “trang trại” dữ liệu khổng lồ.
Dữ liệu hình ảnh sau khi được con người xác nhận sẽ chảy trực tiếp vào hệ thống của Google Maps để nhận diện địa chỉ và cấu trúc đô thị. Đáng chú ý hơn, nhiều chuyên gia tin rằng đây chính là nền tảng để huấn luyện Waymo – dự án xe tự lái của Alphabet (công ty mẹ của Google). Dù Google từng phủ nhận việc dữ liệu reCAPTCHA trực tiếp đào tạo Waymo, nhưng sự trùng khớp giữa các vật thể cần nhận diện (đèn giao thông, vạch kẻ đường, người đi bộ) và nhu cầu của xe tự lái là không thể phủ nhận. Giới thiệu về sản phẩm này
Độ chính xác đo: + / - 0,5% FS
Dung sai bù đầu lạnh: + /- 2 độ C (có thể được sửa đổi
bằng phần mếm trong 0 ~ 50 độ C)
Độ phân giải: 14 bit
Chu ky lấy mẫu: 0,5 giây
Quyền lực: AC 100-240V 50 / 60HZ
Giá trị quá trình (PV), Giá trị cài đặt (SV)
<iểm soát PIN (bao gồm ON / OFF, PID loại bước và PID liêr
tỤc)
Điều khiển tự điều chỉnh
Đầu ra rơ le: công suất tiếp xúc 250V AC 3A (tải điện
3ộ điều khiển nhiệt độ PID REX-C100, với cặp nhiệt
Sự đánh đổi giữa bảo mật và quyền riêng tư

Năm 2018, Google tiến thêm một bước với reCAPTCHA v3. Phiên bản này không còn yêu cầu người dùng giải đố, mà âm thầm theo dõi hành vi trong nền. Nó phân tích quỹ đạo chuột, cách cuộn trang và môi trường trình duyệt để đánh giá độ tin cậy của người dùng.
Tuy nhiên, tính hiệu quả của nó đang bị đặt dấu hỏi lớn. Nghiên cứu của UCI phát hiện ra rằng ngay từ năm 2016, các thuật toán đã có thể vượt qua xác thực hình ảnh với độ chính xác 70%, thậm chí là 100% đối với một số loại xác thực khác. Điều này dẫn đến một kết luận sắc bén: reCAPTCHA hiện nay giống một công cụ thu thập dữ liệu và theo dõi người dùng hơn là một lá chắn bảo mật hiệu quả.
Các cơ quan quản lý tại châu Âu đã bắt đầu vào cuộc. Tòa án Liên bang Áo từng phán quyết rằng reCAPTCHA vi phạm quy định GDPR vì truyền dữ liệu người dùng sang Google mà không có sự đồng ý rõ ràng. Tại sao chúng ta phải giúp một công ty trị giá hàng nghìn tỷ USD huấn luyện sản phẩm thương mại của họ chỉ để được quyền truy cập vào tài khoản ngân hàng của chính mình?
Hành trình từ một ý tưởng số hóa sách miễn phí cho nhân loại đến một công cụ huấn luyện AI cho Waymo – doanh nghiệp vừa huy động thêm 16 tỷ USD với định giá 126 tỷ USD vào đầu năm 2026 – là minh chứng rõ nhất cho việc “không có gì là miễn phí trên Internet”. Khi bạn nhấn vào ô “Tôi không phải là người máy”, bạn thực chất đang khẳng định vai trò của mình trong một dây chuyền sản xuất công nghệ hiện đại: một người lao động không lương, cung cấp tài nguyên quý giá nhất của kỷ nguyên mới – dữ liệu.
Copy link
Lấy link
Nguồn Trang : https://genk.vn/nut-bam-toi-khong-phai-la-robot-thuc-chat-khong-he-vo-nghia-su-that-ke-hoach-hang-ty-usd-cua-google-165260320172422454.chn
Bài viết gợi ý
- Anh em sinh đôi ở Hà Nội cùng giành giải Nhất thi học sinh giỏi Toán
Không chỉ ngoại hình giống nhau, cặp anh em sinh đôi Lê Duy Hùng - Lê Duy Hải còn gây ấn tượng khi cùng đoạt giải Nhất ở kỳ thi chọn học sinh giỏi thành phố môn Toán với điểm số lần lượt là 17,5/20 và 19/20. Riêng Hải còn trở thành đồng thủ khoa ở môn Toán. Trước đó, cả hai anh em cũng giành giải Nhất ở k�...
- Lỗi nghiêm trọng khiến Apple hoãn cập nhật iOS
- Đầu năm xuất hiện 5 mùi hương may mắn gõ cửa: Vướng 3 mùi hương thì tiền bạc dễ hao hụt
- Cách làm chân giò nấu giả cầy kiểu miền Nam vừa đơn giản vừa ngon
- Cận thị từ bao nhiêu độ trở lên không thể vào các trường công an năm 2026?
- Học sinh lớp 10 ở Thanh Hóa bị đánh hội đồng trong lớp, sức khỏe tiên lượng xấu
- Campuchia cảnh báo
- Cách lên lịch họp vào 1 giờ chiều nay trên các nền tảng






