
Captcha giúp trang web phân biệt được lượt truy cập là người hay máy
Nhiều trang web ngày nay đều yêu cầu người dùng xác minh rằng họ là người thật thông qua Captcha. Việc này nhằm tránh những hệ thống tự động giả danh người dùng thật để truy cập bừa bãi.
Ít ai biết rằng phía sau những ô xác nhận quen thuộc, Google đang dùng công nghệ để quan sát hành vi và đưa ra nhận định mà người dùng không hề nhận ra.
Dữ liệu xung quanh một cú click
Bạn thấy một ô vuông nhỏ kèm dòng chữ 'Tôi không phải là người máy'. Cứ ngỡ chỉ cần click nhẹ là vượt qua được bước kiểm tra. Nhưng thực tế, ngay lúc đó, Google bắt đầu quan sát cách bạn thao tác.
Cụ thể, hệ thống ghi lại cách bạn rê chuột đến ô xác nhận: đường đi có tự nhiên không, tốc độ có đều hay hơi giật khựng như tay người thật. Sau đó là cách bạn click, có do dự vài phần giây hay click dứt khoát như máy.
Thậm chí thời gian bạn ở trên trang, bạn cuộn lên xuống bao nhiêu lần, có gõ bàn phím hay không, cũng đều được theo dõi.
Vì các phần mềm tự động thường thao tác cực kỳ chính xác và đều đặn, Google dựa vào những chi tiết nhỏ mang tính con người như lệch tay, dừng giữa chừng hoặc phản ứng chậm để nhận diện bạn là người thật.
Không hiện Captcha, nhưng bạn vẫn đang bị kiểm tra
Có những trang web bạn truy cập hoàn toàn mượt mà, không hiện ô xác nhận 'Tôi không phải là người máy', cũng không bắt bạn chọn hình ảnh nào. Nhưng điều đó không có nghĩa là bạn được tự do bỏ qua bước xác thực. Thực tế, bạn vẫn đang được kiểm tra, chỉ là theo một cách âm thầm hơn.
Google gọi đó là reCAPTCHA v3. Phiên bản này không yêu cầu bạn tương tác gì cả. Thay vào đó, hệ thống tự động theo dõi hành vi của bạn ngay khi bạn vào trang: bạn rê chuột ra sao, gõ bàn phím lúc nào, cuộn trang có tự nhiên không. Mọi thao tác đều được phân tích và chấm một số điểm từ 0 đến 1. Càng gần 1 thì càng có khả năng bạn là người thật.
Trang web sẽ dùng điểm số đó để quyết định có cho bạn tiếp tục truy cập hay không. Nếu điểm quá thấp, bạn có thể bị chặn, chuyển sang bước xác minh khác hoặc phải làm Captcha theo kiểu quen thuộc. Quá trình đó diễn ra trong lặng lẽ, ngay khi bạn chưa kịp nhận ra.
Khi phần mềm cũng cố tỏ ra giống người thật
Không chỉ con người mới tìm cách vượt qua bước xác minh. Nhiều phần mềm tự động ngày nay đã được lập trình để hành xử giống người thật, từ cách rê chuột, dừng lại vài giây đến click theo kiểu ngập ngừng. Một số công cụ còn mô phỏng chuyển động chuột lệch nhẹ sang hai bên, tạo cảm giác thao tác bằng tay.
Có thời điểm, một vài mô hình trí tuệ nhân tạo được huấn luyện kỹ có thể vượt qua các bài kiểm tra cũ với tỉ lệ rất cao. Chúng không chỉ chọn đúng hình ảnh, mà còn biết tạo độ trễ giữa các bước như người đang suy nghĩ.
Nhưng Google cũng không đứng yên. Hệ thống liên tục được cập nhật để phát hiện những kiểu thao tác có dấu hiệu máy móc, kể cả khi chúng được thiết kế tinh vi. Cuộc rượt đuổi giữa phần mềm và hệ thống kiểm tra đang diễn ra từng ngày, và bên nào chậm hơn sẽ nhanh chóng bị bỏ lại phía sau.
Google thu thập những gì, và liệu có quá nhiều không?
Google cho biết dữ liệu thu thập qua Captcha chỉ được dùng để bảo vệ website khỏi truy cập tự động, không phục vụ cho quảng cáo hay theo dõi người dùng. Tuy vậy, điều này vẫn khiến không ít người đặt câu hỏi: rốt cuộc, hệ thống đã theo dõi đến mức nào?
Khi bạn tương tác với Captcha, hệ thống có thể ghi nhận địa chỉ IP, loại trình duyệt, thiết bị bạn đang dùng, cách bạn rê chuột, bấm chuột và thậm chí cả thời gian bạn dừng lại đọc thông tin. Phần lớn những gì bạn làm đều có thể trở thành dữ liệu đầu vào cho một phép đánh giá.
Với người dùng phổ thông, đây là điều dễ bị bỏ qua, vì mọi thứ diễn ra tự động và gần như vô hình. Tuy nhiên, hiểu cách hoạt động của Captcha không chỉ giúp bạn thấy rõ công nghệ đang tiến xa đến đâu, mà còn nhắc rằng nhiều thứ tưởng như đơn giản, thực ra lại phức tạp hơn nhiều.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận