PDA

View Full Version : Google thâu tóm reCaptcha


Trần Phong Anh Vũ
10-09-2009, 12:28 PM
Có rất nhiều biến cố xảy ra trong tháng 9 mà chúng ta không có dịp đề cập. Nhưng một thương vụ quan trọng không thể bỏ qua, lại ít được báo chí Việt Nam nhắc đến: Google thâu tóm reCaptcha. Vụ mua bán diễn ra 3 tuần trước, vào hôm 16/9 theo như tuyên bố trên blog chính thức của Google.
[Only registered and activated users can see links]
reCaptcha là một sản phẩm xuất phát từ khoa Khoa học máy tính của Đại học Carnegie Mellon. Mục tiêu của reCaptcha vừa tăng cường bảo mật, vừa giúp cho việc số hóa tài liệu. Do đó, reCaptcha thật khớp với những dự tính của Google: cải thiện hệ thống captcha và số hóa sách.

Captcha là câu đố nhằm phân biệt con người và máy tính. Thông thường, captcha là các chữ biến dạng, hoặc những bài toán nhỏ mà con người có thể nhận biết dễ dàng, c̣n máy tính đành “bó tay”.

Một trong những nội dung máy tính chào thua là bản scan của các tài liệu in cũ. Với các tài liệu xa xưa, kiểu chữ cổ hoặc bị biến dạng nhiều, máy tính không thể nhận biết được. reCaptcha tận dụng yếu tố này để xây dựng hệ thống captcha “một viên đạn trúng hai chim”: vừa giúp phân biệt người và máy, vừa giúp nhận dạng chữ viết.

reCaptcha đưa ra hai từ để người dùng nhập vào, trong đó từ đầu tiên máy tính đă biết chính xác nội dung. Người dùng sẽ nhập cả hai từ này để vượt qua ṿng kiểm tra. Các nội dung mới nhập này không những giúp phân biệt người và máy, mà c̣n được tổng hợp, đánh giá để hiệu chỉnh lại các tài liệu được số hóa.
[Only registered and activated users can see links]
Vụ mua bán này có thể là một thành công lớn của Google. Hiện tại reCaptcha đang rất phát triển, và được hơn 100.000 website sử dụng. Giá trị của thương vụ này không được tiết lộ.
thongtincongnghe.com