Чимало сайтів перед тим як дозволити користувачам зробити якісь дії – прокоментувати чи написати матеріал, просять ввести букви чи два слова, які, як правило, нічого не значать. Мова йде про технологію CAPTCHA.
До недавнього часу CAPTCHA давала можливість лише застерігатись від спаму, та від недавнього часу технологія сприятиме заповнювати деякі історичні прогалини.
На сьогоднішній день в світі існує чимало проектів покликаних оцифрувати чималі стоси книжок, манускриптів та газет. Одна з найбільших проблем, яка виникає під час цього процесу – не всі тексти розпізнаються ідеально. Наприклад, газета The New York Times зараз працює над оцифровкою свого архіву з 1851 року. Цим процесом паралельно займаються дві різні програми розпізнавання тексту. Після процесу оцифрування – тексти співставляють. Інколи вони не співпадають. Що робити? Як варіант – залучати людей, але це дорого.
Проект reCAPTCHA покликаний вирішити цю проблему. Тисячі слів, які були розпізнані неточно, надсилаються програмою на близько 45 000 сайтів, які підтримують цей проект, і користувачі під час підтвердження свого “неботівського” походження сприяють розшифруванню старих текстів. Коли кілька людей вводять однаковий текст – він автоматично надсилається програмою назад в The New York Times, де вставляється в текст.
Користування послугами reCAPTCHA для комерційних організацій є платним, а для таких проектів, як Internet Archive, який має на меті оцифрувати всі книги видані перед 1980 роком, послуга надається безкоштовно.
Розробники проекту пропонують всім охочим приєднатись до нього та встановити програму на своїх сайтах.