• Про Watcher
  • Реклама
  • Статистика Уанету
  • Повідомити новину
  • Соцмедіа для Журналістів
про інтернет бізнес та маркетинг в соціальних медіа
  • Соціальні Медіа
    • Facebook
    • Twitter
    • ВКонтакте
    • Блогосфера
    • Новини Соціальних Медіа
  • Бізнес
    • Інвестори
    • Бізнесновини
    • Держава
    • Реклама і Маркетинг
    • Стартапи
  • Mobile
    • Android
    • iPhone
    • Nokia
    • Windows Mobile
    • Мобільні новини
  • Google
    • Gmail
    • YouTube
    • Новини Google
    • Пошук Google
  • Яндекс
    • Новини Яндекса
    • Яндекс.Карти
    • Яндекс.Пошук
  • Технології
    • Інтернет
    • Гаджети
    • Новини технологій
    • Телеком
  • HowTo
  • Політики в інтернеті
    • Закордоном
    • Українські політики
  • Розваги і Медіа
    • Ігри
    • Вірусне відео
    • Знаменитості
    • Медіа
  • Різне
    • Анонси
    • Гумор
    • Дайджест
    • Дизайн і програмування
    • Люди
    • Останні статті

Максим Саваневський · 26 Серпня 2008

Як боротьба зі спамом може принести несподівану користь

Tweet
Tweet

Як боротьба зі спамом може принести несподівану користь

Чимало сайтів перед тим як дозволити користувачам зробити якісь дії – прокоментувати чи написати матеріал, просять ввести букви чи два слова, які, як правило, нічого не значать. Мова йде про технологію CAPTCHA.

До недавнього часу CAPTCHA давала можливість лише застерігатись від спаму, та від недавнього часу технологія сприятиме заповнювати деякі історичні прогалини.

На сьогоднішній день в світі існує чимало проектів покликаних оцифрувати чималі стоси книжок, манускриптів та газет. Одна з найбільших проблем, яка виникає під час цього процесу – не всі тексти розпізнаються ідеально. Наприклад, газета The New York Times зараз працює над оцифровкою свого архіву з 1851 року. Цим процесом паралельно займаються дві різні програми розпізнавання тексту. Після процесу оцифрування – тексти співставляють. Інколи вони не співпадають. Що робити? Як варіант – залучати людей, але це дорого.

Проект reCAPTCHA покликаний вирішити цю проблему. Тисячі слів, які були розпізнані неточно, надсилаються програмою на близько 45 000 сайтів, які підтримують цей проект, і користувачі під час підтвердження свого “неботівського” походження сприяють розшифруванню старих текстів. Коли кілька людей вводять однаковий текст – він автоматично надсилається програмою назад в The New York Times, де вставляється в текст.
Як боротьба зі спамом може принести несподівану користь

Користування послугами reCAPTCHA для комерційних організацій є платним, а для таких проектів, як Internet Archive, який має на меті оцифрувати всі книги видані перед 1980 роком, послуга надається безкоштовно.

Розробники проекту пропонують всім охочим приєднатись до нього та встановити програму на своїх сайтах.

Читати більше про: CAPTCHA, reCAPTCHA, розпізнавання тексту, спам

Максим Саваневський
Керуючий партнер PlusOne DA. Засновник Watcher.

Максим Саваневський на зв'язку

Блог автора Twitter Facebook LiveJournal

Також читайте:
  • «Листи, які працюють на вас»: навіщо надсилати електронні листи в епоху диджиталу та як на них заробляти

    «Листи, які працюють на вас»: навіщо надсилати електронні листи в епоху диджиталу та як на них заробляти

  • У Google розповіли, як борються зі спамом і небезпечними додатками

    У Google розповіли, як борються зі спамом і небезпечними додатками

  • В Меркель пообіцяли банити українців за #DankeFrauRibbentrop, але їх це не зупиняє

    В Меркель пообіцяли банити українців за #DankeFrauRibbentrop, але їх це не зупиняє

  • Facebook зменшить кількість спам-публікацій в стрічці новин

    Facebook зменшить кількість спам-публікацій в стрічці новин



  • jarofed

    Чув про цей проект. Але, відверто кажучи, раніше ніяк не міг зрозуміти, за яким же принципом він працює. Адже коли людина вводить текст для підтвердження, що вона не робот, то якраз виходить, що комп по ідеї повинен знати, який текст вона повинна ввести (а інакше як він перевірить, чи правильно введено)… Тепер я зрозумів, у чому суть…
    Одне тільки цікаво, чи різання манускриптів на шматки, які потім використовуються, як капчі, а потім, по ідеї, повинні “збиратися до купи” не ускладнює процес ще більше, ніж якщо просто посадити людину і попросити розшифрувати.

  • maksym

    я думаю, що це стосується масових проектів типу нью-йорк-таймз. а манускрипти, очевидно, все ж люди розбирають вручну

  • podarok

    я пробував цей плагін…
    Для друпалу він не дуже добре реалізований був, тому відмовився на користь алгоритму bayesian

Отримувати новини електронною поштою


Реклама реклама

Маєш новину? Повідом нам

Позначки

Android apple Facebook gmail Google Google+ google maps Inmind Instagram iPad iphone livejournal mail.ru microsoft Twitter uastat video vkontakte YouTube Євромайдан Блоги Київстар Одноклассники Приватбанк СБУ США Твітер Яндекс безпека вибори додатки дослідження пошук рейтинг реклама росія соціальні мережі статистика уанет україна хакери ігри інтернет інтернет реклама інфографіка
© Всі права застережено.
NIC.UA