Сьогодні Google повідомив про офіційний запуск Google Caffeine – нової та покращеної системи індексування вебу.
Головна ідея зміни механізму індексації пов‘язана зі зростаючою роллю пошуку інформації в реальному часі – коли час між появою контенту і можливістю знайти його через пошукових зводиться до мінімуму.
Google повідомляє, що «свіжість» результатів пошуку завдяки Caffeine зросла на 50%. В першу чергу це стосується пошуку в блогах, форумах, новинах, мікроблогах – нові записи індексуються тепер значно швидше.
Окрім пошуку в реальному часі, до якого Google наближається все ближче, Caffeine забезпечив і значно кращу індексацію вебсторінок, які містять комплексний контент – відео, текст, коментарі, зображення.
В Google пояснили, що попередній індекс пошукової системи мав кілька шарів, деякі з яких поновлювались швидше ніж інші, а головний шар – кожних кілька тижнів. Щоб оновити шар старого індексу, Google потребував аналізу всього вебу, що спричиняло суттєві затримки між часом, коли пошуковик знайшов сторінку, і коли зробив її доступною користувачу.
Caffeine натомість аналізує веб малими порціями на постійній основі. Як тільки знаходиться новий контент – він одразу потрапляє до індексу пошуковика і стає доступним для користувачів.
Caffeine індексує в паралельному режимі сотні тисяч сторінок на секунду. Зараз в індексі знаходиться близько 100 тисяч терабайт інформації, які приростають на кілька тисяч терабайт щодня.