Раздел Интернет
2 февраля 2009, 18:23

Google научат различать табличные данные

Сотрудники Google намерены добавить в поисковик функцию анализа табличных данных, пишет PC World.
Пока поисковик не воспринимает таблицы как структурированную информацию и не умеет выводить в том же виде.

Исследователи уже обнаружили в Сети 14 миллиардов таблиц. Хотя 98 процентов из них бесполезны с информационной точки зрения, 154 миллиона таблиц содержат важные для пользователей данные.

Новая технология позволит превращать широкие запросы в несколько узких. Например, структурированная информация поможет в ответ на запрос "путешествия" вывести данные о визах, погоде и путевках.

Поиск по структурированным данным - одна из попыток крупнейшего в мире поисковика проанализировать так называемую "глубинную Сеть" (deep Web) или страницы, до которых сложно добраться по обычным ссылкам.

Другим направлением изучения этой части интернета является попытка изучения результатов поиска на других сайтах. Поисковый робот Google некоторое время назад пробовал отправлять в формы сайтов объявлений вроде Cars.com и Realtor.com тестовые запросы и индексировать выдаваемую в ответ страницу.