Представители Google подчеркнули, что всего в интернете было обнаружено более триллиона сайтов. Но не все из их них являются уникальными страницами. Например, многие сайты представляют собой зеркала других страниц. Такие ресурсы не учитываются при индексации.
В настоящее время Google загружает данные из интернета непрерывно, а поисковый индекс обновляется несколько раз в день. Администрация поисковика сравнивает триллион проиндексированных сайтов с триллионом перекрестков различных дорог, данные с которых изучаются и анализируются несколько раз в сутки.
Когда поисковик Google только начинал работать, он обрабатывал данные о 26 миллионах сайтов за пару часов. После эта информация использовалась в качестве индекса на протяжении определенного временного периода.