Google – это единственная в своем роде компания,
которая сосредотачивает свои усилия на разработке "идеального
поискового сервера", который, по мнению одного из основателей Лэрри
Пэйджа, представляет собой что-то, "что точно понимает, что Вы имеете в
виду, и дает Вам именно то, что Вы хотите". С этой целью Google
постоянно стремился вводить новшества и отказывался принимать
ограничения существующих моделей. В результате Google разработал
собственную инфраструктуру оценки и создал революционную систему
PageRank, которая изменила метод ведения поиска.
С самого начала разработчики Google поняли, что для обеспечения самых
быстрых и точных результатов требуется новая конфигурация серверов.
Тогда как большинство поисковых серверов работали на основе нескольких
крупных серверов, производительность которых часто снижалась при
пиковых нагрузках, Google использовал соединенные ПК для быстрого
поиска ответа на каждый запрос. Это нововведение привело к сокращению
времени отклика и затрат, а также к повышению масштабируемости. Эту
идею затем переняли другие, а Google продолжал совершенствовать
технологию серверной части системы клиент-сервер, чтобы сделать ее еще
более эффективной.
Программное
обеспечение, которое лежит в основе технологии поиска Google,
производит серии одновременных расчетов, которые занимают лишь доли
секунды. Традиционные поисковые серверы в большой мере исходят из того,
насколько часто слово появляется на веб-странице. Google использует
PageRank для изучения всей структуры ссылок Интернета и определения,
какие страницы являются наиболее важными. Затем выполняется анализ
сопоставления гипертекста для определения, какие страницы являются
релевантными для данного поиска. Сочетание показателей общей значимости
и релевантности для конкретного запроса позволяет Google размещать на
первых местах наиболее релевантные и надежные результаты.
Технология PageRank. PageRank
выполняет объективную оценку значимости веб-страниц путем расчета
уравнения с более 500 переменными и 2 миллиардами терминов. Вместо
подсчета прямых ссылок PageRank интерпретирует ссылку страницы А на
страницу В как голос страницы А в пользу страницы В. Затем PageRank
оценивает значимость страницы по числу полученных голосов.
PageRank
также учитывает значимость каждой отдавшей голос страницы, так как
голоса некоторых страниц имеют больший вес и, тем самым, повышают
ценность страницы, на которую они ссылаются. Такие важные страницы
получают более высокую оценку PageRank и отображаются на первых местах
результатов поиска. Технология Google использует коллективный интеллект
Интернета для определения значимости страницы. Человек не принимает
участия в обработке результатов, именно поэтому пользователи стали
доверять поисковой системе Google, которая предоставляет объективную
информацию, не искаженную платой за позицию в результатах поиска.
Анализ сопоставления гипертекста. Поисковый
сервер Google также анализирует содержание страниц. Однако вместо
простого сканирования текста на странице (которым могут манипулировать
издатели сайта с помощью метатегов) выполняется анализ полного
содержания страницы и таких факторов, как шрифты, подразделы и точное
местоположение каждого слова. Google также анализирует содержание
соседних веб-страниц, чтобы обеспечить максимальную релевантность
результатов поиска по запросу пользователя.
Инновации
Google не ограничиваются стационарными ПК. Чтобы донести точные и
быстрые результаты до пользователей, использующих для доступа к
Интернету портативные устройства, Google также первым создал технологию
поиска для беспроводных устройств для моментального преобразования HTML
в оптимизированные форматы для режимов WAP, i-mode, J-SKY и EZWeb. В
настоящее время Google предоставляет свою беспроводную технологию
многочисленным ведущим компаниям на рынке, среди которых AT&T
Wireless, Sprint PCS, Nextel, Palm, Handspring и Vodafone.
|