?

Log in

No account? Create an account
Previous Entry Share Next Entry
Идея о способе выдачи поисковых запросов.
prostak_1982

      Вот когда ты, дорогой посетитель входишь в интернет, что ты там делаешь? Нет, нет, оставим в стороне старую шутку из КВНа, что все дороги в интернете ведут на порно-сайт. Что ты там делаешь чаще всего?

      Кто-то болтается в социальных сетях, кто-то скачивает книги, музыку, фильмы, кто-то читает анекдоты и рассматривает приколы. Дел у всех много и они все разные. Но есть одна вещь, которая объединяет всех пользователей интернета – иногда, кому-то реже, кому-то чаще, приходится искать какую-нибудь информацию.

      Алгоритмов поиска информации в глобальной-локальной сетях или же на отдельном компьютере море. Все они предельно заматематизированы, и простому человеку без поллитры в них не разобраться. Но во всей этой математической сложности есть один момент, в котором простой пользователь может сказать свое веское слово. Это метод вывода разыскиваемой информации на экран, то каким образом человек видит результат поиска.

      Несколько лет назад российская компания Стокона предлагала, так называемый, «естественный» поиск. Пользователь писал в строке запроса «Когда родился ас Пушкин», а система выдавала в ответ, что «ас Пушкин родился 26 мая (по старому стилю) 1799 года», а затем шел список ссылок, подтверждающих эту информацию. Особенностью алгоритма было то, что поисковый сервер разыскивал в текстах корневые слова «родился» и «Пушкин», а в его  алгоритм было введено, что на вопрос «когда» необходимо в ближайшем окружении корневых слов искать какую-нибудь дату. К сожалению, этот поисковик сейчас не вылавливается, как и вся компания Стокона. Что там случилось, не знаю, да и как-то не особо интересно.

      Чаще всего пользователь видит результаты поиска, как длинный список, где указывается адрес странички и кусок текста, в котором попадается искомое слово или выражение. Это самый распространенный метод отображения результатов поиска. В некоторых случаях показывают облако сопутствующих запросов, как делал метапоисковик Kartoo.com. А рядом отображаются обычные ссылки на странички, сайты, порталы.

      Только вот возникает маленькая проблемка. Подобный метод отображения информации ближе всего к библиотечным тематическим карточкам, где записано название предмета, к примеру: «овцеводство у древних скифов», а потом список книг, в которых можно что-то найти по этой теме. Это удобно, когда требуется собрать максимальное количество разной информации, связанной с этой темой.

      Но нередко требуется получить общую картину явления, краткую биографию человека, описание предмета, чтобы потом было удобнее составлять уточняющие запросы. Требуется энциклопедическая статья. Статья, в которой кратко, четко, но достаточно емко объяснялось что-либо.

      Исходя из этого, предлагаю следующий алгоритм формирования результатов, для вывода на экран компьютера.

      Человек в поисковой строке пишет запрос, например тот же «А. С. Пушкин».

      Поисковый сервер обрабатывает запрос, используя свою индексную базу, может быть индексные базы других поисковиков, и кэширует результаты поиска.

      Затем он проводит сравнительный анализ содержимого текстов и составляет таблицу повторяющихся данных:

Повторяющиеся данные

Процент повторений от общего количества документов

«А. С. Пушкин»

100 %

«русский поэт»

98 %

«великий»

95 %

(1799-1837)

95 %

автор

94 %

«Евгений Онегин»

93 %

и так далее.

      После подобной обработки сервер формирует краткую статью, содержащую наиболее повторяющиеся данные:

      «А. С. Пушкин великий русский поэт (1799-1837) автор «Евгения Онегина» и т. д., и т. п…»

      После такой «энциклопедической» статьи идет обычный набор ссылок, как в любом другом поисковике.

      Подобный метод вывода информации позволит пользователю сразу же установить, что именно из биографии славного русского поэта и летчика А. С. Пушкина его интересует.

      На мой взгляд, такой вывод результатов поиска ускорит и облегчит работу в интернете, ведь очень часто нужно просто узнать, кто же такой А. С. Пушкин.