Информационные технологииStfw.Ru 🔍

«Поисковые технологии» дадут каждому персональный поисковик

admin
🕛 16.01.2006, 04:50
На сайте проекта «Новотека» началось тестирование нового сервиса «Персональный поиск». Здесь можно выбрать сайты для индексации и создать свой собственный маленький поисковик.
Систему можно использовать различным образом. Можно организовать полнотекстовый поиск по собственному сайту. Можно организовать полнотекстовую «слежку» за избранными сайтами. Например, таким способом удобно отслеживать форумы, частные объявления, сайты конкурентов, блоги. Выбранные ресурсы будут автоматически индексироваться каждый день, а вы по электронной почте получаете сообщения в случае изменения информации (результаты выполнения сохраненного поискового запроса). И, наконец, можно открыть специализированный поисковик по сайтам определенной тематики.

По своей идее «Персональный поиск» очень напоминает открытую платформу Alexa Web Search Platform, тестирование которой началось буквально месяц назад. Поисковая платформа предоставляет сторонним разработчикам прямой доступ к поисковым серверам Alexa. Пользователь может командовать поисковым роботом. Например, заставить его проиндексировать определенный сегмент сети. Или, скажем, проиндексировать все документы того или иного формата в указанном домене. Или извлечь из индекса данные в определенном формате. Результаты можно использовать на своем собственном сайте или даже открыть новый поисковый сервис в интернете. Это действительно замечательная идея. Единственный недостаток - необходимость оплачивать хостинг, трафик и другие услуги Alexa Web Search Platform.

«Персональный поиск» на «Новотеке» пока бесплатен (прием бета-тестеров осуществляется по персональным приглашениям). Эта система создана фирмой ЗАО «Поисковые технологии» на базе поисковика, разработанного в компании «Ашманов и партнеры». Поисковик Игоря Ашманова работает на сайтах Novoteka.Ru, Lib.Ru, Anekdot.Ru и др. Он поддерживает несколько языков, понимает морфологию русского языка (падежи, времена, склонения и т.д.), поддерживает некоторые оригинальные SQL-подобные функции поиска.

В бета-версии «Персонального поиска» поддерживаются далеко не все функции коммерческого движка. Здесь индексируются только документы в текстовом формате и HTML. В бесплатном доступе система разрешает индексировать до 100 МБ данных. Вы выбираете нужные сайты (точки входа), указываете запрещающие маски, периодичность и глубину выкачки, ожидаете некоторое время, пока система выкачает и проиндексирует сайты, а затем работаете с вашим личным поисковым индексом. Можете осуществлять там полнотекстовый поиск, можете сохранить поисковые запросы и подписаться на новые результаты по мере обновления индекса. Можете сохранять информацию в «архив». Пока что функциональность ограничивается только этим.

Генеральный директор ЗАО «Поисковые технологии» Игорь Ашманов рассказал о новых функциях, которые планируется реализовать в «Персональном поиске» в первую очередь. Это возможность организовать поиск по своему сайту и хостинг тематических поисковиков. В персональном кабинете появится возможность просмотра всех новых страниц сайтов и другое развитие функций мониторинга.

Игорь Ашманов ответил на вопросы «Вебпланеты» и раскрыл некоторые технические и организационные детали проекта.

На какой серверной базе работает «Персональный поиск», по какому каналу он подключен в Сеть? Какая максимальная нагрузка? Легко ли база масштабируется?

Сейчас это современный сервер в датацентре «РТКомм.Ру». В силу выбора данной хостинг-площадки ширина канала нас практически не ограничивает. Про нагрузку пока говорить рано - мы только-только начали бета-тестирование, у нас пока несколько сотен пользователей. По результатам тестирования мы сможем проанализировать среднюю нагрузку и занимаемое дисковое место на одного пользователя.

Масштабирование достигается сравнительно легко, так как система предназначена для одновременного обслуживания многих пользователей, индексы для них раздельные, так что масштабирование по пользователям будет просто линейным.

Понятно, что доступ к системе будет платным. Но вы планируете оставить какой-то бесплатный функционал?

Да, будет бесплатная версия. Какие будут ограничения по объему сайтов и трафику - решим по окончании бета-тестирования. Возможно, ограничения бесплатной версии будут ужесточены по сравнению с нынешней бета-версией, а может быть, и ослаблены.

Тарифы мы пока не готовы опубликовать. Это зависит от средней нагрузки, которую мы сейчас и стараемся определить. Основой тарификации будет объем выкачки и поисковый трафик (количество поисковых запросов). Кроме того, для хостинга публичных поисковиков и поиска по сайту мы рассматриваем возможность зарабатывать вместе с их создателями - путем размещения контекстной рекламы в результатах поиска.

Новости интернета   Теги:

Читать IT-новости в Telegram
Информационные технологии
Мы в соцсетях ✉