“Поиск в глубоком Интернете” может помочь ученым

Источник: http://astronews.ru/cgi-bin/mng.cgi?page=news&news=7301

Когда вы делаете обычный поисковый запрос через поисковую систему, полученные вами результаты не отражают всей картины целиком. В Интернете находится гигантское количество информации — иногда называемой «глубоким Интернетом» (Deep Web) — которое не индексируется поисковыми системами: информации, которая может оказаться полезной при отслеживании преступников, террористов и торговцев людьми. Ученые же могут использовать возможности глубокого Интернета для поиска снимков и данных, полученных с космических аппаратов.

Агентство по перспективным оборонным научно-исследовательским разработкам США (Defense Advanced Research Projects Agency, DARPA) разрабатывало специальные инструменты для поиска информации в рамках своей программы Memex, которая позволяет осуществить доступ к этой таинственной онлайн-Вселенной и индексировать её. Исследователи из Лаборатории реактивного движения НАСА (JPL) присоединились к проекту Memex, чтобы поставить преимущества доступа к глубокому Интернету на службу науке. Программа Memex, к примеру, могла бы помочь каталогизировать гигантские количества данных, которые космические аппараты НАСА поставляют на Землю на регулярной основе.

«Мы разрабатываем поисковые технологии нового поколения, которые способны распознавать людей, места, предметы и связи между ними», — сказал Крис Мэтманн, руководитель исследования, проводимого JPL в рамках программы Memex.

Система Memex проверяет не только стандартный текстовый контент, находящийся в открытом доступе, но также снимки, видео, всплывающие окна с рекламой, формы, скрипты и другие способы хранения информации, устанавливая взаимосвязи между ними.

«Мы совершенствуем поисковых роботов, давая им возможности вести себя, подобно браузерам — другими словами, исполнять скрипты и «прочитывать» рекламные объявления точно так же, как это делали бы вы сами, сидя за компьютером. Обычно такая информация не индексируется поисковыми движками», — сказал Мэтманн.

Все программные коды, написанные для Memex, являются открытыми. Команда JPL является одной из 17 команд, работающих над этой инициативой агентства DARPA.