DEFAULT 

Поисковые информационные системы реферат

ophnoniner 0 comments

Совершенно очевидно, что лобовой просмотр файла или файлов ПОД займет много времени, что абсолютно не приемлемо для интерактивной системы WWW. Как работают поисковые системы в интернете. Помощь в написании студенческих учебных работ любого уровня сложности. При использовании Google следует, однако, помнить, что при работе с файлами большого объема он индексирует не весь источник, а лишь его первые Кб. Однако для такого изменчивого пространства как Интернет необходимо научиться пользоваться специальными инструментами, цель которых - собирать данные об информационных ресурсах и предоставлять пользователям услугу быстрого поиска. Глобальные поисковые системы Рис 1.

Такая информационная структура ИПС называется индексом. Это же относится к переводу запросов в поисковые предписания. Документальный поиск относится к числу сложных информационных процессов, поскольку он связан с проблемой оценивания смыслового соответствия документа и запроса.

Такие сведения по отношению к исходным документам играют роль метаданных. Ключевые слова также относят к метаданным. Поиск по метаданным сближает технологии документальных и фактографических ИПС. Файловый архив студентов. Логин: Пароль: Забыли пароль? Главный вопрос заключается в том, что за термины приписывать документам, откуда их брать, ведь ряд ресурсов вообще не является текстом. Сегодня роботы обычно используют для индексирования следующие источники для пополнения своих виртуальных словарей: гипертекстовые ссылки, заголовки, аннотации, списки ключевых слов, полные тексты документов, а также сообщения администраторов о своих Web-страницах.

Для индексирования telnet, gopher, ftp, нетекстовой информации используются главным образом URL, для новостей Usenet и почтовых списков поля Subject и Keywords.

Однако не следует думать, что все термины из перечисленных элементов документов попадают в их поисковые образы. Очень активно применяются списки запрещенных слов stop-wordsкоторые не могут быть употреблены для индексирования, общих слов предлоги, союзы и т.

Таким образом даже то, что в OpenText, например, называется полнотекстовым индексированием реально является выбором слов из текста документа и сравнением с набором различных словарей, после которого термин попадает в ПОД, а потом и в индекс системы. Для того чтобы не раздувать словарей и индексов индекс поисковые информационные системы реферат Lycos уже сегодня равен 4 Тбайтприменяется такое понятие, как вес термина.

Документ обычно индексируется через 40 - наиболее "тяжелых" терминов. Индекс поиска. После того как ресурсы заиндексированы и система составила массив ПОД, начинается построение поискового аппарата. Совершенно очевидно, что лобовой просмотр файла или файлов ПОД займет много времени, что абсолютно не приемлемо для интерактивной системы WWW. Для ускорения поиска строится индекс, которым в большинстве систем является набор связанных между собой файлов, ориентированных на быстрый поиск данных по поисковые информационные системы реферат.

Структура и состав индексов различных систем могут отличаться друг от друга и зависят от многих факторов: размер массива поисковых образов, информационно-поисковый язык, размещения различных компонентов системы и т.

Проблема поиска информации приобрела новый характер в м столетии, с началом развития века информационных технологий. Однако для формирования многоуровневых запросов лучше обратится к Advanced Search "Расширенному поиску" , который позволяет легко применить фильтры, в числе которых ограничения по местоположению термина в документе, определенному домену или сайту, времени опубликования, языку и даже объему исходной страницы. Робот просматривает сеть, находит новые ресурсы, приписывает им термины и помещает в базу данных индекса.

Рассмотрим структуру индекса на примере системы, для которой можно реализовывать не только примитивный булевый, но и контекстный и взвешенный поиск, а также ряд других возможностей, отсутствующие во многих поисковых системах Internet, например Yahoo.

Информационно-поисковый язык системы. Индекс - это только часть поискового аппарата, скрытая от пользователя. Второй частью этого аппарата является информационно-поисковый язык ИПЯпозволяющий сформулировать запрос к системе в простой и наглядной форме.

Уже давно осталась позади романтика поисковые информационные системы реферат ИПЯ, как естественного языка, - именно этот подход использовался в системе Wais на первых стадиях ее реализации. Если даже пользователю предлагается вводить запросы на естественном языке, то это еще не значит, что система будет осуществлять семантический разбор запроса пользователя.

Проза жизни заключается в том, что обычно фраза разбивается на слова, из которых удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR.

Поисковые информационные системы реферат 245

Таким образомзапрос типа :. Возможны и варианты. Так, в большинстве систем фраза "Unix Platform" будет опознана как ключевая поисковые информационные системы реферат и не будет разделяться на отдельные слова. Другой подход заключается в вычислении степени близости между запросом и документом. Именно этот подход используется в Lycos. В этом случае в соответствии с векторной моделью представления документов и запросов вычисляется их мера близости. Сегодня известно около дюжины различных мер близости.

Наиболее часто применяется косинус угла между поисковым образом документа и запросом пользователя.

Развитие статистики как науки в мире реферат19 %
Основные формы увековечивания памяти российских воинов реферат29 %
Как правильно питаться эссе39 %
Я вижу близкую гибель эссе57 %

Обычно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов. Все документ в системе разбиты на поля, поэтому в запросе можно указать, в какой части документа пользователь надеется увидеть ключевое слово: ссылка, заглавие, аннотация и т.

Можно также задавать поле ранжирования выдачи и критерий близости документов запросу. Теория информационного поиска начиналась с исследования особенностей документальных информационно-поисковыхсистем ИПС.

Массив элементов информации, в котором производится информационный поиск, называется поисковым массивом. Существующие виды информационного обслуживания представлены поисковые информационные системы реферат.

Главная База знаний "Allbest" Программирование, компьютеры и кибернетика Информационные поисковые системы - подобные работы. Процедура актуализации занимала достаточно много времени и доступ к системе в момент ее актуализации закрывался. Реферат по информатике по теме : Информационно-поисковые системы. Характеристика и функции поисковой системы - информационной системы с элементами автоматизации, которая осуществляет поиск интернет страниц по запросам пользователя. Область применения ИПС, как было указано выше, - это внутренняя работа с информацией и обработка информации для использования её в работе САПР, включающей в свой состав ИПС как один из модулей.

Признак классификации. Вид обслуживания. По источнику инициативы. По типам документов. По направленности или адресности.

Поисковые информационные системы реферат 3157

По периодичности или срочности. По способу доведения документов до потребителя. Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат.

Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире.

Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые. Список используемой литературы. Ашманов, И. Байков, В. Сущность поисковых машин Глобальные поисковые системы Поисковая система Google Поисковая система AlltheWeb Поисковая система Alta Vista Список использованной литературы В информационно-поисковой системе должен храниться весь необходимый информационный поисковые информационные, из которого по требованиям пользователей выдается нужная системы.

Поиск информации по требованию пользователя осуществляется либо автоматически, либо вручную как в поисковые информационные системы реферат, когда с запросом к работнику справочного фонда обращается читатель, а работник пользуется системой каталогов. Во втором случае используются ЭВМ, снабженные специальными программными средствами, анализирующими процессы запросов, поиска и выдачи нужных документов.

Таким образом, информационно-поисковые системы ИПС реализуют вопросно-ответное отношение, что сближает задачи, стоящие перед создателями таких систем, с теми задачами, которые решают создатели человеко-машинных систем. Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю.

Однако если для рядового поисковые информационные системы реферат сетевого сообщества знание методов эффективного информационного поиска является желательным, но далеко не обязательным качеством, то для работников высокоинтеллектуальной сферы умение быстро ориентироваться в ресурсах Интернет и находить требуемые источники сегодня относится уже к числу базовых квалификационных навыков.

Задача поисковых машин - обеспечивать детальное разыскание информации в электронной вселенной, что может быть достигнуто только за счет учета индексирования всего содержания максимально возможного числа web-страниц.

В отличие от справочников, все они функционируют в автоматизированном режиме и имеют одинаковый принцип действия.

Поисковые системы состоят из двух базовых компонентов. Первый компонент представляет собой программу-робот, задача которого путешествовать с сервера на сервер, реферат там новые или изменившиеся документы и скачивать их на главный компьютер системы.

При этом робот, инструкция как сделать реферат содержимое документа, находит новые ссылки, как на другие документы данного сервера, так и на внешние сайты.

[TRANSLIT]

Выявленные документы обрабатываются индексируются вторым компонентом поисковой системы. При этом, как правило, учитывается все содержание страницы, включая текст, иллюстрации, аудио и видео файлы и пр.

Информационные поисковые системы

Индексации подвергаются все слова в документе, что как раз и дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том поисковые слово, сколько реферат, в каком документе и на каком сервере употребляется и составляют базу данных, к которой происходит обращение пользователей, вводящих в строку запроса сочетания ключевых слов.

Выдача результатов осуществляется с помощью специального модуля, который производит интеллектуальное ранжирование результатов. При этом берется в расчет местоположение термина в документе название, заголовок, основной текстчастота его повторения, процентное соотношение искомого термина к остальному тексту страницы, а также число и авторитетность внешних ссылок на данную страницу с других сайтов.

Первая величина, являющаяся ключевой, устанавливает широту охвата материала и определяется числом проиндексированных документов. Сейчас эта цифра для лидеров мирового сетевого поиска информационные системы в пределах от 1 до 3 с лишним миллиардов. Учитывая тот факт, что в среднем интернетовский адрес сохраняет актуальность до полугода, после чего документ или меняет местоположение или убирается с сервера, большое значение имеет уровень оперативности обновления данныххарактеризующий степень соответствия индексного файла поисковой системы реальному местоположению документов на сайтах.

Реферат настоящее время этот параметр колеблется от двух недель до полутора месяцев. Возможности поискового механизма выражать запрос максимально точно в значительной степени предопределяют долю релевантных документов в перечне полученных результатов.

Каждая машина имеет свою собственную лексику, которая по-разному позволяет детализировать поисковое предписание.

Всемирная паутина. Поисковые системы - Информатика 7 класс #5 - Инфоурок

Все поисковые машины обладают модулем ранжирования результатов поиска. Создание таких модулей - целая область программирования, в которой конкурируют сложнейшие алгоритмы, созданные разными компаниями. Принципы работы системы поиска, учитывающей не только текст запроса, но и его поисковые информационные системы реферат.

Пополнение информационных ресурсов Интернета. Что такое поисковая система. Задачи поисковых систем. Состав и принципы работы поисковой системы. Алгоритм PageRank. Поисковые системы "Google", "Yahoo! Интернет как глобальная сеть, в которую стекаются все информационные ручейки.

Поиск в компьютерных сетях. Группировка каталогов и справочников по определенным признакам. Организация тематических категорий поиска. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.

Релевантность - это соответствие результатов поиска сформулированному запросу. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные.

Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера.

  • На настоящий момент существует множество различных СУБД.
  • Конечно, нельзя сравнивать в этом отношении, скажем, средние века, когда поиск информации был проблемой потому, что этой информации было мало, и требовались усилия только для того, чтобы найти хоть что-то по более или менее значительному интересующему вопросу.
  • Одним из наиболее ярких явлений этого процесса является возникновение и развития глобальной информационной компьютерной сети.
  • Google отличается высокой степенью комфорта для пользователя.
  • Интерфейс первой страницы Google - на сегодня в Сети у него нет достойных конкурентов.

Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

Большинство первых поисковые, включая FTP и электронную почту, были разработаны исключительно для обмена данными между хост- компьютерами Internet. По реферат развития Internet увеличения пользователей и хост- компьютеров прежние методы обмена данными перестали отвечать возросшим потребностям пользователей. Возникла необходимость разработки новых способов информационные системы сетевых ресурсов и доступа к ним, которые позволяли бы использовать информацию независимо от ее формата и расположения [12, c.

975156

Для удовлетворения таких потребностей сначала были созданы поисковая система Archie, решающая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к поисковые информационные системы реферат сетевым ресурсам.

Принципы работы этих систем позволяют легко ориентироваться в огромном количестве информационных ресурсов без необходимости предоставления механизмов работы самой сети Internet. Такой подход позволяет говорить уже не просто о ресурсах взаимосвязанных компьютерных систем, а об особых информационных пространствах сети [1, c. Система Archie представляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах данных содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP.

Пользуясь услугами системы Archie, можно осуществить поиск файла по шаблону его имени. При этом пользователь получит список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie может осуществляться различными путями, начиная от запросов по электронной почте и с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.

ЭВОЛЮЦИЯ ПОИСКОВЫХ СИСТЕМ. Игорь Ашманов