Что такое индексация в информатике
Перейти к содержимому

Что такое индексация в информатике

  • автор:

Индексирование

процесс выражения главного предмета или темы текста какого-либо документа в терминах информационно-поискового языка (См. Информационно-поисковый язык). Применяется для облегчения поиска необходимого текста среди множества других. Проводится И. как целого документа, так и его части. Для И. нередко используются заглавия текстов. При И. опускаются сопутствующие предметы или темы. Это служит причиной того, что при поиске не найденными остаются тексты, для которых предмет или тема информационного запроса является не главной, а сопутствующей. Различают 2 основных типа И. — классификационное и координатное. При классификационном И., или классифицировании, тексты в зависимости от их содержания включаются в соответствующий класс (один или несколько), в котором собираются все тексты, имеющие в основном одинаковое смысловое содержание. Каждому такому тексту присваивается индекс этого класса, служащий далее его поисковым образом. При координатном И. основное смысловое содержание текста выражается перечнем полнозначных слов, выбираемых либо из самого текста или его заглавия, либо из специального нормативного словаря. В первом случае такие лексические единицы называются ключевыми словами (См. Ключевое слово), а во втором — Дескрипторами. Каждое ключевое слово или дескриптор обозначает класс, в который потенциально входят все тексты, где в выражения основного смыслового содержания входит это слово. Логическое произведение классов, которые обозначены всеми словами, выражающими в совокупности основное смысловое содержание текста, как бы образует некоторый сложный класс. Построенный таким способом сложный класс обозначается перечнем ключевых слов или дескрипторов, и этот перечень служит поисковым образом данного текста или выражением на информационно-поисковом языке смыслового содержания запроса. Таким образом, при координатном И. смысловое содержание текста выражается как бы указанием его координат в некотором n-мерном смысловом пространстве. Разновидностью координатного И. является пермутационное, или циклическое, И., которое основано на использовании ключевых слов заглавия текста и заключается в том, что все ключевые слова заглавия вместе с контекстом поочерёдно выводятся в поисковую колонку. В этой колонке ключевые слова даются в алфавитном порядке. На основе координатного И. созданы и более сложные информационно-поисковые языки. Основное преимущество координатного И. перед классификационным заключается в том, что координатное И. не создаёт никаких затруднений при поиске текстов по любому, заранее не предусмотренному сочетанию признаков. Особым типом И. следует считать раскрытие смыслового содержания текста через приводимую вместе с ним библиографию — имена авторов и библиографические описания их работ, на которые ссылается автор данного текста. Такое И. служит основой для составления указателей цитированной литературы — весьма эффективного инструмента не только для поиска документов, но и для решения других задач (науковедческих, прогностических и т. д.).

Лит.: Михайлов А. И., Черный А. И., Гиляревский Р. С., Основы информатики, 2 изд., М., 1968, с. 179—222, 244—515: Sharp J. R., Some fundamentals of information retrieval, L., 1965, p. 11—120, 156—203; Stevens М. E., Automatic indexing: a state-of-the-art report, Wash., 1965 (National Bureau of Standards, Monograph 91).

А. И. Черный.

Большая советская энциклопедия. — М.: Советская энциклопедия . 1969—1978 .

Синонимы:

  • Индекс запрещённых книг
  • Индексный регистр

Полезное

Смотреть что такое «Индексирование» в других словарях:

  • Индексирование — в информационном поиске процесс описания документов и запросов в терминах информационно поискового языка. По результатам индексирования каждому документу назначается набор ключевых слов, отражающих его смысловое содержание. По английски: Indexing … Финансовый словарь
  • индексирование — индексация Словарь русских синонимов. индексирование сущ., кол во синонимов: 1 • индексация (1) Словарь синонимов ASIS. В.Н. Тришин … Словарь синонимов
  • индексирование — Выражение содержания документа и/или смысла информационного запроса на информационно поисковом языке. [ГОСТ 7.74 96] индексирование Процесс описания содержания документов и запросов в терминах информационно поискового языка; назначение документу… … Справочник технического переводчика
  • ИНДЕКСИРОВАНИЕ — выражение главного содержания текста какого либо документа в терминах языка информационно поисковой системы. Применяется для облегчения поиска нужного документа среди множества других … Большой Энциклопедический словарь
  • индексирование — 3.5 индексирование (indexing): Процесс проставления условных обозначений и составления указателей, служащих для упрощения доступа к документам и (или) информации. Источник … Словарь-справочник терминов нормативно-технической документации
  • Индексирование — вид преобразования содержания документов и информационных запросов в целях их подготовки для механизации информационного поиска. Индексирование заключается в переводе основного смыслового содержания документа или запроса с естественного языка… … Контрразведывательный словарь
  • индексирование — выражение главного содержания текста какого либо документа в терминах языка информационно поисковой системы. Применяется для облегчения поиска нужного документа среди множества других. * * * ИНДЕКСИРОВАНИЕ ИНДЕКСИРОВАНИЕ, выражение главного… … Энциклопедический словарь
  • ИНДЕКСИРОВАНИЕ — В международных страховых операциях: автоматическая корректировка величины стоимости, устанавливаемой при страховании имущества или ответственности при реализации международной программы страхования с целью отражения уровня инфляции в стране,… … Страхование и управление риском. Терминологический словарь
  • индексирование — indeksavimas statusas T sritis radioelektronika atitikmenys: angl. indexing vok. Indexieren, n; Indizierung, f rus. индексирование, n pranc. indexage, m … Radioelektronikos terminų žodynas
  • индексирование — Rus: индексирование Deu: Indexieren Eng: indexing Fra: indexation Выражение содержания документа и или смысла информационного запроса на информационно поисковом языке. ГОСТ 7.74 [7.1] … Словарь по информации, библиотечному и издательскому делу
  • индексирование адреса — Способ вычисления исполнительного адреса, при котором учитывают индекс адреса. Примечание Индексирование может сочетаться с базовой адресацией. [ГОСТ 19781 90] Тематики обеспеч. систем обраб. информ. программное EN indexing … Справочник технического переводчика
  • Обратная связь: Техподдержка, Реклама на сайте
  • �� Путешествия

Экспорт словарей на сайты, сделанные на PHP,
WordPress, MODx.

  • Пометить текст и поделитьсяИскать в этом же словареИскать синонимы
  • Искать во всех словарях
  • Искать в переводах
  • Искать в ИнтернетеИскать в этой же категории

Индексация и индекс

• Процесс загрузки информации из интернета и предварительного анализа ее поисковой машиной называют индексацией . • База данных ПС, в которой храниться вся информация – это и есть индекс , грубо говоря.

Перед нами упорядоченный по алфавиту список слов. Для каждого слова перечислены все «позиции», в которых это слово встретилось (первая цифра — глава, вторая — стих)

Поисковый алгоритм состоит в отыскании нужного слова и загрузке в память уже созданного списка позиций.

Вопрос, что индексировать • волк или волка или волку. • ЗАмок или заМОК.( ударение) • Большие/маленькие буквы — General Motors • Пунктуация — C.Ш. А. или США (сокращение, аббревиатура). • Числа (в каком формате?) 3/12/91, Март 12,1991 55 В.С,В-55 • Как обрататывать синонимы и омонимы, индексировать эквивалентные слова или расширять/уточнять запрос? • Классыэквивалентности: автомашина и автомобиль опушка – край леса или меховая обшивка одежды?

Пример — выделение корня • Сокращаем слова к их корню до их индексирования -языковая зависимость -например, бегун, побег,пробежка все сокращаются к бег.

Для примера, бегун и бегунок оба принимаются относящимися к бегу
Для пример бег и бег оба принимать относиться бег.

Пример — алгоритм Портера • Обычный алгоритм для выделения корня в англоязычных текстах • Соглашения + 5-фазное сокращение – фазы применяют последовательно – каждаяфаза состоит из набора команд – пример соглашения: из правил в составной команде, выбираем одно применимый к самому длинному суффиксу. • Типичные правила Портера

– Прилагательное существительное
– Множественное число един.число

Индексация

Индексация (лат. index – «список, реестр, указатель») – это процесс обработки страниц интернет-ресурсов с помощью специальных программ-роботов (поисковых ботов).

Программа-индексатор (поисковый бот) собирает и анализирует информацию о новых страницах, появляющихся в Сети. Если такая страница будет найдена и будет удовлетворять требованиям поисковой машины, то поисковая система включит ее в результаты поиска. Таким образом будет выполнен процесс индексации.

Индексация.jpg

Интерфейс программы «Семонитор» для проверки индексации сайтов

Индексация играет важную роль в выдаче страниц по запросу пользователя. Однако важно и то, как работают сами поисковые системы, как составлены их алгоритмы. Это обстоятельство наряду с некоторыми другими влияет на принцип отбора страниц. У каждой поисковой системы собственные алгоритмы работы, что приходится учитывать веб-мастерам и специалистам по продвижению.

Индексация сайта не происходит автоматически, сразу же после его размещения на хостинге. Поисковые машины не могут самостоятельно найти новый сайт. Новый интернет-ресурс после его размещения на сервере необходимо добавить в базу данных поисковой системы. Только после этого поисковые боты смогут обойти все страницы (или те, что открыты для робота) сайта и завершить процесс индексации.

Добавление в базу данных поисковой системы не представляет большой сложности. После того, как сайт размещен на хостинге, необходимо заполнить форму добавления сайта на нужном поисковом сервисе. Специалисты также рекомендуют зарегистрировать интернет-ресурс в социальных закладках. Такая операция приведет к ускорению индексации. Ссылка в социальных закладках на новый ресурс станет дополнительным указателем поисковому роботу.

Индексация — важный этап в дальнейшем развитии сайта. Это особенно важно для коммерческих и общественно значимых интернет-проектов. Только после индексации сайта появятся заинтересованные посетители. Только после индексации можно заниматься оптимизацией и продвижением сайта и думать о расширении проекта.

Что такое индексация сайта и для чего она нужна?

Что такое индексация сайта и для чего она нужна?

Информационная супермагистраль подобна библиотеке с миллиардами книг, охватывающих все мыслимые темы на планете. От спорта до ядерной физики, от местных новостей до последних мировых новостей, от политики до охраны здоровья животных — вы можете найти в Интернете все, что угодно.

Содержание:

  1. Индексация сайта: понятие, для чего используют?
  2. Что влияет на индексацию сайта?
  3. Как попасть в индекс?
  4. Как проверить индексацию сайта?
  5. Как закрыть сайт от индексации?

Пауки Google патрулируют интернет в поисках новой информации. Если они считают контент достойным индексации, они хранят его в гигантской базе данных. Когда вы что-то гуглите, поисковая система начинает действовать. Его автоматические браузеры переходят с сайта на сайт и со страницы на страницу в поисках релевантного контента.

индексация сайта

Они ищут и сортируют все, что хранится в индексе Google, выуживают информацию и выкладывают ее в результатах поиска. Система оценивает результаты, помещая наиболее релевантные элементы на первую страницу, а наименее релевантные — на последующие разделы. Рассмотрим, что же это такое.

Индексация сайта: понятие, для чего используют?

Индексация сайта — это процесс добавления сервиса в базу данных поисковой системой. Затем, основываясь на полученной информации, движок оценивает качество платформы и ранжирует его соответствующим образом.

Индексация страниц сайтов — это первый шаг к их оптимизации для поисковых систем. Существует необходимость постоянно отслеживать попадание в поиск вашей платформы как для новых страниц, так и для существующего контента.

Если вы заметили, что многие страницы не попали в поиск, найдите потенциальную причину этого и исправьте ее. Например, нарушив рекомендации Google, сервис потеряет индексацию, поэтому придется отправить запрос на повторное включение. Это повлияет на трафик и доход, поэтому всегда важно следить за сервисом.

Что влияет на индексацию сайта?

Продвижение сайта — это концепция категоризации, сбора и хранения страниц в рамках запроса поисковой системы, чтобы позволить пользователям получать доступ к веб-страницам для использования в будущем. Попадание страниц в поиск зависит от LSI (лингвистическое семантическое индексирование), когнитивной психологии, математики, информатики и компьютерных наук. Большинство поисковых систем ориентированы не только на полнотекстовую информацию, но и на типы носителей, включая видео, аудио и графику. Полная проверка контента — это то, что позволяет отображать эту информацию, чтобы создать лучший опыт для пользователей.

процесс индексации сайта

Время зависит от нескольких факторов. Некоторые из этих факторов включают: размер контента на странице, медиа в контенте, количество элементов, уже попавших в поиск по текущему ключевому слову или поисковому запросу, а также пропускную способность уже используемых ботов обхода. Как правило, чем больше людей ссылаются на контент или делятся им в социальных сетях, тем быстрее он проверится поисковой системой.

Как попасть в индекс?

  • Google ищет новые сайты. Чем старше сайт, тем больше вероятность того, что его обойдут. Пока сайт активен и содержит актуальный контент, он будет проиндексирован, независимо от возраста.
  • Другим важным фактором является объем трафика, который получает сайт при обходе. Веб-сервис с большим трафиком просматривается чаще, Google легче сканировать активные платформы с обновленным контентом.
  • Если сервис содержит много входящих ссылок с авторитетных сайтов, то они будут просматриваться намного чаще.
  • Социальные сети помогают релевантности. Если вы будете использовать социальные сети каждый раз, когда у вас появляется новая запись в блоге, это привлечет трафик на новую страницу.
  • Сохраняйте ссылки на всех подходящих страницах, и когда Google выполнит обход, у него будет больше шансов увидеть страницы, на которые вы ссылаетесь. Обновляйте ссылки в своей биографии каждый раз, когда вы обновляете свой сервис.
  • От создаваемого контента зависит насколько быстро платформа будет проверена Google. Если у вас недостаточно качественный контент, у вас меньше шансов попасть в поиск в первую очередь. Если контент не соответствует стандартам Google, сервис может не быть проиндексирован. Наличие высококачественного, привлекательного контента не только облегчает Google проверку сайта, но и заставляет людей возвращаться на платформу, что также увеличивает шансы на большую релевантность.

Как проверить индексацию сайта?

Проверить индексацию сайта можно следующим способом:

  • Зайдите в Google.
  • Введите «site:» без кавычек, а затем название сервиса. Например: site: redrose.com .
  • Если платформа не была проверена, вы увидите нулевые результаты.
  • Если он проиндексирован, вы увидите количество результатов для платформы.

индексация сайта в поисковой системе

Как закрыть сайт от индексации?

Сервис обычно полностью закрыт для индексации во время разработки или редизайна. Платформы, на которых веб-мастера обучаются или экспериментируют, также часто закрыты.

Вы можете запретить индексацию сайта для всех поисковых систем, для одного бота или выбрать запрет для всех, кроме одного.

Запрет для всех:

Запрет для одного робота:

Запрет для всех, кроме одного:

Не все страницы сайта должны попасть в поиск. Как правило, они включают, но не ограничиваются, следующим:

  • Целевые разделы для рекламы
  • Вкладки благодарности
  • Раздел конфиденциальности и политики
  • Вкладки администратора
  • Дублирующиеся страницы (например, аналогичный контент, размещенный на нескольких платформах, принадлежащих одной компании)
  • Малоценные данные (например, устаревший контент многолетней давности, но что-то достаточно ценное, чтобы не быть удаленным с сервиса)

Перед деиндексацией важно провести тщательный аудит содержимого, чтобы у вас был системный подход к определению того, какие страницы включать, а какие исключать.

Google или Яндекс может потребоваться некоторое время, чтобы получить запрос на деиндексацию. Часто требуется несколько недель, чтобы изменения вступили в силу. Если вы заметили, что страница по-прежнему отображается в результатах поиска Google, скорее всего, это связано с тем, что Google не просматривал данные с момента запроса. Вы можете запросить у Google повторный просмотр страницы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *