Что такое тезаурус

Значение слова тезаурус

Тезаурус в словаре кроссвордиста

тезаурус
  • Лингв. словарь языка.
  • Систематизированная совокупность понятий определённой отрасли науки.

Тезаурус Теза́урус (от «сокровище»), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т.

1.Словарь, стремящийся отразить весь словарный состав языка с исчерпывающим перечнем примеров их употребления в текстах ( в лингвистике ) .

2.Представление лексико-семантической системы языка в виде семантических полей с учетом живых ассоциативных связей; идеографический словарь ( в лингвистике ) .

3.Словарь-справочник, в котором перечислены все лексические единицы информационно-поискового языка ( дескрипторы ) , все синонимичные им слова и словосочетания, а также семантические отношения между дескрипторами; информационно-поисковый словарь ( в информатике ) .

Большой современный толковый словарь русского языка

( гр. thesauros запас)
1) лингв. словарь языка с полной смысловой информацией;
2) в информатике-полный систематизированный набор данных о какой-л. области знания, позволяющий человеку или вычислительной машине в ней ориентироваться.

Новый словарь иностранных слов

м.
1) Словарь какого-л. языка, представляющий его лексику в полном объеме.
2) Полный систематизированный набор данных о какой-л. области знания, позволяющий человеку или вычислительной машине в ней ориентироваться (в информатике).

Новый толково-словообразовательный словарь русского языка Ефремовой

1. лингв. словарь языка с полной смысловой информацией;

2. в информатике-полный систематизированный набор данных о какой-л. области знания, позволяющий человеку или вычислительной машине в ней ориентироваться.

Словарь иностранных выражений

словарь языка, ставящий задачу полного отражения всей его лексики тезаурус словарь или свод данных, полностью охватывающий термины, понятия какой-нибудь специальной сферы

Словарь русского языка Ожегова

(от греч. thesauros — сокровище).
1) словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в полном объеме осуществим лишь для мертвых языков)…
2) Словарь, в котором слова, относящиеся к каким-либо области знания, расположены по тематическому принципу и показаны семантические отношения (родо-видовые, синонимические и др.) между лексическими единицами. В информационно-поисковых тезаурусах лексические единицы текста заменяются дескрипторами.

Современный толковый словарь, БСЭ

тезаурус м.
1) Словарь какого-л. языка, представляющий его лексику в полном объеме.
2) Полный систематизированный набор данных о какой-л. области знания, позволяющий человеку или вычислительной машине в ней ориентироваться (в информатике).

Толковый словарь Ефремовой

(от греч. thesauros — сокровище, сокровищница), множество смысловыражающих единиц некоторого языка с заданной на нём системой семантических (см. Семантика ) отношений. Т. фактически определяет семантику языка (национального языка, языка конкретной науки или формализованного языка для автоматизированной системы управления). Первоначально Т. рассматривали как одноязычный словарь, в котором семантические отношения определяются группировкой слов по тематическим рубрикам. Например, английский Т. (автор П. М. Роджет), изданный в 1962 (1-е издание
1852), содержит 1040 рубрик, по которым распределено около 240 000 слов. Указатель (ключ) к этому Т. содержит алфавитный перечень слов с указанием рубрик и подрубрик, к которым относится каждое слово. Существуют традиционные общеязыковые Т. (описания семантических систем отдельных языков) для английского, французского, испанского языков. К Т. весьма близки одноязычные словари, задающие выражения основных семантических параметров каждого слова, например словарь русского языка С. И. Ожегова. В 70-х гг. 20 в. получили распространение информационно-поисковые Т. В этих Т. выделены специальные лексические единицы — дескрипторы , по которым можно осуществлять автоматический поиск документальной информации. С каждым словом такого Т. сопоставляется синонимичный дескриптор (см. Синонимия ) , и для дескрипторов явным образом указываются семантические отношения: род — вид, часть — целое, цель — средство и т. д. Обычно принято разделять родо-видовые (иерархические) и ассоциативные отношения. Так, ‘Информационно-поисковый тезаурус по информатике’, изданный в СССР в 1973, для каждого дескриптора предусматривает словарную статью, где отдельно указаны синонимичные ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей ориентации в ассоциативных связях между дескрипторами к этому Т. приложены семантические карты тематических классов. При автоматизированном информационном поиске ищутся документы, у которых индекс содержит не только дескрипторы запроса, но и те дескрипторы, которые находятся с ними в определённых семантических отношениях. Иногда бывает полезно выделять в Т. конкретные ассоциативные отношения, специфичные для данной тематической области: болезнь — возбудитель, прибор — назначение (или измеряемая величина) и т. п. Положение лексической единицы (слова, словосочетания) в Т. характеризует его смысл в языке; знание системы семантических отношений, в которые вступает данное слово (в том числе и рубрик, куда оно входит), позволяет судить о смысле этого слова. В широком смысле Т. интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приёмника дополнительной информации, вследствие чего изменяется и его Т. Исходный Т. определяет при этом возможности приёмника при получении им семантической информации . В психологии и при изучении систем с искусственным интеллектом рассматривают свойства Т. индивидуумов, проявляющиеся при восприятии и понимании информации. В социологии и теории коммуникаций изучают свойства Т. индивидуумов и коллективов, обеспечивающие возможность взаимопонимания на основе общности Т. В этих ситуациях в Т. приходится включать сложные высказывания и их семантические связи, определяющие запас сведении, которыми располагает сложная система . Т. фактически содержит не только информацию о действительности, но и метаинформацию (сведения об информации), обеспечивающую возможность приёма новых сообщений.Лит.: Черный А. И., Общая методика построения тезаурусов, ‘Научно-техническая информация. Сер. 2’, 1968, |5; Варга Д., Методика подготовки информационных тезаурусов, пер. [с венг.], М., 1970; Шрейдер Ю. А., Тезаурусы в информатике и теоретической семантике, ‘Научно-техническая информация. Сер. 2’, 1971, | З. Ю. А. Шрейдер.

Большая советская энциклопедия, БСЭ

тезаурус, -а

Полный орфографический словарь русского языка

совокупность смысловыражающих единиц языка с описанием семантических отношений между ними

При неограниченно большом количестве поступающей информации, существенно превышающем тезаурус , ее ценность от этого количества не зависит и целиком определяется тезаурусом .

Когда иссяк общий испанско-английский тезаурус , полицейские знаками показали, что дезинфекция их здесь задушит.

Уиллард взялся подготовить список синтаксических трансформаций, составить тезаурус , включающий синонимы, антонимы и примеры глагольной сочетаемости.

Для восприятия и сотворчества необходим некий оптимальный тезаурус , не малый, но и не слишком большой.

Максимальная ценность соответствует условию Т I/C, то есть тезаурус при этом должен быть пропорционален количеству получаемой информации.

Многосторонность, системность искусства приводит к неравномерности восприятия произведения в целом: для восприятия одних аспектов стиха тезаурус оптимален, для других-недостаточен или слишком велик.

Так как тезаурус растет и меняется, повторное знакомство с произведением может означать получение новой ценной информации.

Стремление ребенка многократно перечитывать полюбившуюся ему сказку понятно: его тезаурус быстро возрастает и его способность к сотворчеству, к ассоциативному фантазированию особенно велика.

Эта сторона дела более переменчива и субъективна, чем тезаурус , и в поисках объективной эстетической оценки произведения ее должно свести к минимуму.

Тезаурус

Теза́урус (от греч. θησαυρός — сокровище), в общем смысле — специальная терминология, более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (проще говоря — пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между лексическими единицами. Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.

В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.

Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.

Тезаурусы

  • Амара-коша (Словарь Амары) — первый и наиболее важный санскритский тезаурус (III—IV век)
  • Первым тезаурусом в современном смысле слова стал английский Тезаурус Роже (XIX век, около 15000 синсетов).
  • Викисловарь: многоязычный свободно пополняемый словарь и тезаурус (2004-наст.вр., проект фонда Викимедиа, в Русском Викисловаре (дамп — январь 2009) содержится 250 тыс. понятий, 67 тыс. отношений [1] )
  • РуТез — тезаурус русского языка (был создан Центром информационных исследований как инструмент для автоматического индексирования; разрабатывается с 1997 года по настоящее время, 45 тыс. понятий, 107 тыс. слов и выражений, 177 тыс. отношений). [2]
  • «Писательский тезаурус» советского писателя С. Н. Есина. [3]
Читайте также  Что такое протокол

Примечания

  1. Krizhanovsky A. A., Lin F.Related terms search based on WordNet / Wiktionary and its application in Ontology Matching : Материалы конф. / RCDL 2009, Петрозаводск, Россия, 17-21 сентября. — 2009. — С. 363-369.
  2. Онтологии для автоматической обработки текстов: описание понятий и лексических значений
  3. Есин С. Н. Писательский тезаурус

См. также

  • Викисловарь
  • Идеографический словарь
  • Русский семантический словарь
  • Семантический анализ
  • Семантическая сеть
  • Сопоставительный словарь

Литература

  • Захаров Н. В. Шекспиризм русской классической литературы: тезаурусный анализ. — М.: Издательство Московского гуманитарного университета, 2008. — ISBN 978-5-98079-486-6
  • Луков Вал. А., Луков Вл. А.Тезаурусы: Субъектная организация гуманитарного знания. — М.: Изд-во Нац. ин-та бизнеса, 2008. — 784 с. — 1000 экз. — ISBN 978-5-8309-0272-4
  • Захаров Н. В., Луков А. В.Школа тезаурусного анализа // Знание. Понимание. Умение. — 2006. — № 1. — С. 231-233.
  • Гетман, Иван Михайлович Тезаурус как инструмент современного языкознания: Автореф. дис. . докт. филол. наук. — Киев: Ин-т языковедения, 1991. — С. 34.
  • Нгуен М.Х., Аджиев А.С.Описание и использование тезаурусов в информационных системах, подходы и реализация // Электронные библиотеки. — 2004. — Т. 7. — № 1. — С. 16-45. — ISSN1562-5419.
  • Лукашевич Н.В.Тезаурусы в задачах информационного поиска. — М .: Изд-тво Московского ун-та, 2011. — С. 512. — ISBN 978-5-211-05926-0

Ссылки

  • www.thesaurus.com — Тезаурус английского языка
  • Луков Вал. А., Луков Вл. А. Тезаурусный подход в гуманитарных науках
  • Луков Вал. А., Луков Вл. А. Тезаурусный подход: исходные положения
  • Тезаурусный анализ мировой культуры. Вып. 1-8, Вып. 9-12,Вып. 13-17, Вып. 18-19, Вып. 20 на сайте Московского гуманитарного университета
  • Эпштейн М. Таня, Пушкин и деньги. Жизнь как нарратив и тезаурус. 20.12.2007
  • Thesaurus Construction
  • Web Thesaurus Compendium
  • Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению: межгосударственный стандарт ГОСТ 7.24-2007 (Система стандартов по информации, библиотечному и издательскому делу) / Межгосударственный совет по стандартизации, метрологии и сертификации – М. : Стандартинформ, 2007

  • Проставив сноски, внести более точные указания на источники.

Wikimedia Foundation . 2010 .

  • Чередование фонем
  • Паронимия

Полезное

Смотреть что такое «Тезаурус» в других словарях:

тезаурус — макротезариус, свод, словарь Словарь русских синонимов. тезаурус см. словарь Словарь синонимов русского языка. Практический справочник. М.: Русский язык. З. Е. Александрова. 2011 … Словарь синонимов

тезаурус — Отдельная программа или функция в текстовых процессорах, содержащая слова и синонимы для их замены, которые используются при проверке орфографии. [http://www.morepc.ru/dict/] тезаурус Свод знаков, терминов, кодов и отношений между ними, которые… … Справочник технического переводчика

ТЕЗАУРУС — [гр. thesauros запас, сокровище] 1) инф. вид словаря, применяемого в системах автоматического упорядочения, хранения и поиска информации (ИНФОРМАЦИЯ); т. содержит список ключевых слов, которыми может быть охарактеризовано содержание документов, с … Словарь иностранных слов русского языка

Тезаурус — [thesaurus] свод знаков, терминов, кодов и отношений между ними, которые используются в процессе обмена сведениями, сообщениями. Чтобы содержание сообщения было понятно, оно должно содержать элементы, соответствующие Т. Например, если в сообщении … Экономико-математический словарь

ТЕЗАУРУС — (от греческого thesauros сокровище), 1) Словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в полном объеме осуществим лишь для мертвых языков). 2) Словарь, в котором слова, относящиеся к какой либо … Современная энциклопедия

ТЕЗАУРУС — (от греч. thesauros сокровище) ..1) Словарь, в котором максимально полно представлены слова языка с примерами их употребления в тексте (в полном объеме осуществим лишь для мертвых языков)2)] Словарь, в котором слова, относящиеся к каким либо… … Большой Энциклопедический словарь

ТЕЗАУРУС — [тэ ], а, муж. (спец.). 1. Словарь языка, ставящий задачу полного отражения всей его лексики. 2. Словарь или свод данных, полностью охватывающий термины, понятия какой н. специальной сферы. | прил. тезаурусный, ая, ое. Толковый словарь Ожегова. С … Толковый словарь Ожегова

Тезаурус — идеографический словарь, предназначенный для группировки слов и понятий по близости их употребления. Методологически обычно выделяются наиболее значимые, доминантные понятия (семы), вокруг которых группируются остальные слова, выражающие… … Официальная терминология

ТЕЗАУРУС — (от греч. thēsauros – сокровище, запас). 1. Словарь, отражающий смысловые связи между словами, терминами и другими элементами языка. 2. Систематизированная совокупность понятий определенной отрасли науки. Этот термин восходит к словарю… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

тезаурус — тезаурус. Произносится [тэзаурус] … Словарь трудностей произношения и ударения в современном русском языке

Тезаурус — 1. В научно информационной деятельности нормативный словарь ключевых слов и дескрипторов (словарных единиц в виде слов, словосочетаний или кодов, называющих класс условной эквивалентности, в который включены эквивалентные и близкие по смыслу… … Издательский словарь-справочник

Тезаурус: что это такое. Словарь-тезаурус, который больше чем словарь

Все чаще в многочисленных проектах, книгах, брошюрах, интернет-ресурсах можно встретить понятие «тезаурус». Словно таинственное явление, оно пугает своей неизведанностью, ведь куда проще сказать «словарь», нежели использовать странное определение.

Тезаурус: что это? Чем он отличается от обычного словаря? Попытаемся изучить данные вопросы более подробно и доступно.

Трактовка термина

Первоначально понятие тезауруса рассматривалось с точки зрения словаря, представлявшего лексику языка с примерами употребления в тексте.

Ожегов трактует тезаурус как словарь конкретного языка, отражающий лексику в полной мере, в то время как Ефремова рассматривает данный феномен с точки зрения систематизированного набора данных в определенной области знания.

Наиболее конкретное определение используется в филологии, там под тезаурусом понимается компонент словарного типа, где все значения слов связаны семантическими отношениями между собой и отражают ключевые соотношения понятий в определенной предметной области.

Как мы видим, довольно сложно ответить на вопрос: «Тезаурус: что это?» однозначно. Для более узкого изучения термина рассмотрим историю возникновения, виды и отношения лексических единиц в словаре подобного типа.

История возникновения

Отцом-основателем тезаурусов считается английский физик Роже, именно он в 1852 г. систематизировал лексику английского языка, распределив ее по группам. При этом каждая группа была представлена названием понятия, а далее шли его синонимы по определенным частям речи, списки родственных наименований, а также отсылки к именам других категорий. Идея такой классификации была очень ценной, поскольку словарь считался самым естественным, описывал лексику языка в самой полной мере. При этом он мог быть применен в качестве быстрого поиска важных понятий. Со времен первого тезауруса и до сих пор происходит регулярная трансформация данного типа словаря, который применяется во многих областях знаний и пользуется широкой популярностью во всем мире. При этом изучение темы: «Тезаурус: что это?» актуально во многих учебных заведениях.

До настоящего времени тезаурусы остаются наиболее популярным способом описания знаний в любой области, необходимой для эффективного восприятия человеком.

Отношения слов в тезаурусе

Самыми распространенными отношениями в классическом тезаурусе считаются:

  1. Синонимия – явление, при котором связываются слова одной части речи, сходные по лексическому значению. Например: держава-отчизна, бригада-отряд, алый – красный и т.д.
  2. Антонимия – связь слов одной части речи, имеющих противоположное лексическое значение. Например: тишина – грохот, ласковый – грубый.
  3. Гиперонимия (гипонимия) – ключевые отношения с целью описания существительных. Гипероним имеет широкое лексическое значение, выражает родовое, общее наименование класса (множества) объектов, предметов, а именно его свойств и признаков. Гипоним обладает узким значением, он называет предмет (признак, свойство) как элемент конкретного множества или класса. Для того чтобы эти отношения стали понятными, приведем простейший пример. Слова зверь и тигр связаны между собой, при этом общее наименование — зверь — является гиперонимом по отношению к гипониму тигр.
  4. Меронимия (партонимия) – отношения для существительных, складываются по принципу «часть – целое». В качестве примера рассмотрим слова самолет, шасси, иллюминатор. В данном случае общее наименование транспорта – холоним (целое, имя), а его составные части – меронимы.
  5. Следствие (отношения между глаголами). Например, слова идти и прийти связаны процессом и его следствием (результатом).
  6. Причина (также допустимо только для глаголов). Рассмотрим пример таких отношений, возьмем слова: болеть – пропустить. В этом случае прослеживается причина — пропустить, потому что были проблемы со здоровьем.

Что тезаурус представляет собой, увидим из следующего примера.

Кровать – приспособление для сна.

[гипероним]: мебель
[мероним]: дом
[синоним]: лежанка, полати.

Это лишь классический пример тезауруса русского языка, однако все словари данного типа строятся именно по такому принципу.

Функции тезауруса

Словарь-тезаурус несет важные социальные, коммуникационные, научные и другие функции.

  • источником специальных знаний в широкой либо узкой предметной области, способом упорядочения, описания терминов предметной области;
  • инструментом поиска в информационном потоке;
  • инструментом ручного анализа документации в поисковых системах;
  • инструментом автоматического индексирования сложных текстов.
Читайте также  Что такое капитализация

Виды тезаурусов

Многообразие словарей требует рассматривать не только вопрос: «Тезаурус: что это?», но и обращать внимание на виды. Это поможет нам лучше усвоить особенности данного типа словарей.

  1. Словари по отдельным отраслям знаний – филологические, педагогические, философские и пр. тезаурусы. Представляют перечень специальных терминов с указанием всех возможных связей между ними.
  2. Информационно-поисковые (ИПТ) – используются в качестве инструмента для автоматического или ручного поиска информации. В институтах создано около сотни отраслевых тезаурусов, которые соответствуют государственным стандартам. Из возможных смысловых связей между понятиями они используют три: родовидовые, синонимические и ассоциативные (все остальные).
  3. Тезаурусы конкретного языка. Например, WordNet – знаменитый тезаурус английского языка, создан для подробной характеристики лексики и понятийного аппарата.
  4. Многоязычные (универсальные) – позволяют находить слова, связанные между собой, из разных языков.
  5. Имеются и нестандартные тезаурусы, ставящие задачу выборочной систематизации терминов в определенной области знаний, что наиболее приемлемо для новейших предметных областей.

Заключение

Мы надеемся, что смогли доступным языком объяснить, что такое тезаурус. Благодаря примерам легко понять, чем он отличается от остальных словарей. Также мы осветили вопрос об информационно-поисковых тезаурусах, которые широко используются информационной системой для быстрого поиска и систематизации миллионов наименований.

Что такое тезаурус? Как пользоваться тезаурусом в Ворде (Word)

Что такое тезаурус? В статье рассмотрим общий термин и поговорим о тезаурусе в Ворде. На практике воспользуемся тезаурусом в программе Word. Эта информация может вам пригодится при написании текстов или в процессе замены слов.

Что такое тезаурус, для чего он нужен

Здравствуйте, друзья! Что такое тезаурус? Это информационный вид словаря или по-другому словарь синонимов. Он хранит в себе различные слова, которые можно использовать для того или иного слова в тексте. То есть, подбирает для слов похожие синонимы или антонимы – противоположные слову.

Для чего нужен тезаурус? Как правило, он нужен для поиска похожих слов и замены старых словосочетаний. Рассмотрим простой пример необходимости использования тезауруса. К примеру, копирайтер написал текст, а он выглядит не уникальным. Чтобы повысить уникальность, можно подобрать слова синонимы для текста. В этом случае, как раз помогает тезаурус.

Вы просто используете набор слов готового словаря и заменяете в тексте слова на другие. Главное подобрать то слово, из-за которого не потеряется смысл текста.

Что такое тезаурус в программе Ворд

Тезаурус в программе Ворд – это словарь синонимов. Данный инструмент встроен в программу. В поздних версиях программы Ворд 2007, 2010, 2013 и так далее, эта функция работает без сбоев.

Так выглядит тезаурус в программе Word (скрин 1).

При нажатии данного инструмента, вы увидите список слов, которые будут доступны в справочном материале.

Как пользоваться тезаурусом в Ворде

Рассмотрим инструкцию, с помощью которой вы научитесь пользоваться тезаурусом в Ворде:

  1. Запустите программу Word с текстом.
  2. Далее выделите слово левой кнопкой мыши, которое хотите заменить.
  3. Затем нажмите правой кнопкой мыши.
  4. Далее перейдите в меню «Синонимы» или в раздел «Тезаурус».
  5. Выбираете подходящее слово и нажимаете «Вставить» из поля, в котором находится слово.

Рассмотренную выше инструкцию мы разберем ниже на практике.

Как пользоваться тезаурусом из интерфейсного меню

Для начала у вас должен быть открыт документ Ворд. Далее выделите слово для замены, и нажмите в разделе «Рецензирование» «Тезаурус» (скрин 2).

Справа в программе будет открыт справочник, откуда вы можете выбрать словосочетание (скрин 3).

Далее наводите курсор мыши на слово в тезаурусе и нажимаете на стрелку справа. Затем из меню выбираете «Вставить», после чего слово в тексте будет заменено. Если вы не нашли подходящего слова, то нажмите в этом окне кнопку «Все справочники». Данная функция поможет найти больше синонимов.

Как пользоваться тезаурусом из контекстного меню

Работать с тезаурусом из контекстного меню так же просто. Выделяете слово в тексте, например, «пользоваться» левой клавишей мыши (скрин 4).

Далее нажимаете правой кнопкой и выбираете из меню «Синонимы». В этом небольшом списке находите подходящее по смыслу слово и нажимаете по нему, чтобы оно вставилось в текст. Если синонимов не хватает, нажмите в данном окне «Тезаурус», чтобы открыть больше информации по словам.

Заключение

В данной статье рассмотрели, что такое тезаурус и как им пользоваться. Применив готовый словарь к своему тексту, вы сможете его улучшить, разбавить новыми словами или повысить уникальность. Измененный текст можно публиковать на ресурсах в Интернете или отправлять работы заказчикам.

Спасибо за внимание!

С уважением, Иван Кунпан

На блоге есть статьи по работе с программой Ворд:

ТЕЗАУРУС

ТЕЗАУРУС (греч. thesauros клад, сокровище) — словарь-справочник, в к-ром собраны термины, используемые в определенной предметной области, а также даны их смысловые связи. Примером Т. могут служить различного рода информационно-поисковые системы (см.), энциклопедические издания, в частности медицинские энциклопедии (см. Большая медицинская энциклопедия, Энциклопедии медицинские), и другие труды справочно-информационного характера.

Термином может быть отдельное слово или устойчивое словосочетание из двух и более слов. Смысловые связи делятся на иерархические (типа род — вид, часть — целое), синонимические и ассоциативные. Синонимия может быть абсолютной и условной. Условно синонимическими считаются термины, смысл к-рых частично совпадает или совпадает полностью с точки зрения части пользователей информационной системы. Ассоциативными связями являются связи типа процесс — продукт, причина — следствие, предмет — область применения и другие связи, отличные от иерархических и синонимических. Т. может содержать также краткие определения терминов, чаще в виде указания области применения в случае многозначных терминов (омонимов), напр, морфология (биология) и морфология (лингвистика).

Состав и структура Т. зависят от технологии обработки информации. В Т., используемом при ручном индексировании, выделены основные термины — дескрипторы (см.) и термины — синонимы этих дескрипторов, при к-рых имеются ссылки на соответствующий им дескриптор. С помощью индексатора из текста документа сначала выделяют основные термины (ключевые слова), определяющие его смысл. Затем с помощью Т. заменяют ключевые слова дескрипторами и т. о. формируют поисковый образ документа. При индексировании запроса в его поисковый образ могут быть добавлены видовые или ассоциативные дескрипторы. Родовые дескрипторы вводятся дополнительно в поисковый образ запроса только при получении отрицательного ответа на первоначальный запрос. При индексировании не рекомендуется использовать дескрипторы с очень широкими значениями.

Развитость Т. характеризуется отношением количества синонимов к общему числу терминов. В Т. с ручным индексированием, как правило, используется несколько систем терминов. Это — лексико-семантическая система и различные указатели (систематический указатель иерархических отношений и др.)- В лексико-семантической системе все термины расположены в алфавитном порядке. В систематическом указателе те же термины упорядочены по предметно-тематическому принципу. В указателе иерархических отношений дескрипторы сгруппированы в виде семейств, во главе каждого из к-рых стоит родовое понятие. В пер-мутационном указателе терминов для многословных терминов реализуется алфавитное упорядочение по каждому из значащих слов.

В системах с автоматическим индексированием каждый термин может быть записан в памяти машины один раз, а связи между терминами отображены с помощью адресных ссылок. В ряде совр. информацион-но-поисковых систем в память ЭВМ заносится полный текст документа или его реферат. Из текста автоматически выделяются все значащие слова (в памяти ЭВМ имеется список незначащих слов, включая предлоги, союзы и слова широкого смысла), по к-рым формируются инверсные массивы (см. Информационно-поисковая система), используемые для поиска при запросах. При автоматическом формировании поискового образа запроса (или поискового предписания) используется Т., хранящийся в памяти ЭВМ. При этом ключевые слова запроса автоматически дополняются синонимами и видовыми дескрипторами. Применяется также диалоговое формирование поискового образа запроса. Хранение в памяти ЭВМ полного текста реферата или документа позволяет по мере пополнения Т. реализовать поиск с большей полнотой, чем при хранении в памяти ЭВМ только поисковых образов документов.

Важное значение имеет задача пополнения Т. новыми терминами и новыми смысловыми связями. Оно может выполняться в ручном или в автоматизированном режимах на основе анализа новых документов и запросов. Окончательное установление смысловых связей в Т. осуществляется специалистом. При автоматическом индексировании возникают достаточно сложные лингвистические задачи. При этом в Т. должны храниться основы слов или же слова со всеми возможными окончаниями.

Т. в фактографических автоматизированных системах (см. Автоматизированная система управления), напр, таких, как система учета запасов лекарственных средств, учета кадров и т. п., отличается от Т. информационно-поисковой системы в области научной информации наличием упорядоченных списков терминов, каждый из к-рых содержит все текстовые значения нек-рого множества объектов или все значения одного признака объекта. Список может содержать названия стран (поставщиков лекарственных средств), перечень заболеваний, перечень видов упаковки и т. п. Наличие в памяти ЭВМ таких списков упрощает автоматическое индексирование и обеспечивает однозначный фактографический поиск и возможность обработки данных.

Библиография: Пшеничная JI. Э. Тезаурус в документальной ИПС, Киев, 1977; Шемакин Ю. И. Тезаурус в автоматизированных системах управления и обработки информации, М., 19 74; Schultz С. К. Thesaurus of information science terminology, N. Y., 1978.

Как устроено современное информационное обеспечение: часть 2. Тезаурус

p, blockquote 1,0,0,0,0 —>

Тезаурус – такое непонятное слово, что захотелось вынести его в отдельный раздел статьи. И обсудить более детально.

p, blockquote 2,0,0,0,0 —>

Как только математики-информатики определились с определениями, так сразу же источниками и преемниками информации занялись спецслужбы.

p, blockquote 3,0,0,0,0 —>

При этом каналами передачи информации занялись инженеры (и тоже спецслужбы!), а вот информационный тезаурус они оставили математикам-информатикам, так как ни черта в этом не смогли понять! Шутка.

p, blockquote 4,0,0,0,0 —>

Просто тезаурус и стал тем важнейшим компонентом информационного обмена, без которого немыслимо современное информационное обеспечение. Им-то и занялись всерьез.

p, blockquote 5,0,0,0,0 —>

Действительно, а можно ли определить, что такое информационный тезаурус? Математики никогда не боятся давать определений. Они сразу же сказали, что тезаурус – это множество дескрипторов. Коротко и ясно! А ведь действительно, что может быть проще? Например, глюкало – это набор финти-флюшек. Финти-флюшка очень напоминает множество смурзиков. Не так ли?!

p, blockquote 6,0,0,0,0 —>

Но оказалось, что не смешно, а полезно. Все сразу упростилось.

p, blockquote 7,0,0,0,0 —>

Если тезаурусы источника и приемника информации совпадают полностью, то это значит (по определению математиков!), что у них эти тезаурусы состоят из одинаковых дескрипторов. Верно? А как это звучит по-русски?

Если два человека говорят на одном языке, то они пользуются одними и теми же словами. Вот и весь перевод с математического языка на русский.

А если тезаурусы совпадают частично, это значит, что только некоторые дескрипторы этих тезаурусов совпадают. Один человек учил английский в школе, а другой вырос в Великобритании. Но «hi» (здесь – «привет») и «bye» (здесь – «пока») они, как ни странно, понимают одинаково. Значит, могут поздороваться и даже попрощаться. То есть, некоторые дескрипторы их тезаурусов являются общими!

p, blockquote 9,0,1,0,0 —>

Ну и какой от этого прок? В чем практическая жилка информационных тезаурусов? Можно согласиться, что если под эти понятия подводить только общечеловеческое общение, то ничего, кроме силы абстрактного мышления математиков, мы не увидим. А только сможем восхититься, как эти математики-информатики (возможно, за государственный счет!) обогащают свой научный язык.

p, blockquote 10,0,0,0,0 —>

p, blockquote 11,0,0,0,0 —>

Но все не так просто, когда появляются человеко-машинные системы. Когда начинается общение людей с компьютерами (по сути, с программируемыми автоматами). Когда, хоть убейся, компьютер не научишь понимать простую, хотя бы русскую речь. Ну ладно, пусть хоть бы английскую, они ведь нас обогнали в этих вопросах (ну ничего, мы им еще покажем, например, на ниве космоса!). «Я б выучил английский только за то, что его понимает компьютер!» – так можно было бы перефразировать очередного классика.

p, blockquote 12,0,0,0,0 —>

Увы, обогнать-то обогнали, но английскому компьютер не обучишь, и китайскому тоже, и вообще никакому языку не получится обучить. Тут тоже математики постарались, они и виноваты. Ввели ряд определений (например, об уровнях кибернетических систем), доказали ряд теорем (например, о невозможности адекватно моделировать системы более высокого уровня с помощью систем более низкого уровня).

p, blockquote 13,0,0,0,0 —>

А чтобы еще больше запутать простых пользователей ПК, математики полезли в лингвистику. Дали определение языкам. Не рискну его здесь воспроизвести полностью, можно умереть от скуки. «А в общих чертах можно понять, о чем он говорит?» – спрашивал Иван Васильевич про пламенную речь посла шведского (а толмача сварили в кипятке перед этим, брр!). Конечно, можно…

p, blockquote 14,0,0,0,0 —>

Попробуем. Язык (по определению математиков) – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка.

p, blockquote 15,0,0,0,0 —>

Поясню. Предположим мы учим английский (чтобы потом говорить hi и bye). Можно по-английски написать эти два слова, я уже это сделал. Они записываются с помощью букв этого языка. А значит – это относится к набору воспроизводимых символов.

p, blockquote 16,0,0,0,0 —>

Но для нас, для начинающих эти символы ничего не значат, мы не знаем значения этих слов. Поэтому нам сначала говорят не по-английски, а по-русски примерно следующее: «Эти слова звучат «хай» и «бай», означают «привет» и «пока», если их произносят два джентльмена, встретившиеся утром на Бейкер-стрит».

p, blockquote 17,0,0,0,0 —>

Но ведь то, что записано в кавычках, записано без использования букв английского языка. Ну, тупые мы, начинающие юзеры английского. Нам надо сначала по-русски растолковать. Это математики и называют невоспроизводимыми символами (или короче, нетерминалами). Это такие понятия, с помощью которых можно давать описание языкам, но в самом языке отсутствуют выразительные средства, чтобы их там можно было бы воспроизвести.

p, blockquote 18,1,0,0,0 —>

Стойте! Бред какой-то. Ведь фразу, записанную в кавычках, можно перевести на английский. И, значит, она станет воспроизводимым символом (или короче, терминалом) по определению математиков. Да, согласен, если говорить о языках общения между людьми. Но машинные языки устроены, к сожалению, так, что в них средства описания структуры языка не могут быть записаны с помощью воспроизводимых символов этого языка. Вот тот-то и начинаются ПРИНЦИПИАЛЬНЫЕ отличия социальных систем высшего уровня сложности (состоящих из сообществ людей) от гораздо более примитивных человеко-машинных систем.

p, blockquote 19,0,0,0,0 —>

Хоть умри, но машине нельзя объяснить, как устроен ее машинный язык. Сам этот язык она понимает, выполняет команды этого языка. Но почему она их выполняет именно таким образом, а не иначе, она (машина) не понимает. И не поймет никогда, потому что в понимаемом ею языке нет ни слов, ни понятий, ни даже намеков на эту тему. Да и нужны ли эти понятия машине? Для надежной работы – не нужны, это точно.

p, blockquote 20,0,0,0,0 —>

p, blockquote 21,0,0,0,0 —>

Люди же по мере освоения иностранного языка перестают нуждаться в объяснениях структуры и понятий этого языка с применением родного языка. Начиная с какого-то момента, развивать знания иностранного языка мы можем, пользуясь только этим иностранным языком.

p, blockquote 22,0,0,0,0 —>

В этом принципиальное отличие человека от машины. В этом принципиальное отличие человеческого интеллекта от программируемых устройств.

p, blockquote 23,0,0,0,0 —>

Математики, кстати, доказали (между прочим, с помощью теорем!) о недостижимости интеллекта человека машинными системами.

Разобравшись с терминалами и нетерминалами, мы легко преодолеем последнюю часть определения языка о правилах вывода (напомню определение, язык – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка – правила вывода).

p, blockquote 25,0,0,0,0 —>

Это есть то, что есть: правила вывода всех конструкций языка. И у них есть общий термин – синтаксис языка (правила написания) и семантика языка (правила употребления). Это мы знаем еще со школьной скамьи.

p, blockquote 26,0,0,0,0 —>

И что же мы имеем сухим остатком, после того, как погрузились в мир абстракций? А то, что в человеко-машинных системах, а мы только о них и говорим, так как постоянно подразумеваем человека (пользователя ПК), общающимся с машиной (персональным компьютером); в человеко-машинных системах информационные тезаурусы не только не совпадают по определению, а еще и относятся к разным классам языков, к разным уровням языков.

p, blockquote 27,0,0,1,0 —>

И между ними настолько большая разница, что

p, blockquote 28,0,0,0,0 —>

компьютер никогда невозможно научить человеческому языку, а машинные языки могут освоить только некоторые представители славного человечества (программисты, особо продвинутые пользователи и т.п.).

О фантастике, когда компьютеры общаются с людьми на равных, мы не говорим. Мы говорим о реалиях, доказанных наукой. Хотя когда-то наука уверенно доказывала, что Земля – плоская. Так что рано или поздно компьютеры все равно заговорят.

p, blockquote 30,0,0,0,0 —>

Но это уже будет совсем другая история, и совершенно иная компьютерная грамотность.

p, blockquote 31,0,0,0,0 —>

P.S. Еще почитать:

p, blockquote 32,0,0,0,0 —>

p, blockquote 33,0,0,0,0 —>

p, blockquote 34,0,0,0,0 —>

p, blockquote 35,0,0,0,0 —> p, blockquote 36,0,0,0,1 —>

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: