Вычислительная техника и информатика (ответы на вопросы по кандидатскому экзамену)

Сдавался/использовался2018г., Москва, МГУКИ, "5"
Примечаниеот автора: Ответы хорошие, но некоторых не хватает. Не обещаю успеха, но 4 ВПОЛНЕ можно получить!
Загрузить архив:
Файл: ref-26885.zip (387kb [zip], Скачиваний: 58) скачать
1

Вычислительная техника и информатика

1. Информатика как наука. Место информатики в системе наук

Информатика: наука, изучающая информационные процессы и системы в социальной среде, их роль, методы построения, механизм воздействия на человеческую практику, усиление этого воздействия с помощью вычислительной техники. Информатика возникла как дополнение и конкретизация Теории информации из потребностей автоматизации социально-коммуникативных процессов, и начала формироваться в 1970-е гг., как научная база использования электронных вычислительных машин в управлении, науке, проектировании, образовании, сфере услуг и т.д.".

Как всякая относительно новая и быстро развивающаяся отрасль знания, не только связанная с социальной сферой, но и широко использующаяся в ней, Информатика получила в последние годы множество толкований и не все они однозначны.

Наибольшие противоречия связаны с той частью этого понятия, которая определяет его семантические границы распространения. В качестве примера приведем другое определение: "Информатика: отрасль знания, изучающая закономерности сбора, преобразования, хранения, поиска и распространения документальной информации и определяющая оптимальную организацию информационной работы на базе современных технических средств" [].

Видимые отличия цитируемых определений заключаются, в частности, в том, что второе ограничивает понятие "Информатика" технологическими процессами, входящими в функции информационных органов, а также документальной информацией. Следует отметить, что, несмотря на давность этого определения (1971 г.), оно используется и в настоящее время в среде работников информационных органов и служб, в недрах которых изначально и было порождено.

Еще один подход связан с организациями, которые ранее были подведомственными Комитету по информатизации России. Основное внимание этот подход акцентирует на инструментальных (программных и технических) средствах "Информатики" и "информатизации": "Информатика:... группа дисциплин, занимающихся различными аспектами применения и разработки ЭВМ: Прикладная математика, Программирование, Программное обеспечение, Искусственный интеллект, Архитектура ЭВМ, Вычислительные сети" [].

Анализируя сказанное, мы склонны предпочесть вариант "кибернетиков" как более объективный и полный.

С целью более глубокого понимания указанного термина продолжим выборочное цитирование соответствующей статьи Словаря по Кибернетике: "?Важнейшими категориями Информатики являются понятия информационных сред (социальных подсистем, в которых осуществляются информационные процессы и куда внедряются ЭВМ как усилители человеческого интеллекта), полного информационного цикла (включающего зарождение информации, ее переработку, передачу, использование для снижения энтропии рассматриваемой социальной системы), полезной работы (отдачи) ЭВМ. Отдача ЭВМ, коэффициент полезного действия зависят от уровня функционирования социальной среды, в которой они задействованы, ее упорядоченности, системности, условий для творческой деятельности людей, сложности и важности задач, решаемых с помощью машин. Информатика не заменяет собой Кибернетику, теорию информации, электронику, системотехнику, а взаимодействует с ними, имея ряд общих проблем. Интегральный характер Информатики заключается также в ее взаимодействии с такими дисциплинами, как теория познания, семиотика, лингвистика, документолистика, библиотековедение" [].

Рассмотрим место науки информатики в традиционно сложившейся системе наук (технических, естественных, гуманитарных и т.д.). В частности, это позволило бы найти место общеобразовательного курса информатики в ряду других учебных предметов.

Напомним, что по определению А.П.Ершова информатика - фундаментальная естественная наука. Академик Б.Н.Наумов определял информатику как естественную науку, изучающую общие свойства информации, процессы, методы и средства ее обработки (сбор, хранение, преобразование, перемещение, выдача).

Уточним, что такое фундаментальная наука и что такое естественная наука. К фундаментальным принято относить те науки, основные понятия которых носят общенаучный характер, используются во многих других науках и видах деятельности. Нет, например, сомнений в фундаментальности столь разных наук как математика и философия. В этом же ряду и информатика, так как понятия "информация", "процессы обработки информации" несомненно имеют общенаучную значимость.

Естественные науки - физика, химия, биология и другие - имеют дело с объективными сущностями мира, существующими независимо от нашего сознания. Отнесение к ним информатики отражает единство законов обработки информации в системах самой разной природы - искусственных, биологических, общественных.

Однако, многие ученые подчеркивают, что информатика имеет характерные черты и других групп наук - технических и гуманитарных (или общественных).

Черты технической науки придают информатике ее аспекты, связанные с созданием и функционированием машинных систем обработки информации. Так, академик А.А.Дородницын определяет состав информатики как три неразрывно и существенно связанные части: технические средства, программные и алгоритмические. Первоначальное наименовании школьного предмета "Основы информатики и вычислительной техники" в настоящее время изменено на "Информатика" (включающее в себя разделы, связанные с изучением технических, программных и алгоритмических средств). Науке информатике присущи и некоторые черты гуманитарной (общественной) науки, что обусловлено ее вкладом в развитие и совершенствование социальной сферы. Таким образом, информатика является комплексной, междисциплинарной отраслью научного знания.

2. Электронные библиотеки в России и за рубежом. Состяние и тенденции

"Электронные библиотеки: перспективные методы и технологии, электронные коллекции", RCDL’2002.

Электронные библиотеки (ЭБ) - область исследований и разработок, направленных на развитие теории и практики обработки, распространения, хранения, поиска и анализа цифровых данных различной природы. Электронные библиотеки, являющиеся хранилищами знаний, можно рассматривать как сложные информационные системы, при создании и использовании которых требуется решение многих научных, технологических, методологических, экономических, правовых и других вопросов. Технологии электронных библиотек стремительно развиваются. Проблемы семантики, интеграции информации, восприятия и представления разнообразных видов данных ждут более совершенных решений. Развитие технологий электронных библиотек становится всё более существенным для совершенствования стандартов здравоохранения, образования, науки, экономики, равно как и качества жизни вообще. Проекты формирования в цифровой форме информации, накопленной человечеством о Земле, Вселенной, Литературе, Искусстве, Окружающей среде, Человеке, являются примерами областей интенсивного развития глобальных репозиториев представления знаний.

Основная цель этой серии конференций заключается в том, чтобы способствовать формированию сообщества специалистов России, ведущих исследования и разработки в области электронных библиотек. Для такого сообщества конференция предоставляет возможность обсуждения идей и полученных результатов, установления контактов для более тесного сотрудничества. Конференция также способствует изучению зарубежного опыта, развитию международного сотрудничества в области электронных библиотек. Конференция акцентирует внимание на перспективных исследованиях и технологиях. Наряду с этим, значительное внимание уделяется прототипам приложений и электронным коллекциям, созданным в рамках проектов программы РФФИ по электронным библиотекам и других программ.

Электронные библиотеки все более активно врываются в жизнь научных учреждений и университетов. Сейчас трудно представить себе университет Запада, в котором не было бы развитой электронной библиотеки. Электронные библиотеки, создаваемые на основе лицензионных соглашений с издательствами, вытесняют подписку на журналы. Вместе с тем, большей частью электронные библиотеки университетов функционально напоминают традиционные или объединяются с ними в гибридные. В перспективе электронные библиотеки должны стать репозиториями знаний. В программе научно-исследовательской конференции RCDL’2002 отражен этот широкий диапазон различных интерпретаций понятия «электронная библиотека». Проблемы создания гибридных библиотек сочетаются с рассмотрением электронных библиотек и информационных систем для организации науки. Рассматриваемые примеры специализированных научных коллекций показывают, что содержательно, структурно и функционально они выходят далеко за пределы традиционных библиотечных возможностей. Проблемы создания виртуальной астрономической обсерватории рассматриваются детально в контексте международного сотрудничества. Значительное внимание в программе конференции уделено формированию интегрированных репозиториев научной информации - глобальных в определенных областях знания, образуемых при помощи перспективных технологий (посредники) и традиционных подходов. Отдельно рассматриваются вопросы создания электронных архивов. Специальные исследования выделены в секции семантики информационных ресурсов, методов представления, поиска и индексирования документов.

Особо на конференции рассматривались электронные библиотеки в образовании как элементы виртуальной образовательной среды. На них возлагаются особые надежды в связи с происходящей глобальной трансформацией образования под действием информационных технологий. Помимо специальной секции, посвященной этим вопросам, во время конференции было проведено Международное Экспертное Совещание Института Информационных Технологий в Образовании ЮНЕСКО по рассмотрению состояния электронных библиотек в образовании в форме Круглого Стола.

2.3. Некоторые из доложенных и опубликованных результатов (общая характеристика)

В докладах, представленных крупными библиотеками России - РГБ, ГПНТБ, БЕН РАН, ЦНСХБ, рассмотрено состояние, применяемые технологии и перспективы развития цифровой составляющей в их гибридных библиотеках.

На секции 2 (Электронные библиотеки для образования) Mary Marlino (UCAR, USA) представила обзор ориентированных на профессиональное сообщество аспектов создания узко профильных электронных библиотек для образования (на примере DLESES - библиотеки в науках о Земле). Показана роль профессионального сообщества в процессе создания такой предметно-ориентированной библиотеки и взаимное влияние сообщества и библиотеки. Новый подход к организации учебных курсов на основе накопленного в электронных библиотеках материала рассматривался в докладе, представленном А. Ушаковым от имени группы специалистов из Калифорнийского Университета в Санта Барбаре по известному проекту Электронной библиотеки Александрия. В подходе во главу угла поставлена понятийная среда соответствующей предметной области. На примере курса физической географии показано построение обучающей среды на основе этой гипотезы о ведущей роли понятий при обучении и электронных библиотек. Технические аспекты создания электронной библиотеки для аэрокосмического образования рассмотрены в докладе Е.Б. Кудашева.

При обсуждении на секции 3 семантических аспектов информационных ресурсов в докладе Л.А. Калиниченко и Н.А. Скворцова внимание уделено возможности использования проекта стандарта онтологической модели DAML+OIL, разрабатываемого W3C, в предметных посредниках на основе инверсируемого преобразования этой модели в каноническую модель посредника. Дискусионно, хотя и недостаточно мотивированно (нужны примеры, демонстрирующие полезность идеи) выглядели предложения об "образном тезаурусе", "образных" метаданных и индексировании "образных данных" в докладе И.М. Зацмана.

Краткий обзор вопросов создания электронных библиотек для организации науки на секции 4 рассматривался в докладах, представленных ОИЯИ, группой физических институтов РАН, Казанским Госуниверситетом. В докладе Е.Н. Филинова и А.В. Бойченко в очередной раз предпринята попытка рассмотрения стандартов представления ресурсов в электронных библиотеках одновременно и для науки, и для культуры и для образования. Представленный материал не поспевает за фактическим развитием представлений ресурсов в современных электронных библиотеках ввиду очевидного отрыва от мирового сообщества в этой области быстро развивающихся технологий.

На секции 5 (На пути к виртуальной обсерватории) Guenther Eichhorn представил доклад о крупной электронной библиотеке публикаций в области астрономии - The Astrophysics Data System (ADS). Это впечатляющая по масштабам коллекция. О.Б. Длужневская и О.Ю. Малков рассказывали о планах приобщения Российского научного астрономического сообщества к международному движению в направлении Виртуальной Астрономической Обсерватории (ВАО). Для этого развивается проект Российской Виртуальной Обсерватории как компонента для интеграции в Международную ВАО. Доклад В.В. Витковского и др. представил информацию о вкладе Специальной астрофизической обсерватории РАН в ВАО. Доклады по астрономическим коллекциям были представлены также на секциях 7 и 9. Доклады от России и Украины на 7 секции посвящены созданию баз данных на основе архивов фотографических пластинок, накопленных в Пулковской и Крымской обсерваториях. На 9 секции обсуждались вопросы применения различных технологий при создании астрономических коллекций объектные модели для пульсарных данных (доклад А.Е. Авраменко) и XML для различных данных наблюдений (доклад В.В. Витковского и др.). Первый доклад характеризовал использование технологии объектной интероперабельности на основе CORBA/DCOM, второй доклад посвящен использованию Web сервисов и их интероперабельности на основе технологий SOAP, WSDL, UDDI.

Важное место в структуре конференции занимает секция 6, посвященная Data Grid и перспективам использования этой архитектуры в электронных библиотеках. Приглашенный доклад И. Заславского из Суперкомпьютерного центра в Сан Диего содержал краткий обзор развиваемых в этом центре технологий - Storage Resource Broker (SRB), являющийся представителем Data Grid, и MIX - посредник, реализующий подход Global as View к интеграции неоднородных источников данных. Пока эти архитектуры рассматриваются отдельно, хотя в перспективе ожидается их интеграция. Доклад В.В. Коренькова объяснил структуру большого проекта Европейского Союза по Data Grid и участие России в этом проекте. Эти два доклада позволяют сравнивать различные архитектуры Data Grid, развиваемые мировым сообществом.

Секции 10 и 13 были посвящены методам представления и поиска документов. Так, Benjamin M.Gross (UIUC,USA), проанализировав приемы работы с электронной почтой (способы выбора адресов, сортировки писем по категориям и т.п.) предложел свой вариант прототипа системы, имеющей на нижнем уровне память для собщений (писем) в виде реляционной базы данных и набор сервисов на верхнем уровне (например, с сервисом индексирования текстов и метаданных) для улучшения организации хранения сообщений, их выборки, адресации и навигации. Многие из предлагаемых решений могут быть применены и для организации электронных коллекций другого типа. Можно отметить и представленные коллективом авторов из Санкт-Петербургского Государственного Университета (СПбГУ) доклады по работам , поддержанным грантами РФФИ и посвященным исследованию возможности автоматического выявления HTML-документов подобной структуры (т.е.получения информации, облегчающей создание программ-медиаторов) и возможности использования информации о содержимом документов в окрестности рассматриваемых Web-страниц для повышения качества поиска. В докладе Б.В. Доброва и Н.В. Лукашевича основное внимание уделено разработке многоязычных информационных систем, в том числе средствам автоматической обработки, индексирования и поиска документов в "многоязычных" коллекциях документов. Большой объем работ по принципам создания на основе расширенной объектной модели документов (DOM) и наполнению научной информацией (по различным областям науки) Интегрированной Распределенной Информационной Системы (ИРИС) Сибирского Отделения РАН был представлен в докладе Ю.И. Шокина, А.М. Федотова и Ю.В. Леонова. В докладе М.В. Губина приведены результаты исследований, проведенных для выбора метода сжатия индексированных файлов (основной индексной структуры для поиска по тексту).

На секции 11 (Интегрированные репозитории научной информации) профессор Bernd Wegner ( Институт Математики Технического Университета в Берлине) отметил, что в деле создания баз знаний библиотечного типа необходимо формирование глобальных репозитариев, что в свою очередь связано с тремя видами деятельности : запоминанием доступных на данный момент электронных материалов, реализацией проектов для решения проблемы архивирования таких материалов с целью их сохранения в читабельном виде для будущих поколений и переводом напечатанной литературы в электронную форму с обеспечением хорошего доступа и поисковых возможностей для потенциальных читателей.Доклад и был посвящен некоторым деталям этой деятельности , в частности, для проектов с распределенной сетевой архитектурой EMANI (Electronic Mathematics Archives Network Initiative ( международный проект) и ERAM (Electronic Research Archive in Mathematics, Германия). Кроме того, был предложен план развития глобальной Электронной Библиотеки по математике (DML и RusDML).

Два доклада в этой секции (с участием авторов из Института Математики СО РАН, Института Проблем Информатики РАН, Института цитологии и генетики СО РАН и Института Вычислительной математики и математической геофизики СО РАН) были посвящены различным сторонам реализации распределенных систем в области молекулярной генетики и биологии, биотехнологии и медицины, и в частности конкретным реализациям системы Gene Discovery/GeneExpress и средствам использования баз данных TRRD, SWISSPROT (структура и функции белков, их классификация и т.д.), EMBL/GenBank (последовательности ДНК, РНК) и Medline. К сожалению, форма представления материала была слишком ориентирована на знание терминологии и понятий рассматриваемой предметной области.

На секции 12 (Интеграция разнородных коллекций) в докладе Ю.С. Затуливетра подчеркивалась предстоящая проблема превращения Интернет в программируемый метакомпьютер путем активизации функциональных возможностей компьютеров сети для глобальных общесистемных (подавление информационного шума, структуризация и интеграция информационных ресурсов, автоматическое управление вычислительными ресурсами) и пользовательских задач; отмечалось, что Grid-технологии - лишь первый серьезный шаг в этом направлении.

Два доклада на этой секции (В.А. Капустина и О.Л. Жижимова с соавторами) были посвящены возможностям и средствам применения протокола Z39/50 для создания профилированных распределенных информационных систем (стандартизации метаданных, схем данных). Наконец, на этой же секции была представлена Библиотечная Подсистема Интегрированной системы информационных ресурсов РАН (ИСИР РАН) как автоматизированная среда доступа к библиотечным каталогам и данным по степени доступности и использования материалов библиотек Институтов РАН (совместный доклад авторов из ВЦ РАН, БЕН РАН и Центра научных телекоммуникаций и информационных технологий РАН).

В рамках программы секции 14 (Архивы) можно отметить доклад Павла Браславского (Уральское отделение РАН) и Tomas Krichel (USA), посвященный технологии организации архивов данных, доступных через Web: форматам и использованию метаданных в стандарте Dublin Core в соответствие с проектом OAI (Open Archive Initiative) для академических организаций, их документов и коллекций. В докладах коллективов авторов из Института проблем передачи информации РАН и Института систем информатики СО РАН характеризовалась технология создания и использования тексто-графической базы данных по истории Российской фундаментальной науки на основе фондов архива РАН и персональных архивов.

Секция 15 (Индексирование документов). В рамках этой секции было представлено два доклада авторов из СПбГУ. В докладе А. Корявко и И. Некрестьянова рассматривалась проблема построения поисковых систем в Web, когда используются альтернативные подходы к оценке "полезности" Web-страниц для конкретного пользователя, опирающиеся, например, не только на информацию о содержимом документа, но и на метаинформацию как о документе, так и о самом пользователе (о его предыдущих запросах, какие документы и сколько времени он их просматривал после выполнения запроса и т.д., что позволяет более эффективно проводить ранжирование документов). Рассматриваются возможности одного из представителей методов, использующих информацию о связях между Web-страницами : алгоритма Клейнберга для ранжирования страниц Web.

Средства для поиска в среде слабоструктурированных данных отмечены в докладе Б.С. Хвостиченко и Б.А. Новикова.

3. Экспертное Совещание ИИТО ЮНЕСКО "Электронные библиотеки в образовании"

Во время конференции, 15 октября 2002 г., Институт Информационных Технологий в Образовании ЮНЕСКО, в кооперации с конференцией RCDL'2002, ОИЯИ и ИПИ РАН провел Международное Экспертное Совещание "Электронные библиотеки в образовании". В соответствии с планом деятельности ИИТО ЮНЕСКО, развивается проект по применению электронных библиотек в образовании. Целью Экспертного совещания явилось обсуждение Аналитического обзора "Электронные библиотеки в образовании", подготовленного международной группой экспертов. Содержание Аналитического обзора было представлено на совещании проф. Л.А. Калиниченко.

В обзоре рассматриваются технологические аспекты создания электронных библиотек на основе нескольких анализируемых проектов США и Европы. Так, в США разрабатывается Национальная электронная библиотека (NSDL) в области науки, технологий, инженерии, математики, ориентированная в первую очередь на использование в образовании и науке. NSDL (первая версия системы планируется в декабре 2002 г.) разрабатывается как интегрированная распределенная информационная среда. NSDL обеспечивает возможность доступа к разнообразным цифровым объектам - не только текстовым, но и мультимедийным, геопространственным объектам, объектам, представляющим результаты измерений, изучаемые образцы и даже дорогостоящие инструменты для дистанционного доступа. Ввиду такого разнообразия информационных объектов, NSDL поддерживает множественный набор различных стандартов метаданных. Интерфейсы таких систем эволюционируют от традиционных, основанных на ключевых словах, в сторону более семантических интерфейсов (например, использование в качестве запросов реперных отметок Атласа грамотности, созданного в США). Планируется весьма быстрое развитие NSDL, включая рассмотрение этой библиотеки как подструктуры федерального правительства.

Примером части NSDL является CITIDEL - интерактивная электронная библиотека в области компьютерных и информационных технологий, а также сетевая электронная библиотека диссертаций (NDLTD). Это - распределенные инфраструктуры с многоязыковым доступом, поддержкой множественных методов поиска информации и сбора метаданных. NDLTD поддерживается на государственном уровне в ряде стран - в Австралии, Бразилии, Германии, Индии, Корее, США, а также рядом национальных библиотек (включая Британскую Библиотеку).

Интересным примером высококачественной специализированной библиотеки в области конкретной предметной области является DLESE (the Digital Library for Earth System Education).

Важно, что наряду с поддержкой уже ставших традиционными данных, развиваются инфраструктуры, в которых информационными объектами являются потоки данных, измеряемых в реальном времени (например, данных измерений у поверхности Земли, в верхних слоях атмосферы, радиолокационных измерений, измерений посредством сетей мониторизации гроз, спутниковых наблюдений). В США уже развиты сети данных, предоставляющие такие измерения в реальном времени сотням университетов. Имеются проекты, которые такие потоковые данные сделают частью информации в NSDL.

Развиваются принципиально новые "кибер-инфраструктуры" для исследований и образования, позволяющие по-новому подойти к созданию электронных библиотек. В решетках данных термин xGrid, где x обозначает предметную область, обозначает структуру (например, BioGrid), объединяющую специалистов, информацию и инструменты в этой предметной области. Одной из целей таких решеток является открытая публикация научной информации.

Аналитический обзор рассматривает эволюцию этих проектов по крайней мере в пятилетней перспективе. В нем проанализированы также перспективные методы использования таких библиотек в образовательных целях.

Обзор завершается рекомендациями по следующему этапу проекта ЮНЕСКО - разработке образовательного модуля, ориентированного на различные группы слушателей в развивающихся странах (преподавателей; лиц, принимающих решения; преподавателей курсов повышения квалификации преподавателей).

В обсуждении Аналитического обзора приняли участие Dr. Mary Marlino (UCAR, Boulder, CO, USA), Alex Ushakov (UC in Santa Barbara, CA, USA), Prof. Bernd Wegner (TU Berlin, Germany), Dr. Stephan Koernig (TU Darmstadt, Germany), проф. В.П. Шириков (ОИЯИ, Дубна, Россия), д-р. С.А. Христочевский (ИИТО ЮНЕСКО), проф. А.Г. Марчук (ИСИ СО РАН, Новосибирск, Россия), д-р. В.Н. Захаров (ИПИ РАН) и др. Совещание рекомендовало издать и широко распространить текст Аналитического обзора и перейти к следующему этапу проекта ЮНЕСКО.

4. Решения конференции

На заключительной секции конференции участниками конференции были приняты следующие решения:

§ отметить важность и актуальность тематики конференции для развития научной и практической деятельности специалистов России в области создания и развития электронных библиотек,

  • провести в 2003 году Пятую Всероссийскую конференцию по электронным библиотекам (RCDL’2003) в Санкт-Петербурге,
  • рекомендовать программному комитету следующей конференции способствовать отбору большего числа приглашенных докладов и дальнейшему повышению качества принимаемых докладов,
  • для обеспечения планирования конференций RCDL, их устойчивого развития, преемственности традиций и качества организовать Наблюдательный Совет, в состав которого включить специалистов, имеющих опыт проведения подобных конференций RCDL и им подобных,
  • продолжить работу по укреплению связей конференций RCDL с зарубежными учеными, специалистами и профессиональными обществами.

В статье сделан обзор наиболее значимых усилий по созданию электронных библиотек, проектов развиваемых за рубежом и проблем, встающих перед создателями таких библиотек. Изложены планы РНБ в этом направлении.

The paper summaries the most significant digital library projects abroad, major tasks for digital library developers and plans of the Russian National Library in this direction.

У статті подається огляд найбільш значних зусиль по створенню електронних бібліотек, проектів, що розвиваються за кордоном та проблем, які постають перед розробниками подібних бібліотек. Викладаються плани РНБ у цьому напрямку.

В последние годы библиотечное дело большинства pазвитых стpан получило новое напpавление pазвития. Десятки пpоектов и значительное финансиpование напpавлены на создание электpонных библиотек. Сам термин “Электронная библиотека” не сходит со страниц профессиональных изданий и все чаще и чаще звучит на научных семинарах и конференциях, в средствах массовой информации развитых стран мира. Появление электpонных библиотек вызвано бурным развитием компьютерных технологий и телекоммуникаций, а также все более высокими тpебованиями, которые пользователи пpедъявляют к библиотечно-информационному обслуживанию.

Традиционное библиотечно-информационное обслуживание наряду с достоинствами обладало и рядом серьезных ограничений.

Библиотеки в основном ориентировались только на обслуживание локальных пользователей (читателей). Это приводило к тому, что читатели каждой конкретной библиотеки имели доступ практически только к информационным ресурсам этой библиотеки. Едва ли ни единственной возможностью получить доступ к изданию, которого не было в этой библиотеке - была служба МБА. Но не всякое издание можно посылать по МБА, сама доставка издания по МБА требует определенного времени и денег.

Другое ограничение заключалось в том, что библиотеки сводили задачу информационного обслуживания только к предоставлению доступа читателей к изданиям на традиционных носителях. Новые возможности предоставляемые компьютерами и Интернет, привели к появлению и широкому применению электронных документов, доступных как на различных физических носителях (магнитные ленты, дискеты, CD-ROM и т.д.), так и в режиме удаленного доступа.

Желая преодолеть эти ограничения библиотеки направили свои усилия на предоставление доступа к электронным документам и ресурсам Интернет, как имеющихся в собственных фондах, так и доступных из других библиотек или информационных центров по телекоммуникационным каналам. Для обеспечения этого потребовалось разрешить ряд проблем технологического, правового и технического порядка, а также пересмотреть концепцию работы библиотеки. В результате появился термин “электронная библиотека”. Создателям электронных библиотек становится очевидным необходимость объединения усилий всех заинтересованных сторон для успешной реализации поставленной цели. В результате работы по созданию электронных библиотек, вначале осуществлявшиеся в рамках отдельных организаций, стали проводится в рамках проектов сначала национального, а затем и международного уровней.

Одним из самых пpедставительных междунаpодных пpоектов, напpавленных на создание электpонных библиотек, является "Bibliotheca Universalis", ставящий своей целью создание глобальной сети электpонных библиотек. Пpоект является одним из одиннадцати пpоектов, осуществляемых под эгидой стpан "Большой Семеpки". В момент написания статьи в пpоекте, начавшемся в 1995 году, участвовали:

от Фpанции - Министерство Культуры (Ministиre de la Culture) и Национальная библиотека Франции (Bibliothиque nationale de France)

от Японии - Национальная библиотека Японии (National Diet Library)

от США - Библиотека Конгресса (Library of Congress)

от Великобpитании -Британская Библиотека (The British Library)

от Геpмании - Библиотека Германии (Deutsche Bibliothek)

от Канады - Национальная библиотека Канады (National Library of Canada)

от Италии - Государственная библиотека (Discoteca di Stato)

Наибольшую активность в создании электронных библиотек проявляют библиотеки и информационные центры США. Среди самых заметных проектов назову:

создание в 1995 Национальной Федерации Электронных библиотек (NDLF), объединившую 15 крупнейших университетских библиотек проекты Национальной Электронной библиотеки и Память Америки, осуществляемые Библиотекой Конгресса

Работы проводимые в США стали одним из движущих факторов по развитию этого направления в других странах. Неслучайно, что в своих проектах они опираются на достижения американских коллег. В 1993 году Архивы Австралии, Австралийский Совет по Библиотекам и Информационным Службам, Национальное Агентство по сохранности и Национальный Архив звука и кино создали рабочий орган для разработки рекомендаций по работе с электронными материалами. Работы ведутся в рамках более широкой программы "Навстречу к Федерации 2001" (в 2001 году будет столетие Австралийской Федерации). С 1995 года этот рабочий орган стал активно использовать работы совместной рабочей группы Комиссии по Сохранности и Доступности (CPA) США и Группы Научных библиотек (RLG), которая носит название "Рабочая Группа по архивации электронной информации" ().

В Европе существует большое количество проектов, как национального уровня, так и международных, осуществляемых под эгидой Совета Европы.

Возможно наиболее продвинута в этом направлении Великобритания, где работы организованы в рамках программы eLib, объединяющей более 60 проектов.

Какова цель такого значительного числа проектов? Для успешной работы электронных библиотек необходимо решить много проблем по разным направлениям:

Технологические вопросы описания электронных документов (правила описания, дополнения в формат библиографической записи, определение решений по присвоению уникальных идентификаторов электронным документам)

постановка на учет в библиотеках электронных изданий, созданных и хранящихся на серверах сторонних организаций

организация долговременной сохранности фондов электронных библиотек

Технические

методика перевода традиционных изданий в электронную форму

методика перевода оригинал-макетов издательств в формат, принятый в электронных библиотеках

средства предотвращения несанкционированного доступа к фондам электронных библиотек

технология хранения электронных документов

разработка средств контроля оплаты за право доступа к электронным документам

Правовые

Действие авторского права на электронные документы. Особенности применения национальных правовых актов в условиях доступа к электронным документам зарубежных пользователей.

Внимание специалистов библиотечного дела pазвитых стpан к пpоблеме создания электpонных библиотек понятно: автоматизация библиотек у них pешается уже более 20 лет и к настоящему моменту многие вопpосы, составляющие основу автоматизации pешены. Интеpнет, одноpазовая каталогизация и взаимное использование инфоpмационных pесуpсов дpуг дpуга давно стало пpивычными для наших западных коллег. Российские библиотеки пока значительно отстают в автоматизации библиотечной деятельности и может возникнуть сомнение в своевpеменности pассмотpения вопpосов связанных с созданием электpонных библиотек. Вpемя само дает нам ответ на этот вопpос - библиотеки уже получают электpонные документы, и мы должны опpеделить технологию pаботы с ними во всех библиотечных процессах. Следует также сказать и о необходимости удовлетворять любые информационные потребности наших пользователей.

Электронные документы на дискетах и CD-ROM в качестве приложений к печатным изданиям и в качестве самостоятельных изданий начали поступать в РНБ несколько лет назад. Пока эти поступления были случайны и их количество незначительно, им не уделялось серьезного внимания, но после того как мы стали их получать по обязательному экземпляру и их число возросло, неотложность решения вопросов, связанных с электронными библиотеками, стала очевидной. За неимением отечественного опыта работы с электронными документами, мы начали pаботы с изучения заpубежного опыта и быстpо пpишли к выводу о необходимости выpаботки единых pешений по использованию электpонных документов и созданию электpонных библиотек. В конце 1996 года мы подали в МК заявку на Федеpальную пpогpамму по теме "Электpонные библиотеки: концепция создания", мы также пpедложили pуководству пpоекта ЛИБНЕТ включить эту пpогpамму в число своих подпpоектов. Для кооpдинации усилий всех библиотек России, заинтеpесованных в pазвитии этого напpавления мы подали пpедложение в РБА на создание pабочей гpуппы по электpонным библиотекам и оpганизации pабот на национальном уpовне.

Паpаллельно с усилиями по оpганизации pабот на общеpоссийском уpовне, в самой РНБ начаты pеальные pаботы по изучению pазличных аспектов создания электpонных библиотек:

пеpеведены междунаpодные пpавила описания компьютеpных файлов (ISBD CF). В настоящее вpемя пpоводится их изучение и готовятся пpедложения по их адаптации к pоссийским условиям отдел автоматизации вместе с НМО и НИОБ пpиступили к изучению вопpосов, связанных с автоpскими пpавами на электpонные документы

РНБ совместно с БАН, ЦГПБ и НБ СПбГУ pазpаботал пpоект создания на базе пеpечисленных библиотек службы электpонной доставки документов. Рассматривается возможность расширения проекта за счет организации доставки медицинской периодики, в котором будут задействованы РНБ, медицинские учреждения СПб и ГЦНМБ.

++++++++

3. электронные информационные ресурсы. Типология. Тенденции формирования

ИНФОРМАЦИОННЫЕ РЕСУРСЫ - отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, других информационных системах). Закон РФ "Об информации, информатизации и защите информации" от 20 февраля 1995г. установил, что И.р. являются объектом . Отношения по поводу права собственности на информационные ресурсы регулируются гражданским законодательством РФ.

Виды информационных ресурсов

Остановимся подробнее на том, какие информационные ресурсы могут успешно продаваться через Интернет:

· новостные ленты (online-новости). Достаточно широкому кругу менеджеров компаний различного профиля необходимо узнавать о происходящих в мире событиях незамедлительно. Например, лента финансовых и политических новостей жизненно необходима трейдерам для принятия решений о продажах и покупках на биржах;

· подписки на электронные копии периодических изданий. Некоторые газеты и журналы выпускают свои полные электронные копии и предоставляют к ним доступ. Это платная услуга. В качестве примера можно привести платную подписку на постатейный доступ к электронной версии материалов газеты "Деловой Петербург" ();

· доступ к электронным архивам и базам данных, содержащим информацию по самым разным вопросам. Хорошим примером здесь может послужить информационное агентство Integrum Techno (), предоставляющее платный доступ к своим базам данных. Естественно, что платный доступ к большим объемам информации должен быть дополнен сервисом по поиску необходимых данных в базе. Integrum Techno использует для этих целей специально разработанную информационно-поисковую систему "Артефакт". За доступ к базам данных может взиматься абонентская плата (за неделю, месяц и т. д.), плата за доступ к каждому единичному документу или плата за объем (в мегабайтах) выкачанной информации;

· аналитические отчеты и исследования. Вместо того, чтобы предоставлять клиенту доступ к базам данных, компания может сама, по заказу клиента, провести анализ хранящихся в базе материалов и подготовить для клиента отчет по интересующему его вопросу. Как правило, такой отчет получается качественнее, чем та информация, которую клиент получил бы сам, поскольку сотрудники компании имеют больший опыт в работе с поисковой системой, которой оснащена база данных, и с большей вероятностью не упустят ничего важного;

· собственные аналитические материалы и прогнозы. Наряду с анализом баз данных, компания может своими силами анализировать рынки, политическую и экономическую ситуацию и делать свои прогнозы и исследования. Такая информация тоже может продаваться, хотя услуги по ее предоставлению можно отнести скорее не к информационному бизнесу, а к консультационным услугам

Типы информационных ресурсов

Информация в FTP-архивах разделена на три категории:

  • Защищенная информация, режим доступа к которой определяется ее владельцами и разрешается по специальному соглашению с потребителем. К этому виду ресурсов относятся коммерческие архивы (например, коммерческие версии программ в архивах ftp.microsoft.com или ftp.bsdi.com), закрытые национальные и международные некоммерческие ресурсы (например, работы по международным проектам CES или IAEA), частная некоммерческая информация со специальными режимами доступа (частные благотворительные фонды, например).
  • Информационные ресурсы ограниченного использования, к которым относятся, например, программы класса shareware (Trumpet Winsock, Atis Mail, Netscape, и т.п.). В данный класс могут входить ресурсы ограниченного времени использования (текущая версия Netscape перестанет работать в июне если только кто-то не сломает защиту) или ограниченного времени действия, т.е. пользователь может использовать текущую версию на свой страх и риск, но никто не будет оказывать ему поддержку.
  • Свободно распространяемые информационные ресурсы или freeware, если речь идет о программном обеспечении. К этим ресурсам относится все, что можно свободно получить по сети без специальной регистрации. Это может быть документация, программы или что-либо еще. Наиболее известными свободно распространяемыми программами являются программы проекта GNU Free Software Foundation. Следует отметить, что свободно распространяемое программное обеспечение не имеет сертификата качества, но как правило, его разработчики открыты для обмена опытом.

Из выше перечисленных ресурсов наиболее интересными, по понятным причинам, являются две последних категории, которые, как правило, оформлены в виде FTP-архивов.

В настоящее время доминирующим фактором развития экономики, основанной на знаниях и новейших технологиях, становится развитие инновационной сферы, так как именно в этой сфере происходит превращение научно-технологического продукта в рыночный товар с высокими потребительскими свойствами.

Развитие инновационной сферы требует действенного информационного обеспечения всех стадий инновационного процесса. Основой информационной поддержки инновационных процессов являются структурированные информационные ресурсы и современные информационно-коммуникационные технологии, обеспечивающие эффективное использование участниками инновационных процессов этих информационных ресурсов.

Естественно, сама информация в виде документов и данных еще не есть знания, а лишь сырье для формирования знаний, используемых, в том числе, в инновационных процессах. В этом смысле информация есть сырье для инноваций. В информационных системах проходит процесс переработки этого сырья. Глубина переработки зависит от целей, которые ставятся перед такими системами. Многие информационные системы занимаются рутинной, хотя и очень важной задачей — накоплением и формированием информационных ресурсов по определенным алгоритмам. Другие системы, и их сейчас тоже много, занимаются интеллектуальной обработкой информационных ресурсов и представляют потребителю вполне “обогащенное” сырье, необходимое для информационного обеспечения инновационных процессов. Самые продвинутые информационные системы перерабатывают информационное сырье до серьезного аналитического уровня, годного для информационного обеспечения процессов расширенного воспроизводства знаний и управления.

Воздействие новейших информационно-коммуникационных технологий касается образа жизни людей, их образования и работы, взаимодействия правительства и общества. Они становятся жизненно важным стимулом для людей и общества эффективно использовать знания в целях обеспечения устойчивого экономического развития, повышения общественного благосостояния, развития культурного многообразия и общечеловеческих ценностей. На это было обращено внимание мировой общественности руководителями стран “восьмерки”, которые свое отношение к проблемам развития и использования информационных ресурсов и информационно-коммуникационных технологий выразили в Окинавской хартии глобального информационного общества.

На пути создания информационного общества в целях использования его экономических, социальных и культурных преимуществ предстоит решить ряд ключевых задач:

· проведение экономических и структурных реформ для создания обстановки открытости, эффективности, конкуренции и использования нововведений в дополнении с адаптацией на рынках труда, развитием людских ресурсов и обеспечением социального согласия;

  • рациональное управление макроэкономикой;
  • развитие коммуникационной среды;
  • развитие людских ресурсов, способных отвечать требованиям века информации, посредством образования и пожизненного обучения;
  • активное использование информационно-коммуникационных технологий в государственном секторе для повышения уровня доступности власти для всех граждан.

Усилия международного сообщества в информационной сфере должны сопровождаться согласованными действиями по созданию безопасного и свободного от преступности киберпространства. Мобилизация знаний и ресурсов является необходимым условием для решения проблемы преодоления “цифрового неравенства” внутри государств и между ними. Решение этой проблемы требует установления благоприятных рыночных условий по предоставлению населению услуг в области коммуникаций, организация доступа к информации через сеть учреждений, открытых для широкой публики, совершенствование сетевого доступа, особенно в отсталых городских, сельских и отдаленных районах, обеспечение льготного доступа к информации для людей, пользующихся меньшей социальной защищенностью, людей с ограниченной трудоспособностью, пожилых граждан.

Развитие информационного общества должно сопровождаться развитием людских ресурсов, соответствующих требованиям информационного века. Поэтому требуется создать условия, в которых все граждане могли бы получать навыки работы с современными информационно-коммуникационными технологиями посредством образования, пожизненного обучения и подготовки.

Существует проблема мирового масштаба, связанная с преодолением имеющихся различий в области информации и знаний. Те страны, которые не успевают за все более высокими темпами развития информационно-коммуникационных технологий, оказываются в определенной степени лишенными возможности в полной мере участвовать в жизни информационного общества и экономике. Этот вопрос особенно остро стоит в тех странах, где распространению информационно-коммуникационных технологий препятствует отставание в развитии основных экономических и социальных инфраструктур. Необходимо учитывать разнообразие условий и потребностей, которые сложились в развивающихся странах. Поэтому важную роль должны сыграть собственные инициативы этих стран по принятию и последовательной реализации национальных программ в области информационно-коммуникационных технологий, развития людских ресурсов, имеющих навыки работы с такими технологиями. Решение этой проблемы во многом зависит от эффективного двустороннего и многостороннего сотрудничества между странами, участия международных финансовых институтов, международных организаций, образовательных учреждений, частных групп. Это может существенно способствовать международным усилиям по преодолению “цифрового неравенства”.

На пути соответствующей трансформации своих программ и проектов в информационной сфере находятся и многие авторитетные международные организации. Так, ЮНЕСКО завершила подготовку глобальной информационной программы “Информация для всех” на базе Межправительственной программы по информатике ЮНЕСКО (IIP) и Общей программы по информации ЮНЕСКО (PGI), предусматривающей объединение усилий участников, работающих с информационными ресурсами и информационно-коммуникационными технологиями. Основная цель этой новой программы — сделать информацию и знания доступными для всех, содействовать преодолению разрыва между “информационно богатыми и информационно бедными”. Люди должны быть вовлечены в мировые информационные процессы и получать максимум преимуществ от эффективного доступа к информации.

Создатели программы отмечают, что международное сообщество должно решить такие проблемы как обеспечение качества, надежности и разнообразия информации, нахождение баланса между свободным доступом к информации, честным ее использованием и защитой прав интеллектуальной собственности, сохранением мирового информационного наследия и безопасностью информации частного характера.

Программа “Информация для всех” призвана содействовать:

· поощрению и расширению доступа к информации с помощью соответствующей организации информационных ресурсов, их перевода в электронную форму;

  • обсуждению вопросов этических, правовых и общественных угроз и вызовов в информационном обществе;
  • непрерывному образованию в информационной сфере;
  • использованию международных стандартов и передового опыта в информационной сфере;
  • сетевому взаимодействию в информационной сфере на локальном, национальном, региональном и международном уровнях.

При формировании программы “Информация для всех” учитывались следующие основные исходные данные:

· доступ к информации в настоящее время не является равным и всеобщим, увеличивается разрыв между “информационно богатыми и информационно бедными”;

  • сокращается общественное владение в сфере информации;
  • растут ожидания граждан, желающих более эффективно участвовать в управлении;
  • во многих регионах имеет место неразвитость информационных инфраструктур и недостаток финансовых средств, инвестируемых в информационную сферу;
  • мировое информационное наследие находится в опасности;
  • быстро развиваются информационно-коммуникационные технологии;
  • поддержка технических инфраструктур требует образованной рабочей силы, возрастает значение компьютерной грамотности для получения основного и дополнительного образования в течение всей жизни, появляются новые информационные профессии;
  • возрастает высокими темпами число пользователей информации;
  • изменяются роли информационных организаций в информационном обществе, создаются новые информационные институты и механизмы доступа к информации всех желающих, возрастает роль информационных организаций как контент-провайдеров и их ответственность в защите и сохранении мирового информационного наследия;
  • продолжается взрывной рост объемов информации в электронном и традиционном виде, затрудняется процесс поиска информации в мировых информационных ресурсах, состоящих из триллионов документов;
  • существует сильная коммерциализация и монополизация на рынке средств управления электронной информацией;
  • создаются новые возможности обмена научно-технической информацией и проведения научных исследований с помощью информационно-коммуникационных технологий (виртуальная реальность, виртуальные лаборатории и университеты, управление в научно-технологической сфере с использованием этих технологий и т.п.);
  • появляются новые кибер-культуры с новыми формами культурного выражения и художественного творчества;
  • наряду с расширением возможностей доступа к культурным благам с помощью информационно-коммуникационных технологий, возрастает риск для развития культурного и лингвистического разнообразия.

В рамках указанной программы должны быть получены следующие основные результаты:

· достигнут международный консенсус о всеобщем и равноправном доступе к информации как одного из основных прав человека, об этических и правовых принципах, относящихся к киберпространству;

  • создан клиринг-хаус передового опыта управления, основанного на применении информационно-коммуникационных технологий;
  • установлены принципы и механизмы сохранения мирового информационного наследия;
  • определены международные требования к уровню компьютерной грамотности, создана международная система аккредитации и сертификации деятельности по обучению в информационной сфере;
  • создан портал ЮНЕСКО для доступа к важнейшим информационным организациям мира;
  • созданы национальные точки доступа к бесплатной информации;
  • разработана и организована реализация национальных стратегий по оцифровыванию информации;
  • созданы стандарты для управления и сохранения зафиксированных знаний, стандарты информационного менеджмента;
  • создана всемирная организация мониторинга потребностей и тенденций компьютерного образования;
  • созданы международные требования по обеспечению и поддержанию многоязычия и разнообразия культур в киберпространстве.

Подобные инициативы разрабатываются и другими международными организациями, специализирующимся в области информации и документации. В национальных программах развития информационной сферы, в том числе и в России, указанные выше тенденции также являются преобладающими.

В этом процессе активно участвует и информационная инфраструктура научно-технологического развития России — Государственная система научно-технической информации (ГСНТИ), которая является неотъемлемой частью мировой информационной инфраструктуры.

Развитие Государственной системы научно-технической информации России и ее электронных информационных ресурсов проходило в соответствии с логикой развития подобных информационных систем в других странах. В мировом информационном пространстве этот процесс имеет четыре ярко выраженных этапа, в рамках которых тем или иным электронным информационным ресурсам уделялось первостепенное значение.

Первый этап (семидесятые — первая половина восьмидесятых годов) характеризовался бурным развитием библиографических и реферативных баз данных. На втором этапе (вторая половина восьмидесятых годов) органы научно-технической информации особое внимание уделяли фактографическим (справочным) базам данных. Для третьего этапа (первая половина девяностых годов) в связи с активным развитием телекоммуникационной среды характерно формирование электронных информационных ресурсов органов научно-технической информации и научно-технических библиотек, пригодных к использованию в сетевом режиме.

В настоящее время основное внимание уделяется решению проблемы накопления и использования научно-технической информации как сырья для инноваций. В первую очередь это связано с увязкой библиографических, реферативных и фактографических баз данных с системами информации, работающими с полными текстами документов. Этот этап — начало новой эпохи информационного обеспечения потребителей на основе современных информационно-коммуникационных технологий, которая уже названа эпохой электронных (цифровых) библиотек.

В информационной инфраструктуре научно-технологического развития страны решается широкий спектр задач, в том числе разработка и реализация государственной информационной политики, определение приоритетных направлений развития научно-информационной сферы с учетом критических технологий информационного профиля, формирование и использование государственных и иных информационных ресурсов, информационное обеспечение жизненного цикла продукции, реализация программ и проектов по развитию национальной сети компьютерных телекоммуникаций и высокопроизводительных вычислений, создание и внедрение перспективных информационных технологий, разработка и реализация международных программ и проектов в информационной сфере, содействие рынку информационной продукции и услуг и ряд других.

Постановка и реализация этих задач направлена на достижение основной цели — создание системы эффективного информационного обеспечения процесса расширенного воспроизводства знаний как основы социально-экономического, научно-образовательного, культурного развития страны, совершенствования личности.

Государственная политика России в информационной сфере строится и реализуется с учетом мировых и отечественных тенденций развития информационно-коммуникационной среды. Ее основные целями являются:

· обеспечение прав и свобод граждан на доступ к информации;

  • формирование и развитие в стране информационно-коммуникационной среды, отвечающей национальным интересам и использующей, в первую очередь, отечественные информационные ресурсы и технологии;
  • преодоление “цифрового неравенства” в области информации и знаний как внутри государства, так и вне его (каждый человек должен иметь полноценный доступ к отечественным и зарубежным информационным и коммуникационным системам и сетям);
  • обеспечение прав владельцев и собственников информации от незаконного ее распространения и использования;
  • обеспечение информационной безопасности государства;
  • содействие развитию добросовестной конкуренции и открытию рынков информационных продуктов и информационно-коммуникационных услуг, обеспечивающих благоприятные условия для предоставления населению этих продуктов и услуг;
  • оказание государственной поддержки созданию и развитию отечественных информационных ресурсов и технологий;
  • привлечение отечественных и зарубежных инвестиций в развитие российской информационно-коммуникационной среды;
  • создание и совершенствование законодательной и нормативной базы развития информационно-коммуникационной среды в России;
  • защита авторских прав и прав интеллектуальной собственности на информационные продукты и технологии, а также внедрение механизмов защиты личной жизни человека при обработке личных данных;
  • разработка и внедрение отечественных стандартов и классификационных систем, гармонизированных с международными, в том числе обеспечивающих функциональную совместимость различных информационно-коммуникационных систем и сред;
  • содействие диалогу информационных организаций России с зарубежными партнерами и международными организациями в целях развития международного сотрудничества при решении проблемы создания глобального информационного общества;
  • увеличение объемов и улучшение качества русскоязычных информационных ресурсов и активное их продвижение на мировой информационный рынок;
  • развитие людских ресурсов, отвечающих требованиям создаваемого информационного общества.

Указанные выше стратегические цели отражены в конкретных программах, проектах, законодательных инициативах, международных соглашениях, в реализации которых принимают участие многие информационные организации России

5. Информационные процессы. Характеристика и назначение

Информационные процессы - это процессы, связанные с получением, хранением, обработкой и передачей информации (т.е. действия, выполняемые с информацией). Т.е. это процессы, в ходе которых изменяется содержание информации или форма её представления.

Для обеспечения информационного процесса необходим источник информации, канал связи и потребитель информации. Источник передает (отправляет) информацию, а приемник её получает (воспринимает). Передаваемая информация добивается от источника до приемника с помощью сигнала (кода). Изменение сигнала позволяет получить информацию

Структура информационного процесса

При переносе информации в виде сигнала от источника к потребителю (пояснения на схеме см. в разделе Информация)

она проходит последовательно следующие фазы (говорят – фазы обращения), составляющие информационный процесс:

1. Восприятие (если фаза реализуется технической системой) или сбор (если фаза реализуется человеком) – осуществляет отображение источника информации в сигнал. Здесь определяются качественные и количественные характеристики источника, существенные для решения задач потребителя информации, для чего и собирается или воспринимается информация. Совокупность этих характеристик создает образ источника, который фиксируется в виде сигнала на носителе той или иной природы (бумажном, электронном и т.п.).

2. Передача – перенос информации в виде сигнала в пространстве посредством физических сред любой природы. Включается в информационный процесс, если места выполнения других фаз информационного процесса территориально разобщены.

3. Обработка – любое преобразование информации с целью решения определенных функциональных задач (они определяются потребителем информации). Данная фаза может включать хранение информации как перенос ее во времени.

4. Представление (если потребителем информации является человек) или воздействие (если потребителем является техническая система). В первом случае выполняется подготовка информации к виду, удобному для потребителя (графики, тексты, диаграммы, таблицы и т.д.). Во втором случае вырабатываются управляющие воздействия на технические средства. Этот случай характерен для выпускников специальности "Автоматизация управления технологическими процессами", а потому здесь не рассматривается

 

6. Современное состояние вычислительной техники. Тенденции и перспективы разыития

1. Охарактеризуйте, пожалуйста, состояние области науки, в которой вы работаете, каким оно было примерно 20 лет назад? Какие тогда проводились исследования, какие научные результаты явились самыми значительными? Какие из них не потеряли актуальности на сегодняшний день (что осталось в фундаменте здания современной науки)?

2. Охарактеризуйте сегодняшнее состояние той области науки и техники, в которой вы трудитесь. Какие работы последних лет вы считаете самыми главными, имеющими принципиальное значение?

3. На какие рубежи выйдет ваша область науки через 20 лет? Какие кардинальные проблемы, по-вашему, могут быть решены, какие задачи будут волновать исследователей в конце первой четверти XXI века?

Редакция обратилась к ученым и "специалистам" - авторам журнала - с просьбой ответить на короткую анкету "Вчера, сегодня, завтра", имея в виду проблемы науки, ее достижения и перспективы на будущее. (см. "Наука и жизнь" №№ и № ). Продолжаем публикацию ответов.

Для людей, работавших в области вычислительной техники, середина 1980-х годов была очень значимым и интересным периодом. То было время больших машин. Но уже появились микропроцессоры. В начале 80-х годов произошел переход на 32-разрядные микропроцессоры, которые производили фирмы "Vax" и "Intel". Микропроцессоры довольно широко применялись, но даже специалисты не представляли, какую революцию произведут они в вычислительной технике. А будущий создатель первых персональных компьютеров, фирма IBM, в то время выпускала в основном большие машины.

Итак, в середине 80-х годов работали большие машины и мини-машины. Очень популярны были машины фирмы DEC. Тогда шла "холодная война", и одним из ее следствий стал интерес к супермашинам Крея и им подобным. Сеймур Крей был гениальным инженером, но его ошибка заключалась в том, что он ориентировался на микросхемы, изготовленные по старой технологии. Она ему была лучше известна, хорошо им просчитана, предсказуема. Крей так и не перешел на большие интегральные схемы. Но на уровне механической интеграции он был гением. Он не интересовался новыми разработками, но возможности старых интеграль ных схем использовал виртуозно. В этом смысле американца можно сравнить с Паганини, который, по преданию, сыграл концерт на одной струне, или с Левшой, подковавшим блоху. А с окончанием "холодной войны" его роль и вовсе сошла на нет.

Что касается технологии микроэлектроники, то на кристалле удавалось разместить 150-200 тыс. транзисторов, то есть до микронных размеров еще не дошли. Первый процессор с элементами размером в микрон и миллионом транзисторов на чипе появился в начале 90-х годов, и это был "Пентиум".

В технологии микросхем мы все время догоняли американцев и пытались сократить отставание, копируя их достижения. Это был не лучший путь, так как развитие технологии шло по экспоненте. Еще в конце 60-х годов Гордон Мур, один из основателей фирмы "Intel", сформулировал эмпирический закон, согласно которому за каждые полтора года количество транзисторов на кристалле микросхемы увеличивается в два раза. И вот уже в течение десятков лет этот закон работает без исключений. Так вот, уменьшив наш разрыв с американцами, скажем с четырех лет до двух, мы так же отставали от них по качеству микросхем, как и на старте.

Совсем другое положение сложилось в области архитектуры машин. Здесь команде, состоявшей из ученых и инженеров Института точной механики и вычислительной техники (ИТМиВТ), которым руководил С. А. Лебедев, удалось значительно обойти американцев и выйти на ведущие позиции в мире. У них была креевская машина с архитектурой "pipeline", или, как называл ее Сергей Алексеевич Лебедев, "водопровод". В ней со сдвигом в несколько тактов происходило наложение операций, благодаря чему машины работали быстрее.

В СССР еще в 1979 году построили машину "Эльбрус" с архитектурой "super scalar" (мы это название произносим на русский манер "суперскаляр"). Эта архитектура характерна тем, что за один такт генерируется несколько команд, и на аппаратном уровне машина сама переставляет и распараллеливает их. К 1985 году мы уже практически создали "суперскаляр" второго поколения. К слову, IBM перешла на процессоры с архитектурой "super scalar" только в начале 90-х годов.

Тогда же стало понятно, что "суперскаляры" наряду с очевидными достоинствами имеют и недостаток. Они были очень сложными по устройству. Ведь машина должна следить, какие команды можно переставить, а какие нельзя. Если идет одна команда, а следом за ней другая, то необходимо проанализировать, чтобы вторая команда не использовала результат предыдущей, и только в этом случае их можно переставить. Причем поскольку мы ставили цель запускать несколько команд за один такт, то и весь этот сложный анализ нужно было проводить в течение одного такта.

И все же архитектура "суперскаляр" оказалась очень успешной, и мы смогли обыграть наших конкурентов из Научно-исследовательского центра электронно-вычислительной техники (НИЦЭВТ). По скорости "Эльбрус" в два раза превосходил самую мощную машину единой серии ЕС-1066, хотя в обеих машинах использовалась одна и та же элементная база.

"Эльбрус" - и это тоже заслуга нашего коллектива из ИТМиВТ - был абсолютно защищенной машиной с той точки зрения, что если бы он работал в сети, то не боялся бы никаких вирусов. А ведь этого до сих пор не удалось достичь нигде - ни у нас, ни на Западе. Такой иммунитет объяснялся тем, что наша машина понимала типы данных, то есть отличала, скажем, адрес от числа. Высокая безопасность упрощала и программирование: программы очень легко отлаживались.

Быстро развивались методы программирования. Программы писали не только на ассемблере; широко использовались языки высокого уровня: Фортран, Алгол-68, PL-1, Паскаль, Симула и многие другие. Еще не появились единоличные лидеры, какими стали языки С++ или Java.

Приходится остановиться и на некоторых не очень светлых страницах истории отечественных ЭВМ. В США, Японии, Великобритании работало множество фирм, создававших технологию, процессоры, машины, и они доказывали преимущества своих достижений в конкурент-ной борьбе. У нас в стране в те годы существовал монополист: НИЦЭВТ. В эту организацию "согнали" основную массу специалистов и заставили копировать разработки компаний IBM и DEC. Это, конечно, была неверная стратегия. На наш институт тоже давили из министерства, требовали, чтобы мы присоединились к НИЦЭВТу. Но С. А. Лебедев категорически отказался, заявив, что будет делать только свои машины - сначала БЭСМ, потом "Эльбрусы". (Кстати, название "Эльбрус" предложил Сергей Алексеевич: в молодости он увлекался альпинизмом, совершал восхождения на Эльбрус.) И он оказался прав. Наши работы по-настоящему продвигали электронно-вычислительную технику не только в СССР, но и в мире.

К сожалению, нас очень подводила микроэлектроника. В Зеленограде на заводе "Ангстрем" обещали сделать процессор для "Эльбруса" с элементами размером 1,25 мкм, но он так и не заработал. Технология была плохая, отсталая, надежность микросхем очень низкая. Те же трудности испытывал и НИЦЭВТ с машинами единой серии. Чтобы машина работала без сбоев, мы резервировали узлы и таким образом обеспечива ли функциональную надежность.

Оглядываясь назад, можно с полной уверенностью сказать, что такого прогресса, какой наблюдался в течение двадцати лет в вычислительной технике, человечество еще не знало в своей истории. Главным событием этого периода стали появление и невиданная экспансия персональных компьютеров, ресурсы которых ныне намного превосходят возможности больших машин того времени. Лишь в памяти остались пишущие машинки, арифмометры, чертежные доски да и многие другие предметы, окружавшие нас и считавшиеся постоянными спутниками человека.

Микропроцессоры, эти крошечные вычислительные машины, работают в технологических установках, в бытовых приборах, на транспорте - проще перечислить области деятельности, где их нет. Кто мог представить подобное?

Сейчас в микроэлектронике появились методы, которые позволяют размещать на кристалле до 1,5 млрд транзисторов. Другими словами, за два десятилетия число транзисторов в микросхемах возросло на четыре порядка. Можно снять шляпу перед технологами! Во-первых, они постоянно уменьшали размеры элементов микросхем, и ныне минимальные размеры структур составляют 0,13 и даже 0,09 мкм. Во-вторых, заметно выросли сами кристаллы - до 200 мм2 (квадрат со сторонами 15 мм), тогда как первые большие интегральные схемы (БИС) изготавливали на кристаллах площадью 25-50 мм2. И если по поводу размеров элементов можно не вдаваться в подробные пояснения, то на значении больших кристаллов стоит чуть остановиться.

Кристаллы для микросхем изготовляют по групповой технологии на круглых кремниевых пластинах (мы между собой называем их "вафлями" за внешнее сходство: кристаллы напоминают квадратные ячейки на поверхности этого кондитерского изделия). Стоимость кристаллов в большей степени зависит не от сложности интегральной схемы (при миллионных объемах выпуска этот параметр существен ного значения не имеет), а от процента выхода годных изделий. Хотя в цехах предприятий микроэлектроники поддерживается идеальная чистота, в воздухе летают отдельные пылинки. Стоит одной из них оказаться на поверхности кристалла, он окажется бракованным. Естественно, чем больше поверхность кристалла, тем больше вероятность, что в число годных он не попадет.

Более того, сейчас уже научились склеивать кристаллы. Берут "вафлю", режут на кристаллы, кладут один на другой, совмещая контактные площадки, и склеивают: получается опять вафля, напоминающая шахматную доску. Благодаря этому обеспечивается хорошая связь с памятью, объем которой достиг фантастических значений.

Немыслимо выросли и тактовые частоты: первые "пентиумы" работали на частотах меньше 1 МГц, а сегодня никого не удивляют частоты в несколько гигагерц.

Основной архитектурой стали суперскаляры. Сменилось уже несколько поколений машин с такой архитектурой, и техника эта очень отточена. Если в первом "Эльбрусе" мы генерировали две команды за такт, то теперь генерируют до четырех команд за такт, хотя это очень трудно и сейчас (но с точки зрения производительности нужно учитывать и то, что тактовая частота выросла во много тысяч раз).

В настоящее время мы переходим на постсуперскалярную архитектуру, или архитектуру широкого командного слова. Ее принципы были заложены в конце 80-х годов в машине "Эльбрус-3". И теперь та сложная функция распараллеливания задач, которую выполняла сама машина аппаратным способом, возложена на программное обеспечение. В 1991 году мы построили такую машину, но не успели ее отладить (вспомните, какое было время). Десять лет спустя подобную философию, которую мы заложили в архитектуру, использовали американцы, создавая Itanium.

Сейчас одни разработчики делают суперскаляры, другие предпочитают архитектуру широкого командного слова, но, как бы то ни было, приоритет в создании обеих архитектур принадлежит нам.

Переложив тяжелую ношу планирования и распараллеливания задач на плечи программного обеспечения, мы столкнулись с новой проблемой. При разработке очередной модели машины для нее создается и своя система команд. Машины оказываются несовместимыми: новая машина "не понимает" двоичных кодов, на которых работала старая. Нужно предпринять какие-то меры, чтобы восстановить "взаимопонимание".

Нашим ответом на такой вызов стало создание технологии двоичной компиляции. Вообще двоичной компиляцией занимались давно, но ее технология всегда была далека от совершенства. Одну часть кодов удавалось переводить, другую - нет. Программы, прежде чем запустить, приходилось подолгу отлаживать.

Новизна нашего подхода заключалась в том, что мы заложили двоичную компиляцию в архитектуру машины, а раньше ее разрабатывали для перевода кодов с одной известной машины на другую. С нашей технологией пользователь не знает, с какой машиной работает. Ему кажется, что это Intel, а на самом деле это "Эльбрус".

Конечно, одним из самых заметных событий прошедших лет стало появление Интернета. Но при всех благах, которыми он обеспечивает пользователей, к сожалению, приходится констатировать, что всемирная паутина превратилась в настоящую помойку, - вирусы просто жить не дают. И поэтому те принципы безопасности, иммунитета от вирусов, которые закладывалась в "Эльбрусы", приобрели особую значимость. Если бы тогда мир пошел по намеченному нами направлению… А сейчас внедрение этой технологии приведет к потере совместимости операционных систем. Добиться совместимости не так и сложно, но в этом случае у неуязвимой машины пропадает иммунитет. Остается один выход: менять весь парк существующих компьютеров и программного обеспечения. Несмотря на миллиардные убытки, которые несет человечество от компьютерных вирусов, такой радикальный шаг вряд ли пока реален. Ведь каждый пользователь в душе надеется, что его минует сия чаша и вирус не тронет его машину. Но вопрос уже обсуждается.

Что касается языков программирования, то произошла их конвергенция. Остались С++, Java, немного используется Фортран. С точки зрения стандартизации это, может быть, и правильно. Но останавливается прогресс. Представьте такую ситуацию: на Земле оставили два языка, скажем английский и китайский. Конечно, людям станет проще общаться. Но ведь в каждом языке есть своя изюминка, свои нюансы, которые на другом языке не выразишь. Например, много интересного было в нашем языке Эль-76, разработанном для "Эльбруса".

За двадцать лет куда более богатыми стали возможности общения человека с машиной. Появилась прекрасная графика (в том числе трехмерная), изменились линии связи. В области связи основной упор делается на развитие беспроводных линий. Например, система Wi-Fi обеспечивает внутри отдельного здания связь между компьютерами и возможность выхода в Интернет. Портативные компьютеры уже оснащают встроенными адаптерами беспроводной связи. В ближайшее время начнется развертывание системы Wi-Max. По масштабам она будет сопоставима с сетью сотовой телефонной связи.

Много внимания уделяется энергопотреблению. Не потому, конечно, что кристалл берет много энергии из электрической сети. Дело в трудностях с его охлаждением. Сейчас рассеиваемая кристаллом мощность приближается к сотне ватт. Однако, принимая во внимание крошечные размеры микросхемы, мы увидим, что плотность выделяемой мощности примерно та же, что и в двигателе реактивного самолета. Там даже проще отводить тепло, поскольку выше градиент температуры (микросхему нельзя нагревать выше 100°С). И теперь конструкторам персональных компьютеров приходится решать проблему, над которой бились создатели больших машин: как охлаждать кристалл. Нынешние вентиляторы шумят, часто ломаются - вообще не очень удобны. И уже появились системы охлаждения для ПК на жидких хладагентах: как в домашних холодильниках.

Делать прогнозы на десятки лет вперед в любой области очень трудно, а в вычислительной технике - многократно труднее, учитывая, какими темпами она развивается. В данном случае можно обратиться к опыту англичан, всего несколько десятков лет назад отменивших средневековый закон, по которому за предсказание погоды можно было лишиться головы: если предсказываешь, значит, можешь влиять, значит, общаешься с нечистой силой.

Но если серьезно, то, конечно, быстродействие будет расти, объемы памяти будут расти. Хотелось бы - и, как я говорил, это вполне реально - обеспечить безопасность вычислений, сделать безопасным Интернет. Кроме очевидных выгод это повысит эффективность работы программистов, поскольку во много раз упростится отладка программ. Машины научатся распознавать информацию. Если в распознавании речи уже достигнуты реальные успехи, то распознавание графических образов пока пребывает в зачаточном состоянии. В идеале машина должна выбрать из движущегося изображения и перевести в закодированный вид такую, скажем, информацию: вот Путин, вот Гинзбург, вот Бабаян, один в синем костюме, другой в сером, третий в джемпере, вот они пожали друг другу руки, повернулись, пошли и т.д. Тогда передавать всю эту информацию можно будет не пикселями, как сейчас, а быстро, в компактном виде.

Ноябрь 2004 года.

*Intel Fellow - самое высокое научное звание в корпорации "Intel". Его носят 42 человека из 85-тысячного коллектива компании. Б. Бабаян стал первым в Европе обладателем такого титула.

7. Традиционные информационные ресурсыю Типология, тенденции формирования

Тв, радио, газеты и тп

8. Персональные компьютеры-роль в развитии информатизации библиотек

1. Электронный каталог – основа для работы современной библиотеки. Создание
электронного каталога, два пути — «вручную» или ретроконверсия - их плюсы и
минусы. Опыт создания ЭК библиотеки №27.
2. Использование электронного каталога читателями и сотрудниками.
3. Перспективы дальнейшего развития: создание единого информационного
пространства, корпоративная каталогизация и т.д.

9. информационные ресурсы как национальный стратегический ресурс

ой как важно!

Общие принципы построения современных ЭВМ

Основным принципом построения всех современных ЭВМ является программное управление. В основе его лежит представление алгоритма решения любой задачи в виде программы вычислений.

“Алгоритм - конечный набор предписаний, определяющий решение задачи посредством конечного количества операций”. “Программа ( для ЭВМ) - упорядоченная последовательность команд, подлежащая обработке” (стандарт ISO 2382/1-84). Следует заметить, что строгого, однозначного определения алгоритма, равно как и однозначных методов его преобразования в программу вычислений, не существует. Принцип программного управления может быть осуществлен различными способами. Стандартом для построения практически всех ЭВМ стал способ, описанный Дж. фон Нейманом в 1945 г. при построении еще первых образцов ЭВМ. Суть его заключается в следующем.

Все вычисления, предписанные алгоритмом решения задачи, должны быть представлены в виде программы, состоящей из последовательности управляющих слов-команд. Каждая команда содержит указания на конкретную выполняемую операцию, место нахождения (адреса) операндов и ряд служебных признаков. Операнды - переменные, значения которых участвуют в операциях преобразования данных. Список (массив) всех переменных (входных данных, промежуточных значений и результатов вычислений) является еще одним неотъемлемым элементом любой программы.

Для доступа к программам, командам и операндам используются их адреса. В качестве адресов выступают номера ячеек памяти ЭВМ, предназначенных для хранения объектов. Информация ( командная и данные: числовая, текстовая, графическая и т.п.) кодируется двоичными цифрами 0 и 1. Поэтому различные типы информации, размещенные в памяти ЭВМ, практически неразличимы, идентификация их возможна лишь при выполнении программы, согласно ее логике, по контексту.

Каждый тип информации имеет форматы - структурные единицы информации, закодированные двоичными цифрами 0 и 1. Обычно все форматы данных, используемые в ЭВМ, кратны байту, т.е. состоят из целого числа байтов.

Последовательность битов в формате, имеющая определенный смысл, называется полем. Например, в каждой команде программы различают поле кода операций, поле адресов операндов. Применительно к числовой информации выделяют знаковые разряды, поле значащих разрядов чисел, старшие и младшие разряды.

Последовательность, состоящая из определенного принятого для данной ЭВМ числа байтов, называется словом. Для больших ЭВМ размер слова составляет четыре байта, для ПЭВМ - два байта. В качестве структурных элементов информации различают также полуслово, двойное слово и др.

Схема ЭВМ, отвечающая программному принципу управления, логично вытекает из последовательного характера преобразований, выполняемых человеком по некоторому алгоритму (программе). Обобщенная структурная схема ЭВМ первых поколений представлена на рис. 1.1.

В любой ЭВМ имеются устройства ввода информации (УВв), с помощью которых пользователи вводят в ЭВМ программы решаемых задач и данные к ним. Введенная информация полностью или частично сначала запоминается в оперативном запоминающем устройстве (ОЗУ), а затем переносится во внешнее запоминающее устройство (ВЗУ), предназначенное для длительного хранения информации, где преобразуется в специальный программный объект - файл. “Файл - идентифицированная совокупность экземпляров полностью описанного в конкретной программе типа данных, находящихся вне программы во внешней памяти и доступных программе посредством специальных операций (ГОСТ 20866 - 85)”.

Рис. 1.1. Структурная схема ЭВМ первого и второго поколений

При использовании файла в вычислительном процессе его содержимое переносится в ОЗУ. Затем программная информация команда за командой считывается в устройство управления (УУ).

Устройство управления предназначается для автоматического выполнения программ путем принудительной координации всех остальных устройств ЭВМ. Цепи сигналов управления показаны на рис. 1.1 штриховыми линиями. Вызываемые из ОЗУ команды дешифрируются устройством управления:

определяются код операции, которую необходимо выполнить следующей, и адреса операндов, принимающих участие в данной операции.

В зависимости от количества используемых в команде операндов различаются одно-, двух-, трехадресные и безадресные команды. В одноадресных командах указывается, где находится один из двух обрабатываемых операндов. Второй операнд должен быть помещен заранее в арифметическое устройство (для этого в систему команд вводятся специальные команды пересылки данных между устройствами).

Двухадресные команды содержат указания о двух операндах, размещаемых в памяти (или в регистрах и памяти). После выполнения команды в один из этих адресов засылается результат, а находившийся там операнд теряется.

В трехадресных командах обычно два адреса указывают, где находятся исходные операнды, а третий - куда необходимо поместить результат.

В безадресных командах обычно обрабатывается один операнд, который до и после операции находится на одном из регистров арифметико-логического устройства (АЛУ). Кроме того, безадресные команды используются для выполнения служебных операций (очистить экран, заблокировать клавиатуру, снять блокировку и др.).

Все команды программы выполняются последовательно, команда за командой, в том порядке, как они записаны в памяти ЭВМ (естественный порядок следования команд). Этот порядок характерен для линейных программ, т.е. программ, не содержащих разветвлений. Для организации ветвлений используются команды, нарушающие естественный порядок следования команд. Отдельные признаки результатов r(r = 0, r < 0, r > 0 и др.) устройство управления использует для изменения порядка выполнения команд программы.

АЛУ выполняет арифметические и логические операции над данными. Основной частью АЛУ является операционный автомат, в состав которого входят сумматоры, счетчики, регистры, логические преобразователи и др. Оно каждый раз перенастраивается на выполнение очередной операции. Результаты выполнения отдельных операций сохраняются для последующего использования на одном из регистров АЛУ или записываются в память. Результаты, полученные после выполнения всей программы вычислений, передаются на устройства вывода (УВыв) информации. В качестве УВыв могут использоваться экран дисплея, принтер, графопостроитель и др.

Современные ЭВМ имеют достаточно развитые системы машинных операций. Например, ЭВМ типа IBM PC имеют около 200 различных операций (170 - 230 в зависимости от типа микропроцессора). Любая операция в ЭВМ выполняется по определенной микропрограмме, реализуемой в схемах АЛУ соответствующей последовательностью сигналов управления (микрокоманд). Каждая отдельная микрокоманда- это простейшее элементарное преобразование данных типа алгебраического сложения, сдвига, перезаписи информации и т.п.

Уже в первых ЭВМ для увеличения их производительности широко применялось совмещение операций. При этом последовательные фазы выполнения отдельных команд программы (формирование адресов операндов, выборка операндов, выполнение операции, отсылка результата) выполнялись отдельными функциональными блоками. В своей работе они образовывали своеобразный конвейер, а их параллельная работа позволяла обрабатывать различные фазы целого блока команд. Этот принцип получил дальнейшее развитие в ЭВМ следующих поколений. Но все же первые ЭВМ имели очень сильную централизацию управления, единые стандарты форматов команд и данных, “жесткое” построение циклов выполнения отдельных операций, что во многом объясняется ограниченными возможностями используемой в них элементной базы. Центральное УУ обслуживало не только вычислительные операции, но и операции ввода-вывода, пересылок данных между ЗУ и др. Все это позволяло в какой-то степени упростить аппаратуру ЭВМ, но сильно сдерживало рост их производительности.

В ЭВМ третьего поколения произошло усложнение структуры за счет разделения процессов ввода-вывода информации и ее обработки (рис. 1.2).

Рис. 1.2. Структурная схема ЭВМ третьего поколения

Сильносвязанные устройства АЛУ и УУ получили название процессор, т.е. устройство, предназначенное для обработки данных. В схеме ЭВМ появились также дополнительные устройства, которые имели названия: процессоры ввода-вывода, устройства управления обменом информацией, каналы ввода-вывода (КВВ). Последнее название получило наибольшее распространение применительно к большим ЭВМ. Здесь наметилась тенденция к децентрализации управления и параллельной работе отдельных устройств, что позволило резко повысить быстродействие ЭВМ в целом.

Среди каналов ввода-вывода выделяли мультиплексные каналы, способные обслуживать большое количество медленно работающих устройств ввода-вывода (УВВ), и селекторные каналы, обслуживающие в многоканальных режимах скоростные внешние запоминающие устройства (ВЗУ).

В персональных ЭВМ, относящихся к ЭВМ четвертого поколения, произошло дальнейшее изменение структуры (рис. 1.3). Они унаследовали ее от мини-ЭВМ.

Рис. 1.3. Структурная схема ПЭВМ

Соединение всех устройств в единую машину обеспечивается с помощью общей шины, представляющей собой линии передачи данных, адресов, сигналов управления и питания. Единая система аппаратурных соединений значительно упростила структуру, сделав ее еще более децентрализованной. Все передачи данных по шине осуществляются под управлением сервисных программ.

Ядро ПЭВМ образуют процессор и основная память (ОП), состоящая из оперативной памяти и постоянного запоминающего устройства (ПЗУ). ПЗУ предназначается для записи и постоянного хранения наиболее часто используемых программ управления. Подключение всех внешних устройств (ВнУ), дисплея, клавиатуры, внешних ЗУ и других обеспечивается через соответствующие адаптеры - согласователи скоростей работы сопрягаемых устройств или контроллеры - специальные устройства управления периферийной аппаратурой. Контроллеры в ПЭВМ играют роль каналов ввода-вывода. В качестве особых устройств следует выделить таймер - устройство измерения времени и контроллер прямого доступа к памяти (КПД) - устройство, обеспечивающее доступ к ОП, минуя процессор.

Способ формирования структуры ПЭВМ является достаточно логичным и естественным стандартом для данного класса ЭВМ.

Децентрализация построения и управления вызвала к жизни такие элементы, которые являются общим стандартом структур современных ЭВМ:

Модульность построения, магистральность, иерархия управления.

Модульность построения предполагает выделение в структуре ЭВМ достаточно автономных, функционально и конструктивно законченных устройств (процессор, модуль памяти, накопитель на жестком или гибком магнитном диске).

Модульная конструкция ЭВМ делает ее открытой системой, способной к адаптации и совершенствованию. К ЭВМ можно подключать дополнительные устройства, улучшая ее технические и экономические показатели. Появляется возможность увеличения вычислительной мощности, улучшения структуры путем замены отдельных устройств на более совершенные, изменения и управления конфигурацией системы, приспособления ее к конкретным условиям применения в соответствии с требованиями пользователей.

В современных ЭВМ принцип децентрализации и параллельной работы распространен как на периферийные устройства, так и на сами ЭВМ (процессоры). Появились вычислительные системы, содержащие несколько вычислителей (ЭВМ или процессоры), работающие согласованно и параллельно. Внутри самой ЭВМ произошло еще более резкое разделение функций между средствами обработки. Появились отдельные специализированные процессоры, например сопроцессоры, выполняющие обработку чисел с плавающей точкой, матричные процессоры и др.

Все существующие типы ЭВМ выпускаются семействами, в которых различают старшие и младшие модели. Всегда имеется возможность замены более слабой модели на более мощную. Это обеспечивается информационной, аппаратурной и программной совместимостью. Программная совместимость в семействах устанавливается по принципу снизу-вверх, т.е. программы, разработанные для ранних и младших моделей, могут обрабатываться и на старших, но не обязательно наоборот.

Модульность структуры ЭВМ требует стандартизации и унификации оборудования, номенклатуры технических и программных средств, средств сопряжения - интерфейсов, конструктивных решений, унификации типовых элементов замены, элементной базы и нормативно-технической документации. Все это способствует улучшению технических и эксплуатационных характеристик ЭВМ, росту технологичности их производства.

Децентрализация управления предполагает иерархическую организацию структуры ЭВМ. Централизованное управление осуществляет устройство управления главного, или центрального, процессора. Подключаемые к центральному процессору модули (контроллеры и КВВ) могут, в свою очередь, использовать специальные шины или магистрали для обмена управляющими сигналами, адресами и данными. Инициализация работы модулей обеспечивается по командам центральных устройств, после чего они продолжают работу по собственным программам управления. Результаты выполнения требуемых операций представляются ими “вверх по иерархии” для правильной координации всех работ.

Иерархический принцип построения и управления характерен не только для структуры ЭВМ в целом, но и для отдельных ее подсистем. Например, по этому же принципу строится система памяти ЭВМ.

Так, с точки зрения пользователя желательно иметь в ЭВМ оперативную память большой информационной емкости и высокого быстродействия. Однако одноуровневое построение памяти не позволяет одновременно удовлетворять этим двум противоречивым требованиям. Поэтому память современных ЭВМ строится по многоуровневому, пирамидальному принципу.

В состав процессоров может входить сверхоперативное запоминающее устройство небольшой емкости, образованное несколькими десятками регистров с быстрым временем доступа (единицы нс). Здесь обычно хранятся данные, непосредственно используемые в обработке.

Следующий уровень образует кэш-память или память блокнотного типа. Она представляет собой буферное запоминающее устройство, предназначенное для хранения активных страниц объемом десятки и сотни Кбайтов. Время обращения к данным составляет 10-20 нс, при этом может использоваться ассоциативная выборка данных. Кэш-память, как более быстродействующая ЗУ, предназначается для ускорения выборки команд программы и обрабатываемых данных. Сами же программы пользователей и данные к ним размещаются в оперативном запоминающем устройстве (емкость - миллионы машинных слов, время выборки - до 100 нс).

Часть машинных программ, обеспечивающих автоматическое управление вычислениями и используемых наиболее часто, может размещаться в постоянном запоминающем устройстве (ПЗУ). На более низких уровнях иерархии находятся внешние запоминающие устройства на магнитных носителях:

на жестких и гибких магнитных дисках, магнитных лентах, магнитооптических дисках и др. Их отличает более низкое быстродействие и очень большая емкость.

Организация заблаговременного обмена информационными потоками между ЗУ различных уровней при децентрализованном управлении ими позволяет рассматривать иерархию памяти как единую абстрактную кажущуюся (виртуальную) память. Согласованная работа всех уровней обеспечивается под управлением программ операционной системы. Пользователь имеет возможность работать с памятью, намного превышающей емкость ОЗУ. ,

Децентрализация управления и структуры ЭВМ позволила перейти к более сложным многопрограммным (мультипрограммным) режимам. При этом в ЭВМ одновременно может обрабатываться несколько программ пользователей.

В ЭВМ, имеющих один процессор, многопрограммная обработка является кажущейся. Она предполагает параллельную работу отдельных устройств, задействованных в вычислениях по различным задачам пользователей. Например, компьютер может производить распечатку каких-либо документов и принимать сообщения, поступающие по каналам связи. Процессор при этом может производить обработку данных по третьей программе, а пользователь - вводить данные или программу для новой задачи, слушать музыку и т.п.

В ЭВМ или вычислительных системах, имеющих несколько процессоров обработки, многопрограммная работа может быть более глубокой. Автоматическое управление вычислениями предполагает усложнение структуры за счет включения в ее состав систем и блоков, разделяющих различные вычислительные процессы друг от друга, исключающие возможность возникновения взаимных помех и ошибок (системы прерываний и приоритетов, защиты памяти). Самостоятельного значения в вычислениях они не имеют, но являются необходимым элементом структуры для обеспечения этих вычислений.

Как видно, полувековая история развития ЭВТ дала не очень широкий спектр основных структур ЭВМ. Все приведенные структуры не выходят за пределы классической структуры фон Неймана. Их объединяют следующие Традиционные признаки [53]:

 ядро ЭВМ образует процессор - единственный вычислитель в структуре, дополненный каналами обмена информацией и памятью;

 линейная организация ячеек всех видов памяти фиксированного размера;

 одноуровневая адресация ячеек памяти, стирающая различия между всеми типами информации;

 внутренний машинный язык низкого уровня, при котором команды содержат элементарные операции преобразования простых операндов;

 последовательное централизованное управление вычислениями;

 достаточно примитивные возможности устройств ввода-вывода. Несмотря на все достигнутые успехи, классическая структура ЭВМ не обеспечивает возможностей дальнейшего увеличения производительности. Наметился кризис, обусловленный рядом существенных недостатков:

 плохо развитые средства обработки нечисловых данных (структуры, символы, предложения, графические образы, звук, очень большие массивы данных и др.);

 несоответствие машинных операций операторам языков высокого уровня;

 примитивная организация памяти ЭВМ;

 низкая эффективность ЭВМ при решении задач, допускающих параллельную обработку и т.п.

Все эти недостатки приводят к чрезмерному усложнению комплекса программных средств, используемого для подготовки и решения задач пользователей.

В ЭВМ будущих поколений, с использованием в них “встроенного искусственного интеллекта”, предполагается дальнейшее усложнение структуры; В-первую очередь это касается совершенствования процессов общения пользователей с ЭВМ (использование аудио-, видеоинформации, систем мультимедиа и др.) , обеспечения доступа к базам данных и базам знаний, организации параллельных вычислений. Несомненно, что этому должны соответствовать новые параллельные структуры с новыми принципами их построения. В качестве примера укажем, что самая быстрая ЭВМ фирмы IBM в настоящее время обеспечивает быстродействие 600 MIPS (миллионов команд в секунду), самая же большая гиперкубическая система nCube дает быстродействие 123.103 MBPS. Расчеты показывают, что стоимость одной машинной операции в гиперсисте-ме примерно в тысячу раз меньше. Вероятно, подобными системами будут обслуживаться большие информационные хранилища.

++++

10. Типы информационно-поисковых систем

Информационно-поисковые системы

02.11.00

Поисковые системы в интернете на сегодняшний день являются единственным способом доступа пользователя к информации, расположенной в сети. Я имею в виду самый широкий смысл понятия "информация". При этом как инструмент, поисковые системы не могут удовлетворить запросы пользователей, но за отсутствием альтернатив...

Вообще говоря, информационно-поисковая система (сокращенно, ИПС) это такая "штука", которая получает на входе набор документов (база поиска) и еще один документ в качестве искомого, и выдает в результате оценки релевантности каждого из документов искомому. После этого можно отсортировать документы из базы поиска в соответствии с релевантностью. Вообще говоря, понятие релевантности в ИПС --- ключевое: насколько точно она будет рассчитываться, настолько качественной будет ИПС. Все остальные параметры (размер используемых индексов, скорость работы и прочее) в принципе, не особенно важны.

Я об этом имею некоторое представление, потому что сам написал поисковую систему для интернет-сайтов... только, как водится, на тот момент, когда я ее начал писать, о важности понятия "релевантности" я и не догадывался, поэтому ИПС получилась "как у всех", так как я отталкивался от алгоритмов поиска, а не от оценки релевантности. Собственно, это можно приводить в качестве примера подхода к задаче "от сохи".

Теоретически, релевантность можно оценивать многими способами; лучше всего, если программа будет считать ее исходя из соответствия смысла двух документов. Другое дело, что выделение смысла... хм... само по себе задача не простая (мягко говоря) и в общем еще не решенная. Частности же таковы, что все сводится к поиску слов в рубрикаторах, для которых этот смысл известен, или построению графов с информацией о языковой структуре предложения.

Современные ИПС, применяемые в интернете, для обеспечения приемлемой скорости поиска, накладывают ограничения на формат искомого документа и на оценку релевантности. Документ обычно задается в виде логического выражения, а релевантность строится исходя из контекста. То есть, можно поискать документы, в которых находятся одновременно слова "Вася" и "Петя", но нельзя искать документы, по смыслу соответствующие фразе "Вася дружит с сестрой Пети".

Под "документами, соответствующими по смыслу", я подразумеваю, например, следующие тексты:

  • Вася дружит с девушкой. У мамы этой девушки есть сын по имени Петя.
  • У сестры Пети есть много поклонников. Один из них --- Вася.

Если искать по ключевым словам "Вася", "Петя" и "сестра", то, например, первый документ из вышеприведенных найден не будет, а вот что-то в духе "У Пети нет сестры, поэтому Васе приходится дружить с сестрой Коли" --- найдется. Работы в направлении "поиска по смыслу", конечно же, ведутся, но пока что чего-либо, приспособленного для интернета, нет.

Поисковыми системами пользуются множество людей. При этом достаточно велика вероятность того, что приход человека по ссылке из поисковой системы будет "в жилу" сайту, т.е. целевой для него (сами понимаете, что "целевой хит" много полезнее, чем простое посещение "на три клика"). Соответственно, в качестве поиска заинтересованы и владельцы сайтов, и пользователи поисковых систем.

Свойством современных ИПС в интернете является то, что пользователь должен уметь сформулировать свой запрос в виде набора ключевых слов. То есть, если он ищет какую-то информацию по интересующей его тематике, то пользователь должен быть способен выделить ключевые слова, по которым надо будет производить контекстный поиск. Если он этого сделать не сможет, то вряд ли кто-нибудь сможет ему в чем-то помочь... из-за этого, кстати, как мне кажется, новопоявившийся сервис InternetHelp.com, который предоставляет услуги по поиску в интернете посредством своих операторов (в смысле, людей), не особенно удачен: все равно оператор может найти что-либо только в том случае, когда пользователь (или, быть может будет вернее, клиент) сможет внятно сформулировать, что же он хочет найти. А если человек сможет это сделать, то ему прямая дорога к использованию традиционных поисковых систем.

В качестве примера, могу привести несколько запросов к поисковым системам, в результате которых люди попадали ко мне на страницу. Есть, к примеру, строка запроса "фотографию медведя"... Запрос "какой язык программирования использует Microsoft" просто вывел меня из себя минут на 15. Был запрос "Курск инопланетяне"... Особенно мне больно за тех, кто попадает ко мне на страничку с запросом "как установить TeX" ;-) Они точно попадают туда, где я сообщаю о том, что не буду рассказывать о процессе инсталяции TeX'а. Заранее извиняюсь перед тем человеком, который попадет по аналогичному запросу сюда, я не хотел :-) Это я все к тому, что запрос надо уметь формулировать. Если этого не уметь, то никакая ИПС не поможет...

Кстати, как вы думаете, что чаще всего ищут? Ну да, правильно. Именно это и ищут. Опять же, к слову сказать, я видел страницу, на которой был только один баннер, счетчик TOP100, и 100КБ текста, состоящего из повторяющихся слов, которые люди употребляют при поиске порнографии. Только не надо ничего выдумывать: у меня эту страничку выкачал робот, когда обходил URL'ы из некоторого списка, в котором эта страничка уже была. А смешно то, что TOP100 показывал чуть-ли не миллион посещений... куда уж тут мне с "фотографией медведя". Вы хоть представьте себе: миллион (!) людей, которых ждало разочарование на этой странице! Прямо скажем, жестоко.

Недавно Дмитрий Завалишин (dz) написал о том, что Интернет --- это несколько корневых DNS-серверов. Красивое выражение... как и не особенно правильное. Все дело в том, что популярными ресурсами можно управлять и так при помощи некоторого "рубильника" (при этом необязательно, что бы "рубильник" был, как в случае DNS, "виртуальным"; существует множество иных способов "реального" давления). А вот управлять множеством "непопулярных" ресурсов, на которых находится просто дикое количество самой разной информации, как "угодной", так и "неугодной" тем самым высшим силам, которые могут убрать DNS-сервера, не представляется возможным.

И что будет, если пропадут крупные поисковые системы? Или просто "очистятся" поисковые базы? Тогда "ой". Это я к тому, что поисковые системы --- одна из самых важных компонент интернета. Так сказать, пользовательский интерфейс.

Резюме

Поисковыми системами надо уметь пользоваться. Если этого умения нет, то искать можно долго... очень долго. Или ждать интеллектуальных систем поиска. Использование же людей для улучшения качества поиска не сильно поможет общему горю, потому что оператор вообще, скорее всего, не знает предметной области поиска, что скажется на его результативности в худшую сторону.

Ссылки по теме

http://www.google.com

Поисковая система Google. Рекомендую.

http://cooler.irk.ru/cl140800.

Статья про поисковые системы у Cooler'а.

http://cooler.irk.ru/cl190800.

Продолжение статьи "про поиск".

http://www.sai.msu.su:7000/sem

Краткое описание ИПС с семантическим поиском "Excalibur".

http://www.searchtools.com

Сайт, посвященный описанию различных поисковых систем.

Типа ИПЯ: определение особенности назначение

Информационно-поисковый  язык.

В  настоящее  время быстрый  рост  количества, сложности  и  срочности  информационных  запросов, вызванный  непрерывным  увеличением  численности  специалистов, а  также  количества  и   сложности  решаемых  ими  научно-технических  задач  и  быстрый  рост  фонда  документов, в  котором  необходимо  производить  информационный  поиск, делает  задачу  механизации  процедуры  информационного  поиская  все  более  актуальной. Своевременная, точная  и  полная  выдача  научных  документов  в  ответ  на  многочисленные  и  разнообразные  информационные  запросы  приобретает  характер  задачи  массового  обслуживания, которая  может  быть  успешно  решена  лишь  путем  применения  соответствующих  средств  механизации  и  автоматизации. Чтобы  процедуру  сопоставления  поисковых  образов  документов  с  информационным  запросом  можно  было  выполнить  механически, не  вникая  в  их  смысл, необходимо  их  выразить  на  определенном  языке, слова  и  фразы  которого  обладали  бы  смысловой  однозначностью. Этот  язык - информационно-поисковый.

Информационно-поисковый  язык (ИПЯ) ­­- это  специализированный  искусственный  язык, предназначенный  для  описания  (выражения)  центральных  тем  или  предметов  и  формальных  характеристик (тип  документа, авторы, название  издательства, язык  документа  и т. п.)  документов  среди  множества  других - и/или  для  выражения  содержания  информационных  запросов  и  поиска  нужных  документов. Информационный  запрос, выраженный  на  информационно-поисковом  языке можно  механически  сравнивать  с  поисковыми  образами документов, тоже  выраженными  на  этом  языке. Если  эти  два  выражения  полностью  совпадают или  первое  является  частью  второго, то  документ  считается  отвечающим  на  информационный  запрос  и  выдается  потребителю. В  одной  ИПС  часто  применяется  не  один, а  два  разных  ИПЯ: один - для  индексирования  документов, а  другой - для  индексирования  информационных  запросов.

К  идеальному  ИПЯ  предъявляют  следующие  требования: ИПЯ  должен  располагать  лексико-грамматическими  средствами, необходимыми  для  точного  выражения  центральной  темы  или  предмета  любого  текста  (документа); ИПЯ  не  должен  быть  двусмысленным, т. е.  каждая  запись  на  нем  должна  допускать  одно, и  только  одно, истолкование; ИПЯ  не  должен  содержать  элементов, которые  как-то  связывают  сообщение  с  автором  или  адресатом  этого  сообщения; ИПЯ  должен  быть  удобным  для  алгоритмического  сопоставления  и  отождествления  поисковых  образов  документов  с  записями, выражающих  центральные  темы  или  предметы  документов  и  темы  информационных  запросов.

Любой  письменный  язык,  в  том  числе  ИПЯ, состоит  по  крайней  мере, из  алфавита, словарного  состава  и  грамматики. В  ИПЯ  используются  все  или  некоторые  буквы  латинского  или  кириллического  алфавита, арабские  цифры, пунктуационные  знаки, а  также  специальные  символы. Словарный  состав  ИПЯ  обычно  задается  одним  из  следующих  способов: перечислением  всех  без  исключения  лексических  единиц (коды  или  шифры  слов, словосочетанийи  выражений  естественного  языка); перечислением  лишь  ограниченного  числа  исходных  лексических  единиц  и  формулированием  правил  построения  из  них  любых  других  лексических  единиц; формулированием  правил  использования  в  качестве  лексических  единиц  ИПЯ  слов  и  словосочетаний  соответствующего  естественного  языка. ИПЯ  должен  иметь  развитую  систему  грамматических  средств, которая  позволяла  бы  точно  и  исчерпывающе  описывать  любые  ситуации, но  при  этом  не  порождала  бы  синтаксической  синонимии.

Когда  какому-либо  документу  присваивается  поисковый  образ, то  этот  документ  обычно  включается  в  более  или  менее  сложный  класс, именем  которого  служит  данный  поисковый  образ.

Для  эффективного  использования  ИПЯ  в  нем  дожны  быть  выявлены  и  эксплицитно  (в  явном  виде) выражены  важнейшие  парадигматические  отношения  между  словами. Парадигматические  отношения  носят  логический  характер  и  определяются  содержанием  понятий, которые  выражаются  словами.

Для  оценки  сравнительной   эффективности  различных  ИПЯ (предкоординированные: перечисленные  классификации (иерархические  классификации, алфавитно-предметные классификации), фасетные классификации; посткоординируемые: дескрипторные  языки, семантические коды, синтагматические языки; язык библиографических  ссылок) может  быть  использовано  понятие  семантической  силы  языка, которое  характеризует  смысловыразительные  возможности  ИПЯ  и  показывает, насколько  данный  ИПЯ  в  своей  коммуникативной  функции  уступает  естественному  языку. 

Ни  один  из  известных  ныне  типов  и  видов  ИПЯ  не  является  одинаково  высокоэффективным для  решения  всевозможных  информационно-поисковых  задач  при  любых  условиях  его  использования. Для  каждого  типа  или  вида  ИПЯ, обладающего  своими  достоинствами  и  недостатками  существуют  условия, в  которых  заложенные  в  нем  возможности  раскрываются  наиболее  полно. Именно  наличием  таких  условий  должен  прежде  всего  определяться  выбор  ИПЯ  для  любой  создаваемой  ИПС.

Информационно-поисковый язык (ИПЯ)

Information retrieval language

Информационно-поисковый язык - формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов с целью последующего хранения и поиска.

Вербальный информационно-поисковый язык

Вербальный информационно-поисковый язык - информационно-поисковый язык, использующий для представления своих лексических единиц слова и выражения естественного языка в их орфографической форме.

Грамматика информационно-поискового языка

Information retrieval language grammar

Грамматика информационно-поискового языка - правила формирования поисковых образов и поисковых предписаний из лексических единиц информационно-поискового языка.

Дескрипторный информационно-поисковый язык

Информационно-поисковый язык дескрипторного типа; Дескрипторный язык

Descriptor language

Дескрипторный информационно-поисковый язык - информационно-поисковый язык, предназначенный для координатного индексирования документов и информационных запросов посредством дескрипторов и/или ключевых слов.

Документальный информационно-поисковый язык

Documentary language

Документальный информационно-поисковый язык - информационно-поисковый язык, предназначенный для индексирования (частей) документов с целью последующего хранения и поиска.

>> Информационная классификационная система

Классификационная система

Информационная классификационная система - средство формализованного представления содержания документов, данных и информационных запросов посредством кодов или описаний классов логически упорядоченного множества понятий.
Информационные классификационные системы являются одним из типов информационно-поисковых языков.

Классификационный информационно-поисковый язык

Информационно-поисковый язык классификационного типа

Classificational information retrieval language

Классификационный информационно-поисковый язык - информационно-поисковый язык, предназначенный для индексирования (частей) документов и информационных запросов посредством понятий и кодов некоторой выбранной классификации документов (классификационной системы).
Классификационные информационно-поисковые языки эффективно используются в автоматизированных ИПС промышленного назначения.

>> Лексическая единица информационно-поискового языка (ЛЕ)

Information retrieval language lexical unit

Лексическая единица информационно-поискового языка - обозначение отдельного понятия, принятое в информационно-поисковом языке и неделимое в этой функции.
Лексические единицы могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов, а также эквивалентные им кодовые или символические обозначения искусственного языка.

Объектно-признаковый информационно-поисковый язык

Объектно-признаковый информационно-поисковый язык - фактографический информационно-поисковый язык, предназначенный для индексирования описаний фактов в виде перечня объектов (предметов) с указанием относящихся к ним признаков (свойств) и соответствующих значений признаков.

>> Предметная рубрика

Subject heading

Предметная рубрика - элемент информационно-поискового языка, представляющий собой краткую формулировку темы на естественном языке.

Фактографический информационно-поисковый язык

Фактографический информационно-поисковый язык - информационно-поисковый язык, предназначенный для индексирования описаний фактов и информационного поиска в фактографических информационных массивах.

Язык ключевых слов

Key-word language

Язык ключевых слов - информационно-поисковый язык, предназначенный для индексирования документов и информационных запросов посредством ключевых слов.

Язык предметных рубрик

Предметизационный информационно-поисковый язык

Subject headings language

Язык предметных рубрик - информационно-поисковый язык, предназначенный для индексирования (частей) документов и информационных запросов посредством предметных рубрик.

Базы и банки данных

банки и базы данных. Введение.

ключевые слова: банк данных, база данных, интегрированные банки данных, интерфейсы для работы с банкими данных.

Термины "банк данных" и "база данных" являются очень близкими синонимами для обозначения некоторого структурированного массива информации. Предполагается, что банки данных содержат информацию, с которой можно производить достаточно ограниченное число манипуляций (поиск, просмотр), в то время как базы данных предоставляют возможность какой-то специальной обработки информации (с помощью специально написанных программ). Тем не менее, для простого пользователя не всегда очевидна закономерность выбора между этими двумя близкими терминами в том или ином случае. Поэтому банки и базы данных можно представлять как суть одно и тоже, с исторически сложившимся отнесением конкретных массивов информации либо к базам, либо к банкам данных. (По крайней мере, в настоящем курсе это делается именно так).

Ба́за да́нных (БД) — структурированный организованный набор данных, описывающих характеристики какой-либо физической или виртуальной системы.

«Базой данных» часто упрощённо или ошибочно называют Системы Управления Базами Банных (). Нужно различать набор данных (собственно БД) и , предназначенное для организации и ведения баз данных ().

[] Структура БД

Организация структуры БД формируется исходя из следующих соображений:

1. Адекватность описываемому объекту/системе — на уровне концептуальной и логической модели.

2. Удобство использования для ведения учёта и анализа данных - на уровне так называемой физической модели.

Виды концептуальных и логических моделей БД — сетевая модель, иерархическая модель, реляционная модель (ER-модель), многомерная модель, объектная модель.

Таким образом, по виду модели БД разделяются на:

На уровне физической модели электронная БД представляет собой файл или их набор в формате , , , , либо в специализированном формате конкретной СУБД. Также в СУБД в понятие физической модели включают специализированные виртуальные понятия, существующие в ёё рамках — таблица, табличное пространство, сегмент, куб, и т.д.

В настоящее время наибольшее распространение получили реляционные базы данных. Картотеками пользовались до появления электронных баз данных. Сетевые и иерархические базы данных считаются устаревшими, объектно-ориентированные пока никак не стандартизированы и не получили широкого распространения. Некоторое возрождение получили иерархические базы данных в связи с появлением и распространением формата XML.

Для поиска и получения необходимой информации из биологических баз данных существует специально разработанное програмное обеспечение. Как правило, поставщик базы данных предоставляет и необходимый для работы с этой базой инструментарий. Кроме этого, некоторые базы данных могут иметь копии (например библиографическая база данных MEDLINE), доступ к которым через свои интерфейсы предлагают независимые организации.

Основной тенденцией в развитии современных биологических банков и баз данных можно назвать стремление к их интеграции, созданию перекрестных ссылок между ними (например, между библиографической ссылкой на статью, описывающую какой-то ген, и собственно нуклеотидной последовательностью этого гена). Такой подход позволяет быстро находить и получать исчерпывающую информацию по определенной теме.

 (On-line Analytical Processing) - Многомерные .

OLAP используется при обработке данных из различных источников. Эти программные продукты позволяют реализовать множество различных представлений данных и характеризуются тремя основными чертами: многомерное представление данных; сложные вычисления над данными; вычисления, связанные с изменением данных во времени.

Объектно-ориентированная база данных — , в которой данные оформлены в виде моделей объектов, включающих прикладные программы, которые управляются внешними событиями.

Реляционная база данных — , основанная на . Слово «реляционный» происходит от «relation» (отношение). Для работы с реляционными БД применяют .

Теория реляционных баз данных была разработана доктором из компании в году. В реляционных базах данных все данные представлены в виде простых таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные. Запросы к таким таблицам возвращают таблицы, которые сами могут становиться предметом дальнейших запросов. Каждая база данных может включать несколько таблиц. Кратко особенности реляционной базы данных можно сформулировать следующим образом:

  • Данные хранятся в таблицах, состоящих из столбцов ("атрибутов") и строк ("записей");
  • На пересечении каждого столбца и строчки стоит в точности одно значение;
  • У каждого столбца есть своё имя, которое служит его названием, и все значения в одном столбце имеют один тип.
  • Запросы к базе данных возвращают результат в виде таблиц, которые тоже могут выступать как объект запросов.

Строки в реляционной базе данных неупорядочены - упорядочивание производится в момент формирования ответа на запрос.

Общепринятым стандартом языка работы с реляционными базами данных является .

Иерархическая модель состоит из с указателями от родительских объектов к потомкам, соединяя вместе связанную информацию.

Иерархические базы данных могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй — объекты второго уровня и т. д.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможно, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами.

Например, если иерархическая база данных содержала информацию о покупателях и их заказах, то будет существовать объект «покупатель» () и объект «заказ» (дочерний). Объект «покупатель» будет иметь указатели от каждого заказчика к физическому расположению заказов покупателя в объект «заказ».

В этой модели запрос, направленный вниз по иерархии, прост (например: какие заказы принадлежат этому покупателю); однако , направленный вверх по иерархии, более сложен (например, какой покупатель поместил этот заказ). Также, трудно представить не-иерархические данные при использовании этой модели.

Примером иерархической базой данных может служить и каталог папок Windows.

К основным понятиям сетевой модели относятся: уровень, элемент (узел), связь.

Узел — это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами . В сетевой структуре каждый элемент может быть связан с любым другим элементом.

Сетевые базы данных подобны , за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию.

Несмотря на то, что эта модель решает некоторые проблемы, связанные с иерархической моделью, выполнение простых запросов остается достаточно сложным процессом.

Также, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами если необходимо изменить структуру данных, то нужно изменить и приложение.

Картотека — название происходит от «карто-» и «тека», то есть собрание, хранилище (как библиотека — книгохранилище). Внимание обращается на сущность хранящихся в «-теке» предметов: книг, карточек.

С картотеками мы встречаемся часто в — знаменитые шкафы с многочисленными карточками, на которых отражено содержимое библиотеки — библиотеки.

Обычно сведения на карточке отображаются в определенном заранее установленном порядке.

Были найдены эффективные методы и средства поиска карточек в картотеке — например карты с краевой .

СУБД и текстовые редакторы

Система управления базами данных

[]

Материал из Википедии — свободной энциклопедии

(Перенаправлено с )

Перейти к: ,

Систе́ма управле́ния ба́зами да́нных (СУБД) — специализированная программа (чаще комплекс программ), предназначенная для манипулирования . Для создания и управления СУБД необходима в той же степени, как для разработки программы на алгоритмическом языке необходим .

Содержание

[убрать]

// [] Основные функции СУБД

Обычно современная СУБД содержит следующие компоненты:

  • ядро, которое отвечает за управление данными во внешней и оперативной памяти и журнализацию,
  • процессор языка базы данных, обеспечивающий оптимизацию запросов на извлечение и изменение данных и создание, как правило, машинно-независимого исполняемого внутреннего кода,
  • подсистему поддержки времени исполнения, которая интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД
  • а также сервисные программы (внешние утилиты), обеспечивающие ряд дополнительных возможностей по обслуживанию информационной системы.

[] Классификация СУБД

[] По модели данных

По типу управляемой базы данных СУБД разделяются на:

[] По архитектуре организации хранения данных

  • локальные СУБД (все части локальной СУБД размещаются на одном компьютере)
  • распределенные СУБД (части СУБД могут размещаться на двух и более компьютерах)

[] По способу доступа к БД

Архитектура «файл — сервер» не имеет сетевого разделения компонентов диалога и использует компьютер для функции отображения, что облегчает построение графического интерфейса. «Файл-сервер» только извлекает данные из файлов, так что дополнительные пользователи добавляют лишь незначительную нагрузку на ЦП и каждый новый клиент добавляет вычислительную мощность сети. Минус: высокая загрузка сети.

На данный момент файл-серверные СУБД считаются устаревшими.

Примеры:

См. также .

Примеры: , , /.

Встраиваемая СУБД — , которая позволяет унифицированным образом хранить большие объёмы данных на локальной машине. Доступ к данным может происходить через либо через особые функции СУБД. Встраиваемые СУБД быстрее обычных клиент-серверных и не требуют установки сервера, поэтому востребованы в локальном ПО, которое имеет дело с большими объёмами данных (например, ).

Примеры: , , один из вариантов .

Текстовый редактор

[]

Материал из Википедии — свободной энциклопедии

Перейти к: ,

Окно текстового редактора

Те́кстовый реда́ктор — , предназначенная для создания и изменения , а также их на , вывода на , фрагментов текста и т.п.

Содержание

[убрать]

// [] Типы текстовых редакторов

Условно выделяют два типа редакторов.

ориентирован на работу с последовательностью символов в . Такие редакторы обеспечивают расширенную функциональность — , строк, , конвертация , показ кодов символов и т.п. Иногда их называют редакторы кода, так как основное их предназначение — написание компьютерных .

текстовых редакторов имеет расширенные функции текста, внедрения в него и , и . Такие редакторы часто называют и предназначены они для создания различного рода , от личных писем до официальных бумаг. Классический пример — .

Так же выделяют более общий класс программ — . По сути, такие среды представляют собой полноценную рабочую среду, в которой можно решать самые разнообразные задачи: с помощью надстроек они позволяют писать и читать письма, веб-каналы, работать в и , вести дневник, управлять списками адресов и задач. Представители этого класса — , , и из операционной системы . Такие программы могут служит . В любом случае, последние всегда содержат текстовый редактор как необходимый инструмент программирования.

[] Популярные текстовые редакторы (первого рода)

  • EditPlus — текстовый редактор для Windows, предназначенный для программирования и веб-разработки.
  • Emacs. Свободный. — Имеет мощный и очень гибкий настраиваемый интерфейс, поддерживает макросы.
  • EmEditor — платный редактор для Windows-систем. Обеспечивает подсветку текста для разных форматов, модулей, однако интерфейс требует изучения.
  • jEdit. Свободный редактор на .
  • Kate. — Мощный расширяемый свободный текстовый редактор с подсветкой синтаксиса для массы языков программирования и разметки (модули подсветки можно автоматически обновлять по сети). Гибкий настраиваемый интерфейс. Входит в состав KDE.
  • Notepad — входит в состав Microsoft Windows.
  • SciTE Свободный кроссплатформенный редактор с подсветкой синтаксиса для многих языков программирования, фолдингом. Широкие возможности настройки и автоматизации.
  • Notepad++ (), основан на том же движке, что и . Имеет сходные возможности и удобный интерфейс.
  • Vim. Свободный. Разделяет процесс редактирования на режим ввода и коммандный. Даёт неограниченные возможности настройки и автоматизации.
  • GNU nano — Свободный редактор для текстового режима.
  • Pspad — Текстовый редактор с подсветкой синтаксиса, поддержкой скриптов и инструментами для работы с -кодом.
  • TEA [1] — Редактор с сотнями функций обработки текста и разметки в HTML, LaTeX, Docbook.
  • Crimson Editor — текстовый редактор с подсветкой синтаксиса для Microsoft Windows, распространяемый под лицензией GNU GPL.
  • UltraEdit [2].
  • RulNote.
  • EditPad.
  • HippoEdit.
  • MiBEditor.
  • TextMate.

[] Популярные текстовые процессоры (текстовые редакторы второго рода)

17. Информационный поиск

Информационный поиск

Information retrieval

Информационный поиск - в широком смысле - последовательность операций, направленных на предоставление информации заинтересованным лицам. В общем случае информационный поиск состоит из четырех этапов:
-1- уточнение информационной потребности и формулировка запроса;
-2- определение совокупности держателей информационных массивов;
-3- извлечение информации из информационных массивов;
-4- ознакомление пользователя с полученной информацией и оценка результатов поиска.

Автоматизированный информационный поиск

Автоматизированный информационный поиск - информационный поиск с использованием ЭВМ.

Диалоговый поиск

Interactive searching

Диалоговый поиск - автоматизированный информационный поиск, при котором пользователь автоматизированной системы может:
- формулировать информационные запросы в диалоговом режиме;
- корректировать запросы в процессе поиска; и
- получать промежуточные результаты.

>> Информационно-поисковый тезаурус (ИПТ)

Тезаурус

Thesaurus

От греч.Thesauros - запас, сокровище

Информационно-поисковый тезаурус - словарь дескрипторного информационно-поискового языка с зафиксированными в нем парадигматическими отношениями лексических единиц.
Тезаурус содержит список ключевых слов, которыми может быть охарактеризовано содержание документов, с выделением слов, рекомендованных для индексирования (дескрипторов).
Парадигматические отношения указывают общность или противопоставление значений и использования лексических единиц.
Обычно информационно-поисковые тезаурусы оформляются в виде книг. В соответствии с тематическим профилем различают многоотраслевые, отраслевые и узкотематические тезаурусы.

Морфологический поиск

Stemming

Морфологический поиск - возможность поисковой системы искать слово в документах не только в строго заданном виде, но и во всех его морфологических формах.

Пакетный поиск

Deferred searching

Пакетный поиск - автоматизированный информационный поиск, при котором информационные запросы накапливаются в специальном массиве для последующей совместной обработки.

Поиск в определенных полях

Search by field

Поиск в определенных полях - поиск в отдельных полях веб-страниц: title, alt, img и т.д.

Поиск информации

Поиск данных

Information retrieval

Поиск информации - в узком смысле - процесс выявления в массиве информации записей, удовлетворяющих заранее определенному условию поиска (запросу).

Поиск на естественном языке

Free text searching; Natural language searching

Поиск на естественном языке - автоматизированный информационный поиск, для которого информационный запрос формулируется на естественном языке.

Полнотекстовый поиск

Full text searching

Полнотекстовый поиск - автоматизированный информационный поиск, при котором в качестве поискового образа документа используется его полный текст или существенные части текста.

18

Информационно лигические основы вычислительных машин

Глава 2. ИНФОРМАЦИОННО-ЛОГИЧЕСКИЕ ОСНОВЫ ЭВМ

2.1. Системы счисления

Системой счисления называется способ изображения чисел с помощью ограниченного набора символов, имеющих определенные количественные значения. Систему счисления образует совокупность правил и приемов представления чисел с помощью набора знаков (цифр).

Различают позиционные и непозиционные системы счисления. В позиционных системах каждая цифра числа имеет определенный вес, зависящий от позиции цифры в последовательности, изображающей число. Позиция цифры называется разрядом. В позиционной системе счисления любое число можно представить в виде:

An=am-1am-2…aia0*a-1a-2…a-k=am-1*Nm-1+am-2*Nm-2…+a-k*N-k

где ai – i-я цифра числа; k – количество цифр в дробной части числа; m - количество цифр в целой части числа; N – основание системы счисления.

Основание системы счисления N показывает, во сколько раз “вес” г-го разряда больше (i-1) разряда. Целая часть числа отделяется от дробной части точкой (запятой).

Пример 2.1. А10=37.25.

В соответствии с формулой (2.1)это число формируется из цифр с весами рядов:

А10=3*101+7*100+2*10-1+5*10-2.

Теоретически наиболее экономичной системой счисления является система с основанием е=2,71828..., находящимся между числами 2 и 3.

Во всех современных ЭВМ для представления числовой информации используется двоичная система счисления. Это обусловлено:

более простой реализацией алгоритмов выполнения арифметических и логических операций;

более надежной физической реализацией основных функций, так как они имеют всего два состояния (0 и 1);

экономичностью аппаратурной реализации всех схем ЭВМ.

При N=2 число различных цифр, используемых для записи чисел, ограничено множеством из двух цифр (нуль и единица). Кроме двоичной системы счисления широкое распространение получили и производные системы:

 двоичная- {0,1};

 десятичная, точнее двоично-десятичное представление десятичных чисел, - {0, 1,...,9};

 шестнадцатеричная - {0,1,2, ...9, А, В, С, D, Е, F}. Здесь шестнадцатеричная цифра А обозначает число 10,В-число 11, ...,F-число 15;

 восьмеричная (от слова восьмерик) - {0,1,2,3,4,5, б, 7}. Она широко используется во многих специализированных ЭВМ.

Восьмеричная и шестнадцатеричная системы счисления являются производными от двоичной, так как 16 = 24 и 8 = 23. Они используются в основном для более компактного изображения двоичной информации, так как запись значения чисел производится существенно меньшим числом знаков.

Пример 2.2. Число в двоичной, восьмеричной и шестнадцатеричной системах счисления имеет следующее представление:

А2=1100100,101;

Аg=144.5;

A16=64.A;

A2=1*26+1*25+0*24+0*23+1*22+0*21+1*20+1*2-1+0*2-2+1*2-3;

A8=1*82+4*81+4*80+5*8-1;

A16=6*161+4*160+10*16-1.

Представление чисел в различных системах счисления допускает однозначное преобразование их из одной системы в другую. В ЭВМ перевод из одной системы в другую осуществляется автоматически по специальным программам. Правила перевода целых и дробных чисел отличаются

.2.2. Представление других видов информации

Различные виды информации могут быть разделены на две группы: статические и динамические. Так, числовая, логическая и символьная информация является статической - ее значение не связано со временем. В отличие от перечисленных типов вся аудиоинформация имеет динамический характер. Она существует только в режиме реального времени, ее нельзя остановить для более подробного изучения. Если изменить масштаб времени (увеличить или уменьшить), аудиоинформация искажается. Это свойство иногда используется для получения звуковых эффектов.

Видеоинформация может быть как статической, так и динамической. Статическая видеоинформация включает текст, рисунки, графики, чертежи, таблицы и др. Рисунки делятся также на плоские - двухмерные и объемные - трехмерные.

Динамическая видеоинформация - это видео-, мульт- и слайд- фильмы. В их основе лежит последовательное экспонирование на экране в реальном масштабе времени отдельных кадров в соответствии со сценарием.

Динамическая видеоинформация используется либо для передачи движущихся изображений (анимация), либо для последовательной демонстрации отдельных кадров вывода (слайд-фильмы).

Для демонстрации анимационных и слайд-фильмов используются различные принципы. Анимационные фильмы демонстрируются так, чтобы зрительный аппарат человека не мог зафиксировать отдельных кадров. В современных высококачественных мониторах и в телевизорах с цифровым управлением электронно-лучевой трубкой кадры сменяются до 70 раз в секунду, что позволяет высококачественно передавать движение объектов.

При демонстрации слайд-фильмов каждый кадр экспонируется на экране столько времени, сколько необходимо для восприятия его человеком (обычно от 30 с до 1 мин). Слайд-фильмы можно отнести к статической видеоинформации.

По способу формирования видеоизображения бывают растровые, матричные и векторные.

Растровые видеоизображения используются в телевидении, а в ЭВМ практически не применяются.

Матричные изображения получили в ЭВМ наиболее широкое распространение. Изображение на экране рисуется электронным лучом точками.

Информация представляется в виде характеристик значений каждой точки - пиксела (picture element), рассматриваемого как наименьшей структурной единицей изображения. Количество высвечиваемых одновременно пикселов на экране дисплея определяется его разрешающей способностью. В качестве характеристик графической информации выступают: координаты точки (пиксела) на экране, цвет пиксела, цвет фона (градация яркости). Вся эта информация хранится в видеопамяти дисплея. При выводе графической информации на печать изображение также воспроизводится по точкам.

Изображение может быть и в векторной форме. Тогда оно составляется из отрезков линий ( в простейшем случае - прямых), для которых задаются:

начальные координаты, угол наклона и длина отрезка (может указываться и код используемой линии). Векторный способ имеет ряд преимуществ перед матричным: изображение легко масштабируется с сохранением формы, является “прозрачным” может быть наложено на любой фон и т.д.

Способы представления информации в ЭВМ, кодирование и преобразование кодов в значительной степени зависят от принципа действия устройств, в которых эта информация формируется, накапливается, обрабатывается и отображается.

Для кодирования символьной или текстовой информации применяются различные системы: при вводе информации с клавиатуры кодирование происходит при нажатии клавиши, на которой изображен требуемый символ, при этом в клавиатуре вырабатывается так называемый scan-код, представляющий собой двоичное число, равное порядковому номеру клавиши.

Номер нажатой клавиши никак не связан с формой символа, нанесенного на клавише. Опознание символа и присвоение ему внутреннего кода ЭВМ производятся специальной программой по специальным таблицам: ДКОИ, КОИ-7, ASCII (Американский стандартный код передачи информации).

Всего с помощью таблицы кодирования ASCII (табл. 2.1) можно закодировать 256 различных символов. Эта таблица разделена на две части: основную (с кодами от OOh до 7Fh) и дополнительную (от 80h до FFh, где буква h обозначает принадлежность кода к шестнадцатеричной системе счисления

Первая половина таблицы стандартизована. Она содержит управляющие коды (от 00h до 20h и 77h). Эти коды из таблицы изъяты, так как они не относятся к текстовым элементам. Здесь же размещаются знаки пунктуации и математические знаки: 2 lh - !, 26h - &, 28h - (, 2Bh -+,..., большие и малые латинские буквы: 41h - A, 61h - а,...

Вторая половина таблицы содержит национальные шрифты, символы псевдографики, из которых могут быть построены таблицы, специальные математические знаки. Нижнюю часть таблицы кодировок можно заменять, используя соответствующие драйверы - управляющие вспомогательные программы. Этот прием позволяет применять несколько шрифтов и их гарнитур.

Дисплей по каждому коду символа должен вывести на экран изображение символа - не просто цифровой код, а соответствующую ему картинку, так как каждый символ имеет свою форму.

Описание формы каждого символа хранится в специальной памяти дисплея - знакогенераторе.

Высвечивание символа на экране дисплея IBМ PC осуществляется с помощью точек, образующих символьную матрицу.

Каждый пиксел в такой матрице является элементом изображения и может быть ярким или темным. Темная точка кодируется цифрой 0, светлая (яркая)- 1.

Если изображать в матричном поле знака темные пикселы точкой, а светлые - звездочкой, то можно графически изобразить форму символа.

Кодирование аудиоинформации - процесс более сложный. Аудиоинформация является аналоговой. Для преобразования ее в цифровую форму используют аппаратурные средства: аналого-цифровые преобразователи (АЦП), в результате работы которых аналоговый сигнал оцифровывается представляете ся в виде числовой последовательности. Для вывода оцифрованного звука на аудиоустройства необходимо проводить обратное преобразование, которое осуществляется с помощью цифро-аналоговых преобразователей (ЦАП).

Арифметические основы ЭВМ

Все современные ЭВМ имеют достаточно развитую систему команд, включающую десятки и сотни машинных операций. Однако выполнение любой операции основано на использовании простейших микроопераций типа сложения и сдвиг. Это позволяет иметь единое арифметико-логическое устройство для выполнения любых операций, связанных с обработкой информации. Правила сложения двоичных цифр двух чисел А и В представлены в табл. 2.2.

Здесь показаны правила сложения двоичных цифр ai, bi одноименных разрядов с учетом возможных переносов из предыдущего разряда pi-1.

Подобные таблицы можно было бы построить для любой другой арифметической и логической операции (вычитание, умножение и т.д.), но именно данные этой таблицы положены в основу выполнения любой операции ЭВМ. Под знак чисел отводится специальный знаковый разряд. Знак “+” кодируется двоичным нулем, а знак “-” - единицей. Действия над прямыми кодами двоичных чисел при выполнении операций создают большие трудности, связанные с необходимостью учета значений знаковых разрядов:

Многопроцессорные вычислительные комплексы

Многомашинные и многопроцессорные вычислительные комплексы. Определение, типы связей и структурная организация. Особенности программного обеспечения. Примеры отечественных и зарубежных вычислительных комплексов [5].

Вычислительная техника в своем развитии по пути повышения быстродействия ЭВМ приблизилась к физическим пределам. Время переключения электронных схем достигло долей наносекунды, а скорость распространения сигналов в линиях, связывающих элементы и узлы машины, ограничена значением 30 см/нс (скоростью света). Поэтому дальнейшее уменьшение времени переключения электронных схем не позволит существенно повысить производительность ЭВМ. В этих условиях требования практики (сложные физико-технические расчеты, многомерные экономико-математические модели и другие задачи) по дальнейшему повышению быстродействия ЭВМ могут быть удовлетворены только путем распространения принципа параллелизма на сами устройства обработки информации и создания многомашинных и многопроцессорных (мультипроцессорных) вычислительных систем. Такие системы позволяют производить распараллеливание во времени выполнения программы или параллельное выполнение нескольких программ.

В настоящее время исключительно важное значение приобрела проблема обеспечения высокой надежности и готовности вычислительных систем, работающих в составе различных АСУ и АСУ ТП, особенно при работе, в режиме реального времени. Эта проблема решается на основе использования принципа избыточности, который ориентирует также на построение многомашинных или многопроцессорных систем (комплексов). Появление дешевых и небольших по размерам микропроцессоров и микро-ЭВМ облегчило построение и расширило область применения многопроцессорных и многомашинных ВС разного назначения

Различие понятий многомашинной и многопроцессорной ВС поясняет рис.6.1. Многомашинная ВС (ММС) содержит несколько ЭВМ, каждая из которых имеет свою ОП и работает под управлением своей операционной системы, а также средства обмена информацией между машинами. Реализация обмена информацией происходит, в конечном счете, путем взаимодействия операционных систем машин между собой. Это ухудшает динамические характеристики процессов межмашинного обмена данными. Применение многомашинных систем позволяет повысить надежность вычислительных комплексов. При отказе в одной машине обработку данных может продолжать другая машина комплекса. Однако можно заметить, что при этом оборудование комплекса недостаточно эффективно используется для этой цели. Достаточно в системе, изображенной на рис.6.1,а в каждой ЭВМ выйти из строя по одному устройству (даже разных типов), как вся система становится неработоспособной.

Этих недостатков лишены многопроцессорные системы (МПС). В таких системах (рис. 6.1,б) процессоры обретают статус рядовых агрегатов вычислительной системы, которые подобно другим агрегатам, таким, как модули памяти, каналы, периферийные устройства, включаются в состав системы в нужном количестве.

Вычислительная система называется многопроцессорной, если она содержит несколько процессоров, работающих с общей ОП (общее поле оперативной памяти) и управляется одной общей операционной системой. Часто в МПС организуется общее поле внешней памяти.

Под общим полем понимается равнодоступность устройств. Так, общее поле памяти означает, что все модули ОП доступны всем процессорам и каналам ввода-вывода (или всем периферийным устройствам в случае наличия общего интерфейса); общее поле ВЗУ означает, что образующие его устройства доступны любому процессору и каналу.

В МПС по сравнению с ММС достигается более быстрый обмен информацией между процессорами и поэтому может быть получена более высокая производительность, более быстрая реакция на ситуации, возникающие внутри системы и в ее внешней среде, и более высокие надежность и живучесть, так как система сохраняет работоспособность, пока работоспособны хотя бы по одному модулю каждого типа устройств.

Многопроцессорные системы представляют собой основной путь построения ВС сверхвысокой производительности. При создании таких ВС возникает много сложных проблем, к которым в первую очередь следует отнести распараллеливание вычислительного процесса (программ) для эффективной загрузки процессоров системы, преодоление конфликтов при попытках нескольких процессоров использовать один и тот же ресурс системы (например, некоторый модуль памяти) и уменьшение влияния конфликтов на производительность системы, осуществление быстродействующих экономичных по аппаратурным затратам межмодульных связей. Указанные вопросы необходимо учитывать при выборе структуры МПС.

На основе многопроцессорности и модульного принципа построения других устройств системы возможно создание отказоустойчивых систем, или, другими словами, систем повышенной живучести.

Однако построение многомашинных систем из серийно выпускаемых ЭВМ с их стандартными операционными системами значительно проще, чем построение МПС, требующих преодоления определенных трудностей, возникающих при реализации общего поля памяти, и, главное, трудоемкой разработки специальной операционной системы.

Многомашинные и многопроцессорные системы могут быть однородными и неоднородными. Однородные системы содержат однотипные ЭВМ или процессоры. Неоднородные ММС состоят из ЭВМ различного типа, а в неоднородных МПС используются различные специализированные процессоры, например процессоры для операций с плавающей запятой, для обработки десятичных чисел, процессор, реализующий функции операционной системы, процессор для матричных задач и др.

Многопроцессорные системы и ММС могут иметь одноуровневую или иерархическую (многоуровневую) структуру. Обычно менее мощная машина (машина-сателлит) берет на себя ввод информации с различных терминалов и ее предварительную обработку, разгружая от этих сравнительно простых процедур основную, более мощную ЭВМ, чем достигается увеличение общей производительности (пропускной способности) комплекса. В качестве машин-сателлитов используют малые или микро-ЭВМ.

Важной структурной особенностью рассматриваемых ВС является способ организации связей между устройствами (модулями) системы. Он непосредственно влияет на быстроту обмена информацией между модулями, а следовательно, на производительность системы, быстроту ее реакции на поступающие запросы, приспособленность к изменениям конфигурации и, наконец, размеры аппаратурных затрат на осуществление межмодульных связей. В частности, от организации межмодульных связей зависят частота возникновения конфликтов при обращении процессоров к одним и тем же ресурсам (в первую очередь модулям памяти) и потери производительности из-за конфликтов.

Используются следующие способы организации межмодульных (межустройственных) связей:

  • регулярные связи между модулями;
  • многоуровневые связи, соответствующие иерархии интерфейсов ЭВМ;
  • многовходовые модули (в частности, модули памяти);
  • коммутатор межмодульных связей (“Эльбрус” Рис.6.2);
  • общая шина (“СМ ЭВМ” Рис.6.3).

Принципы организации МПС и ММС существенно отличаются в зависимости от их назначения. Поэтому целесообразно различать:

  • ВС, ориентированные в первую очередь на достижение сверхвысокой производительности;
  • ВС, ориентированные в первую очередь на повышение надежности и живучести.