Архиваторы. Программа Архиватор ARJ

Загрузить архив:
Файл: ref-21613.zip (25kb [zip], Скачиваний: 419) скачать

Елабужский Государственный Педагогический Университет

1. Введение. PAGEREF _Toc101272852 h 3

2. Основные виды программ-архиваторов. PAGEREF _Toc101272853 h 4

3. Показатель - степени сжатия файлов. PAGEREF _Toc101272854 h 5

4. Сжатие файлов при архивации. PAGEREF _Toc101272855 h 6

5. Архиватор ARJ. PAGEREF _Toc101272856 h 6

5.1. Назначение архиватора ARJ. PAGEREF _Toc101272857 h 7

5.1.1. Структура командной строки для работы с программой ARJ. PAGEREF _Toc101272858 h 7

5.1.2. Основные команды программы-архиватора ARJ. PAGEREF _Toc101272859 h 7

5.1.3. Наиболее важные ключи настройки программы-архиватора ARJ. PAGEREF _Toc101272860 h 8

5.1.4. Помещение файлов в архив. PAGEREF _Toc101272861 h 9

5.1.5. Создание многотомных архивов. PAGEREF _Toc101272862 h 9

5.2. Достоинства и недостатки программы ARJ. PAGEREF _Toc101272863 h 10

6. Заключение. PAGEREF _Toc101272864 h 11

7. Список литературы.. PAGEREF _Toc101272865 h 12


1. Введение

Архивация - это сжатие, уплотнение, упаковка информации с целью ее более рационального размещения на внешнем носителе (диске или дискете). Архиваторы - это программы, реализующие процесс архивации, позволяющие создавать и распаковывать архивы.

Необходимость архивации связана с резервным копированием информации на диски и дискеты с целью сохранения программного обеспечения компьютера и защиты его от порчи и уничтожения (умышленного, случайного или под действием компьютерного вируса). Чтобы уменьшить потери информации, следует иметь резервные копии всех программ и файлов.

Программы-упаковщики (архиваторы) позволяют за счет специальных методов сжатия информации создавать копии файлов меньшего размера и объединять копии нескольких файлов в один архивный файл. Это даёт возможность на дисках или дискетах разместить больше информации, то есть повыситьплотность хранения информации на единицу объёма носителя (дискеты или диска).

Кроме того, архивные файлы широко используются для передачи информации в Интернете и по электронной почте, причем благодаря сжатию информации повышается скорость её передачи. Это особенно важно, если учесть, что быстродействие модема и канала связи (телефонной линии) намного меньше, чем процессора и жесткого диска.

Работа архиваторов основана на том, что они находят в файлах повторяющиеся участки и пробелы, помечают их в архивном файле и затем при распаковке восстанавливают по этим отметкам исходные файлы.

Программы-упаковщики (или архиваторы) позволяют помещать копии файлов в архив и извлекать файлы из архива, просматривать оглавление архива и тестировать его целостность, удалять файлы, находящиеся в архиве, и обновлять их, устанавливать пароль при извлечении файлов из архива и др. Разные программы архивации отличаются форматом архивных файлов, скоростью работы, степенью сжатия, набором услуг (полнотой меню для пользователя), удобством пользования (интерфейсом), наличием помощи, собственным размером.

Ряд архиваторов позволяют создавать многотомные архивы, саморизвлекающиеся архивы, архивы, содержащие   каталоги. Наиболее популярны и широко используются следующие архиваторы: ARJ, PKZIP/PKUNZIP, RAR, ACE, LHA, ICE, PAK, PKARC/PKXARC, ZOO, HYPER, AIN.

Наиболее высокоэффективными являются архиваторы RAR, ACE, AIN, ARJ.

Они обеспечивают наибольшую степень сжатия информации и имеют наиболее высокую скорость работы. Архиватор RAR имеет удобный графический интерфейс и позволяет читать текстовые файлы, находящиеся как в rar-архиве, так и в arj и zip-архивах. Архиватор AIN имеет русскоязычный интерфейс. Ахиваторы WinRAR-95 и WinZIP работают только в среде Windows-95/98/2000. Они необходимы при работе с длинными и русскими именами файлов в Windows-95/98/2000. В настоящее время именно эти архиваторы применяются чаще всего. Работа архиваторов ARJ, PKZIP, LHA и др. автоматизирована с помощью оболочек Norton Commander    4.0, 5.0, DOSNavigator, WindowsCommanderи др. Дляэтих архиваторов имеются специальные          программы просмотрщики архивных файлов ARCVIEW и AVIEW. Основным для всех архиваторов является режим работы в командной строке. Архиватор RAR может использовать для работы своё собственное меню. Некоторые архиваторы для извлечения файлов из архива используют отдельные программы-распаковщики, например PKUNZIP, PKXARC. Степень упаковки архива зависит от типа архивируемых файлов, их числа и размера, выбранной программы архивации и установленных в ней ключей, вида архива. Текстовые файлы в упакованном виде занимают гораздо меньше места, чем программы (exe и com файлы).

Степень упаковки в среднем равна 2-3, но иногда она достигает нескольких десятков.

Кроме того, существуют упаковщики exe и com файлов PKLITE, DIET, LZEXE, EXEPACK, AINEXE и др. Упакованные exe и com файлы имеют те же расширения (exe и com) и сохраняют свою способность к исполнению,в отличие от архивных файлов.     Они занимают значительно меньше места на диске, чем неупакованные файлы.

2. Основные виды программ-архиваторов

Различными разработчиками были созданы специальные программы для архивации файлов. Как правило, программы для архивации файлов позволяют помещать копии файлов на диске в сжатом виде в архивный файл, извлекать файлы из архива, просматривать оглавление архива и т.д. Разные программы отличаются форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования.

В настоящее время применяется несколько десятков программ - архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить:

ARJ, PKPAK, LHA, ICE, HYPER, ZIP, РАК, ZOO, EXPAND, разработанные за рубежом, а также AIN и RAR, разработанные в России. Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами, например, программа РКZIР производит упаковку файлов, a PKUNZIP - распаковку файлов.

Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие - либо программы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.

Самораспаковывающийся архивный файл - это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы - архиватора.

Самораспаковывающийся архив получил название SFX - архив (SelF - eXtracting). Архивы такого типа в MS DOS обычно создаются в форме .ЕХЕ - файла.

Многие программы - архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые предназначены для создания упакованного исполняемого модуля (программы). В результате такой упаковки создается программный файл с теми же именем и расширением, который при загрузке в оперативную память самораспаковывается и сразу запускается. Вместе с тем возможно и обратное преобразование программного файла в распакованный формат. К числу таких архиваторов относятся программы PKLITE, LZEXE, UNP.

Программа EXPAND, входящая в состав утилит операционной системы MS DOS и оболочки Windows, применяется для распаковки файлов программных продуктов, поставляемых фирмой Microsoft.

Программы - архиваторы RAR и AIN, кроме обычного режима сжатия, имеют режим solid, в котором создаются архивы с повышенной степенью сжатия и особой структурой организации. В таких архивах все файлы сжимаются как один поток данных, т.е. областью поиска повторяющихся последовательностей символов является вся совокупность файлов, загруженных в архив, и поэтому распаковка каждого файла, если он не первый, связана с обработкой других. Архивы такого типа предпочтительнее использовать для архивирования большого числа однотипных файлов. Управление программой - архиватором осуществляется одним из двух способов:

1) с помощью командной строки MS DOS, в которой формируется команда запуска, содержащая имя программы - архиватора, команду управления и ключи ее настройки, а также имена архивного и исходного файлов; подобное управление характерно для архиваторов ARJ, AIN, ZIP, РАК, LHA и др.;

2) с помощью встроенной оболочки и диалоговых панелей, появляющихся после запуска программы и позволяющих вести управление с использованием меню и функциональных клавиш, что создает для пользователя более комфортные условия работы. Такое управление имеет программа - архиватор RAR.

3. Показатель - степени сжатия файлов

Необходимость архивации связана с резервным копированием информации на диски и дискеты с целью сохранения программного обеспечения компьютера и защиты его от порчи и уничтожения (умышленного, случайного или под действием компьютерного вируса). Чтобы уменьшить потери информации, следует иметь резервные копии всех программ и файлов.

Архивация - это сжатие, уплотнение, упаковка информации с целью ее более рационального размещения на внешнем носителе (диске или дискете) в виде так называемых архивных файлов.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Сжатие информации в архивных файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Алгоритмы подобного сжатия информации реализованы в специальных программах-архиваторах (наиболее известные из которых arj/arjfolder, pkzip/pkunzip/winzip, rar/winrar) применяются определенные Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Поэтому основным показателем эффективности той или иной программы-архиватора является степень сжатия файлов.

Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах (в некоторых источниках используется обратное соотношение):

Кс=(Vc/Vo)*100%

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла.

Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых коэффициент сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей Кс = 60 - 90%. Почти не сжимаются архивныефайлы. Это нетрудно объяснить, если знать, что большинство программ-архиваторов используют для сжатия варианты алгоритма LZ77 (Лемпеля-Зива), суть которого заключается в особом кодировании повторяющихся последовательностей байт (читай - символов). Частота встречаемости таких повторов наиболее высока в текстах и точечной графике и практически сведена к нулю в архивах.

Кроме того, программы для архивации все же различаются реализациями алгоритмов сжатия, что соответственно влияет на степень сжатия.

В некоторые программы-архиваторы дополнительно включаются средства, направленные на уменьшение коэффициента сжатия Кс. Так в программе WinRAR реализован механизм непрерывного (solid) архивирования, при использовании которого может быть достигнута на 10 - 50% более высокая степень сжатия, чем дают обычные методы, особенно если упаковывается значительное количество небольших файлов однотипного содержания.

4. Сжатие файлов при архивации

При работе на персональном компьютере довольно часто возникает необходимость уменьшить размер файла с целью экономии места на диске. Например, требуется перенести файлы с одного компьютера на другой на дискетах. Или нужно переслать большой файл по электронной почте - уменьшив его размер, можно сэкономить и время и деньги. Лучшее решение в таких случаях создать так называемый архивный файл, или, проще говоря, архив. Это единый файл, в который для компактного хранения информации помещены в сжатом виде один или несколько исходных файлов.

Как известно, подавляющее большинство современных форматов записи данных содержат их в виде, удобном для быстрого манипулирования, для удобного прочтения пользователями. При этом данные занимают объем больший, чем это действительно требуется для их хранения. Алгоритмы, которые устраняют избыточность записи данных, называются алгоритмами сжатия данных, или алгоритмами архивации. В настоящее время существует огромное множество программ для сжатия данных, основанных на нескольких основных способах.

Все алгоритмы сжатия данных делятся на:

1) алгоритмы сжатия без потерь, при использовании которых данные на приемной восстанавливаются без малейших изменений;

2)алгоритмы сжатия с потерями, которые удаляют из потока

данных информацию, незначительно влияющую на суть данных, либо вообще невоспринимаемую человеком (такие алгоритмы сейчас разработаны только для аудио- и видео- изображений).

Преимущество отдается естественно, первой группе алгоритмов.

Существует два основных метода архивации без потерь:

алгоритм Хаффмана (англ. Huffman), ориентированный на сжатие последовательностей байт, не связанных между собой,

алгоритм Лемпеля-Зива (англ. Lempel, Ziv), ориентированный на сжатие любых видов текстов, то есть использующий факт неоднократного повторения "слов" - последовательностей байт.

Практически все популярные программы архивации без потерь

(ARJ, RAR, ZIP и т.п.) используют объединение этих двух методов - алгоритм LZH.

Алгоритм Хаффмана. Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, - реже. Следовательно, если $+o записи распространенных символов использовать короткие последовательности бит, длиной меньше 8, а для записи редких символов - длинные, то суммарный объем файла уменьшится.

Алгоритм Лемпеля-Зива. Классический алгоритм Лемпеля-Зива -

LZ77, названный так по году своего опубликования, предельно прост. Он формулируется следующим образом : <если в прошедшем ранее выходномпотоке уже встречалась       подобная

последовательность байт, причем запись о ее длине и смещении от текущей позиции короче чем сама эта последовательность, то в выходной файл записывается ссылка (смещение, длина), а не сама последовательность>.          Так фраза <КОЛОКОЛ_ОКОЛО_КОЛОКОЛЬНИ>

закодируется как <КОЛО(-4,3)_(-5,4)О_(-14,7)ЬНИ>.

5. Архиватор ARJ

Программа ARJ (разработчик - Robert K. Jung) относится к числу наиболее известных продуктов своего класса. Она выполняет все функции по обслуживанию своих, архивов, может помещать файлы в архив, извлекать файлы из архива, и делать «саморизвлекающиеся» файлы и так далее.

5.1. Назначение архиватора ARJ

Программа ARJ позволяет:

·

·

·

·

·

·

·

·

·

·

·

·

·

·

·

·

5.1.1. Структура командной строки для работы с программой ARJ

Для получения на экране краткой помощи по работе достаточно в командной строке ввести имя программы: ARJ.

Для получения развернутой помощи и примеров задания команд следует ввести:

ARJ -? или ARJ /?

Для загрузки программы и выполнения ею необходимых функций используется формат командной строки, где имя программы и параметры разделяются пробелами:

ARJ <команда> [-<кл1> [-<кл2>...]] <имя_архива> [<список_имен_файлов>]

Обязательные параметры командной строки — это два параметра: <команда> и <имя_архива>.

В качестве списка имен файлов можно использовать шаблон (маску).

Параметр <команда> записывается в виде одного символа вслед за именем программы и задает функцию архивации в соответствии с табл. 11.1.

5.1.2. Основные команды программы-архиватора ARJ

Номер группы

Группа команд

Команда

Функция архивации

1

Помещение в архив

а

Добавить файлы в архив

u

Заменить файлы в архиве на новые версии

f

Добавить в архив только новые файлы

m

Переместить файлы в архив

2

Извлечение из архива

е

Извлечь файлы из архива в текущий каталог

х

Извлечь файлы из архива и поместить в каталоги в соответствии с указанными к ним путями доступа

3

Удаление из архива

d

Удалить файлы из архива

4

Сервисные функции

t

Полное тестирование архива

l

Вывод содержимого архива без указания пути к файлам

v

Вывод содержимого архива с указанием пути к файлам

y

Копировать архив с новыми параметрами

w

Найти текстовую строку в архиве

Параметр <имя_архива> задает имя архивного файла и записывается по общим правилам MS DOS, но без указания расширения, которое при создании нового файла присваивается автоматически. Имя архива может быть записано с указанием пути к файлу. Архиватор по умолчанию обрабатывает архивные файлы, имеющие расширение .ARJ.

Самораспаковывающийся архивный файл создается с расширением .ЕХЕ. Такой файл содержит в себе программный модуль распаковки, и для извлечения из него файлов не требуется программа ARJ.

Ключи уточняют действие команды архивации, и их может быть несколько. Каждый ключ начинается с символа "-" и может быть помещен в любом месте командной строки после команды. Признаком ключа кроме символа "-" может быть символ "/". В табл. 11.2 приведены наиболее важные ключи настройки.

Примечание. Команды и ключи программы-архиватора ARJ можно вводить в командную строку в любом регистре.

Список имен файлов приводится тогда, когда обработке подлежат не все файлы архива или текущего каталога. При необходимости добавить, извлечь или удалить несколько файлов в командной строке следует записать их полные имена. В списке файлов можно указать до 64 имен файлов. Для сокращения записи имен файлов можно использовать шаблоны в соответствии с правилами MS DOS, например:

5.1.3. Наиболее важные ключи настройки программы-архиватора ARJ

Ключ

Назначение

-r

Добавление файлов из текущего каталога и всех вложенных в него подкаталогов с указанием пути к файлам

-v

Создание многотомного архивного файла

-g

Защита создаваемого архива паролем: g<пароль> — пароль вводится в командной строке; g? — ввод невидимого пароля при выполнении

-x

Добавление/замена файлов, за исключением файлов, имена которых указаны вслед за ключом

-q

Запрос на выполнение операции для каждого файла: для подтверждения необходимо ввести символ "Y"; для отказа — символ "N"

-je

Создание самораспаковывающегося архива

-m

Указание метода архивации:  m0 — без сжатия;

ml — нормальное сжатие (по умолчанию);

m2 — наибольшая компрессия;

m3 — быстрое сжатие и меньшая компрессия;

m4 — самое быстрое сжатие и наименьшая компрессия

-y

Предполагается ответ Yes на все вопросы архиватора

-jp

Пауза при просмотре содержимого архива после заполнения экрана

5.1.4. Помещение файлов в архив

Одной из основных операций при работе с архивными файлами является помещение файлов в архив, которая может выполняться с помощью команд: a, u, m, f. Наиболее часто эти команды применяются совместно с ключами: -r, -g, -q, -je.

5.1.5. Создание многотомных архивов

Одним из важных достоинств программы - архиватора ARJ является возможность создания многотомных архивов, т.е. архивов, для размещения которых используется несколько дисков. На каждом из дисков размещается один файл архива, занимая все свободное его пространство. При этом необязательно, чтобы диск предварительно был очищен, так как на нем вместе с архивным файлом могут находиться и другие файлы. При создании архива файлу, размещаемому на первом диске, по умолчанию присваивается расширение *.ARJ, а на последующих дисках - *.А01, *.А02 и т.д. Правило обозначения расширений можно изменить с помощью ключей настройки, что практически снимает ограничения по количеству томов архива.

Просмотр оглавлений каждого из архивных файлов многотомного архива осуществляется так же, как и однотомного архива. Программа ARJ позволяет корректировать содержимое многотомного архива - удалять, заменять и добавлять файлы. При этом перераспределение файлов между томами не производится.

Для работы с многотомным архивом необходимо указывать ключ -v. Уточнение настройки команды достигается использованием модификаторов команды.

Для создания многотомного архива для архиватора arj командная строка должна иметь вид: arj a -v1200 имя архива, или arj a /v1200 /y имя архива (многотомного, без расширения arj).

Здесь указан формат дискет (1,2M). Может быть формат 360К, 720K, 1200K, 1440K. Kлюч /v1200 означает создать многотомный архив на дискетах 1,2M. Каждый том архива должен размещаться на отдельной дискете и будет соответствовать её размеру.

Для создания многотомного архива с поддиректориями командная строка должна иметь вид: arj a -r -v1200 -y имя архива (без расширения).

Если указать в имени архива путь a:имя архива, то архив будет создан на дискете a: (или b:имя архива), но при этом ключ -y не нужен.

После ввода команды программа архивации начинает выполнять запрошенные действия. На экране изображаются имена помещаемых в архив файлов. При сжатии каждого файла выводится либо процент обработанной части файла, либо горизонтальная, полоска, сообщающая о ходе сжатия. После окончания сжатия каждого файла напротив его имени сообщается о степени сжатия (отношение длины сжатого файла к длине исходного файла).

По умолчанию программа ARJ обеспечивает достаточно большую скорость работы и близкую к максимальной степень сжатия. Но при желании можно получить еще на несколько процентов большую степень сжатия файлов за счет несколько более медленной работы. Для этого следует указать режим –JM.

5.2. Достоинства и недостатки программы ARJ

ARJ. Работает из командной строки. Выполняет все функции по обслуживанию архивов .arj , в т.ч. поддержку многотомных архивов. Arj имеет очень большое число ключей. Получить справку по ключам архиватора arj можно с помощью команд:

arj(обычная справка)

arj /?(подробная справка)

Можно автоматизировать много действий - создание резервной копии диска, архивирование начиная с какой-то даты, добавление к имени архива текущей даты (arh970821.arj), архивирование файла с конкретного места, несколько уровней сжатия и так далее. В версии 2.55 возможна работа с длинными именами. Недостатки: отсутствие диалогового режима, некоторое неудобство работы при наличии какого-то ключа в переменной окружения (ARJ_SW) и строке запуска - взаимное уничтожение.


6. Заключение

При эксплуатации компьютера по самым разным причинам возможны порча или потеря информации на жестких дисках. Это может произойти из-за физической порчи жесткого диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы уменьшить потери в таких ситуациях, следует иметь архивные копии используемых файлов и систематически обновлять копии изменяемых файлов.

Для сохранения информации можно конечно её дублировать, однако при этом  копии занимают столько же места, сколько занимают исходные файлы, и для копирования нужных файлов может потребоваться много дискет. Например, для копирования файлов с жесткого диска емкостью 1,2 Гбайт необходимо 854 дискеты емкостью по 1,44 Мбайт. В таком большом количестве дискет даже разобраться довольно трудно, поэтому трудоемкость создания и обновления копии будет весьма значительной.

Более удобно использовать для созданиякопий специально разработанные программы архивации файлов. Эти программы позволяют не только сэкономить место надискетах, но и объединять группы совместно используемых файлов в один архивный файл, что заметно облегчает ведение архивов.

Принято различать архивацию и упаковку (компрессию, сжатие) данных. В первом случае речь идет о слиянии нескольких файлов и даже каталогов в единый файл — архив (примером использования такой технологии в чистом виде может служить формат TAR). Во втором — о сокращении объема исходных файлов путем устранения избыточности (в данной работе рассматривается упаковка без потерь информации, т. е. с возможностью точного восстановления исходных файлов). Как правило, современные архиваторы обеспечивают также сжатие данных, являясь, таким образом, еще и упаковщиками, однако существуют и чисто «упаковочные» утилиты типа Gzip, сжимающие отдельные файлы, преобразуя их в формат Z или GZ.

При выборе инструмента для работы с упакованными файлами и архивами следует учитывать два фактора: эффективность, т. е. оптимальный баланс между экономией дисковой памяти и производительностью работы, и совместимость, т. е. возможность обмена данными с другими пользователями. Совместимость, пожалуй, сегодня более важна, так как по достигаемой степени сжатия конкурирующие форматы и инструменты различаются на проценты (но не в разы), а вычислительная мощность современных компьютеров делает время обработки архивов не столь существенным показателем, как, скажем, десять лет назад. Поэтому при выборе инструмента для работы с архивами важнейшим критерием для большинства пользователей (во всяком случае тех, для кого обмен большими массивами данных — насущная проблема), вероятно, является способность программы «понимать» наиболее распространенные архивные форматы, даже если эти форматы не самые эффективные.


7. Список литературы

1. Фигурнов В.Э. - М.: ИНФРА-М, 1998.

2. Журнал PC Magazine №6 1999 г.

3. http://school87.kubannet.ru/info/first33.html

4. http://www.citforum.urbannet.ru/internet/infsecure/its2000_33.shtml (Архивация)

5. http://www.citforum.urbannet.ru/internet/infsecure/its2000_34.shtml (Принципы Архивации)

6. http://www.citforum.urbannet.ru/internet/infsecure/its2000_35.shtml (Алгоритм Хаффмана)

7. http://www.citforum.urbannet.ru/internet/infsecure/its2000_36.shtml (Алгоритм Лемпеля - Зива)