Как уменьшить объем файлов: выбор архиватора и формата сжатия

Большой файл — один из недостатков, от которого можно избавиться с помощью архивации. Архивирование — это процесс сжатия файлов для уменьшения их размера. Сжатие может происходить с ухудшением качества файла или без него; это зависит от того, какие файлы и почему они сжаты. Сжатые файлы могут иметь разные расширения, например: ZIP, JPEG, MP3 и т д.

Сжатие — это процесс, который уменьшает размер файла при сохранении исходных данных. Таким образом, сжатый файл потребует меньше места для хранения на вашем устройстве, и им будет проще поделиться через Интернет.

От чего зависит степень сжатия файлов

Чуть выше мы писали, что существует два вида сжатия:

  • с потерей качества

  • без потери качества.

Эти методы сжатия следует обсудить отдельно.

Сжатие с потерей качества

Этот вариант сжатия используется, когда есть возможность удалить ненужные части файла. При удалении ненужных бит качество исходного файла теряется. Как ни странно, это распространенный вариант сжатия. В основном используется для «индивидуальных» файлов, таких как: видеоклип, фильм, аудиофайл, графические изображения и т.д. Многие знают форматы такого сжатия. Наверное, каждый пользователь Интернета сталкивался с графикой в ​​формате JPEG или музыкальными файлами в формате MP3. Сжатие с потерями не используется для документов, где важно сохранить всю информацию. Например, нет смысла сжимать табличные документы или документы текстового редактора с помощью этого типа сжатия, потому что тогда они будут искажены, но вы можете заархивировать их без потери качества.

Этот подход не сохраняет всю информацию в исходном файле. Например, MP3 не содержит всех звуков исходной звуковой дорожки. Этот формат исключает звуки, которые пользователи не слышат на обычных устройствах. Вы можете заметить отсутствие звуков, если используете специализированное оборудование, обеспечивающее максимально качественное звучание. MP3-файлы теряют качество звука, но пользователи этого не замечают.

Такая же ситуация с JPEG. Когда изображение сжимается в этом формате, удаляются части файла, которые человеческий глаз не может различить. Однако чем сильнее вы сжимаете графический документ JPEG, тем заметнее будет потеря качества.

Имеет смысл использовать сжатие с потерями, если сжимаемый документ содержит больше информации, чем необходимо. Например, есть смысл сжать исходное фото в JPEG, чтобы добавить его в соцсети, ведь никто не увидит разницы между сжатым и несжатым изображением. Однако, если исходное изображение должно быть напечатано на фотографии большого формата, сжатие JPEG может быть вредным и повлиять на качество фотографии.

Большинство сервисов и программ сжатия файлов предлагают самостоятельно настроить степень сжатия и качество выходного файла, поэтому здесь нужно помнить простое правило: чем выше степень сжатия, тем больше вы потеряете качество исходного файла.

Сжатие без потери качества

Большой размер файла является одним из недостатков. Однако всегда есть два аргумента по поводу «весов сжатия»: вес файла и качество файла. Бывают случаи, когда нет возможности потерять качество файла, но необходимо его сжать. Затем вы можете использовать опцию сжатия без потери качества.

Это удобный вариант сжатия, так как размер файла уменьшается в несколько раз, а исходное качество не теряется. На самом деле многие пользователи сталкивались с этим видом сжатия — это процесс архивации. При архивировании исходный файл сжимается и уменьшается в размере, но затем этот файл можно распаковать, восстановив прежний размер и качество.

Файл производится по интересному принципу. Архивация не удаляет информацию из файла, а просто группирует идентичные файлы вместе, уменьшая общий вес исходного файла. Затем, когда начнется распаковка, файл будет разгруппирован. Как это выглядит на практике, поясним простыми словами:

  • перед вами «башня», построенная из 10 блоков детского конструктора — это ее исходный файл;

  • башня состоит из 2-х зеленых, 5-ти оранжевых и 3-х фиолетовых блоков: вы видите все 10 блоков;

  • если "заархивировать" башню, то в результате вы увидите только 3 блока разных цветов, на которых будет написано общее количество блоков одного цвета; то есть «2» будет написано зеленым цветом, «5» — оранжевым, «3» — фиолетовым»;

  • если "разархивировать" башню, то перед вами снова выстроится произведение из 10 блоков.

Таким образом при подшивке башни отображалось всего 3 блока вместо 10.

Посмотрим другой пример:

  • есть некий текстовый файл "yyyyyyddddddddddddvvvvvvvvvvvvv" – видим, что он состоит из 35 символов;

  • запускаем архивацию, и в результате у нас будет такая запись для того же файла: "8g12d15v" – мы видим, что файл укорочен и состоит всего из 8 символов вместо 35 символов исходного файла.

Какое сжатие лучше: с потерей или без потер и качества

Какое сжатие использовать, решать пользователю. Если качество файла роли не играет, потому что его просто не будет видно, то можно использовать сжатие с потерями, например фото для социальной сети.

Если качество файлов имеет значение и их невозможно сжать с потерями, то их следует заархивировать. Например, вы написали книгу или разработали компьютерную игру; в этом случае лучше использовать архиваторы (сжатие без потерь).

Каждый из типов сжатия имеет свои особенности и характеристики, поэтому выделить какой-то конкретный тип как лучший невозможно. Лучший тот, который подходит вам в данный конкретный момент. Есть две вещи, которые следует учитывать при сжатии:

  1. Нет смысла преобразовывать файл с потерями в файл без потерь. Окончательное качество файла не улучшится, так как файл уже конвертирован с потерей качества, и качество не восстановится, хотя размер файла увеличится.

  2. Если вы конвертируете файл с потерями в идентичный формат, вы не только уменьшите размер файла, но и его качество.

Форматы сжатия: какие из них наиболее популярны и какой следует использовать в каждом конкретном случае

Форматы сжатия

Когда мы говорим о формате ZIP, все сразу понимают, о чем мы говорим. Этот формат впервые появился в 1989 году, и мы все знаем его отчасти потому, что это стандартная система сжатия Windows, и многие из нас начали делать свои первые шаги в вычислениях с системой Microsoft. Позже появилось больше форматов сжатия, и в этой статье мы расскажем о самых популярных из них, среди которых у нас будет RAR или 7z.

Когда мы хотим сжать файлы, а эта статья посвящена именно этому типу сжатия, а не другим, таким как сжатие видео или аудио, нам, вероятно, нужно их обслуживать. Таким образом, по крайней мере один из форматов сжатия, включенных в эту статью, будет просто делать это, что означает, что мы включили формат, который не сжимает, но позже вы поймете, почему.

Самые популярные форматы сжатия

ZIP, быстрый и легкий

Как мы уже упоминали, архиватор 7-ZIP — очень известный формат сжатия, отчасти потому, что это «один на всю жизнь» в системах Microsoft. Будучи одним из первых, со временем его превзошли другие форматы, такие как 7z или RAR, но он по-прежнему имеет свои сильные стороны:

  • Сжатие ZIP очень быстрое и не требует много ресурсов, по крайней мере, по сравнению со сжатием 7z или RAR. Он основан на сжатии Deflate Lossless, что делает его идеальным для архивирования больших объемов комбинированных данных, таких как резервные копии.
  • Молния везде. Формат ZIP доступен практически в любой операционной системе, такой как Linux, или даже в гораздо более закрытых системах, таких как iOS от Apple.
  • В последних версиях появилось шифрование AES.

Причины выбрать ZIP в качестве формата сжатия: быстрый и отлично работает в любой операционной системе. Другие форматы хоть и доступны, но могут вызвать проблемы в некоторых операционных системах, и именно это произошло со мной при сжатии файлов в 7z в разных местах, начиная с Ark.

ZIPX, эволюция ZIP

Если мы говорим о ZIP, мы должны говорить о его эволюции. Это ZIPX, и среди его функций мы можем сжимать больше, чем ZIP, что сравнимо с форматом RAR. Проблема в том, что при использовании ZIPX мы теряем сильные стороны ZIP: компьютер потребляет больше ресурсов, а сжатие/распаковка происходит медленнее.

Я бы рекомендовал использовать ZIPX только в том случае, если вы не хотите использовать RAR, то есть по финансовым и лицензионным причинам.

TAR в файл 

Как мы объясняли ранее, мы собирались упомянуть формат сжатия, который не сжимается. Это TAR, и мы упоминаем его, потому что он часто используется в Linux. S обеспечивает только архивирование (объединяет входные данные и метаданные в один выходной файл), делегируя такие функции, как сжатие, шифрование, проверка четности/целостности, внешнему программному обеспечению, которое работает в конвейере с выводом команды TAR.

… И ГЗ сжать

Многие файлы, которые мы загружаем для Linux, имеют формат tar.gz. Расширение GZ обозначает формат сжатия одного файла, созданный для проекта GZip (GNU Zip или «Free Zip»), начатого в 1992 году Жаном-Лу Гейли и Марком Адлером для обеспечения бесплатной замены коммерческих решений для сжатия данных. Сжатие основано на алгоритме DEFLATE (также используется в качестве алгоритма по умолчанию в формате PKZip/WinZip .ZIP), комбинации кодирования Lempel-Ziv (LZ77) и кодирования Хаффмана.

Его можно использовать вместо ZIP и, как и ZIPX, для решения проблемы с лицензированием, так как он совершенно бесплатный.

7z, открытый исходный код и мощный

7z — это современный формат сжатия с открытым исходным кодом. Он предлагает шифрование AES и высокое сжатие, одно из лучших, в большинстве случаев превосходящее RAR или ZIPX. Он был представлен в Windows как 7-Zip и перенесен с помощью команды p7zip на платформы Unix. Поддерживаемые алгоритмы сжатия (LZMA/LZMA2, PPMd, BZip2) позволяют использовать преимущества параллельных вычислений на современных многоядерных процессорах.

Основной причиной использования 7z является его высокая степень сжатия, но это того не стоит, если мы собираемся сжимать большие файлы во время работы, потому что мы будем тратить много времени/ресурсов нашего оборудования. С другой стороны, как я уже упоминал, я не мог сжимать с помощью Ark, поэтому лично я имею этот шип на своей стороне и не могу полностью ему доверять. Другими словами, 7z может представлять больше проблем, чем другие форматы, такие как ZIP.

RAR, лучший вариант, если вам не нужны лицензии

Формат RAR является одним из самых известных, как и ZIP, отчасти потому, что он также широко используется в системах Microsoft. Это проприетарный формат, представленный WinRAR в Windows, и его часть распаковки была перенесена в Linux (Unrar). Среди его особенностей у нас есть:

  • Сжать больше, чем ZIP.
  • Предлагает надежное шифрование.
  • Возможность восстановления в случае ошибок.

Подобно 7z и ZIPX, одной из его сильных сторон является сжатие, но за счет затрат времени и ресурсов. Я всегда использовал формат RAR в Windows как для сжатия файлов, так и для разделения файлов и защиты паролем. Конечно, вы должны заплатить за это или делать то, что вы знаете.

ACE, старая слава

Как и RAR, ACE является проприетарным форматом, представленным вместе с Windows WinACE, но в данном случае он был перенесен в Linux той же компанией, а точнее его возможности извлечения (UNACE). В последние годы он потерял популярность, но предлагает лучшую степень сжатия, чем ZIP, не доходя до RAR, ZIPX или 7z.

Поскольку нет бесплатной или бесплатной версии для создания файлов ACE, я бы не рекомендовал ее использовать, если у нас нет доступа к дешевой лицензии. Если вам нужно выбирать, RAR лучше.

Какой из этих форматов сжатия лучший?

Как мы объяснили, это будет зависеть от многих факторов, среди которых у нас есть совместимость, уровень сжатия и лицензии. Для Linux я бы рекомендовал формат 7z, но не перед тестированием, чтобы убедиться, что мы не столкнемся с какими-либо ошибками, подобными той, с которой я столкнулся в Kubuntu с Ark.

В Windows или macOS это будет зависеть от того, что мы хотим «обрести жизнь» и от вопроса лицензий. Формат 7z тоже может быть хорошим вариантом, как с точки зрения сжатия и безопасности, так и с точки зрения открытого исходного кода.

Что касается распаковки, мы можем распаковывать форматы ZIP сразу во многих операционных системах, в то время как другие, такие как RAR или ACE, могут распаковывать их бесплатно с помощью UNRAR или UNACE.

Как вы думаете, стоит ли добавить в этот список форматов сжатия еще несколько параметров?

Как уменьшить объем файлов: выбор архиватора и формата сжатия

 

Какой архиватор сильнее сжимает файлы? WinRar, WinUha, WinZip или 7Z?

картотечный шкаф

Небольшое предисловие… Сравнение может быть не слишком объективным. Сравнение картотек проводилось на самом обычном домашнем компьютере, среднем на сегодняшний день. К тому же не брались разного рода данные – сравнение сжатия производилось на обычном "Вордовском" документе, коих у многих, кто изучает или работает, может накопиться большое количество. Что ж, само собой разумеется, что редко используемую информацию целесообразно запаковать в архив и иногда извлекать. Да и передать такой файл куда проще: на флешку он скопируется быстрее, чем куча мелких файлов, и быстрее скачается через интернет…

Таблица сравнения сжатия

Для небольшого эксперимента был взят относительно большой RTF-файл, около 3,5мб, и сжат различными архиваторами. Время работы пока не брали, о характеристиках программ поговорим позже, а пока посмотрим только на степень сжатия.

Программа Формат степень сжатия Размер, кбайт Насколько уменьшился размер файла ?
Картотека КГБ 2 .кгб максимум 141411 22,99
Прирост .rar максимум 190546 17.07
WinUha .или имеет максимум 214294 15.17
7Z .7z максимум 218511 14,88
Винзип .Почтовый Код максимум 299108 10,87
Исходный файл .rtf Без сжатия 3252107 один

Как видно из небольшой таблицы, программа KGB Archiver 2 достигает наибольшей степени сжатия – исходный размер файла уменьшен в 23 раза! Те, если у вас на винчестере несколько гигабайт различной документации, которой вы не пользуетесь и которую хотите удалить (но это не оставляет ощущения, а может быть полезна), не проще ли сжать такими программу и записать на диск…

Но обо всех «ловушках» по порядку…

KGB Archiver 2

В целом неплохой архиватор, по словам разработчиков, алгоритм сжатия у него один из самых "сильных". Трудно не согласиться…

Только вот скорость сжатия оставляет желать лучшего. Например, файл примера (около 3 мб) был сжат программой около 3 минут. Нетрудно подсчитать, что на сжатие компакт-диска уйдет полдня, если не больше.

Total Commander (x64) 8.01 - BurSoft_2014-01-01_22-46-54

Но это не особенно удивительно. Разархивирование файла занимает столько же времени, сколько и его архивирование! То есть, если вы потратили полдня на архивирование некоторых ваших документов, то столько же времени вы потратите на их извлечение из архива.

Итог: Программу можно использовать для небольших объемов информации, особенно когда важен минимальный размер исходного файла (например, файл необходимо разместить на дискете или небольшой флешке). Но опять же, размер сжатого файла заранее не угадаешь, да и время на сжатие можно потратить…

WinRar

Известная на постсоветском пространстве программа, установленная на большинстве компьютеров. Наверное, если бы он не показывал таких высоких результатов, у него не было бы столько поклонников. Ниже скриншот, показывающий настройки сжатия, ничего особенного, кроме того, что степень сжатия была установлена ​​на максимум.

Имя файла и параметры_2014-01-01_22-30-21

Удивительно, но WinRar сжал архив за несколько секунд и размер файла уменьшился в 17 раз очень достойный результат, если еще учесть, что затраты времени на обработку ничтожно малы. А времени на распаковку файла еще меньше!

Итог: отличная программа, которая показывает одни из лучших результатов. В процессе настройки сжатия вы также можете указать максимальный размер файла, и программа разделит его на несколько частей. Очень удобно перенести файл с одного компьютера на другой на флешку или CD/DVD, когда нет возможности записать весь файл на…

WinUha

Относительно молодой архивариус. Его нельзя назвать суперпопулярным, но он интересует многих пользователей, которые часто работают с файлами. И это неспроста, ведь по словам разработчиков архиватора, его алгоритм сжатия сильнее, чем у RAR и 7Z.

Архивировать выбранные файлы_2014-01-01_22-39-26

В нашем маленьком эксперименте я бы не сказал, что это так. Не исключено, что на каких-то других данных он покажет гораздо лучшие результаты…

Кстати, при установке выбирай английский, на русском – программа выдает "крякозабры».

В двух словах: хорошая программа с интересным алгоритмом сжатия. Время обработки и создания архива, конечно, выше, чем у WinRar, но на некоторых типах данных можно получить несколько большую степень сжатия. Хотя лично я бы не придавал этому особого значения…

Очень популярный бесплатный архиватор. Многие утверждают, что степень сжатия в 7z даже лучше, чем в WinRar. Вполне возможно, но при сжатии на уровне "Ультра" на большинстве файлов проигрывает WinRar.

Добавить в файл_2014-01-01_22-30-44

В двух словах: хорошая альтернатива WinRar. Достаточно сопоставимая степень сжатия, хорошая поддержка русского языка, удобное встраивание в контекстное меню браузера.

WinZip

Легендарная, одна из самых популярных некогда картотек. Вероятно, наиболее распространенными архивами в Интернете являются ZIP. И это неслучайно: ведь, несмотря на не самую высокую степень сжатия, скорость работы просто поражает. Например, Windows открывает такие файлы как обычные папки!

Также нельзя забывать, что этот архиватор и формат сжатия намного старше новых конкурентов. Да и не у всех сейчас есть мощные компьютеры, которые позволят быстро работать с новыми форматами. А формат Zip совместим со всеми современными архиваторами!

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
CompSch.com
Добавить комментарий