Russian Qt Forum

Qt => Общие вопросы => Тема начата: Majestio от Ноябрь 21, 2013, 14:26



Название: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 21, 2013, 14:26
Не так давно я написал архиватор ZIP на PHP (нужда возникла чисто из за ограничений бесплатного хостинга - по памяти, выделяемой процессу, и по макс. размеру файла на хостинге). Сама реализация получилась так, что и самому понравилась - сделал ее так сказать адаптивной.

Алгоритм следующий:

1) (опционально) Если файл имеет расширение слабо пакуемых или непакуемых файлов, типа -
'7z','a00','a01','a02','ace','ain','alz','apz','ar','arc','arh','ari','arj','ark','axx','b64','ba','bh','bhx','boo','bz','bz2','bza','bzip','bzip2','c00','c01','c02',
'cab','car','cb7','cbr','cbz','cp9','cpt','dd','deb','dgc','dist','djvu','dl_','dz','ecs','efw','epi','ex_','f','fdp','gca','gif','gz','gza','gzi','gzip','ha','hbc','hbc2',
'hbe','hki','hki1','hki2','hki3','hpk','hyp','ice','ipg','ipk','ish','ita','j','jar.pac','jgz','jic','jpeg','jpg','kgb','lbr','lemon','lha','lnx','lqr','lz','lzh','lzma','lzo',
'lzx','md','mou','mzp','oar','oz','p7m','pack.gz','package','pae','pak','paq6','paq7','paq8','par','par2','pbi','pcv','pea','pet','pf','pim','pit','piz','pkg','png','pup',
'pup','puz','qda','r0','r00','r01','r02','r03','r1','r2','r21','r30','rar','rev','rk','rnc','rp9','rpm','rte','rzs','s00','s01','s02','sar','sdn','sea','sen','sfs','sfx',
'sh','shar','shr','sit','sitx','spt','sqx','sqz','tar','tar.gz','tar.xz','taz','tbz','tbz2','tg','tgz','tlz','tlzma','tsk','txz','tz','uc2','uha','vem','vsi','wad','war',
'wot','xef','xez','xmcdz','xpi','xx','xz','y','z','z01','z02','z03','z04','z05','z06','z07','z08','z09','zap','zi','zip','zipx','zix','zl','zoo','zpi','zz'
выбирается метод STORE
2) Иначе файл сперва жмется методом DEFLATE, потом BZIP2
3) В результирующий архив попадают сжатые данные у которых размер получается меньше
4) Алгоритму можно задавать предельные размеры использования памяти и размеры томов результирующего архива

Хочу это переписать под Qt.

Плюс этого всего - архивы получаются ощутимо меньше, нежели я использую обычный пакер, т.к. там есть возможность только жестко выбирать метод сжатия. Но есть одно "но" ...

Мои ZIP-ы нормально читает только 7z. WinRAR, открывая архивы со смешанными методами сжатия файлов - на файлы сжатые по BZIP2 кричит "неизвестный метод сжатия". Почитав стандарт, я вроде не нашел запрета на BZIP2 в явном виде.

Вот и не решаюсь тратить время - если это все же в пределах стандарта, тогда смысл есть.
А если всеж нарушение и это новодел - думаю забросить это.

Какие мысли есть по этому поводу?
Интересно все.


Название: Re: ZIP для домохозяек
Отправлено: Bepec от Ноябрь 21, 2013, 14:31
Сравнение приведите с zip'ом с максимальным сжатием.


Название: Re: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 21, 2013, 14:49
Сравнение приведите с zip'ом с максимальным сжатием.

Сейчас не приведу - когда писал для бэкапа сайта, мой пакер выигрывал у 7z (в режиме ZIP), с максимальным сжатием - примерно 2-7%, но и 2-5% проигрывал ему же в режиме 7z (метод PPMD). В точных цифрах могу ошибаться - ориентировочно пишу, запомнились разбежки в районе 5% в среднем. Данные были - картинки, текст (html, php), архивы, исполняемые файлы, звуковые в формате ogg. Зависимость такая - чем больше непакуемых или слабопакуемых данных, тем больше 7z-ZIP пухнет.


Название: Re: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 21, 2013, 19:40
Вот еще думаю, можно попробовать запилить DEFLATE64, еще процент-другой "отвоевать" ...


Название: Re: ZIP для домохозяек
Отправлено: Bepec от Ноябрь 21, 2013, 20:11
А стоит овчинка выделки? К примеру гиг плохо пакуемых данных зазиповать и эмм.. задомохозяйничать. Результаты по времени и размерам сравнить бы.

PS ради 2-3% даже шевелиться не особо хочется :D


Название: Re: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 21, 2013, 20:31
Лан, оставлю пока в виде TODO. Пока стоял вопрос только распаковки - штатные средства тянут. Ну а там посмотрим. Пока Qt-шными средствами гигабайты не жал, на счет расхода памяти ниче не скажу.


Название: Re: ZIP для домохозяек
Отправлено: alex312 от Ноябрь 22, 2013, 11:57
Majestio , может тебе будет интересно глянуть на FreeArc (http://freearc.org/ru/Default.aspx).
Он тоже анализирует содержимое и применяет разные алгоритмы компрессии для разных данных.


Название: Re: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 22, 2013, 12:09
Majestio , может тебе будет интересно глянуть на FreeArc (http://freearc.org/ru/Default.aspx).
Он тоже анализирует содержимое и применяет разные алгоритмы компрессии для разных данных.

Идея хорошая! Но чего-то исходников не вижу. А вообще суть моего поста - создание не очередного пакера, а библиотеки под Qt, чтобы не заморачиваться с архивами. По поводу реализации, в принципе так и думал, вполне можно реализовать методы сжатия, как плагины, ну и пару процедур по разборке контейнеров, а-ля ZIP, 7z.


Название: Re: ZIP для домохозяек
Отправлено: gil9red от Ноябрь 22, 2013, 14:13
Цитировать
Но чего-то исходников не вижу.
Ты их не видишь, но они есть :)
http://freearc.org/ru/Download.aspx


Название: Re: ZIP для домохозяек
Отправлено: Majestio от Ноябрь 22, 2013, 14:20
Цитировать
Но чего-то исходников не вижу.
Ты их не видишь, но они есть :)
http://freearc.org/ru/Download.aspx

Сенкс - был невнимателен! Супер, это еще более может облегчить дело! :)