原文:编码日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。
简介如果你是一个后端程序员,我想你一定见过后缀为*.tar.gz、*.zip、*.jar的文件。这些都是压缩文件。这些文件是如何生成的?主要区别是什么?本文将带您了解这些文件和配套的操作命令,以及它们的常用场景。
tar 和gzip Linux 上最常见的压缩文件是*.tar.gz。各种开源软件经常以这种格式发布源代码或程序,所以作为后端开发人员,有必要了解它。
首先可以发现这个文件有两个后缀,分别是.tar和.gz。这个名字是有原因的,因为它的制作过程分为两部分,如下:
使用tar将目录打包成单个.tar文件# 将applogs目录打包成applogs.tar文件# 其中-c表示打包,-f指定打包文件名$ tar -cf applogs.tar applogs/# 可以找到即打包文件的大小与目录占用的大小相似,因为tar只是将目录中的文件组合成单个文件,并且默认不压缩$ du -sh applogs/applogs.tar177M applogs/175M applogs.tar 使用gzip将.tar文件压缩成.gz文件# 使用gzip压缩会生成applogs.tar.gz文件$ gzip -k applogs.tar# 可以发现压缩后文件大小明显变小$ du -sh applogs.tar applogs.tar.gz175M applogs.tar8.8M applogs.tar.gz 这是*.tar.gz文件的制作过程。事实上,使用tar 命令可以将这两步简化为一步,如下:
# 打包压缩,其中-z表示打包然后使用gzip压缩$ tar -czf applogs.tar.gz applogs/# 解压到当前目录$ tar -xzf applogs.tar.gz -C ./压缩日志文件In另外,由于日志文件的内容一般具有较高的重复率,这导致Linux经常对后端系统产生的历史日志文件进行压缩和存储,这样可以显着减少磁盘空间的使用。
基于这种情况,Linux上诞生了很多查看压缩日志文件的命令,如zcat、zgrep、zless等,如下:
# 自动解压文件并输出文件内容$ zcat applogs.tar.gz # 自动解压文件并在其中搜索。用法类似于grep $ zgrep -a 'error' applogs.tar.gz 这比先愚蠢地解压要好。文件中,在文件内搜索效率更高。
tar与其他压缩算法另外,除了gzip之外,tar还可以与其他压缩算法配合使用,例如bzip2、xz等,如下:
-j, --bzip2 通过bzip2 过滤存档-J, --xz 通过xz 过滤存档--lzip 通过lzip 过滤存档--lzma 通过xz 过滤存档--lzop 通过lzop 过滤存档-z, - -gzip, --gunzip, --ungzip 通过gzip 过滤存档--zstd 通过zstd 过滤存档-Z, --compress, --uncompress 通过compresszip 过滤存档,jarzip 也是常见的压缩文件格式。后缀为*.zip。与上面的tar和gzip不同,zip集成了打包和压缩两个过程。 Linux下对应的操作命令是zip和unzip,如下:
# 创建zip压缩文件$ zip -r applogs.zip applogs/# 查看zip压缩文件中有哪些文件$ unzip -l applogs.zipArchive: applogs.zip Length Date Time Name--------- --- - ------ ----- ---- 0 2022-09-17 12:58 applogs/99166 2022-09-16 18:20 applogs/demo.2022-09-16.0.log 13177092 2022-09-17 13:37 applogs /demo.2022-09-17.0.log 948 2022-08-09 15:08 applogs/demo.log.----------------203039002140 files#解压zip文件, -d 指定解压目录$ unzip applogs.zip -d ./与gzip类似,zip也自带了一些方便特定场景的命令工具,如zipinfo、zipgrep等,如下:
# zipinfo 查看zip文件包含哪些文件$ zipinfo applogs.zipArchive: applogs.zip压缩文件大小: 9573195字节,条目数: 140drwxrwxrwx 3.0 unx 0 bx stor 22-Sep-17 12:58 applogs/-rwxrwxrwx 3.0 unx 99166 tx defN 9 月22 日16 18:20 applogs/demo.2022-09-16.0.log-rwxrwxrwx 3.0 unx 13177092 tx defN 22-Sep-17 13:37 applogs/demo.2022-09-17.0.log-rwxrwxrwx 3.0 unx 948 tx defN 2009 年8 月22 日15:08 applogs /demo.log.140 个文件,未压缩203039002 字节,压缩9546235 字节: 95.3%# zipgrep 自动解压缩文件并在其中搜索。用法类似grep $ zipgrep 'error' applogs.zip 查看jar文件目前大多数Java项目都是基于spingboot的。众所周知,spingboot会将项目打包成单个jar文件进行部署,但实际上,jar文件本质上是zip格式。与zip文件相比,它只多了一个META-INF/MANIFEST.MF文件。如下:
$ unzip -p app.jar META-INF/MANIFEST.MFManifest-Version: 1.0Spring-Boot-Classpath-Index: BOOT-INF/classpath.idxImplementation-Version: 0.0.1-SNAPSHOTSpring-Boot-Layers-Index: BOOT-INF/层。 idxStart-Class: com.example.demo.DemoApplicationSpring-Boot-Classes: BOOT-INF/classes/Spring-Boot-Lib: BOOT-INF/lib/Build-Jdk-Spec: 1.8Spring-Boot-Version: 2.4.0Created-By: Maven Jar Plu gin 3.2.0Main-Class: org.springframework.boot.loader.JarLauncher 如上所示,MANIFEST.MF文件指定了jar包的Main-Class,这样当执行java -jar app.jar时,java就会知道是哪个类来查找main.方法,而spingboot打包的jar无非是将启动类替换成自己的。
很多时候,我们需要确认jar文件的内容。比如我想在app.jar中查看spingboot内嵌的tomcat的线程池配置大小。您可以通过如下方式查看:
$ zipgrep 'max-thread' app.jar BOOT-INF/classes/application.yml: max-threads: 500 这个比jdk自带的jar命令方便多了。如果你是一名Java开发的学生,这个命令应该成为你的开发工具箱中的其中之一。
总结ok,压缩文件和命令都介绍得差不多了,我们简单总结一下:
tar、gzip:用于打包或解压缩*.tar.gz 文件的命令。尽管它们是两个命令,但它们几乎总是一起使用。 zip、unzip:用于打包或解压缩*.zip 文件的命令。值得注意的是,它们还可以处理*.jar文件,并且在搜索场景中,使用zipgrep更方便。 less命令实际上可以直接打开这些压缩文件。甚至可以打开png、pdf等广义的压缩文件!
另外,Linux平台上其实还有一些其他的压缩命令,比如bzip2、xz、7z、rar等,我就不一一介绍了。如果有兴趣可以查看Linux man文档。