Linux 中的拆分命令示例
Linux 中的 split 命令用于将大文件拆分为较小的文件。它将文件分成每个文件 1000 行(默认情况下),甚至允许用户根据需要更改行数。
这些文件的名称是 PREFIXaa、PREFIXab、PREFIXac 等。默认情况下,文件名的前缀为 x,每个拆分文件的默认大小为每个文件 1000 行,这两个参数都可以轻松更改。它通常与日志和存档文件一起使用,因为它们非常大并且有很多行,因此为了将它们分解成小文件进行分析,使用 split 命令。
句法:
split [options] name_of_file prefix_for_new_files
使用拆分命令
1. 将文件拆分成短文件。假设文件名为 index.txt。使用下面的 split 命令将其分解成碎片。
split index.txt
Index.txt文件被分成两部分,名称分别为“xaa”和“xab”。默认情况下,每个文件中有 1000 行。拆分命令的名称是“xaa”和“xab”,因为我们没有设置任何前缀值。
2.根据行数拆分文件。
split -l 4 index.txt split_file
Index.txt文件根据我们想要使用 -l 选项的行数拆分为短文件,如图所示。
3.带有详细选项的拆分命令。我们还可以使用“--verbose”在详细模式下运行 split 命令。每次创建新的拆分文件时,它都会给出诊断消息。
split index.txt -l 4 --verbose
在这里,我们创建了一个名为 index.txt 的文件,该文件将被拆分为短文件,verbose 将为我们提供执行任务的详细信息。
注意:这里 -l 4 不是必须使用的。它仅用于理解目的。
4.使用“-b”选项分割文件大小。
split -b 16 index.txt index
在这里,它会将文件index.txt 拆分为名为 indexaa、indexab、..... 的单独文件,每个文件中包含 16 个字节的数据。
5.后缀长度的变化。默认情况下,后缀长度为 2。我们也可以使用 '-a' 选项更改它。
split -l 4 -a 4 index.txt
在这种情况下,它在拆分文件上的后缀长度为 4。
注意:这里 -l 4 不是必须使用的。它仅用于理解目的。
6.使用数字后缀创建的拆分文件。通常,输出的格式为 x**,其中 ** 是字母。我们可以使用“-d”选项将拆分文件的后缀更改为数字。
split -l 4 -d index.txt
注意:这里 -l 4 不是必须使用的。它仅用于理解目的。
7.创建 n 个块输出文件。如果我们想将一个文件拆分为三个块输出文件,那么在 split 命令中使用 '-n' 选项来限制拆分输出文件的数量。
split -n 3 index.txt
它将创建三个分割文件块。
8.使用自定义后缀拆分文件。使用此命令,我们可以创建带有自定义后缀的拆分输出文件。假设,如果我们要创建带有索引后缀的拆分输出文件,请执行以下命令。
split -l 4 index.txt split_index_
将创建带有索引后缀的拆分输出文件。
注意:这里 -l 4 不是必须使用的。它仅用于理解目的。
9.避免零大小的拆分文件。在某些情况下,我们将一个小文件拆分为大量块文件,这可能会导致拆分输出文件的大小为零。它们不添加任何值,因此为了避免它,我们使用选项“-e”。
split -l 4 -e index.txt
通过使用它,不会创建零大小的分割输出文件。
注意:这里 -l 4 不是必须使用的。它仅用于理解目的。
10.将文件拆分为两个等长的文件。要将一个文件平均分成两个文件,我们使用“-n”选项。通过指定“-n 2”,文件被平均分成两个文件。
split -n 2 index.txt