📜  从 TXT 文档中提取内容的Java程序(1)

📅  最后修改于: 2023-12-03 14:49:19.551000             🧑  作者: Mango

从TXT文档中提取内容的Java程序

在日常工作中,我们经常需要从文本文档中提取内容并进行处理。本文将介绍Java程序员如何编写一个简单的程序从TXT文档中提取内容。

准备工作

首先,我们需要准备一个简单的TXT文档。假设该文档内容如下:

This is a test document.
It contains multiple lines of text.
We will use this document to extract content using Java program.
读取文档内容

我们可以使用Java提供的文件读写操作来读取文档内容。以下是一个可以读取文档内容的Java程序:

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;

public class ReadTextFile {
    public static void main(String[]args) throws IOException {
        String fileName = "path/to/your/txt/file.txt";
        BufferedReader br = new BufferedReader(new FileReader(fileName));
        String line;
        while((line = br.readLine()) != null){
            System.out.println(line);
        }
        br.close();
    }
}

该程序使用BufferedReader类来读取文件内容,并将文件中的每一行输出到控制台。运行该程序,将会输出以下内容:

This is a test document.
It contains multiple lines of text.
We will use this document to extract content using Java program.
提取特定内容

当我们需要从文档中提取特定内容时,我们可以使用Java提供的正则表达式。以下是一个简单的程序,用于提取文档中包含“test”的行:

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ExtractContent {
    public static void main(String[]args) throws IOException {
        String fileName = "path/to/your/txt/file.txt";
        String pattern = ".*test.*";
        BufferedReader br = new BufferedReader(new FileReader(fileName));
        String line;
        Pattern p = Pattern.compile(pattern);
        while((line = br.readLine()) != null){
            Matcher m = p.matcher(line);
            if(m.find()){
                System.out.println(line);
            }
        }
        br.close();
    }
}

该程序使用正则表达式“.test.”来匹配包含“test”的行,并输出这些行到控制台。运行该程序,将会输出以下内容:

This is a test document.
总结

本文介绍了如何编写一个Java程序来从TXT文档中提取内容。我们首先介绍了如何读取文档内容,然后给出了一个使用正则表达式来提取特定内容的程序。如果你对Java的文件读写操作和正则表达式的使用还不熟悉,建议多写几个练习程序来提高自己的水平。