📅  最后修改于: 2023-12-03 14:49:19.551000             🧑  作者: Mango
在日常工作中,我们经常需要从文本文档中提取内容并进行处理。本文将介绍Java程序员如何编写一个简单的程序从TXT文档中提取内容。
首先,我们需要准备一个简单的TXT文档。假设该文档内容如下:
This is a test document.
It contains multiple lines of text.
We will use this document to extract content using Java program.
我们可以使用Java提供的文件读写操作来读取文档内容。以下是一个可以读取文档内容的Java程序:
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
public class ReadTextFile {
public static void main(String[]args) throws IOException {
String fileName = "path/to/your/txt/file.txt";
BufferedReader br = new BufferedReader(new FileReader(fileName));
String line;
while((line = br.readLine()) != null){
System.out.println(line);
}
br.close();
}
}
该程序使用BufferedReader类来读取文件内容,并将文件中的每一行输出到控制台。运行该程序,将会输出以下内容:
This is a test document.
It contains multiple lines of text.
We will use this document to extract content using Java program.
当我们需要从文档中提取特定内容时,我们可以使用Java提供的正则表达式。以下是一个简单的程序,用于提取文档中包含“test”的行:
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ExtractContent {
public static void main(String[]args) throws IOException {
String fileName = "path/to/your/txt/file.txt";
String pattern = ".*test.*";
BufferedReader br = new BufferedReader(new FileReader(fileName));
String line;
Pattern p = Pattern.compile(pattern);
while((line = br.readLine()) != null){
Matcher m = p.matcher(line);
if(m.find()){
System.out.println(line);
}
}
br.close();
}
}
该程序使用正则表达式“.test.”来匹配包含“test”的行,并输出这些行到控制台。运行该程序,将会输出以下内容:
This is a test document.
本文介绍了如何编写一个Java程序来从TXT文档中提取内容。我们首先介绍了如何读取文档内容,然后给出了一个使用正则表达式来提取特定内容的程序。如果你对Java的文件读写操作和正则表达式的使用还不熟悉,建议多写几个练习程序来提高自己的水平。