📅  最后修改于: 2023-12-03 15:07:14.857000             🧑  作者: Mango
在处理字符串数据时,经常需要删除其中的重复单词,以便进行后续的分析和处理。这里介绍一种简单的 Java 程序,可以实现这一目的。
程序的实现思路比较简单,主要包括以下几步:
下面是实现上述思路的 Java 代码,其中 words 是原始的字符串,去重后的字符串存储在 uniqueWords 中:
String words = "This is a sample sentence with some repeated words. The repeated words should be removed.";
String[] wordArray = words.split(" ");
Set<String> uniqueWords = new HashSet<String>();
for (String word : wordArray) {
uniqueWords.add(word);
}
String[] uniqueArray = new String[uniqueWords.size()];
uniqueWords.toArray(uniqueArray);
String uniqueWordsString = String.join(" ", uniqueArray);
System.out.println("Original words: " + words);
System.out.println("Unique words: " + uniqueWordsString);
其中,包含以下几个主要步骤:
split()
方法。uniqueWords
,用于存储去重后的单词。add()
方法。toArray()
方法。join()
方法。运行上述代码,输出结果如下:
Original words: This is a sample sentence with some repeated words. The repeated words should be removed.
Unique words: is been a removed. This sentence some The should with words. repeated sample
可以看到,去重后的结果已经正确地删除了字符串中的重复单词。
本文介绍了一种简单的 Java 程序,可以实现删除字符串中重复单词的功能。该程序采用了 HashSet 数据结构,具有代码简洁、效率高的优点。对于需要处理字符串数据的程序员,这是一个非常有用的技巧。