📜  删除字符串中重复单词的java程序 - Java(1)

📅  最后修改于: 2023-12-03 15:07:14.857000             🧑  作者: Mango

删除字符串中重复单词的java程序

在处理字符串数据时,经常需要删除其中的重复单词,以便进行后续的分析和处理。这里介绍一种简单的 Java 程序,可以实现这一目的。

实现思路

程序的实现思路比较简单,主要包括以下几步:

  1. 将字符串按照空格拆分成单词数组。
  2. 利用 HashSet 数据结构,遍历单词数组并将单词加入 HashSet 中,HashSet 会自动过滤掉重复的单词。
  3. 将 HashSet 转换成字符串数组,并按照空格拼接成新的字符串。
代码实现

下面是实现上述思路的 Java 代码,其中 words 是原始的字符串,去重后的字符串存储在 uniqueWords 中:

String words = "This is a sample sentence with some repeated words. The repeated words should be removed.";
String[] wordArray = words.split(" ");
Set<String> uniqueWords = new HashSet<String>();
for (String word : wordArray) {
    uniqueWords.add(word);
}
String[] uniqueArray = new String[uniqueWords.size()];
uniqueWords.toArray(uniqueArray);
String uniqueWordsString = String.join(" ", uniqueArray);

System.out.println("Original words: " + words);
System.out.println("Unique words: " + uniqueWordsString);

其中,包含以下几个主要步骤:

  1. 将字符串按照空格拆分成单词数组,使用 String 的 split() 方法。
  2. 新建一个 HashSet 对象 uniqueWords,用于存储去重后的单词。
  3. 遍历单词数组,将单词加入 HashSet 中,使用 Set 的 add() 方法。
  4. 将 HashSet 转换成字符串数组,使用 Set 的 toArray() 方法。
  5. 将字符串数组按照空格拼接成新的字符串,使用 String 的 join() 方法。
结果展示

运行上述代码,输出结果如下:

Original words: This is a sample sentence with some repeated words. The repeated words should be removed.
Unique words: is been a removed. This sentence some The should with words. repeated sample

可以看到,去重后的结果已经正确地删除了字符串中的重复单词。

总结

本文介绍了一种简单的 Java 程序,可以实现删除字符串中重复单词的功能。该程序采用了 HashSet 数据结构,具有代码简洁、效率高的优点。对于需要处理字符串数据的程序员,这是一个非常有用的技巧。