如何从Java中的给定字符串中删除HTML标签?

一个字符串 是一个final类在Java中,这是不可改变的,这意味着我们不能改变物体本身,但我们可以改变的参考对象。可以使用String类的replaceAll()方法从给定的字符串中删除HTML标签。我们可以使用 正则表达式从给定的字符串中删除HTML标签。从字符串中删除HTML标记后,它将返回字符串作为普通文本。

语法

public String replaceAll(String regex, String replacement)

示例

public class RemoveHTMLTagsTest {
   public static void main(String[] args) {
      String str = "<p><b>Welcome to nhooo.com</b></p>";
      System.out.println("Before removing HTML Tags: " + str);
      str = str.replaceAll("\\<.*?\\>", "");
      System.out.println("After removing HTML Tags: " + str);
   }
}

输出结果

Before removing HTML Tags: <p><b>Welcome to nhooo.com</b></p>
After removing HTML Tags: Welcome to nhooo.com