Hello, <…">

当前位置：首页 > Java

Java如何删除标签

2026-03-22 20:44:42Java

删除HTML标签的方法

使用正则表达式可以快速删除HTML标签。以下代码示例展示了如何通过正则表达式移除字符串中的HTML标签：

String html = "<p>Hello, <b>world</b>!</p>";
String plainText = html.replaceAll("<[^>]*>", "");
System.out.println(plainText);  // 输出: Hello, world!

使用Jsoup库处理HTML

Jsoup是一个专门用于处理HTML的Java库，提供了更安全可靠的方式来移除标签：

import org.jsoup.Jsoup;

String html = "<div>Sample <span>text</span></div>";
String plainText = Jsoup.parse(html).text();
System.out.println(plainText);  // 输出: Sample text

保留特定标签的删除方法

如果需要保留某些特定标签，可以结合正则表达式和条件判断：

String html = "<p>Keep <b>this</b> but remove <i>that</i></p>";
String result = html.replaceAll("<(?!b\\s*\\b)[^>]*>", "");
System.out.println(result);  // 输出: <p>Keep <b>this</b> but remove that</p>

处理XML标签的删除

对于XML文档，可以使用DOM解析器来移除标签：

Java如何删除标签

import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

String xml = "<root><item>content</item></root>";
Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(new InputSource(new StringReader(xml)));
NodeList nodes = doc.getElementsByTagName("item");
String content = nodes.item(0).getTextContent();
System.out.println(content);  // 输出: content

注意事项

正则表达式方法虽然简单，但对于复杂的HTML可能不够健壮。Jsoup库能更好地处理格式不规范的HTML文档。在性能敏感的场景中，可以考虑使用StringBuilder进行手动解析。

标签: 标签 Java

分享给朋友：

相关文章

Vue实现菜单标签页

Vue实现菜单标签页

Vue 实现菜单标签页的方法使用 Vue Router 和动态组件在 Vue 中实现菜单标签页可以通过结合 Vue Router 和动态组件的方式完成。Vue Router 用于管理路由，动态组件…

vue多标签怎么实现

vue多标签怎么实现

Vue 多标签实现方法使用动态组件结合 v-for 通过 v-for 循环渲染多个标签页，结合 Vue 的动态组件 (<component :is="currentTab">) 切换内容…

vue实现标签选中效果

vue实现标签选中效果

实现标签选中效果的方法在Vue中实现标签选中效果可以通过多种方式完成，常见的方法包括使用v-model绑定数据、动态类绑定或条件渲染。以下是几种实现方案：使用v-model绑定单选/多选对于单…

react a标签实现跳转

react a标签实现跳转

使用 React 中的 <a> 标签实现跳转在 React 中，可以使用标准的 HTML <a> 标签进行页面跳转，但需要注意与 React Router 结合时的行为差异。…

标签制作css

标签制作css

标签制作CSS的方法使用CSS可以轻松自定义标签样式，使其更符合设计需求。以下是几种常见的标签样式实现方法。基础标签样式通过设置display属性为inline-block或inline，配合…

jquery隐藏标签

jquery隐藏标签

使用 jQuery 隐藏标签的方法 hide() 方法通过 hide() 方法可以直接隐藏选中的元素，元素会被设置为 display: none。语法如下： $("selector").hid…