当前位置：首页 > Java

java网址如何提取

2026-03-25 10:28:50Java

提取Java网址的方法

使用Java提取网址可以通过正则表达式或第三方库实现。以下是几种常见的方法：

使用正则表达式提取

Java内置的正则表达式功能可以匹配URL模式。以下代码示例展示如何从文本中提取URL：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class UrlExtractor {
    public static void main(String[] args) {
        String text = "Visit https://www.example.com or http://test.org for more info.";
        String regex = "\\b(https?|ftp|file)://[-a-zA-Z0-9+&@#/%?=~_|!:,.;]*[-a-zA-Z0-9+&@#/%=~_|]";

        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(text);

        while (matcher.find()) {
            System.out.println("Found URL: " + matcher.group());
        }
    }
}

使用Jsoup库

Jsoup是一个HTML解析库，可以方便地从HTML文档中提取链接：

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupUrlExtractor {
    public static void main(String[] args) throws Exception {
        String url = "https://www.example.com";
        Document doc = Jsoup.connect(url).get();
        Elements links = doc.select("a[href]");

        for (Element link : links) {
            System.out.println("Link: " + link.attr("href"));
        }
    }
}

使用Apache Commons Validator

Apache Commons Validator库提供了URL验证功能，可用于提取和验证URL：

java网址如何提取

import org.apache.commons.validator.routines.UrlValidator;

public class UrlValidatorExample {
    public static void main(String[] args) {
        String[] schemes = {"http", "https"};
        UrlValidator urlValidator = new UrlValidator(schemes);

        String url = "https://www.example.com";
        if (urlValidator.isValid(url)) {
            System.out.println("Valid URL: " + url);
        }
    }
}