jsoup抓取豆瓣美女
发布时间:2020-12-15 03:19:04 所属栏目:Java 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 import java.io.BufferedOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputS
以下代码由PHP站长网 52php.cn收集自互联网 现在PHP站长网小编把它分享给大家,仅供参考 import java.io.BufferedOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import java.net.URL; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class Demo4 { private static final String url = "http://www.dbmeinv.com/?p="; private static final String picPath = "d:/picTest"; private static String USER_AGENT="Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0"; public static void main(String[] args) { System.out.println("下载完的图片位于d:/picTest"); for (int i = 0; i < 50; i++) { try { Document doc = Jsoup.connect(url+i).userAgent(USER_AGENT).timeout(3000).data("pager_offset",i+1+"").post(); Elements img = doc.select("img"); for (Element ele : img) { String src = ele.absUrl("src"); //System.out.println(src); getImage(src); } } catch (IOException e) { e.printStackTrace(); } } System.out.println("这些足够多了!"); System.out.println("图片下载完成!"); } private static void getImage(String src) { int indexName = src.lastIndexOf("/"); String name = src.substring(indexName,src.length()); //System.out.println(name); InputStream in = null; OutputStream out = null; try { URL url = new URL(src); in = url.openStream(); //创建文件夹 File files = new File(picPath); if(!files.exists()) files.mkdirs(); out = new BufferedOutputStream(new FileOutputStream(files+name)); for(int b;(b=in.read())!=-1;) out.write(b); } catch (Exception e) { e.printStackTrace(); }finally{ try { out.close(); in.close(); } catch (IOException e) { e.printStackTrace(); } } } } 以上内容由PHP站长网【52php.cn】收集整理供大家参考研究 如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |