C#使用Selenium
介绍: Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),Mozilla Firefox,Safari,Google Chrome,Opera等。 利用它可以驱动浏览器执行特定的动作,如点击、下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码 ,做到可见即可爬。?? 所以Selenium现在被广泛用于Python爬虫。查了下资料,发现这个工具确实强大,最重要的是,C#也是可以调用的。 官方支持Java,C#,Python,Ruby,PHP,Perl,Javascript等语言 Selenium使用Java开发,项目地址?https://github.com/SeleniumHQ/selenium ? 使用Selenium: 1、我们新建一个C#控制台程序 2、使用Nuget搜索以下依赖库 需要引用的核心库是Selenium.RC,Selenium.Support,Selenium.WebDriver ? 然后再需要引用 浏览器驱动库,这里我以IE浏览器为例,Chrome使用方式跟IE是一样的,程序包名称为Selenium.WebDriver.ChromeDriver。 ? 3、在Main函数中输入以下代码 ? 1 static void Main(string[] args) 2 { 3 using (IWebDriver driver = new OpenQA.Selenium.IE.InternetExplorerDriver()) 4 { 5 driver.Navigate().GoToUrl("http://www.baidu.com"); 6 7 var source = driver.PageSource; 8 9 Console.WriteLine(source); 10 } 11 } ? 运行,会弹出IE浏览器,网页加载完成后,浏览器会自动关闭。控制台输入结果如下 这样我们就可以轻松的获取动态渲染页面的源码。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |