php采集页面时候经常遇到一些采集问题 1.js动态生成页面内容无法采集 2.https采集问题 3.防盗链问题

解决方法:

使用第三方的浏览器工具——phantomjs

PhantomJS介绍

PhantomJS 是一个基于 WebKit 的服务器端 JavaScript API。它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。 PhantomJS 可以用于 页面自动化 , 网络监测 , 网页截屏 ,以及 无界面测试 等。

更多网站: http://www.tuicool.com/articles/beeMNj/ http://phantomjs.org/