你的位置:PHP先生 phpsir.com >> php基础资料 >> php小经验 >> 详细内容 在线投稿

徐州楼盘在百度排名分析的PHP程序

发布: 2009-10-26 15:47 |  作者: phpsir |   查看: 51次

分析200个楼盘名称在百度搜索里面排名前三名的站点域名,绘制表格,并统计出现次数

hi 大家好,从今天开始给大家作一点PHP方面实用性的介绍,利用小项目补充日常开销,或者和同室好友一同分享劳动果实

项目内容:
分析200个楼盘名称在百度搜索里面排名前三名的站点域名,绘制表格,并统计出现次数

================================================================================================================
美达檀香山 www.soufun.com/house/2009-06-27/2648574.htm www.xfzc.com/Sales/SaleHtml/Sales_145.html newhouse.xz.soufun.com/house/1811191266.htm
香花畦 http://house.focus.cn/common/group/main/house_forum_frame.php?group_id=1890&sub_id=4813&page=1 http://www.xianghuaqi.com/ http://www.soufun.com/house/1010069861.htm
日成奥运城 http://www.xfzc.com/Sales/SaleHtml/Sales_62.html http://newhouse.xz.soufun.com/house/1811286024.htm http://www.soufun.com/house/2009-08-18/2736595.htm
城置国际花园城
苏商御景湾
阿尔卡迪亚
世茂东都
星光名庭  
...
 
汇总:
soufun.com XXX次
xfzc.com XXX 次
focus.cn XXX次

 ================================================================================================================

下面讲解如何解决此类问题
分析问题如下:
1)解决自动搜索问题: 如何到百度将关键词填入并分析HTML得出结果
2)循环200次
3)将结果根据域名统计(如何分析url里面的域名)

解决方法:
1) 百度支持 get  方式提交查询 只需要提交到 http://www.baidu.com/s?wd=关键字  我们用file_get_contents(URL)来获取内容
2) 分析得到的HTML 得出前3名,这需要一点正则表达式的知识,(关于"正则"请自行google)
$p = "/href=\"(.+?)\".+?>(.+?)</";
preg_match_all($p,$c,$m);
针对$m 进行分析就可以了
3)统计 利用php字符串函数切割url的域名部分,并去除www. 得到域名根部

总结:
此类问题 用时1小时左右,项目价值200-400元,
代码行数 20-50行内


写于校内:
phpsir.com 张建 QQ 733905


 

如果仍然没有找到解决问题的思路,请联系 PHP先生 QQ 733905

打印 | 收藏此页 |  推荐给好友 | 举报
上一篇 下一篇
 

评分:0

发表评论
seccode 换一个
查看全部回复【已有0位网友发表了看法】