一 : 什么是“火车头采集规则”?
网友汶锐权对[火车头采集规则]什么是“火车头采集规则”?给出的答复:
采集规则是告诉采集程序如何去抓取网址,如何提取数据,如何保存或发布的一系列设置的集合。
二 : 火车头采集器的发布和采集规则(爆划算、秒杀通、特价猫、燕子团)
经过一段时间的摸索和使用,已经能够利用火车头采集器采集淘宝客所需的产品,现将使用心得和大家分享一下(本次提供的发布规则仅适用于飞天侠的程序,其他程序需要请加群235830061交流)
首先下载好火车头采集器(可到火车头采集器官网下载好,也可以到我们的百度网盘下载下载地址:http://pan.baidu.com/s/1jGzIrsy)然后下载发布规则(下载地址:http://pan.baidu.com/s/1kz70i),下面给大家截图说明使用方法:
下载好火车头采集器解压如下图
[www.61k.com]
以上是发布规则的使用方法
接下来咱们说一下采集规则的使用方法,首先下载特价猫、燕子团和秒杀通的采集规则(下载地址:http://pan.baidu.com/s/1ntiHlJb,并以其中一个为例来截图说明,下面截图怎么操作:
打开所下载软件解压的文件夹,
完成以上各部之后就可以采集了。
可以到我的网站看看采集效果www.shihuizz.cn
更多火车头采集器交流请加群:235830061
本文出自:,若转载,请注明出处
三 : 火车头采集器如何写分页规则
[火车头采集规则]火车头采集器如何写分页规则——简介四 : 关于淘宝客商品用火车头采集规则详情(免费教程)
原文地址:关于淘宝客商品用火车头采集规则详情(免费教程)作者:寻回沧桑的童年工具:首先要使用的工具fiddler(mic官方抓包工具)、火车头V7.6(最新版)。
首先:
打开并进入自己的阿里妈妈单品列表(随意关键字为演示,需小白举一反三)
接下来
解压火车头zip
打开LocoyPlatform.exe(火车头执行文件)
为了演示快速,不懂火车头使用方法推荐去学习http://v7.help.locoy.com/
懂得火车头请往下看:
(cookis要点击登陆采取)
创建任务组(测试)-任务(test):
编码最好自己设置好.请看源码的head;
首先设置采集网址规则
复制网址添加到起始页码的批量/多页
并且把&_fmu.a._0.t=1改为&_fmu.a._0.t=(*)1为分页。(*)为规则。
其它选项自己定义.
点击添加完成/.
多级网址添加-设置为手动填写....
右键阿里妈妈商品列表的源代码.示范找到第一件商品的部分代码:
复制途中选中的图片(地址或许不一样。但还要复制,后面需要该规则).
复制到火车头的脚本规则:
这里将地址设置为[参数]
下面实际地址设置为[参数1]
保存
------------>这里是为了得到商品的普通地址.
进入下一步
火车头第二步->采集内容规则
先全部点击删除
打开商品的地址(刚源代码复制的内容的地址)
我这里是?id=16403431420
接下来右键打开源代码。找到标题、价格、购买人数、掌柜....并像标题下图一样正则匹配:
添加标题(为演示迅速.故一项示范)>
其它自行设置.
然后测试。复制?id=16403431420
现在进入截取淘宝客推广链接:(PS:各种论坛卖50块,我很气愤。自己花了一天时间找到了链接分享步骤,希望多来我的博客看网上所谓的付费教程,互相交流.博客:http://blog.sina.com.cn/u/1853189751)
打开fiddler
点击阿里妈妈第一件商品立即推广。然后找到fiddler
主机host为www.alimama.com的抓包信息:(PS:推荐使用Raw排列)
复制GET之后至?specialType=cowry&auction_id=16403431420
其实这段代码就是
手动打开这段代码。
找到源文件的的
点击多页面管理
设置为
链接为:自定义名称
页面地址选中获取默认页地址的格式;这里我选择默认页源代码内容采集得到的地址;
正则内容为:
复制并修改value值为[参数]
传递给组合结果
?specialType=cowry&auction_id=[参数1]ps:应该有印象吧?是去复制淘宝客链接的页面地址。这里是为了得到淘宝客链接。
测试一下。
完美保存~!
添加一个淘宝客链接-并且所属多页选择为链接
匹配:
确定保存。测试结果:
教程结束!
END!
推荐广告联盟: 美度联盟作者:食肉者食天下
转载请保留作者和原地址。不然视为侵权~
五 : 火车头采集器怎么设置正则过滤数字?
火车头很好想怎么采集就怎么采集,但是有时需要过滤一些麻烦的数字怎么办呢?今天小编就给大家一个方法!
1、打开您的火车头,并打开需要替换的字段,添加正则替换。
2、输入正则替换语句。
(d{2,100})
意思是替换2位以上的数字,后面的100和前面的2一个意思!
3、替换结果!
第一张有数字2017
第二张为替换后的结果,已经去掉了2017
相关推荐:
火车头采集器怎么采集文章?
本文标题:火车头采集规则-什么是“火车头采集规则”?61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1