一 : 电商数据挖掘之关联算法(一):“啤酒+尿布”的关联规则是怎么来的
关联,其实很简单,就是几个东西或者事件是经常同时出现的,“啤酒+尿布”就是非常典型的两个关联商品。
文/通策信息首席运营官 谭磊
所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。其中前者主要用在互联网的内容和文档上,比如搜索引擎算法中文档之间的关联性,我们采用的词是relevance;而后者往往用在实际的事物之上,比如电子商务网站上的商品之间的关联度我们是用association来表示的,而关联规则是用association rules来表示的。
如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。简单地来说,关联规则可以用这样的方式来表示:A→B,其中A被称为前提或者左部(LHS),而B被称为结果或者右部(RHS)。如果我们要描述关于尿布和啤酒的关联规则(买尿布的人也会买啤酒),那么我们可以这样表示:买尿布→买啤酒。
关联算法的两个概念
在关联算法中很重要的一个概念是支持度(Support),也就是数据集中包含某几个特定项的概率。
比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%。
和关联算法很相关的另一个概念是置信度(Confidence),也就是在数据集中已经出现A时,B发生的概率,置信度的计算公式是 :A与B同时出现的概率/A出现的概率。
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,或者即使知道也是不确定的,因此关联分析生成的规则带有置信度。
关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。
关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。
关联规则的发现过程可分为如下两步:
第一步是迭代识别所有的频繁项目集(Frequent Itemsets),要求频繁项目集的支持度不低于用户设定的最低值;
第二步是从频繁项目集中构造置信度不低于用户设定的最低值的规则,产生关联规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大的部分。
支持度和置信度两个阈值是描述关联规则的两个最重要的概念。一项目组出现的频率称为支持度,反映关联规则在数据库中的重要性。而置信度衡量关联规则的可信程度。如果某条规则同时满足最小支持度(min-support)和最小置信度(min-confidence),则称它为强关联规则。
关联规则数据挖掘阶段
第一阶段必须从原始资料集合中,找出所有高频项目组(Large Itemsets)。高频的意思是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。以一个包含A与B两个项目的2-itemset为例,我们可以求得包含{A,B}项目组的支持度,若支持度大于等于所设定的最小支持度(Minimum Support)门槛值时,则{A,B}称为高频项目组。一个满足最小支持度的k-itemset,则称为高频k-项目组(Frequent k-itemset),一般表示为Large k或Frequent k。算法并从Large k的项目组中再试图产生长度超过k的项目集Large k+1,直到无法再找到更长的高频项目组为止。
关联规则挖掘的第二阶段是要产生关联规则。从高频项目组产生关联规则,是利用前一步骤的高频k-项目组来产生规则,在最小可信度(Minimum Confidence)的条件门槛下,若一规则所求得的可信度满足最小可信度,则称此规则为关联规则。
例如:经由高频k-项目组{A,B}所产生的规则,若其可信度大于等于最小可信度,则称{A,B}为关联规则。
就“啤酒+尿布”这个案例而言,使用关联规则挖掘技术,对交易资料库中的记录进行资料挖掘,首先必须要设定最小支持度与最小可信度两个门槛值,在此假设最小支持度min-support=5% 且最小可信度min-confidence=65%。因此符合需求的关联规则将必须同时满足以上两个条件。若经过挖掘所找到的关联规则 {尿布,啤酒}满足下列条件,将可接受{尿布,啤酒} 的关联规则。用公式可以描述为:
Support(尿布,啤酒)≥5% and Confidence(尿布,啤酒)≥65%。
其中,Support(尿布,啤酒)≥5%于此应用范例中的意义为:在所有的交易记录资料中,至少有5%的交易呈现尿布与啤酒这两项商品被同时购买的交易行为。Confidence(尿布,啤酒)≥65%于此应用范例中的意义为:在所有包含尿布的交易记录资料中,至少有65%的交易会同时购买啤酒。
因此,今后若有某消费者出现购买尿布的行为,我们将可推荐该消费者同时购买啤酒。这个商品推荐的行为则是根据{尿布,啤酒}关联规则而定,因为就过去的交易记录而言,支持了“大部分购买尿布的交易,会同时购买啤酒”的消费行为。
从上面的介绍还可以看出,关联规则挖掘通常比较适用于记录中的指标取离散值的情况。
如果原始数据库中的指标值是取连续的数据,则在关联规则挖掘之前应该进行适当的数据离散化(实际上就是将某个区间的值对应于某个值),数据的离散化是数据挖掘前的重要环节,离散化的过程是否合理将直接影响关联规则的挖掘结果。
下一期将介绍一个运用关联规则的案例来解释关联算法的实际应用。
下一篇:电商数据挖掘之关联算法(二):牛奶可以搭配哪些商品
注:相关网站建设技巧阅读请移步到建站教程频道。
二 : 小挖掘机参数计算
7 与同类产品主要参数比较表
4.5T级小型挖掘机国内外同类机型性能规格对照表
小挖机 小挖掘机参数计算
1 总体参数计算
1.1 功率计算
1.1.1发动机原始参数
发动机型号:YANMAR 4TNV88-SYY
型式:4缸直列、水冷、4冲程、涡轮增压、空气中冷、电控燃油系统
发动机功率/额定转速: 29.4kW/2400rpm
发动机最大扭矩: 144 N?m /1320rpm
1.1.2液压泵参数
液压主泵型号: PVK-2B-505-N-4191A
主泵排量: 50ml /rev
主泵最大流量: 110 l/min
主泵起调压力: 12Mpa
主泵输入功率: kW (W=110*12/(60*0.97)=22.7)
主泵输入扭矩: N?m (Pq=159×12×50×0.001=95.4)
伺服系统压力: 3.9 Mpa
1.1.3功率储备系数、扭矩储备系数
功率储备系数:
K1= (29.4-22.7-2.5)/29.4 =14.3%
扭矩储备系统:
K2= (144-95.4)/144 = 50%
通过以上计算功率储备系数、扭矩储备系统均大于10%,发动机能够稳定地工作。(www.61k.com)
1.2 回转速度、回转力矩计算
1.2.1回转机构原始数据:
回转马达型号: PCL-200-18B-1S2-8486A
回转马达排量: 33.8ml/rev
回转马达最大供油量: 39l/min
回转减速机速比: i1 18.4
输出轴齿数/模数: 14/7
回转系统压力: 21Mpa
回转齿圈齿数: 86
终传动速比: i2 86/14=6.143
1.2.2回转速度计算:
回转马达转速(容积效率设定为0.96):
n1= 39/33.8×1000×0.94= 1085rpm
n1 回转速度: n==1085/(18.4×6.143) =9.6rpm i1?i2
机密 第 2 页 2005年12月
小挖机 小挖掘机参数计算
1.2.3回转力矩计算:
马达输出转矩(机械效率设定为0.85):
M?vg?p?i1210?0.85?18.4
20??33.8?
20?3.14?1767.7Nm
回转力矩
Mh?Mi2?1767.7?6.143?10859Nm
1.3 行走性能计算
1.3.1基本参数
整机质量 G=4800kg
履带内阻力 W=0.06G=2880N
驱动轮节圆直径 Dk=0.4158m
驱动轮齿数 Z=19
轨链节距 t0=135mm
履带轮距 L=1940mm
履带轨距 A=1560mm
履带高度(不包括凸缘) h=536mm
履带板宽 B=400mm
行走减速机速比 i =47.53
行走马达减速机型号: PHV-4B-60BP-1S-8502A 马达最大供油量: 50l/min
行走马达排量(qmax/qmin ) 28.6/17.4 ml/rev
1.3.2驱动力矩、行走牵引力计算
液压系统压力 P=24.5MPa
马达机构效率 ηm1=95%
马达容积效率 ηv=98%
行走机构机械效率ηm2=85%
马达低速时输出扭矩 Mmmax=159?P?qmax?ηm1
=159?24.5?28.6?0.001?95% =105.84N.m
马达高速时输出扭矩 Mmmin=159?P?qmin?ηm2
=159?24.5?17.4?0.001?95% =64.39N.m
行走机构低速时输出扭矩 Mgmax= Mmmax?i?ηm2 =105.84?47.53?85% =4276N.m
行走机构高速时输出扭矩 Mgmin= Mmmin?i?ηm2 =64.39?47.53?85%
=2601.4N.m
低速时行走牵引力 Tmax= 2?Mgmax/(Dk/2)
机密 第 3 页 2005年12月
小挖机 小挖掘机参数计算
=2?4276/(0.4158/2)
=41135.2N
实际低速时行走牵引力 Tmaxa=Tmax - W
=41135.2-2880N
=38255.2N
高速时行走牵引力 Tmin= 2?Mgmin/(Dk/2)
=2?2941/(0.4158/2)
=25073.6N
实际高速时行走牵引力 Tmina=Tmin - W
=25073.6-2880
=22193.6N
1.3.3爬坡能力计算
设爬坡能力为: 60%
爬坡角度: α= arctan(60%) = 31°
坡度阻力: W1 = Gsinα= 4800×9.8×sin(31°)
= 24227.4N
滚动阻力系数: f = 0.12
滚动阻力 W2= Gfcosα=4800×9.8×0.12×cos(31°)
=4838.5N
爬坡阻力 W坡=W1+W2
= 24227.4+4838.5
=29065N
因为 最大牵引力 Tmaxa=38255.2> W坡
所以有60%的爬坡能力,由于受发动机油底壳的限制,本机爬坡能力为30°。(www.61k.com]
1.3.4原地转弯能力计算
W= W运行阻力+ W转弯阻力
W运行阻力= (G/2)*K K=0.12
W转弯阻力=(β×μ1×G×L)/(4×A)
式中:W转弯—原地转弯阻力
β—转弯时履带板侧边刮土的附加阻力系数,β=1.15
μ1—履带与地面的摩擦系数,μ1=0.5~0.6 取 0.6
L —轴距 A—轨距
则 W转弯=(1.15×0.6×4800×1940) ×9.8/(4×1560)
=10091 N
W= 10091+2822.4=12913.4 N
Tmaxa=38255.2 > W转弯 所以能实现原地转弯
1.3.4行驶速度计算
行走马达减速机型号:PHV-4B-60BP-1S-8502A
主要参数:
最大输出扭矩:5301NM
最高输出速度:36.8/60.5rpm
速 比(ratio) :I=47.53
机密 第 4 页 2005年12月
小挖机 小挖掘机参数计算
马达大排量(Vgmax):qmax=28.6 cc/r
马达小排量(Vgmin):qmin=17.4 cc/r
马达最高输出转速(Max. Output speed): 2874rpm
过载溢流阀压力设定:P=25.0 Mpa
停车制动:静摩擦扭矩(Static friction torque):87.3NM
释放压力(Release pressure): 最小(Min):15bar,最大(Max):300bar
1.3.4.1高速行驶计算
61阅读提醒您本文地址:
高速行驶时马达转速 Nmmax1=Q×ηv/qmin
=50×0.98/(17.4×0.001)
=2816rpm
高速行驶时减速机转速 Ngmax1= Nmmax1/i
=2816/47.53
=59.25rpm
高速行驶速度 V1=60× Ngmax1×π×Dk×0.001
=60×59.25×3.14159×0.4158×0.001
=4.6km/h
1.3.4.2低速行驶计算
低速行驶时马达转速 Nmmax2=Q×ηv/qmax
=50×0.98/(28.6×0.001)
=1713.3rpm
低速行驶时减速箱转速 Ngmax2= Nmmax2/i
=1713.3/47.53
=36.05rpm
低速行驶速度 V2=60× Ngmax2×π×Dk×0.001
=60×36.05×3.14159×0.4158×0.001
=2.8km/h
注:本计算以NACHI系统机构参数为依据,具体参看液压参数对比表。(www.61k.com]
1.3.5接地比压计算
接地比压 p=G
2B(L?0.35h)
=4800/[ 2×40×(194+0.35×53.6)]
=0.28 kgf/cm2
1.4 挖掘力计算
1.4.1铲斗挖掘力计算
铲斗油缸缸筒直径: D铲斗=0.075m
液压系统最高压力: PC=28MPa
铲斗油缸推力: Fb=πD2 PC /4
=3.14×0.0752×28×106/4
=123.64kN
机密 第 5 页 2005年12月
小挖机 小挖掘机参数计算
r1?r3 r2?l3
=123.64×(330×228.98)/(297.55×861.6)
=36.4 kN
铲斗最大挖掘力: POD=Fb?
1.4.2斗杆挖掘力计算
斗杆油缸缸筒直径: D斗杆=0.17m
液压系统最高压力: Pd=24.5MPa
斗杆油缸推力: Fa=πD2 Pd /4
=3.14×0.0852×24.5×106/4
=139.03kN
r5斗杆最大挖掘力: POG=Fa? r6
=139.03×405/2240.881
=25.13 kN
机密 第 6 页 2005年12月
小挖机 小挖掘机参数计算
机密 第 7 页 2005年12月
61阅读提醒您本文地址:
本文标题:数据挖掘算法-电商数据挖掘之关联算法(一):“啤酒+尿布”的关联规则是怎么来的61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1