摘要
“薄利多销”的规则广泛应用于商家的销售规则中,通过打折来实现商品销量的增加,从而获取利益,本篇论文将对这个“薄利多销”这个问题进行研究,利用python、Excel、IBM SPSS22等工具对问题进行分析,从而算出营业额、利润率、打折力度并用回归分析建立打折力度与商品销售额和利润率的统计模型。
问题1计算该商场从2016年11月30日到2019年1月2日每天的营业额和利润率(注意:由于未知原因,数据中非打折商品的成本价缺失。一般情况下,零售商的利润率在20%-40%之间)。针对问题1,通过python中pandas、Excel、IBM SPSS22对附件1、附件2中的异常值、缺失值进行数据预处理,并通过零售商利润率在20%-40%补全未打折的商品成本价,再通过SSPS22、Excel算出每天的营业额以及利润率,在画出营业额与利润率的透视图并发现隐藏信息,得到商场应在节假日或者双休加强打折力度,从而实现“利薄多销”。
问题2 建立适当的指标衡量商场每天的打折力度,并计算该商场从2016年11月30日到2019年1月2日每天的打折力度。对问题2
问题3分析打折力度与商品销售额以及利润率的关系。对问题3
关键词:SSPS22、数据预处理、数据挖掘
1问题描述
“薄利多销”是通过降低单位商品的利润来增加销售数量,从而使商家获得更多盈利的一种扩大销售的策略。对于需求富有弹性的商品来说,当该商品的价格下降时,如果需求量(从而销售量)增加的幅度大于价格下降的幅度,将导致总收益增加。在实际经营管理中,“薄利多销”原则被广泛应用。
附件1和附件2是某商场自2016年11月30日起至2019年1月2日的销售流水记录,附件3是折扣信息表,附件4是商品信息表,附件5是数据说明表。请根据这批数据,建立数学模型解决下列问????
1.计算该商场从2016年11月30日到2019年1月2日每天的营业额和利润率(注意:由于未知原因,数据中非打折商品的成本价缺失。一般情况下,零售商的利润率在20%-40%之间)。
2.建立适当的指标衡量商场每天的打折力度,并计算该商场从2016年11月30日到2019年1月2日每天的打折力度。
3.分析打折力度与商品销售额以及利润率的关系。
4.如果进一步考虑商品的大类区分,打折力度与商品销售额以及利润率的关系有何变化?
2分析问题
2.1对数据进行分析
第一步检查数据是否存在空值、缺失值、异常值,例如商品的UPC码存在缺失值,因为UPC码对问题的研究影响不大,可以直接剔除,商品的数量sku_cnt存在负值,这很有可能是人工误填的,可以直接剔除,商品的名称sku_name存在部分缺失,商品的名称对问题的研究影响较大,我们应该补全商品的名称。
2.2对问题分析
问题一要求计算出每天的营业额以及利润率,首先利用python、Excel对数据进行预处理之后,题目描述未打折的商品成本价已经缺失,可以根据零售商的20%对未打折的商品的成本价格进行填补,通过Excel按利润的20%计算出未打折商品的成本价,再把Excel中的数据导入到SSPS22中,根据营业额公式以及利润率公式计算出每天营业额和利润率。
对问题二,我们可以通过Excel计算出打折力度,然后建立数据透视图,从而更好的研究打折力度的。
对问题三,可以通关SPSS22导入数据,调用回归分析,判断是否共线,从而求出相关系数,确定回归模型。
3符号说明
4模型建立与求解
4.1数据预处理
通过python、Excel、SSPS22对附件1、2的商品销售记录的分析,发现其存在无关数据、异常数据、缺失数据,因此首先要进行数据预处理工作。
4.1.1消除无关数据
通过python发现附件1、2存在未交易完成的订单,即属性is_finished的属性值为0,因此我们应该消除这些与主题无关的数据,如图所示:
图4.1.1消除订单未完成的数据
4.1.2删除异常数据
通过python发现附件1、2中商品的销数量存在问题,即sku_cnt存在负值,这很有可能是人工误写导致的,因此我们可以利用python将这些数据进行删除。如图所示:
4.1.3异常数据的修改
通过Excel发现附件1、2中商品名称存在部分缺失,商品名称对我们的主题比较重要,所以我们应该根据商品的id(即附件4里面的商品名)来补全附件1、2的商品的名称,商品名称缺失的29个,占总数目的0.028%。通过Excel操作如图所示:
第一步筛选出附件1、2中商品名称缺失的数据:
4.1.4缺失数据的清除
通过Excel发现商品的upc_code存在缺失和异常,upc_code对主题的研究影响不大,因此我们可以通过Excel直接将其进行剔除,缺失和异常数据为98764,占比8.08%,如图所示:
第一步筛选出异常和缺失的upc_code:
4.1.5对成本价补全
由题目描述知附件1、2中未打折的商品成本已经缺失,因此我们可以可以根据题目给出的一般商品销售利润在20%~40%之间,我们通过商品的40%销售利润进行计算,从而补全商品的成本价,通过Excel价附件1、2进行补全,销售利润率=(售价-成本)/售价,如图是补全后的商品成本价的数据:
4.2计算每天的营业额与利润
营业额的计算公式:
4.2.1利用SPSS22
利用SPSS22求营业额如下图所示
1.打开数据集附件1、附件2
2.将附件1、附件2合并,步骤如下图所示:
3.选择个案→选择条件满足→输入is_finshed* sku_cnt* sku_sale_prc→单击确定
4.部分营业额报表
4.2.2对日营业额进行分析
通过SPSS22将合并之后的数据集存为csv格式的,通过Excel创建数据透视图,如图所示:
通过上述图片的分析可之峰值大部分是在周末或者节假日,在周末的时候商场应该打折或者举行其他方式的促销,吸引消费者,促进销量,从而减少库存,2017年、2018年营业销售总额在双11期间达到了最高峰值,其他峰值也是在周末或者其节假日,因此在节假日或者周末对需求量大的商品举行促销活动是有必要,加大促销,从而吸引消费者,提升商场人气,使消费者对商场产生依赖性,从而达到“薄利多销”的目的。
4.2.2营业额进一步分析
4.2.3利润率的计算
通过Excel先计算出每天的销售额和成本,从而计算出每天的利润率,日销售额、日成本价以及日利润率,下面给出16、17、18、19年的日销售额、日成本价以及日利润率图(由于17、18篇幅过大,只展示部分):
从图中分析可知,每天的利润率在不断波动,在节假日或者周末时,这天的利润率会出现较低的值,但是这天的润率却是个高值,例如在17年的12月11日、12月12日这两天的日利润率分别为0.211729774420964、0.167206955906349,日利润分别为3032.0719999999、7106.8240000006,由此可见12日的利润率低于11日的,但利润却高于11日的,所以商场应在周末或者节假日加大促销力度,以较低的利润率从而扩大商品的销售量,吸引消费者的购买欲望,导致整体收益变大,实现“薄利多销”。
4.2.4营业额与利润率的关系
通过Excel绘画出2017年、2018年营业额与利润率的趋势,如下图所示:
4.2计算每天的打折力度
折扣力度Zi =(Yi-Xi)/Yi,(i=1,2,...,n),其中Zi为第i天折扣率,Yi为第i天的总门店价,Xi为第i天的总销售价。
4.2.3利用Excel计算出打折率
通过Excel的数据透视表分别计算出16、17、18、19年打折率,如图所示(由于17、18篇幅过大,所以只给部分)
4.3打折力度与销售额及利润率的关系
4.3.1分析打折率与销售额及利润率的关系
通过Excel画出月平均打折率与月销售额的折线图以及月平均打折率与月平均利润率的折线图,如图所示:
4.3.2利用SPSS22确定三者关系
利用SPSS22来对折扣率、销售额、利润率做线性回归,步骤如下:
第一步导入数据到SPSS22,如下图所示:
判断方法1:特征值,存在维度为3和4的值约等于0,说明存在比较严重的共线性。
判断方法2:条件索引列第3第4列大于10,可以说明存在比较严重的共线性。
判断方法3:比例方差内存在接近1的数(0.99),可以说明存在较严重的共线性。
由上图知,维度2、3的特征值接近于0,且条件指标大于10,比例方差接近于1,因此可以得出结论折扣率与利润率、销售额存在严重的共线性。
由SPSS22得到的相关系数以及残差等如图所示:
折扣率与营业额回归图
通过以上分析从而得出折扣率与利润率、销售额共线两个标准化的系数分别为分别为-0.732196和0.219598,以及常数项0.265540,因此可以建立回归的线性模型为:
y=0.265540-0.725758x1+0.2195982
5模型评价
5.1模型优点
1.对数据进行预处理时,采用了不同的方法进行处理。
2.问题一中,对每天影响营业额和利润率情况的分析比较透彻,给出了合理的建议。
3.解决问题二,给出了合理的衡量指标。
4.问题三给出了不同折扣率对商场盈利的影响。
5.数据透视表给出了营业额等属性的分布规律。
5.2模型缺点
1.问题中只采取了一种指标来衡量打折力度。
2.没有更深层次挖掘其隐含信息。
附件:
软件工具Excel2018、IBM SPSS Statistics 22 Anaconda
问题三:SPSS运行代码求相关系数截图