如何入门参与数学建模?

发布时间:
2024-09-05 23:06
阅读量:
38

​某商超蔬菜类商品动态定价与补货决策研究

摘 要

随着生鲜市场规模的持续扩大,蔬菜零售行业的竞争也愈加激烈。为帮助某商超 改善经营模式,本文基于题目所给数据信息,建立数学模型进行分析,从而制定合理 的蔬菜类商品动态定价与补货决策,提高商超收益。

针对问题一,第一问首先计算出蔬菜品类的标准差、偏度系数、峰度系数等描述 统计量。然后进行数据可视化处理,分析各蔬菜品类、单品蔬菜的销售量分布规律。结果可得各单品和各蔬菜品类的日销售量都呈现出不同程度的季节性波动,其中花叶 类和辣椒类蔬菜日销售量的波动性较大。第二问引入 Spearman 相关系数,以各蔬菜 品类及单品蔬菜的日销售量为指标,进行相关性分析,求解得出除茄类外,其它五种 品类蔬菜之间都呈现出显著的正相关关系。然后以单品的总销售量、每日最大销售量 和日均销售量为指标,通过 K-means++聚类算法将单品划分为热销、畅销、平销和滞 销四大类,进行相关性分析,结果可得热销单品较其他单品呈现出高总销售量,高每 日最大销售量和高日均销售量特点。

针对问题二,第一问首先计算出各蔬菜品类每日成本加成定价,然后通过 Pearson 相关系数检验出各蔬菜品类销售总量与成本加成定价呈负线性相关关系,于是建立线 性回归模型,利用最小二乘法求出线性回归方程。第二问首先针对不同品类蔬菜建立 时间序列预测模型,考虑数据的时效性以前半年的日销售量为原始数据预测出未来一 周各蔬菜品类的日销售量,再根据预测结果确立决策变量,以利润最大化为目标函数, 以蔬菜的补货量、定价、损耗为约束条件建立优化模型,求解出未来一周最大收益为 5105.60 元,最后引入模拟退火模型求出最优的蔬菜品类的补货和定价策略。

针对问题三,首先筛选出可用数据范围,以最大化收益为目标函数,以单品种类 数量、陈列量、补货量和定价为约束条件建立优化模型求解,筛选出 29 种可售单品 蔬菜,并估计 2023 年 7 月 1 日最大收益为 1282.2631 元,最后基于问题二的模拟退火 模型求解出最优的单品补货量和定价策略。针对问题四,首先筛选出可代表季度蔬菜丰富度、季度效应和节日因素的指标以 及六大蔬菜品类的季度平均销量,运用灰色关联分析模型,以季度各蔬菜品类的单品 蔬菜销售种数、节气期间特征单品蔬菜销量和节日期间特征单品蔬菜销量作为子序列, 遍历花叶类、辣椒类等六大蔬菜品类季度平均销量作为母序列,求解得出各指标与六 大蔬菜品类季度平均销售量的关联度均在 0.5 以上,具有很强的相关性。此外本文采 用文献检索法,综合引入了客流量数据、竞争对手的价格和策略数据、消费者反馈和 评价数据等 10 种相关数据,以此来帮助商超制定合理的蔬菜补货和定价策略。最后本文对所建立的模型进行了讨论和分析,综合评价了模型的优缺点。

关键词:K-means++聚类 优化模型 模拟退火模型 灰色关联分析

一、 问题重述

1.1 问题背景 随着社会经济的飞速发展和人民生活水平的提高,我国消费市场呈现持续活跃、 稳健增长的态势。而生鲜产品作为保障民生、维护社会安稳的刚需性消费品,市场规 模巨大[1]。

蔬菜作为人民日常生活不可或缺的食物之一,其本身具有高频性、精致化等消费 特点,市场前景广阔。但由于蔬菜具有周期性、季节性、易腐和易伤等自然属性,加 之蔬菜品种众多且产地不同所导致的购入成本各异,因此合理的定价和补货决策对于 商家实现成本较低、利润最大化的经营目标至关重要,此外,制定针对于不同时间段 的蔬菜需求量与供给量、供给种类的促销方案与销售组合也是需要考虑的问题。为了 更好地满足市场需求,达到好的经济效益和社会效益,很有必要根据实际情况决定生 产和销售活动[4]。可通过较为科学系统的数学方法对蔬菜市场进行研究分析,制定动 态灵活的蔬菜商品定价以及补进策略,并依据分析结果策划合理营销方案,持续焕发 商业活力,带来更高利润。

1.2 问题要求

附件 1、2、3、4 所给出的是某商超近三年关于蔬菜类商品的单品编码、类别等基 本信息,进价、定价和销量等销售及进货情况。为使该商超在今后蔬菜类商品的销售 中做出合理决策,获得更高利润,现需结合实际情况与附近所给信息建立数学模型, 分析以下问题:

问题一:依据附件 1 中 6 个蔬菜品类的商品信息以及附件 2 中的销售流水明细, 合并统计相关数据,分别分析蔬菜各品类、蔬菜单品销售量的分布规律、相互关系, 判断不同品类或不同单品之间是否存在一定的关联关系。

问题二:结合相关文献以及附件 1、2、3、4,计算出各蔬菜品类的成本加成定价, 再分析其与各蔬菜品类销售总量之间的关系。同时以利润最大化为目标,制定出各蔬 菜品类未来一周(2023 年 7 月 1 日-7 日)的日补货总量和定价策略。

问题三:从附件 2 中找出 2023 年 6 月 24-30 日的可售品种,按照单品订购量(销 售总量)不少于 2.5 千克等要求,筛选出 27-33 个可售单品,并据此制定 7 月 1 日的 单品补货量和定价策略,尽量满足市场需求,获得最大收益。

问题四:整合分析 4 个附件中的数据,从季节、节日、销售形式等角度观察数据 特征,整理出对于制定蔬菜商品的补货和定价决策有较大影响的相关数据,并给出选 择理由,提出合理意见。

二、 问题分析

2.1 问题一的分析 针对问题一,第一小问,首先对附件 2 中的无效数据进行剔除处理,然后引入均 值、最大值、最小值、中位数、标准差、偏度系数、峰度系数描述统计量,并通过数 据可视化分析,通过绘制柱状图,折线图等直观观测 2020 年 7 月 1 日-2023 年 6 月 30 日各品类蔬菜和单品蔬菜的销售情况及销售趋势,由此得出其分布规律。第二小问首 先引入 Spearman 相关系数,以第一问得到的各蔬菜大类及大类中的单品蔬菜每日销 售量为指标,进行蔬菜各品类销售量的相关性分析。然后采用 K-means 聚类算法,以单品的总销售量、每日最大销售量和日均销售量为指标,将单品划分为热销、畅销、 平销和滞销四大类,进行单品销售量的相关性分析。

2.2 问题二的分析

针对问题二,第一小问先根据成本加成定价公式计算得出各蔬菜品类三年来每日 定价情况,然后引入 Pearson 相关系数判定各蔬菜品类的销售总量与成本加成定价的 线性关系,最后建立线性回归模型,使用最小二乘法求出各蔬菜品类与其成本加成定 价之间的线性回归方程。第二小问针对不同品类蔬菜建立合适的时间序列预测模型, 考虑到数据的时效性,本文首先以前半年日销售量为原始数据预测未来一周各蔬菜品 类的日销售量,然后根据预测结果建立优化模型。最后引入模拟退火模型求出最优的 蔬菜品类的补货和定价策略。

2.3 问题三的分析

针对问题三,题目要求根据 2023 年 6 月 24-30 日的可售品种,按照单品订购量 (销售总量)不少于 2.5 千克等要求,筛选出 27-33 个可售单品。以最大收益为目标, 制定 7 月 1 日的单品补货量和定价策略。本题仍然为优化问题中的线性规划问题,由 由此本题基于问题二构建的模拟退火模型。首先根据题意筛选出可用的数据范围,确 定目标函数及其约束条件,求出最优的单品补货量和定价策略。

2.4 问题四的分析

针对问题四,首先在现有数据基础之上进行数据预处理,筛选出季度各蔬菜品类 的单品蔬菜销售种数、节气期间特征单品蔬菜销量和节日期间特征单品蔬菜销量,分 别代表季度蔬菜丰富度、季度效应和节日三个因素。其次利用以上指标数据,建立灰 色关联分析模型,以季度各蔬菜品类的单品蔬菜销售种数、节气期间特征单品蔬菜销 量和节日期间特征单品蔬菜销量作为子序列,遍历花叶类、辣椒类等六大蔬菜品类季 度平均销量作为母序列,求出各指标对销售量的关联度,以关联度值衡量相关性的大 小。通过文献检索法综合引入客流量数据、竞争对手的价格和策略数据、消费者反馈 和评价数据等 10 种相关数据,据此制定合适的蔬菜补货和定价策略。



三、 模型假设

1.假设蔬菜的历史销售数据能够代表未来的销售趋势,本文使用历史销售数据来预 测未来的销售。

2.假设蔬菜的损耗是固定的,本文使用损耗率来计算蔬菜的单位成本。3.商超的销售空间是固定的,我们假设商超的销售空间在一段时间内是恒定的。



五、 数据侧写

考虑到数据较为庞大和复杂,为更好地分析和理解数据,需在进行问题分析和解 答前提前进行数据分析。根据题目要求,综合附件 1、附件 2、附件 3 和附件 4 中的 数据和信息,并利用 Excel 和 Python 等工具,对数据进行多角度、多标准的整理和观 察,以初步了解整体数据的大致情况,便于之后对问题的分析和解答

5.1 六大品类蔬菜的品种丰富度

蔬菜的品种丰富度可以为商超提供洞察消费者需求、增加竞争优势和挖掘市场潜 力的机会,有助于商家优化产品组合、关注热门品种、提高销售额和满足消费者的多 样化需求,六大品类蔬菜的丰富度如图 2 所示:



由图 2 可知,花叶类蔬菜占品种数量的 40%,品种丰富,意味着市场上有各种各 样的花叶类蔬菜可供选择。相比之下,花菜类蔬菜的品种数量只占 2%,在市场上可 供选择的品种相对较少,选择范围较窄。

5.2 六大品类蔬菜

12 个季度平均销售量情况 蔬菜 12 个季度的平均销售量情况可以帮助商超了解销售趋势、预测市场需求、 调整产品组合和制定竞争策略。对商超进行决策制定、业务规划和市场运营都非常有 价值。六大品类蔬菜 12 个季度平均销售量情况如图 3 所示:



由图 3 知,花叶类较其他五类蔬菜全年销售量较高。花叶类、辣椒类、食用菌和 水生根茎类销售量峰值的出现规律都呈现出周期性,大都在每年的一三四季度出现峰 值。

5.3 六大品类蔬菜损耗率

蔬菜损耗率的分布情况可以帮助商家成本管理和供应链优化,推动可持续发展, 并提高商超的市场竞争力。六大蔬菜品类的损耗率如图 4 所示:



由图 4 可知,花菜类、水生根茎类以及花叶类的蔬菜损耗率都在 10%以上,损耗 率较高,较难保存。茄类的损耗率大约为 7%,较容易保存,意味着销售时间较长。

六、 问题一模型的建立与求解

6.1 数据预处理

在分析蔬菜各品类及单品的销售量分布情况时,部分商品存在退货的情况,销售 单价显示为负值,不能反映实际的销售量情况,属于无效数据,故对附件 2 中退货的 数据进行剔除处理。

6.2 第一问:通过数据处理分析分布规律

6.2.1 基于数据的数字特征进行描述

题目要求根据蔬菜各品类的商品信息和单品销售量的情况,描述蔬菜各品类和单 品的销售量的分布规律,本文引入均值、最大值、最小值、中位数、标准差、偏度系 数、峰度系数来描述统计数据。













6.3 第二问:分别建立模型判断关联关系

6.3.1 利用 Spearman 相关系数判断各品类之间的相关性





































八、 问题三模型的建立与求解

8.1 数据预处理

根据题目规定,制定较合理的单品补货量和定价策略,选择 2023 年 6 月 24 日-6 月 30 日间所销售的单品蔬菜作为补货选择,。同时为求收益最大,还需筛选出各补货 单品蔬菜此期间批发单价和损耗率。共筛选出 49 种单品蔬菜进行售卖,部分单品蔬菜每日批发单价及其损耗率如下 (其余单品蔬菜此期间批发单价和损耗率见附录







九、 问题四模型的建立与求解

题目要求分析影响商超收益的因素,并据此制定更优的蔬菜商品补货和定价决策, 本文将通过模型分析和文献查阅两种方式提出合理建议。

9.1 模型分析

为更好制定蔬菜补货和定价策略,本文在现在已有数据基础之上进行数据预处理, 筛选出季度各蔬菜品类的单品蔬菜销售种数、节气期间特征单品蔬菜销量和节日期间 特征单品蔬菜销量,分别可代表季度蔬菜丰富度、季度效应和节日因素,三个指标与 其所属蔬菜品类季度平均销量相结合,建立灰色关联分析模型,分析各指标对销量的影响程度,从而可说明这些指标对制定补货和定价策略存在一定影响。

9.1.1 数据预处理

根据现有数据进行处理。本题根本要求为探查各因素对销售情况的影响,故筛选 出六大蔬菜品类三年来 12 季度的平均销售量作为因变量因素;同时筛选出季度各蔬 菜品类的单品蔬菜销售种数、节气期间特征单品蔬菜销量和节日期间特征单品蔬菜销 量作为自变量因素。

(1)特征单品蔬菜的选取 为有效的判断单品蔬菜对其所属蔬菜品类的影响,本文选取各蔬菜品类三年中销 售总量最多的单品蔬菜作为特征单品蔬菜。各蔬菜品类特征单品蔬菜如下:









9.2 文献查阅

9.2.1 客流量数据:不同的时间和日期会对客流量产生显著影响,而客流量与蔬菜的销售量直接相关。商超通过掌握客流量高峰和低谷时段,可以精准调整陈列策略、促销活动时间以及进 货量,最大程度地满足顾客需求并提高经营利润。

9.2.2 竞争对手的价格和销售策略信息:竞争对手的实力和数量,因为一家超市都有一定的服务商圈,同一商圈内竞争对 手的数量、规模、核心竞争力等因素直会影响到超市的定价策略[3]。通过比较其他商 超的定价策略,商家可以精准自身价格定位,以此保持竞争力。商家还可以根据竞争 对手的销售策略来设计自己的促销方案,通过了解竞争对手关于产品定位、品种选择 和组合搭配等方案,选择合理的优惠方式、设置合适的销售季节或节日促销活动等, 以提升顾客吸引力。通过对竞争对手商业经营的研究,商家也可以发现差异化的市场 机会,并根据市场需求调整自身的经营模式,从而吸引更多顾客。

9.2.3 消费者反馈和评价数据:收集顾客关于商品新鲜度、品质和价格的反馈,可以进一步了解顾客的需求和喜 好,从而做出有针对性的销售改进和调整。首先,顾客对商品新鲜度的反馈可以让商 家了解保鲜时间较长的商品以及可能存在质量问题的商品,从而对商品的运输储存工 作进行调整,确保商品能够以较佳状态售卖给顾客。其次,顾客对商品品质的反馈可 以反映商品的优点和不足之处。商家可以借助顾客的反馈选择进货渠道。最后,顾客 对商品价格的反馈可以帮助商家了解其定价策略是否与顾客的期望相符,进而对定价 策略做出适当调整。

9.2.4 顾客需求数据:通过顾客走访调查、购买记录和反馈收集等方式,了解顾客对蔬菜商品的需求偏 好、偏好的品种、包装的偏好、购买频率等信息。基于以上数据,商超可以制定针对性的营销策略和经营决策。首先,根据顾客对 蔬菜品种和包装的偏好,商超可以优化产品陈列组合,增加顾客喜欢的蔬菜种类和规 格的供应,从而满足多样化的需求。其次,根据顾客对品质、有机认证等需求的偏好 以及竞争市场定价情况,商超可以优选进货源、合理定价,平衡产品质量和价格之间 的关系,提供更具吸引力和竞争力的蔬菜商品。最后,根据购买频率和顾客偏好,商 超可以设计有针对性的促销活动,增加顾客的忠诚度和购买欲望

9.2.5 天气数据:收集未来的天气预报和节假日数据,可以帮助商家做出更准确和有针对性的决策, 以应对消费者购物行为的变化和利用特定的销售机会。天气状况对顾客的购物行为有很大的影响。例如,在暴雨天气下,消费者可能不 愿意外出购物,而更倾向于线上购物。通过收集未来的天气预报数据,商家可以提前 准备,适时调整库存、推广策略和促销活动,以满足消费者的需求和偏好。

9.2.6 供应链和物流数据:收集有关供应商的信息,包括产品产量、产地规模、货源地距离等。这些数据可 以帮助商超评估供应商的供货能力,确保供应链不会出现缺货或供应不足的情况。其 次,记录供应商的交货时间,并与实际交货时间进行对比。这有助于商超评估供应商 的交货准确性和可靠性,以便合理安排库存和补货计划。此外,监测和记录供应商提 供的产品的品质和符合性。通过收集顾客的反馈和进行抽样检测,商超可了解各供应 商提供的产品质量,并据此判断合作伙伴的可靠性。

9.2.7 库存状况:通过了解蔬菜的库存情况,可以预测可能会出现过度库存情况的蔬菜。当某种蔬 菜库存过多而需求不足时,商家可能需要考虑采取打折销售、促销活动等措施来减少 库存,帮助商家降低库存积压的风险,同时吸引更多的消费者购买,减少损失并库存 的新鲜度。另一方面,了解蔬菜的库存情况还可以预测可能出现短缺的蔬菜种类。如 果某种蔬菜的库存供应紧张,商家需考虑调高价格或采取其他供应措施,以确保供应 的持续性、保持产品的可行性,这有助于商家在供应紧缺的情况下维持合理的利润, 并能够及时调整供应链、寻找替代品或与供应商进行谈判。

9.2.8 财务数据:通过分析各蔬菜商品的成本、利润率和销售额,商超可以做出准确的定价决策。商超基于商品的成本和市场需求,可以设定合理的售价,以确保合理的利润水平;其 次,根据销售数据和市场趋势,调整商品组合,引入新的热门蔬菜品种,并适应消费 者需求的变化,可优化其蔬菜商品组合;通过重点关注高利润率的商品或调整库存量, 可提高整体利润率。


9.2.9 退货数据 通过分析退货记录可以帮助商家做出更好的决策:首先可以帮助商家了解退货的原因:是因为产品质量问题,还是因为顾客对产品 不满意,或者是因为误购或者不需要了。其次,退货记录可以揭示产品的质量问题。商家可以根据退货原因和产品类型,对质量问题进行统计和分析,以识别潜在的质量 问题,并采取相应的措施,提高产品质量。此外,通过分析退货记录,商家可以确定 哪些商品容易被退货。根据这些数据,商家可以考虑调整其商品组合,例如减少或替 换不受欢迎的产品,增加更受顾客喜爱的产品。同时,退货记录也提供了有关顾客反 馈和满意度的信息。商家可以利用这些数据来改进客户服务,以减少退货率。



9.2.10 打折次数

通过分析单品的打折次数可以帮助商超做出更好的决策:打折销售频繁度的单品蔬菜即可反映出其销售呈现俱佳或较差两个极端现象。如 果某个单品蔬菜的打折销售频繁度较低或几乎没有打折情况,这可能意味着该蔬菜在 市场上非常受欢迎,供不应求。如果某个单品蔬菜的打折销售频繁度较高,这可能意 味着该蔬菜的销售相对较弱。商家为了促进销售,采取了多次打折策略。此外,蔬菜 的保鲜期通常较短,如果销售不及预期,商家可能需要加快处理和销售以减少损耗。因此,通过观察单品蔬菜的打折销售频繁度,商家可以了解该蔬菜的销售情况表 现,从而根据情况调整定价策略、采取促销措施,并有效管理损耗和保持蔬菜的品质。本文收集了 2020 年 7 月 1 日—2023 年 6 月 30 日三年期间的单品蔬菜的打折次 数,如下表(由于篇幅原因,此处只展示前三十种单品数据,其余见附录)



由上图可知,净藕的打折次数颇多,可能意味着销售状况不理想或市场竞争激烈。商家可以通过分析销售数据、消费者反馈和竞争情况来确定适当的销售策略和促销措施,以提高净藕的销售额和市场竞争力。

9.3 总结

综上所述,商超采集以上相关数据可以为他们制定蔬菜商品的补货和定价决策提 供更准确、科学的依据,从而提高经营效益和顾客满意度。

十、 模型的评价与推广

10.1 模型的优点

1、K-means++算法是 K-means 算法的升级,本文聚类指标量纲差距较大,此算法 在初始聚类中心上做出规定,选取了更合理的初始聚类中心,为迭代出最佳迭代聚类 中心而奠基。

2、线性回归模拟各蔬菜品类销售量与成本加成定价的关系,可直观显示各蔬菜品 类销售量的变化可引起一定量的成本加成定价的变化。

3、时间序列预测模型为简单季节性和温特斯乘法,充分分解了各蔬菜品类近三年 历史销售量的各项特征结合,近期时效特征,模拟出更加贴合实际和准确的预测值。

4、模拟退火算法可根据一定概率可以放弃局部最优解,找到全局最优解。

5、灰色关联分析简单易懂,可直观地反映因素之间的关联程度。通过计算关联度 来判断各个因素对目标因素的影响程度,结果易于理解和解释。

10.2 模型缺点

1、K-means++算法初始中心选择不当,仍然可能陷入局部最优解。

2、灰色关联分析过去浅显,对数据要求过高,数据若存在较大异常值,可能会对 结果产生较大的影响。

10.3 模型推广

时间序列可提取数据的长期、季节、循环和不规则趋势,可用其做一社会生产中 的经济发展预测或交易预测等,如冷饮销售的预测、服饰销售的预测、天气温度的预 测等。

END