步骤2:准备模型训练数据
我们的推荐系统将基于分类任务,确定特定产品是否属于适当的组。训练得两种类型的数据。正条目表示从购物车中移除任意产品,而负条目表示从未包含在购物车中的产品。这种方法可以让您区分应该或不应该包含在购物车中的产品。接下来,您需要为每个条目填充上下文:零售店的描述、购买时间、外部属性。在形成用 切特数据 于训练模型的数据集的过程中,这些操作的代码包含在上面的笔记本中。
DataSphere 使用标准的 Jupyter Notebook 界面。 GlowByte。通常,不同的笔记本电脑可用于信息准备和培训;在演示装置中,这些动作是一起进 如何优化网站的移动 SEO 行的。创建推荐系统时,用户可以使用任何指定的选项。本说明使用现成的笔记本文件。
接下来,您需要为每种产品创建矢量表示 – 一组与产 手机号码列表 品在篮子中的呈现方式相对应的特征。为此,我们使用了 SVD 分解方法,该方法广泛应用于机器学习的各个领域。让我们创建一个矩阵,其中一行代表一个篮子,一列代表其中包含的产品。利用SVD分解,将矩阵分解为三个元素。为此,计算给定产品的向量表示和购物篮向量的平均值之间的余弦度量。
这将允许您确定给定产品和特定购物篮中的产品之间的相似程度。
为了向用户生成个性化推荐,我们对每个产品应用计算的 RFM 聚合:新近度(购买该产品的时间)、频率(购买频率)、金额(每个用户在相应产品上的支出)。计算出的总量可作为预测模型的预测指标。
在输出中我们得到一个将用于解决问题的数据集。
步骤3:训练模型
完成数据准备后,您需要选择训练方法。一旦完成,该模型将能够根据产品与购物篮的潜在相关性对其进行排名。根据生成的排名和业务指标,提出建议。 GlowByte 专家发现,在这种情况下最合适的方法是梯度提升,它被广泛用于分类和回归。如果所使用的数据包含可以成功应用于深度学习的依赖关系,那么所有类型的神经网络也都适用。
接下来我们开始训练。完成后,可以评估所选预测因子的重要性。
下一步是评估生成的模型的质量。 GlowByte 专家声称分两步进行会更加方便。首先是评估预测某个产品是否会被纳入购物篮的准确性。二是检验算法的实际使用效果。所考虑情况下的第一个动作是通过分类方法评估的指标,基于历史数据来执行的。第二是通过详细设计和实施A/B测试。