浅析亚马逊A10算法②-如何让产品更容易被Amazon搜到

 AE1234速卖通卖家网  347  2023-11-24 17:48

温故而知新


亚马逊平台是如何给产品排序的呢?
通过预估不同产品的千次收益来排序,具体公式如下:
ECPM = 1000*CTR*CVR*price*comission
ECPM高的排在前面,反之则排在后面

产品是如何被找到的


我们知道了产品排序是如何排序的,那么在此之前平台是如何找到这些产品的呢?
产品在被展示到用户面前,首先要进入被收录的集合里面,才有资格被排序。然后再根据ECPM进行排序。当产品被收录和被排序同时完成后,才能获取更多流量。
结合到实际业务中,通常我们在撰写listing时,会埋入很多的关键词,是为了让产品被更多的词搜到,这就是和被收录相关。如果产品点击率,转化率都比较好,产品排序就会比较高,就会获取更多的流量。
综上,是否被收录决定了产品是否被展现,排序决定了展现量的大小
平台找产品,主要和IR(Information Retrieval)也就是信息检索相关,是指将信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。主要应用就是在搜索引擎,比如在谷歌、百度、淘宝、亚马逊等都有应用;
从时间线来看,分为现代较常用的技术知识图谱;传统的主要有倒排索引以及TF-IDF对于亚马逊而言,可以了解一下传统的解决方案。
注:知识图谱不是本章的重点,大家可以自行搜索。

倒排索引
倒排索引是一种索引方法。它被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是文档检索系统中最常用的数据结构。
结合亚马逊业务,可以这么来理解:
假设产品是蓝牙音箱。
倒排索引:通过词找asin,即某个词,对应很多asin。如下图:
假设用户搜索的是waterproof bluetooth speaker,平台会先找到waterproof、bluetooth、speaker每个词对应的asin集合,然后取交集,于是就找到了该搜索词对应的所有asin,最后再根据ECPM进行排序。参考下图案例:
注:实际上,最终符合条件的asin是非常多的,上图是个简化案例。
综上,通过倒排索引,可以快速找到许许多多相关产品。但是产品那么多,如果平台只需要其中的部分asin参与到后续的精细排序,那么如何去判断哪些asin更相关,哪些不那么相关呢?这时候就需要TF-IDF来解决这个问题。

TF-IDF
TF-IDF(Term Frequency-Inverse Document Frequency)是一种用于信息检索和文本挖掘的常用加权技术。简单来说,就是解决怎么被收录到以及如何做到排名更高的问题。
TF-IDF的计算公式为:TF-IDF = TF * IDF。
其中,TF = 词在文档中出现的次数 / 文档中总词数,IDF = log(文档总数 / 包含该词的文档数)。
具体我们通过案例来理解:
假设在类目speaker中共计有10000个asin,通过倒排索引找到了1000个和waterproof bluetooth speaker相关的asin,然后分别计算不同asin下该搜索词的TF-IDF,即可得到一个初步的相关性的排序。最终平台再选取相关度高的参与到最终ECPM的排序。
以waterproof的TF-IDF为例,包含waterproof的总计有1000个asin:
TF = 某asin中waterproof出现的次数 / title中的总词数(为了简化TF的计算,假设只采取了title中的总词数,实际可能包含bullet point等的词数。)
IDF = log2 (10000/1000)=log2 100(二进制是计算机的进制方式。)

以此类推,计算TF-IDF(bluetooth),另因为每个asin都包含speaker,通过计算IDF(speaker)=log2 1=0,即TF-IDF(speaker)=0,TF-IDF(speaker)可以忽略不计。最后三者相加,得到最终的TF-IDF值,以此来进行初步的相关性排序

最后,我们再回顾一下,产品获得流量的全流程:先被收录到,然后进入被排序的集合,最终根据ECPM来进行精细排序。
我们无法控制产品的点击率及转化率,但是一定要保证产品被收录,进入到排序的集合。因此listing的撰写尤为重要,要被收录,进入到排序的集合,核心卖点词一定要出现在title中
注:本文主要是为了给大家科普关于搜索引擎的相关技术,在实际工作中的应用还是很复杂的。

 标签: 搜索 Listing 谷歌
  • 内容来源:网络
  • 版权声明:如您认为该页面内容侵犯您的权益,请及时联系我们进行处理。
  • 友情提示:本站内容均来源于用户上传与网络,与AE1234速卖通卖家网无关。请用户注意甄别服务质量,避免上当受骗。
  • 最新