首页 / 音乐推荐 / 协同过滤系统音乐推荐,协同过滤的推荐

协同过滤系统音乐推荐,协同过滤的推荐

Time:2024-08-13 08:02:52 Read:0 作者:

大家好,今天小编关注到一个比较有意思的话题,就是关于协同过滤系统音乐推荐的问题,于是小编就整理了2个相关介绍协同过滤系统音乐推荐的解答,让我们一起看看吧。

如何理解协同过滤?

协同过滤可以简单理解为人们对“人以群分,物以类聚”算法解释和应用。

协同过滤系统音乐推荐,协同过滤的推荐


人以群分——基于用户的协同过滤

基于用户的协同过滤主要基于的是用户之间的相似度(依赖用户的历史喜好数据),先计算用户之间的相似度,然后将用户喜欢的物品推荐给相似用户。也就是说,当用户需要个性化推荐时,可以先找到与他相似其他用户(通过兴趣、爱好或行为习惯等),然后把那些相似用户喜欢的并且自己不知道的物品推荐给用户。

物以类聚——基于物品的协同过滤

基于项目(item-based)的协同过滤基于物品之间的相似度,先计算物品之间的相似度,然后根据用户对物品的评分,将用户喜欢物品的相似物品推荐给用户。也就是说,当一个用户需要个性化推荐时,例如由于他之前购买过《集体智慧编程》这本书,所以会给他推荐《机器学习实战》,因为其他用户很多都同时购买了这两本书。

基于用户协同过滤与基于物品协同过滤的区别

基于用户的协同过滤需要在线(系统上线后)找用户和用户之间的相似度关系,计算复杂度肯定会比基于物品的协同过滤高。同时还需考虑推荐算法的冷启动问题(如何在没有大量用户数据的前提下能够让用户对推荐结果满意),比如可以通过用户注册时让用户选择自己感兴趣的领域,生成粗粒度的推荐。

基于用户的协同过滤是给用户推荐那些和他有共同兴趣的用户喜欢的物品,所以基于用户的协同过滤推荐较为社会化,即推荐的物品是与用户兴趣一致的那个群体中的热门物品,同时能够推荐给用户新类别物品。

基于物品协同过滤则是为用户推荐那些和他之前喜欢的物品类似的物品,基于物品协同过滤的推荐较为个性,因为推荐的物品一般都满足自己的独特兴趣,所以比较是适应于用户个性化需求强烈的领域,但由于物品的相似度比较稳定,很难推荐给用户新类别的物品。

协同过滤是推荐系统中采用的一种技术手段,简单地说就是利用跟你有某些相似之处的群体的喜好行为来推荐你可能感的兴趣的信息,跟你行为相似的用户或者用户行为能帮助过滤筛选你想要的信息,达到一种“协同”的效果。

举例来说,比如你现在想去看电影,但是不知道在众多的电影之中选择哪一部,这时你会怎么做?

你可能问你身边的朋友、同事、同学,他们最近看了什么好看电影,你会参考他们的选择。

或者,打开视频网站,你在选择电影的时候,你会偏向去你之前经常看的电影类别中,找一找有没有什么新出的这类题材的电影,比如你之前是一个钢铁侠迷,钢铁侠系列的电影你都看过了,你可能就会再去看美国队长等。

上面这个例子,就展现了协同过滤的思想及两种方式:基于用户的协同过滤和基于物品的协同过滤。

1)基于用户的协同过滤,目标就是寻找跟你行为相似度高的用户,把他们的选择推荐给你。如下图所示:

但这种方式,会面临一些问题,一是对于一个没有什么行为积累的新用户,很难找到跟他行为相似的用户;二是,本用户关系的某类产品,跟其相似的用户在该类产品的选择上很少,也无法推荐;三是,人是善变的动物,比如,你之前特别爱手游,某一天你突然把游戏戒掉了,那在给你推荐游戏类的软件就是无用的。因此基于用户的协同过滤在实际应用中,因用户表稀疏,且不易维护往往不常使用。

2)基于物品的协同过滤,既然用户不便维护,我们就寻求物品之间的相似度。因为物品的一旦生产出来,特性就是确定的,而且商家为了能更好地卖出商品,也会积极描述物品的特点,因此基于物品的协同过滤,物品的特征更容易获取,也就更容易计算物品之间的相似度。

而在实际中,也要根据不同的应用场景选择合适的方式,比如,如果做新闻推荐的话,就最好选择基于用户的方式,实时进行推荐。如果是做电商、像图书、电影等,就更适合基于物品的推荐。

网易云音乐每日歌曲推荐的原理是什么?

你可能以为网易是用一天时间做一个大数据的计算,辛苦推荐出来。但是我今天做了一个试验。推荐的全是我平时不听的华语音乐。我全部点了不感兴趣。然后再点进去每日推荐,神奇的事情出现了,每日推荐又满了。再全部消掉,再点进去,又满了。说明网易的推荐其实是可以瞬间完成的,平时的每日推荐只不过是每天六点强制刷新一次。这三次推荐都是我不听的华语音乐。我开始寻找原因。原来红心里最新添加了几首华语歌。全部删掉,再点开推荐,就换风格了。重复这个操作,可以发现,推荐的歌曲并不是和红心的所有歌曲有关系,而是和最近红心的十首以内的歌曲有关。我没有测试具体数字。再试验另一个方面,我把所有红心删掉,这次没有推荐。我加上了一首金属音乐。这次下面出现几首金属音乐。上面出现的竟然都是我刚开始用网易音乐时期的推荐。我猜想网易有一个音乐库,无论喜欢的音乐是什么。在新手时期都可能推荐这个音乐库里面的音乐。重度用户会减少这个库的推荐。

首先本人非程序员,不懂算法,纯属瞎逼逼。我仅凭主观非专业角度猜测这是一种关联推荐。比如,首先你听了A这首歌,然后后台关联到听了A这首歌的所有人,看他们在听了A的同时还听了哪些歌,比如统计样本总共有10个人,他们听的歌除了A之外,还有C,D,E,F。10个人当中有8个人听过C,5个听过D,3个人听过E,一个人听过F。那么网易云音乐就把最多人听过的C推荐给你。这个统计的人数越多,就越准确。比如有统计了一千万人,或者,统计了10万人的一百次听歌记录。那么它的推荐就应该相当地准确。当然,这只是一个思路,具体实现起来,肯定还会有更多的细节需要考虑。再次声明,这仅仅是非专业的瞎逼逼,专业人士勿拍砖。

我不是专业人士真不太懂,但从一个局外人来看网易云音乐身后一定有大数据分析能力,你的歌单里有哪些歌,最经常播放哪些歌,你平时在网易云音乐喜欢搜哪类歌,它们应该都能分析出来,然后在进行统一分析处理,最后你每次登录网易云音乐时它们会根据分析的你的个人爱好进行推荐,应该是这样,

关于推荐算法现在讨论的也很多,比较基本的两种是collaborative filtering(CF) 和 content-based (CB)两种,整个推荐系统的核心我觉得就是找两个objects(可以是歌曲,可以是用户)之间的相似度。

大概意思就是说,CB就是根据用户自己提供的信息,比如建立账号时生日啊岁数啊喜好啊,还有你用了产品之后的一些操作,比如 @路人甲提到的那个表格其实就是一种可能。CF则是基于一个前提,假设甲喜欢产品a, 乙也喜欢产品a,那么乙如果买了产品b并说好,那么甲也很有可能会觉得b不错,所以就推荐给你,当然真实操作肯定不会只用一个产品确定这种联系。

这是简单的背景,如今很多公司,比如淘宝还是亚马逊,任何推荐算法本身都不可能只是单一的一种,一般都是复合型的(hybrid)。其实还有很多其他的推荐算法不过就不说了。假设你选定了一个算法,那么你就得用那个来量化相似度,因为有了量化的相似度,你才能排序,才能按照顺序从可能喜欢到最不可能喜欢推荐给用户。具体量化方法,欧几里得距离是比较简单和方便的那种。其实这个就是数学概念的矢量,可以有很多个dimensions,然后算数学距离。那么现在你有了这个排名,你得不断更新,因为不可能一下子就完全把用户的喜好口味抓住,你得通过长时间的使用让属于你的data更多,这样出来的结果也会更准确,这也是为啥你新注册账号,如果乱选或者喜欢的音乐差异较大,推荐的内容就比较不稳定。

关于具体的实现,网易的我肯定不知道,不过我想如果你真想自己做一个,写好这个之后租一个服务器,定时跑一次就可以了,大部分创业公司都是这样。

网易云音乐是网易最棒的产品,也是中国最佳音乐类产品。

推荐原理应该是基于一个模型,模型的参数大概包括:

你明确标注喜欢的曲目的类型、歌手、所属专辑等;

你的经常播放的曲目;

你对于推荐的认可度。

等等。

原理就是在海量的用户数据(行为记录等)中对用户进行划分,对同一群体的用户推荐其余用户喜欢的音乐。

1、给音乐进行归类并建立评分规则

这是我们前面说到的给内容分类,是每个平台推荐前要做好的准备。简单说就是把音乐贴标签,把相同/相似标签的音乐归到一块,所以一首歌可能会被归到多个类别里,比如说同一个歌手的歌、同种曲风或者表达某一个情绪等等。

2、建立用户模型

制定评分规则后,就可以得到每个用户和该用户相关的每首歌的一个得分,那么根据这些数据就可以给用户建立相应的模型从而为其做精确推荐。

3、寻找相似的用户

是时候介绍一下专业的词了,常用的计算相似度评价值的体系有两种:欧几里得距离和皮尔逊相关度。后者有点复杂,这里简单介绍欧几里得距离。

欧几里得距离非常直观,如下图,根据上面得出的评分,我们可以制作二维图,简单明了看出用户在哪个位置,比如 A 用户就与 D 用户距离最近,所以可以给 A 推荐 D 喜欢的歌曲。

有人说还没看懂,那我说一个简化版本的。你经常听民谣,喜欢的歌曲很大一部分都是民谣,于是网易云音乐把你归到了民谣这个群体,民谣这个群体里面还有一个人叫赵雷,有一天赵雷听了一首歌叫《成都》并且点了喜欢和收藏。系统发现你并没有听过这首歌,于是在后面的某一天,网易云音乐悄悄的把这首歌放进了你的每日推荐里面,你一听,真好听。这只是最简单的情况,而网易云音乐的推荐远没有这么简单。

到此,以上就是小编对于协同过滤系统音乐推荐的问题就介绍到这了,希望介绍关于协同过滤系统音乐推荐的2点解答对大家有用。

相关推荐
Copyright © 2002-2024 爱思音乐网 版权所有 
备案号: 沪ICP备2023025141号-115

免责声明: 1、本站部分内容系互联网收集或编辑转载,并不代表本网赞同其观点和对其真实性负责。 2、本页面内容里面包含的图片、视频、音频等文件均为外部引用,本站一律不提供存储。 3、如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除或断开链接! 4、本站如遇以版权恶意诈骗,我们必奉陪到底,抵制恶意行为。 ※ 有关作品版权事宜请联系客服邮箱:478923*qq.com(*换成@)