本文作者:访客

Yandex 发布最大音乐推荐开源数据集 Yambda

访客 2025-05-30 15:24:10 3
Yandex 发布最大音乐推荐开源数据集 Yambda摘要: 5月30日消息,俄罗斯搜索引擎巨头Yandex昨日发布了世界上最大的音乐推荐系统开源数据集Yambda,包含47.9亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。Yand...
5月30日消息,俄罗斯搜索引擎巨头Yandex昨日发布了世界上最大的音乐推荐系统开源数据集Yambda,包含47.9亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。
Yandex在十个月内收集了近2800万YandexMusic月度用户的数据,具体为用户与939万首歌曲的47.9亿次交互,数据集包括听众对歌曲好恶的关键反馈,所有交互都带有时间戳以提高准确度。

Yambda在HuggingFace提供三种大小的数据集供自由下载:Yambda-5B(来自100万名用户的行为)、Yambda-500M(10万用户)和Yambda-50M(1万用户)。其中规模最大的5B数据集至少需要85GB存储空间。数据集包含音乐听众的偏好信息,以ApacheParquet格式存储,可用作研究用途或开发类似Spotify等流媒体服务提供的AI音乐推荐功能。据了解,Spotify和Tidal等流媒体服务通常不会发布其音乐推荐算法的代码或模型,因为推荐听众喜爱歌曲的能力被视为其成功的商业秘密。

Yandex 发布最大音乐推荐开源数据集 Yambda

阅读
分享