内容

这是一个包含125种不同音乐流派的Spotify音乐曲目数据集。每个曲目都有一些与其相关的音频特征。该数据以CSV格式呈现，具有表格结构，加载速度快。

用途

该数据集可用于以下用途：

根据用户的输入或偏好构建推荐系统
基于音频特征和可用的流派进行分类
其他任何您能想到的应用。欢迎讨论！

列描述

track_id：曲目的Spotify ID
artists：执行曲目的艺术家名称。如果有多个艺术家，则用“;”分隔
album_name：曲目所属的专辑名称
track_name：曲目名称
popularity：曲目的流行度，一个介于0到100之间的值，100表示最受欢迎。流行度是通过算法计算得出的，主要基于曲目播放的总次数和最近播放的次数。一般来说，当前播放量较大的歌曲比过去播放量大的歌曲更受欢迎。重复的曲目（例如来自单曲和专辑的相同曲目）将独立评级。艺术家和专辑的流行度是从曲目流行度中数学推导出来的。
duration_ms：曲目长度（毫秒）
explicit：曲目是否含有带有不雅言辞的歌词（true表示有，false表示没有或未知）
danceability：舞曲性描述了曲目适合跳舞的程度，取决于包括节奏、节奏稳定性、节拍强度和整体规律性在内的一些音乐元素的组合。0.0表示最不适合跳舞，1.0表示最适合跳舞。
energy：能量是一个介于0.0到1.0之间的指标，表示强度和活动水平的感知度量。通常，具有高能量的曲目感觉快速、响亮和嘈杂。例如，重金属音乐具有很高的能量，而巴赫的前奏曲在这个尺度上得分较低。
key：曲目的调式。整数通过标准音高类别符号映射到音高。例如，0 = C，1 = C♯/D♭，2 = D，以此类推。如果没有检测到调性，值为-1。
loudness：曲目的整体响度，以分贝（dB）为单位。
mode：模式指示曲目的调性（大调或小调），即从其旋律内容派生的音阶类型。大调表示为1，小调表示为0。
speechiness：语言感度检测一个曲目中是否存在口语单词。属性值越接近1.0，录音的语言特性越明显，例如脱口秀、有声书、诗歌等。大于0.66的值描述的是可能完全由口语单词组成的曲目。0.33到0.66之间的值描述的是可能包含音乐和语音的曲目，可以是分段或叠加的形式，包括说唱音乐等情况。小于0.33的值很可能代表音乐或其他非语音的曲目。
acousticness：曲目是否是原声曲的置信度，范围从0.0到1.0。1.0表示非常有信心曲目是原声曲。
instrumentalness：预测曲目是否不包含声乐。在这个上下文中，“嗯”和“啊”之类的声音被视为器乐。说唱或口语曲目显然是“声乐”。离器乐性值越接近1.0，曲目包含器乐内容的可能性就越大。
liveness：检测录音中是否存在观众。较高的现场性值表示曲目是现场演奏的概率较大。值大于0.8提供了曲目为现场演奏的强有力的可能性。
valence：一种介于0.0到1.0之间的衡量音乐积极性的指标。具有较高积极性的曲目听起来更积极（例如快乐、欢快、欣忭），而具有较低积极性的曲目听起来更消极（例如悲伤、沮丧、愤怒）。
tempo：曲目的整体估计速度，以每分钟的节拍数（BPM）表示。在音乐术语中，节奏是给定作品的速度或步伐，并直接衍生自平均拍子持续时间。
time_signature：估计的拍号。拍号是一种记号约定，用于指定每小节（或小节）中有多少拍子。拍号范围从3到7，表示时间签名为3/4到7/4。
track_genre：曲目所属的流派

来源和方法

此数据集使用Spotify的Web API和Python进行收集和清理。

作者:

maharshipandya

数据集大小:

19.19 MB