数据集:

maharshipandya/spotify-tracks-dataset

英文

内容

这是一个包含125种不同音乐流派的Spotify音乐曲目数据集。每个曲目都有一些与其相关的音频特征。该数据以CSV格式呈现,具有表格结构,加载速度快。

用途

该数据集可用于以下用途:

  • 根据用户的输入或偏好构建推荐系统
  • 基于音频特征和可用的流派进行分类
  • 其他任何您能想到的应用。欢迎讨论!

列描述

  • track_id:曲目的Spotify ID
  • artists:执行曲目的艺术家名称。如果有多个艺术家,则用“;”分隔
  • album_name:曲目所属的专辑名称
  • track_name:曲目名称
  • popularity:曲目的流行度,一个介于0到100之间的值,100表示最受欢迎。流行度是通过算法计算得出的,主要基于曲目播放的总次数和最近播放的次数。一般来说,当前播放量较大的歌曲比过去播放量大的歌曲更受欢迎。重复的曲目(例如来自单曲和专辑的相同曲目)将独立评级。艺术家和专辑的流行度是从曲目流行度中数学推导出来的。
  • duration_ms:曲目长度(毫秒)
  • explicit:曲目是否含有带有不雅言辞的歌词(true表示有,false表示没有或未知)
  • danceability:舞曲性描述了曲目适合跳舞的程度,取决于包括节奏、节奏稳定性、节拍强度和整体规律性在内的一些音乐元素的组合。0.0表示最不适合跳舞,1.0表示最适合跳舞。
  • energy:能量是一个介于0.0到1.0之间的指标,表示强度和活动水平的感知度量。通常,具有高能量的曲目感觉快速、响亮和嘈杂。例如,重金属音乐具有很高的能量,而巴赫的前奏曲在这个尺度上得分较低。
  • key:曲目的调式。整数通过标准音高类别符号映射到音高。例如,0 = C,1 = C♯/D♭,2 = D,以此类推。如果没有检测到调性,值为-1。
  • loudness:曲目的整体响度,以分贝(dB)为单位。
  • mode:模式指示曲目的调性(大调或小调),即从其旋律内容派生的音阶类型。大调表示为1,小调表示为0。
  • speechiness:语言感度检测一个曲目中是否存在口语单词。属性值越接近1.0,录音的语言特性越明显,例如脱口秀、有声书、诗歌等。大于0.66的值描述的是可能完全由口语单词组成的曲目。0.33到0.66之间的值描述的是可能包含音乐和语音的曲目,可以是分段或叠加的形式,包括说唱音乐等情况。小于0.33的值很可能代表音乐或其他非语音的曲目。
  • acousticness:曲目是否是原声曲的置信度,范围从0.0到1.0。1.0表示非常有信心曲目是原声曲。
  • instrumentalness:预测曲目是否不包含声乐。在这个上下文中,“嗯”和“啊”之类的声音被视为器乐。说唱或口语曲目显然是“声乐”。离器乐性值越接近1.0,曲目包含器乐内容的可能性就越大。
  • liveness:检测录音中是否存在观众。较高的现场性值表示曲目是现场演奏的概率较大。值大于0.8提供了曲目为现场演奏的强有力的可能性。
  • valence:一种介于0.0到1.0之间的衡量音乐积极性的指标。具有较高积极性的曲目听起来更积极(例如快乐、欢快、欣忭),而具有较低积极性的曲目听起来更消极(例如悲伤、沮丧、愤怒)。
  • tempo:曲目的整体估计速度,以每分钟的节拍数(BPM)表示。在音乐术语中,节奏是给定作品的速度或步伐,并直接衍生自平均拍子持续时间。
  • time_signature:估计的拍号。拍号是一种记号约定,用于指定每小节(或小节)中有多少拍子。拍号范围从3到7,表示时间签名为3/4到7/4。
  • track_genre:曲目所属的流派

来源和方法

此数据集使用Spotify的Web API和Python进行收集和清理。