这次要分享的是我使用 kaggle上公开的Tiktok的2022年流行的音乐 做数据分析
数据来源地址:
仅供学习使用 如有侵权联系我立马删
首先打开Tableau 然后导入数据。
接下来需要对数据进行熟悉,
可以看到 有曲目的名称 艺术家姓名 专辑名称 还有 受欢迎程度 和可跳舞性
那么 拿到这个数据我的想法第一个就是分析 曲目名称 和 曲目受欢迎的程度
因为这样可以直接筛选出 最热门的音乐
说做就做 接下来 将 曲目名称放置到列 欢迎程度 放置到行
就可以得到这样的效果 接下来 我们需要 将前十名最受欢迎的歌曲 筛选出来 先按照 降序排列 然后选出前十的歌曲
筛选出来以后 将受欢迎程度 拉至文本处即可得到这样的图像
接下来需要想好 我们的仪表盘需要做成什么色系的 因为我个人比较喜欢橙色系 所以我设置成了橙色为主色
除了设置好色系以外 还可以改变一些样式 来让样式更加好看
接下来我想做一个TikTok数据总览 想当于做一个总数据表 那么就可以将度量名称拉至列 艺术家名称 专辑名称 曲目名称拉至行
接下来 将度量值放置到文本区域即可
得到数据总览以后 就可以更改样式以及文字大小等
接下来我想到的就是 做一个 最受欢迎的艺术家分析 我想了很久认为词云最适合展示 因为能够突出受欢迎的艺术家的名称
做法如下:
使用词云是不是对受欢迎的艺术家一目了然了 当然你可以使用其他图像展示 欢迎在评论区评论
接下来要先说一个概念 是关于可跳舞性的
可跳舞性描述了基于音乐元素组合(包括节奏,节奏稳定性,节拍强度和整体规律性)的轨道是否适合跳舞。值 0.0 表示最不可跳舞,1.0 表示非常适合跳舞
有了这个讲解想必大家也明白可跳舞性代表的是什么含义了
那么接下来我打算做一个曲目受欢迎程度与可跳舞性的关系
做法如下:
接下来要注意需要排除一些异常值 可以看到有的点已经到0了 所以可以排除掉 让图像看起来更加连贯
既然有曲目受欢迎程度与可跳舞性的关系 自然就会有 艺术家受欢迎程度与可跳舞性的关系
看了上面2个图我们能够得出什么结论呢? 根据整体的图像 我们可以知道 受欢迎的程度实际上于音乐的可跳舞性没有什么关联 无论你音乐是不是可跳舞性很强 受欢迎程度都不会有太大波动
接下来我想看看曲目受欢迎程度与艺术家受欢迎程度的关系 为什么? 因为我想知道 是不是艺术家受欢迎 曲目就受欢迎 它们是不是相互影响的
我们可以看到 图像变化基本一致 能说明是呈正相关的 你高我也高 你低我也低 说明 艺术家的影响力于曲目的影响力 是有关的 反过来 曲目的影响力对艺术家的影响力也是有关的