分享好友 最新动态首页 最新动态分类 切换频道
难倒95%数据分析师的面试题!
2024-11-07 21:53
今天,从网上整理了11道数据分析面试真题,供大家参考学习~

01 统计学部分

难倒95%数据分析师的面试题!

c8de961a0a4a4bc86c9ad7d2bfcc29fc.gif

1、一副扑克牌一共54张,平均分成2份,求这2份都有2张A的概率。

639d2fb7442f57fc21eea5e53ddb160b.png
参考答案

先求分母

54张牌,分成2份,每份应该27张。

第一步:我们从54张牌取27张,作为第一份,就是第二步:剩下的27张牌取27张,作为第二份,就是

这样分母就有了:把第一步和第二步相乘,就是54张牌,随机平均分成2份的组合数量,因此分母=

再求分子

一副牌有4张A,50张非A的牌。

为了保证两份都要有2张A,在挑第一份的时候,应该先在4张A里面挑2个A,50张非A的牌里挑25个非A。然后第二份就是在剩下的2个A里挑选2个,25个非A里面挑25张。

第一步:从4张A里挑2张A,50张非A里挑25张,第二步:从2张A里挑2张A,25张非A里挑25张

分子

所以概率是

2、男生录取率增加,女生录取率增加,总体为何减少?

b6f47fb13ce28f5897ea2060f7fd4728.png
参考答案

此题考查的是辛普森悖论,因为男女的录取率可能有较大差异,同时低录取率群体的占比增大。

如原来男性20人,录取1人;女性100人,录取99人,总录取率100/120。

现在男性100人,录取6人;女性20人,录取20人,总录取率26/120。

即那个段子“A系中智商最低的人去读B,同时提高了A系和B系的平均智商。”

3、置信度与置信区间是什么意思

9b2af32250f901dd00b82271b1c47401.png
参考答案

置信区间是我们所计算出的变量存在的范围,置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。

举例来讲,如果我们有95%的把握,让真正的数值在我们所计算的范围里。

那么在这里,95%是置信水平,而计算出的范围,就是置信区间。

如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。

4、p值的含义

4b1ee8c8d425d81d6f2ce516999255cd.png
参考答案

假设检验的基本原理只有3个

  • 一个命题只能证伪,不能证明为真

  • 在一次观测中,小概率事件不可能发生

  • 在一次观测中,如果小概率事件发生了,那就是假设命题为假

证明逻辑就是

我要证明命题为真——证明该命题的否命题为假——在否命题的假设下,观察到小概率事件发生了——否命题被推翻——原命题为真

比如:要证明A是合格的投手——证明“A不是合格投手”这个命题为假——观察到一个事件(比如A连续10次投中10环,而这个事件在“A不是合格投手”的假设下,概率为p,小于0.05——小概率事件发生,否命题被推翻。

可以看到p越小——这个事件越是小概率事件——否命题越可能被推翻——原命题越可信

5、怎么向小孩子解释正态分布

4237580f4a0c48c551cf17de9cca2b25.png
参考答案

先拿出小朋友班级的成绩表,每隔2分统计一下人数(因为小学一年级大家成绩很接近,画出钟形。然后说这就是正态分布,大多数的人都集中在中间,只有少数特别好和不够好。

拿出隔壁班的成绩表,让小朋友自己画画看,发现也是这样的现象;然后拿出班级的身高表,发现也是这个样子的。

大部分人之间是没有太大差别的,只有少数人特别好和不够好,这是生活里普遍看到的现象,这就是正态分布。

02 业务思维部分

15331459d91887a68fa7a4aa4b55f199.gif

1、卖玉米如何提高收益?价格提高多少才能获取最大收益

ae9c8d8ed0e4693424782a99a64355c1.png
参考答案

收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销售规模。

提高单位溢价的方法

  • 品牌打造获得长期溢价,但缺陷是需要大量前期营销投入

  • 加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如礼品化等

  • 价格歧视,根据价格敏感度对不同用户采用不同定价。

销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。

收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。

2、店铺销售额降低如何分析

33966d632a1e6c8580220cbcaa3a15f4.png
参考答案

先定位问题:运用多维度分析法和七何分析模型定位到异常现象。

拆分维度有

  • who:用户(新用户/老用户、渠道、画像等

  • when:访问时段

  • where:产品(产品类型

然后拆分问题:运用多维度分析法从指标构成拆分。

  • 销售额=浏览量转化率客单价

  • 销售额=GMV-取消订单金额-退货订单金额

  • 假设检验:确定问题源头,分析原因,提出假设再验证,再假设再验证

可以从以下角度提出假设

  • 内部原因:产品、价格、渠道、促销(4P营销理论

  • 外部原因:政治、经济、社会、技术(PEST分析

3、若用户留存率下降如何分析

d51ce73cc39afb878a85451419c968ac.png
参考答案

先定位问题:运用多维度分析法定位到异常现象发生的具体位置和程度。

拆分维度有:新用户/老用户、渠道、画像(用户特征)等,分析不同维度下的用户留存情况、定位到问题人群。

然后假设检验:提出假设再验证,再假设再验证

  • 内部:用户获取及激活(AARRR模型)、产品

  • 外部:PEST,主要考虑竞品影响

4、我们有一款游戏收入下降了,你怎么分析

bdbcd9f7b47d879bbee983ba0df30c76.png
参考答案

两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了

指标拆解:收入 = 玩家数量 * 活跃占比 * 付费转化率 * 付费次数 * 客单价进一步细分,如玩家数量 = 老玩家数量 * 活跃度 + 新玩家数量 * 留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降

原因分析:a. 内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等b. 外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等

如何提高:基于乘法模型,可以采用上限分析,从前往后依次将指标提升到投入足够精力(假设优先分配人力、经费与渠道)后的上限,然后分析“收入”指标的数值提升。找到数值提升最快的那个阶段,就是我们提高收入的关键任务。

03 数据挖掘部分

8494dad6410b0cd5d0915ce3ca3866d5.gif

1、数据库与数据仓库的区别

e430083fdaad46a63ee2fc491e837481.png
参考答案

简单理解下数据仓库是多个数据库以一种方式组织起来,数据库强调范式,尽可能减少冗余;而数据仓库强调查询分析的速度,优化读取操作,主要目的是快速做大量数据的查询。

数据仓库定期写入新数据,但不覆盖原有数据,而是给数据加上时间戳标签;数据库采用行存储,数据仓库一般采用列存储。

数据仓库的特征是面向主题、集成、相对稳定、反映历史变化,存储数历史数据;数据库是面向事务的,存储在线交易数据。

2、什么是聚类分析

5a2a1f4daa87ffd93568e2779318784c.png
参考答案

聚类分析是一种无监督的学习方法,根据一定条件将相对同质的样本归到一个类总。

聚类方法主要有a. 层次聚类 b. 划分聚类:kmeans c. 密度聚类 d. 网格聚类 e. 模型聚类:高斯混合模型

来 源:成都数据分析

db3949df5750fa7a1040e2760a7da1bc.gif

NO.1

往期推荐

Historical articles

Python 数据可视化全方位讲解,建议收藏

整理了10个经典的Pandas数据查询案例

用Python绘制了几张有趣的可视化图表

20个数据分析师必知必会的SQL查询语句

长按👇关注- 关于数据分析与可视化 -设为星标,干货速递

分享、收藏、点赞、在看安排一下

62d4dd904afeaca467586b34780e2d6d.gif

55db87c5307a91860ac50f98ed7dedb1.gif

26999d9ecb21339d76f18dd45aa48f20.gif

最新文章
长尾关键词搜索,挖掘用户需求之秘密利器!
摘要:长尾关键词搜索是一种有效的挖掘潜在需求的方法,它能够帮助企业发现并利用那些不太被关注但具有特定用户群体的关键词。通过长尾关键词搜索,企业可以深入了解用户的兴趣和需求,进而优化产品和服务,满足用户的个性化需求。这一秘密
百度推广怎么做关键词优化,效果更好?
在互联网营销这片浩瀚的海洋中,百度推广无疑是众多企业扬帆起航的重要平台。作为一名在数字营销领域摸爬滚打多年的实践者,我深知关键词优化对于百度推广效果的重要性。今天,我将结合过往的实战经验,与大家分享如何精准地优化关键词,让
江西南昌seo网站优化
江西南昌SEO网站优化 - 南昌网站排名优化公司南昌SEO网站优化,是指通过优化网站的结构、内容、代码和外部链接等因素,提升网站在搜索引擎中的排名,从而增加网站的曝光度、流量和转化率。作为江西省南昌市的一家专业网站排名优化公司,我
# 讯飞输入法功能怎么样关闭与相关设置详解:全面指南
在数字化时代智能输入法为使用者提供了极大的便捷。讯飞输入法作为国内领先的人工智能输入法其强大的功能为客户带来了丰富的输入体验。有些使用者可能因为个人惯或隐私考虑期望关闭讯飞输入法的功能。本文将详细介绍讯飞输入法功能的关闭方
站群寄生虫找人做排名 站群寄生虫:寻人合作提升排名
警惕!站群寄生虫的排名骗局:守护网络诚信,拒绝非法SEO操作在当今这个数字化时代,互联网已成为信息传播和商业活动的重要平台然而,随着网络空间的日益繁荣,一些不法分子也趁机而动,利用各种手段进行网络欺诈和非法营销其中,“站群寄
SEO培训助力企业外推,提升品牌影响力与市场份额
随着互联网的飞速发展,网络营销已经成为企业推广的重要手段。而SEO(搜索引擎)作为网络营销的核心技术之一,其重要性不言而喻。近年来,越来越多的企业开始重视SEO,希望通过专业的外推策略,提升品牌影响力与市场份额。本文将从SEO培训
'剧本一键成片':AI赋能影视创作的革新之路
随着人工智能(AI)技术的飞速发展,其在影视产业的应用正以前所未有的深度和广度改变着创作模式与行业生态。近日,猫眼娱乐推出的首个面向长剧本解析的动态故事板AI生成工具“神笔马良”,以其“剧本一键成片”的强大功能,引发了业界的高
网站优化怎么做,才能快速提升关键词排名?
在互联网这片浩瀚的海洋中,每个网站都像是一艘扬帆起航的船,而关键词排名就是指引我们航向的灯塔。作为一名在网站优化领域摸爬滚打多年的老手,我深知如何在激烈的竞争中,通过精准的策略和不懈的努力,让网站的关键词排名迅速攀升。今天
外贸独立站的内容营销策略?
在开展内容营销之前,首先要明确营销目标。清晰的目标将有助于指导内容创作和推广策略的制定。以下是一些常见的内容营销目标:通过提供有价值的内容,增加潜在客户对品牌的认知。提升品牌知名度有助于企业在目标市场中脱颖而出,吸引更多流
高效SEO优化:掌握IJ工具,提升网站排名秘诀
高效SEO优化:掌握IJ工具,提升网站排名秘诀在当今的信息化时代,数据分析和处理成为了各行各业不可或缺的技能。IJ工具(ImageJ)作为一款开源的图像处理软件,凭借其强大的功能和易用性,在生物医学、物理学、化学等领域得到了广泛应用。
相关文章
推荐文章
发表评论
0评