作者:朱小五
大家好,我是小五🧐
同学,你在刚毕业或者转行做数据分析师的时候,有没有遇到过这样尴尬的圈子?
[En]
Classmate, have you ever encountered such an awkward circle when you just graduated or switched to a job as a data analyst?
比方说下面的jd就很真实:
今天,小吴将为您讲述在采访数据分析师时,如何彻底摆脱与简历单薄的面试官聊天的场景。关键词是--工作经验!
[En]
Today, Xiao Wu will talk to you about how to completely get rid of the scene of chatting with the interviewer with a thin resume when interviewing data analysts. the key word is- work experience !
别慌,不是让你瞎编。
缺乏相关工作经验确实是一个弱点,那么哪些项目经验可以弥补这一弱点呢?例如,你做了一个完整的分析项目、挖掘项目,或者参加了与你申请的职位相关的竞争,这是你简历上的额外经历。
[En]
Lack of relevant work experience is indeed a weakness, so which project experience can make up for this weakness? For example, you have done a complete analysis project, mining project, or participated in a competition related to the position you are applying for, which is a bonus experience on your resume.
因此,在简历中加入一些数据分析项目是一种巧妙的方式。
[En]
Therefore, it is an ingenious way to add some data analysis items to your resume.
哪里找数据
这个问题,不少同学也在群里问过。
毕竟看看日历,马上都2021年了,你简历上要是还写"爬取拉勾、Boss直聘的数据进行分析",就真要找不到工作了。
首先,确保招聘公司最想看到的是做过真实项目的项目体验。在我们没有相关经验的情况下,我们选择模拟项目,模仿真实的数据分析师如何做项目,复制他们做项目的想法,然后结合自己的理解。
[En]
First of all, make sure that what the recruiting company wants to see most is the project experience that has done real projects. In the case that we have no relevant experience, we choose to simulate the project, imitate how the real data analysts do a project, copy their ideas for doing the project, and then combine their own understanding.
因此,这里所需数据也就有了一定要求, 最好是商业数据集,尤其是跟你要应聘的行业密切相关的!
在这里,我推荐大家三个网站, kaggle、阿里云天池、和鲸社区。
这些网站、商业数据集非常齐全,并且有特定的业务场景,因此非常适合分析,并作为自己的数据分析项目。这些网站中的数据集基本上涵盖了电子商务、广告、旅游、在线教育、金融等不同领域,足以支持你完成各类数据分析项目。
[En]
These websites, commercial data sets are very complete, and have specific business scenarios, so it is very suitable for analysis, and as their own data analysis projects. The data sets in these sites basically cover different areas such as e-commerce, advertising, travel, online education, finance and so on, which are enough to support you to complete all kinds of data analysis projects.
如何选数据
然而,在选择数据集时,需要注意的是,淘宝用户行为、泰坦尼克号预测、宝宝产品信息、波士顿房价等项目更适合实践,但真的建议不要把它们写在你的简历上,无论是在糟糕的街道上,还是离真实商业场景太远。
[En]
However, when selecting data sets, it should be noted that items such as Taobao user behavior, Titanic predictions, baby product information, Boston house prices, etc., are better for practice, but it is really recommended not to write them on your resume, either on a bad street, or too far from the real business scene.
如果你想找到一些独特的东西,你可以去小众和鲸鱼社区看看,可能会有惊喜。
[En]
If you want to find something unique, you can go to the minority and whale community to have a look, there may be surprises.
我也想提一下,小吴公众号的热点新闻大多是娱乐性较强的,不能作为正式项目来体验哈。
[En]
I would also like to suggest that most of the hot news in Xiao Wu's official account is more entertaining and cannot be experienced as a formal project, ha.
如果你正在面试一个数据分析师的职位,你的项目需要反映你自己的水平和你对业务/分析方法的理解程度,也就是,从头到尾对项目的完整描述、分析和总结。这里有一个真实的案例,也是《颠簸数据》史上发表的一篇文章。
[En]
If you are interviewing for a position as a data analyst, your project needs to reflect your own level and your "depth" of understanding of the business / analysis methodology, that is, a complete description, analysis, and summary of the project from start to finish. Here is a real case, which is also an article published in the history of "bump data".
原文截图
这篇文章其实就是 Rilke Yang 利用上述平台网站中的数据集进行分析的,他用真实的数据集向我们展示了滴滴出行如何进行A/B测试以及城市运营分析。
这种真实的业务数据和分析方法,真的且用且珍惜!
如何分析数据
在分析方法优先的基础上,我们可以用来分析数据的工具有很多,使用Excel、SQL、Python、Tableau等等,不过涉及机器学习和算法的项目,就只能用Python了。这里建议直接使用和鲸,本身集数据、项目、比赛、在线环境于一体。尤其它旗下的 K-Lab(最新更名为"ModelWhale")数据科学 SaaS 平台,可满足我们在线完成分类、建模、分析、可视化、结果输出等任务,并支持私有化部署和云端协同。
之前我一般推荐本地安装Anaconda,以免卡在学习Python的第一步——安装环境。不过如果你使用ModelWhale,连本地配置都不需要了,如果你之前使用过Jupyter notebook完全可以直接上手。
这里给大家演示一下,打开网页https://www.kesci.com/mw/project/5fe9d710840381003bfafb09
您可以很容易地看到完整的数据分析项目,包括想法、代码注释和数据集。
[En]
You can easily see a complete data analysis project, including ideas, code comments, and datasets.
那我们如何复制本项目,并自己运行呢?
下面给大家演示一下~
建议选择2核8G的就够了,不同等级每月都会赠送鲸币(注册后随便做几个任务就升级了)。
反正小五我现在是3级,每月免费送我几百小时的使用时长,完全够用。
点击运行后,会跳转到这个界面,如果平时使用 Jupyter Notebook
来数据分析的小伙伴,一定会有一种亲切感。
预览界面
而且与 Jupyter Notebook
相比,功能只多不少!
比如我们想更改或新增分析维度:
新增分析维度
最后我们再说一个以前的痛点,如何把项目分析给其他人?
如果平时在本地使用 Jupyter Notebook
,分享给其他小伙伴的话就需要保存成本地文件,再存到百度网盘里公开分享。而且小伙伴接受到文件后,还需要自己再将.ipynb文件导入他自己的Jupyter Notebook中,才能预览或运行。
而我们在和鲸社区运行项目后,不仅可以同样导出.ipynb本地文件,也可以生成在线网址供其他人预览或fork。
生成项目版本
点击个人主页,就会发现个人主页拥有了这个项目。单击分享标识,随时可以将链接(或者二维码)发给其他小伙伴,比直接发.ipynb文件好多了。
个人主页下方
点击的小伙伴再打开这个链接,就是下面这个效果了,可以预览,也可以选择Fork后直接运行~
获取到链接的小伙伴打开后
是不是针不戳
将分析结果写成项目
这里直接引用麟哥的书《拿下Offer:数据分析师求职面试指南》里的一段~
项目描述给出的建议是: 用四五句话以列表的形式描述清楚一个项目,列出清晰的项目流程,并将数字部分具体化,同时加入简明的技术实现细节。
这里分享了一个林哥的项目描述案例。您可以根据自己项目的实际情况进行调整。
[En]
A project description case of brother Lin is shared here. You can adjust it according to the actual situation of your own project.
在这个数据分析师逐渐"内卷"的大环境下,希望本文能够给大家的求职简历项目带来帮助,祝每个数据分析师的努力都不被辜负!
总结分享
最后,小五还总结了一些和鲸社区上的精华帖子:
关注公众号【 凹凸数据】后
后台回复" 和鲸01",获取Python入门合集
后台回复" 和鲸02",获取数据分析进阶教程与项目
后台回复" 和鲸03",获取各种真实场景实战项目
即刻获取链接,轻松fork小五的总结~
Original: https://blog.csdn.net/zhuxiao5/article/details/112130781
Author: 朱小五是凹凸君呀
Title: 同学,你这简历上没项目啊!

论文解读BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation,

Pandas

DAX :【翻译】数据沿袭(Data Lineage )

百度API调用(五)——语音识别之使用Android SDK(超详细)

【tensorflow】Could not load dynamic library ‘cudnn64_8.dll‘; dlerror: cudnn64_8.dll not found

NLP(五十一)在BERT模型中添加自己的词汇

tensorflow 安装中遇到的坑

笔记本GTX1050(计算能力6.1)安装cuda11.0+cudnn8.2(for cuda 11.x)+pycharm tensorflow-gpu2.4.0错误排除

Anaconda中快速安装Tensorflow与Keras并在pycharm中完成相应配置(win10cpu版)

人工智能AI系列 – 元宇宙 – 2D虚拟人

车道线检测2022新工作整理,2D、3D都有

VIT中提取图像分类特征的详细步骤

Halcon深度学习介绍(一)

【机器学习】聚类算法——高斯混合聚类(理论+图解)
