零基础如何入门数据分析师?

人工智能33

在大数据时代,数据为王。在这个精细化运营、降本增效的时代,用数据分析为决策者提供指导,几乎是每个企业的一致选择。截至目前,中国数据分析人才累计短缺1,400万人,预计2025年市场规模将达到2,000亿!数据分析与其说是一份工作,不如说是一项重要的技能,拥有这项技能意味着更好的就业前景和更广阔的职业发展。

[En]

In the era of big data, data was king. In this era of fine operation, reducing cost and increasing efficiency, using data analysis to provide guidance to decision-makers is almost the unanimous choice of every enterprise. Up to now, there is a total shortage of 14 million data analysis talents in China, and the market size is expected to reach 200 billion in 2025! Data analysis is not so much a job as an important skill, and having this skill means better job prospects and broader career development.

那么,Zero Foundation应该如何学习数据分析呢?下面,我将从数据分析的学习周期、学习内容、职业发展规划三个方面全面了解如何入门零基数据分析师。

[En]

So how should Zero Foundation learn data analysis? Below, I will fully understand how to get started with zero-based data analysts from three aspects: the learning cycle of data analysis, learning content, and career development planning.

1、数据分析要学多久?

每个人的学习能力和基础都不一样,所以数据分析的学习周期也不一样。如果是通过自学,因为没有专业的老师指导,不能系统地学习,这个周期可能会很长。如果零基学习者进行系统培训,需要三四个月的时间。

[En]

Everyone's learning ability and foundation are different, so the learning cycle of data analysis is also different. If it is through self-study, because there is no professional teacher guidance and can not study systematically, this cycle may be very long. If zero-based learners carry out systematic training, it will take three or four months.

数据分析的学习应该首先从熟悉表以及表结构开始,所有的知识点一定是在首先了解熟悉Excel的后,能够从数据库里提数的基础上再进行技能的升级。数据分析师的技能从一开始能从数据库里提数,并且用Excel和BI处理几万行的小数据量,到使用Python批量化处理几十万甚至百万行中量级数据量,到最终使用大数据的相关组件,例如hadoop,spark,flume等组件处理千万级甚至是亿级大数据量。每一个阶段所需要的工具加方法论都是不一样的。

一般而言,对于自学成为能处理中量级数据量的分析师而言,至少得入门python的pandas,numpy等数据处理库。自学的周期,跟悟性和自律有关,悟性和自律性高的同学,可能在4个月左右能基本掌握。如果悟性和自律性不高的同学,这个周期有可能就是半途而废,无法估量学习时间了。聚数云海专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用到数据挖掘算法等,对一整套数据分析流程技术进行系统讲解并配以实战练习,学完之后,学习者可以直接达到数据分析师的水平。

2、 数据分析要学什么?

(1) Excel

说起Excel可能会有人觉得很简单,但是Excel确实是一个功能强大的利器。零基础学数据分析师一定要从Excel入门。因为大部分企业在处理小型数据量时,Excel是用的最多的工具,在基础数据分析师与数据运营岗位中具有极其重要的地位。作为数据分析师的核心工具,具体学习内容有Excel函数技巧(查找函数、统计函数、逻辑函数)、Excel快速处理技巧(格式调整、查找定位、快捷键技巧等)和Excel可视化技巧(组合图、条形图、数据气泡地图)等。

(2) Mysql

SQL同样是零基础学习数据分析的核心内容。因为作为数据分析师,首先要解决的问题就是需要有数据用来做分析。通常企业都会有自己的数据库,数据分析师首先得根据业务需要,知道自己要从企业数据库中提取哪些数据。企业如果部署了本地数据库,那么一定是SQL语言做提取数据的语言。SQL简单易懂,非常容易上手,并且是非学不可的。SQL语言从学习MySQL数据库开始,涉及对表结构数据的增删改查。真正在企业里面,数据分析师一般不会有增删改的权限,只会有查的权限,零基础入门应该重点掌握查的各种句式。

(3) Python

Python的基础对于数据分析师而言是非常重要的。对于十万级或者百万级数据量而言,Excel和BI都会因为运行卡顿而变得完全无法使用。然而在实际企业运用中,一次性处理十万级以及百万级数据又是非常常见的。而Python则是处理这种中量级数据的利器。因为Python有很多的第三方强大的库,比如Numpy、Pandas、Matplotlib、Seaborn等。这些库能让数据分析师对百万数据进行数据清理和画图分析。Python不仅能数据清洗、画图,还能用sklearn进行大数据算法分析。虽然Python是数据分析的重要工具,但是不同的职业发展方向,Python掌握的程度也是不一样的。

(4) BI商业智能工具

BI可以理解成Excel图表透视表的高级版。BI是将表与表相连,然后得出很多指标图:企业销售指标,运营指标,物流指标等等。这些图可以表示企业在过去5个月的平均销售单价,过去24个月销售的物流发货量的变化曲线,甚至是现在实时的销售额,这些都是企业关心的问题。有了这个看板,领导层在监控企业的业务方面就有了非常直观的数据呈现,以供他们及时做出决策调整。现在市面上比较流行的BI软件,有FineBI,PowerBI等。而这些BI软件实际上都是非常类似的,学起来难度也不大。学习FineReport、FineBI由入门到精通,快速挖掘数据价值,将这些数据转化成有用的信息,让企业决策有数据依据,从而驱动企业决策和运营。

(5) 数理统计与数据运营

数理统计和数据运算方法论是数据分析师的理论基石。数理统计包括概率论、统计学、线性代数和微积分基础理论。这些内容不需要深入理解,但需要掌握其原则和内涵。因为整个数据分析的源头实际上是从描述性统计分析中诞生的。描述性统计分析对样本的总数和均值进行统计,而后续数据分析所涉及的算法是统计学中更深层次的建模。因此,掌握数理统计的相关知识对于初级数据分析人员来说是基本和必要的。

[En]

Mathematical statistics and data operation methodology are the theoretical cornerstones of data analysts. Mathematical statistics include probability theory, statistics, linear algebra, and basic calculus theory. These contents do not need to be understood deeply, but their principles and connotations need to be mastered. Because the source of the whole data analysis is actually born out of descriptive statistical analysis. Descriptive statistical analysis makes statistics on the total number and mean of samples, while the algorithm involved in the follow-up of data analysis is a deeper modeling in statistics. Therefore, mastering the relevant knowledge of mathematical statistics is basic and necessary for entry-level data analysts.

那数据运营方法论是什么呢?数据运营方法论实际上是学习各个行业所运营的分析模型。例如,对电商而言,漏斗分析可以分析出来进入主页的人数PV1,到进入服装板块的人数PV2,PV2/PV1就可以得出一个进入服装板块的比率。还有很多通用的分析模型:相关分析,A/B test等。对于想往管理路线发展的数据分析师来讲,数据运营是必须要学习的知识。其实数据运营知识也不复杂,就是根据自身业务需求将指标拆解到最细,然后运用同比和环比两种数据分析方式。

(6) 机器学习

最后一个进阶要求数据分析师掌握对大量数据分析的能力。这种分析就不只是停留在描述统计分析和运用数据运营方法进行分析了,而是进行预测分析。预测分析的本质是利用已有的数据做出一套变量x,与预测最终值y之间的关系(也就是数学算法公式),然后利用这套算法,将更多的x输入算法中去得出一个预测的y值,这里听不懂没关系。总之,这个阶段的数据分析是利用大量的历史数据构建出一套数学公式(也就是算法),用这个数学公式去对未来进行预测。比如说:一个人大量地刷体育短视频,根据算法可以得出这个人可能对观看足球比赛的腾讯体育会员感兴趣。这类推断和预测对于商业世界是有着极大变现意义的。要想成为掌握算法的数据分析师,机器学习是不可跳过的入门。学员应该从简单的一元回归,多元回归,以及逻辑回归学习等,逐渐学习更多像决策树,随机森林,SVM等更高级的算法。

(7) 就业指导

除了数据分析的相关知识外,还有一个非常重要且容易遗漏的零基础录入数据分析,那就是就业指导。它们是三个环节:专业素养培训、简历撰写与提炼和面试咨询。职业素养培训主要是为了提高求职者的职业心态、职场形象、职业素养和商业兴趣。下一步是对求职的关键--简历进行修改和打包,引导求职者撰写简历,以及简历的排版和提炼。面试表现是决定求职者最终能否过关的重要一步。通过大量的大厂数据分析员实操练习,培养良好的心理素质,提前练习准备好的面试题,做大量的模拟练习。最终完成一套零基础,成为数据分析师培训的完美闭环。

[En]

In addition to the relevant knowledge of data analysis, there is a zero-basic entry data analysis that is very important and easy to miss, that is, the guidance for employment. They are three links: professional literacy training, resume writing and refinement and interview counseling. Professional literacy training is mainly aimed at improving job seekers' professional mentality, workplace image, professional accomplishment and business interests. The next step is to modify and package the resume, which is the key to the job search, and guide the job seekers to write the resume, as well as the typesetting and refinement of the resume. Interview performance is an important step to determine whether job seekers can finally pass or not. through a large number of practical exercises for data analysts in large factories, we can cultivate good psychological quality, practice prepared interview questions in advance, and do a lot of simulation exercises. finally complete a set of zero foundation to become a perfect closed loop of data analyst training.

3、 数据分析的职业发展规划?

一般来讲,数据分析有两条发展路线,一条是管理路线,一条是技术路线。往管理端发展,比如初级数据分析师,到数据运营,到数据分析经理、数据运营总监等等。这条发展路径主要要求统计学、Excel、PPT等技能,需要撰写市场分析报告。这条路看似技术掌握不用太深,但是对业务的理解要极深。而精深的业务理解需要时间和深度的业务钻研精神。如果你是非数学、计算机和统计学专业的朋友,比较适合这条非技术的职业发展之路。

而向技术方向发展,则目标会非常明确:一是深入数据挖掘方向发展,学习深度神经网络,NLP等前沿算法;二是深入数据分析开发,把大数据组件hadoop,spark等等大数据组件学好学精。这是一条技术类的发展方向,要求更高的统计学能力、数理能力以及编程技巧。

事实上,无论是非技术业务指导还是技术专家指导,都需要从数据分析入手。从初级数据分析入手并不难,但要成为一名好的数据分析师却很难,需要潜心钻研。

[En]

In fact, both non-technical business direction and technical expert direction need to get started with data analysis. It is not difficult to get started with primary data analysis, but it is difficult to be a good data analyst and requires painstaking study.

如果你看到这一点,你认为你在心理上已经准备好进入数据分析师的方向,但你没有任何基础,真的不知道如何进入这个职业,你聚集了几朵云为你打造了一门数据分析师课程。无论你是零基础的菜鸟,还是大学毕业生,甚至是其他行业的从业者,只要你想学习数据分析,云集都是你的最佳选择。

[En]

If you see this, you think you are psychologically ready to enter the direction of data analysts, but you have zero foundation and really do not know how to enter the profession, you have gathered several clouds to create a data analyst course for you. Whether you are a rookie with zero foundation, a college graduate, or even a practitioner in other industries, as long as you want to learn data analysis, gathering clouds is your best choice.

Original: https://blog.csdn.net/KBScp/article/details/121926983
Author: 聚数云海
Title: 零基础如何入门数据分析师?

相关文章
Bayer到RGB,格式转换原理及具体实现 人工智能

Bayer到RGB,格式转换原理及具体实现

缘起 使用海康彩色相机,采集到的图像数据是Bayer GR8格式的,如果在相机参数中改为其它彩色格式,那就是相机内部完成格式转化,就会导致采集帧率变慢。一般情况下这种方式是简单实用的,但如果想要追求更...
人工智能基础整理 人工智能

人工智能基础整理

人工智能基础整理 考前复习 随便整了一下 填空题 目前人工智能的主要学派有三家: 符号主义、 进化主义、 连接主义 知识图谱本质上是 结构化的语义知识库,是一种由节点和边组成的 图数据结构,以 符号形...
2020未来杯高校AI挑战赛-跨设备说话人识别 人工智能

2020未来杯高校AI挑战赛-跨设备说话人识别

赛事简介 语音可以作为一种生物识别的形式,通过对说话人语音的采样,我们对说话的身份进行验证,在语音助手、安防等领域有着广泛的应用场景。相对于基于文本内容的说话人识别,文本无关的验证因减少了变化的约束,...
深度学习关于数据集的六大问题 人工智能

深度学习关于数据集的六大问题

问题一:数据集太小 如果数据集太小,模型将没有足够样例概括来区分特征。这将使数据过拟合,从而出现训练误差低但测试误差高的情况。 解决方案1 尝试找到更多和原始数据集来源相同的数据。 注:如果图像很相似...
详解BiLSTM 人工智能

详解BiLSTM

一、介绍 1.1 文章组织 本文简要介绍了BiLSTM的基本原理,并以句子级情感分类任务为例介绍为什么需要使用LSTM或BiLSTM进行建模。 1.2 情感分类任务 自然语言处理中的情感分类任务是对给...
语音助手——简介与交互过程 人工智能

语音助手——简介与交互过程

语音助手简介 语音助手这个产品的目的,是希望通过语音说话的方式,来实现闲聊陪伴、知识获取、设备控制等需求,对应的就有三种不同的助手类型:闲聊型、问答型、指令型。 闲聊型助手用于实现闲聊陪伴的目的,通过...