只要你每天上网、刷微博、刷抖音、在微信上聊天、玩游戏,你每天都在产生数据。互联网用户现在每天产生高达2.5万亿字节的数据,我们今天收集和使用的数据中有90%是在过去两年产生的。
[En]
As long as you surf the Internet, browse Weibo, browse Douyin, chat on Wechat and play games every day, you are generating data every day. Internet users now generate as much as 2.5 trillion bytes of data every day, and 90% of the data we collect and use today is generated in the past two years.
数据科学家是统计学、数据科学、大数据、R 编程、Python和 SAS 方面的专家,他们每天处理大量的数据,为企业提供方方面面的数据分析,比如帮助企业提高资源利用率,帮助企业降低运营成本,或者帮助企业发现新机遇。
数据科学家是一个企业谋求发展最不可或缺的一员。如果你想成为一名数据科学家,你知道如何度过数据科学家的一天吗?
[En]
Data scientist is the most indispensable member of an enterprise to seek development. If you want to be a data scientist, do you know how to spend your day as a data scientist?
没有典型的一天
如果你去问100个数据科学家,企图想要获得一个标准答案,很抱歉,没有。尽管如此,通过走访不同的数据科学家,他们工作中的共性还是被我们找到了。
每天打开电脑,就是数据
数据科学家将1天中的大部分时间用于收集数据、查看数据、分析数据、数据可视化处理、数据解读等工作。
数据科学家与数据相关的任务包括:
- 拉取数据
- 合并数据
- 分析数据
- 寻找模式或趋势
- 使用各种工具,包括 R、Tableau、Python、Matlab、Hive、Impala、PySpark、Excel、Hadoop、SQL 和/或 SAS
- 开发和测试新算法
- 试图简化数据问题
- 开发预测模型
- 构建数据可视化
- 写数据报告与他人分享
- 汇集概念证明
这些任务是数据科学家用来解决问题的手段,因为数据科学家的基本角色是问题解决者。
[En]
These tasks are the means that data scientists use to solve problems, because the essential role of data scientists is the problem solver.
与高管/客户开会
数据科学家需要参加各种各样的会议,其中一些可能是商务会议,通过这些会议,数据科学家能够了解目前业务中遇到的问题以及他们所在领域能提供什么帮助;有时是数据报告说明会,也就是数据科学家做完数据分析后,他们担心自己的利益,将你的报告和结论呈现在公司高管面前。
[En]
Data scientists need to attend a variety of meetings, some of which may be business meetings, through which data scientists will be able to know what problems are currently encountered in the business and what help their field can provide; sometimes it is a data report presentation meeting, that is to say, after data scientists have done data analysis, they are worried about their interests and present your report and conclusions in front of company executives.
与职场中的其他职位一样,科学家需要花时间参加不同的会议,回复来自不同部门的电子邮件,因此演讲和沟通技能对数据科学家来说至关重要。复杂的数据,太深奥的表达,你可能无法理解,所以你需要数据科学家能够以人们可以理解的方式解释数据背后的科学,并帮助他们发现问题所在。如果一份报告,只有数据科学家才能理解,那就是失败。
[En]
Like other positions in the workplace, scientists need to spend time attending different meetings and responding to emails from various departments, so presentation and communication skills are essential for data scientists. Complex data, too esoteric expressions, you may not understand, so you need data scientists to be able to explain the science behind the data in ways that people can understand, and to help them see what the problem is. If a report, only the data scientist can understand it, that is a failure.
学习新知识
如果你决定成为一名数据科学家,那么处理数据和与他人合作将占据你一天的大部分时间,剩下的时间将花在给自己充电和学习新知识上。在数据领域,每天都有新的问题出现,新的解决方案也在诞生。如果你跟上技术更新的步伐,浏览新闻,阅读博客,与同龄人交流,你会在不知不觉中取得进步。
[En]
If you decide to be a data scientist, then processing data and working with others will take up most of your day, and the rest of the time will be spent recharging yourself and learning new knowledge. In the field of data, new problems arise every day, and new solutions are born. If you keep up with the pace of technological updates, browse news, read blogs and communicate with excellent people in your peers, you will make progress before you know it.
数据科学家入门
Simplilearn圣普伦的数据科学家课由 Ronald Van Loon 设计,被评为世界十大大数据和数据科学影响者之一。通过Simplilearn 圣普伦的数据科学计划,您学习统计和统计程序、假设检验、聚类、决策树、线性和逻辑回归、R、数据可视化、回归模型、Hadoop、Spark、PROC SQL、SAS 宏等技能和工具、高级分析、Matplotlib、Excel 分析函数、Zookeeper、Kafka 接口等知识和技能。如果您遵循科学的学习路径,每周 8 h学习时间, 21周后你就成为一名经过认证的数据科学家。
Original: https://blog.csdn.net/simplilearnCN/article/details/124155209
Author: simplilearn圣普伦
Title: 数据科学家的一天,是怎样度过的?

鼠标点击测试_Studio One技巧——测试、调整歌曲BPM

2021SC@SDUSC山东大学软件学院软件工程应用与实践——yolov5代码分析——第六篇——train.py(2)

Visual studio 2019使用Microsoft Speech SDK 5.1语音识别

机器学习TensorFlow安装之CPU版本

如何进行图像锐化处理

【CVPR2022】论文列表与下载——PartFour

语音识别课前准备-kaldi安装流程

使用Selenium从IEEE与谷歌学术批量爬取BibTex文献引用
![[代码实现]用Tensorflow实现MMoE](https://www.itcode1024.com/wp-content/themes/begin/prune.php?src=https://www.itcode1024.com/wp-content/themes/begin/img/loading.png&w=280&h=210&a=&zc=1)
[代码实现]用Tensorflow实现MMoE

语音信号预处理提取特征

最大公约数、最小公倍数、辗转相除法的求解和证明

机器学习系列:LightGBM 可视化调参

智能家居的新想法(2022)

tf.keras.layers.BatchNormalization
