STATA数据统计软件学习记录

人工智能59

STATA是一个数据统计软件,正如它的名字一样,STATA=statistic+data。STATA软件的功能和matlab类似,也可以用代码实现数据的统计与可视化。但几乎只能进行整行整列的数据处理,且每次只能加载处理一个数据矩阵,灵活性和全面性比不过matlab。那我为什么要用STATA呢?这是因为我选修了这门课,水一下学分。当然,相比matlab,它在数据处理方面,也有一些方便之处。下面记录STATA的一些常用的处理、统计、可视化方法。

基本命令

STATA命令的语法大部分是这样的:命令(空格)待处理的数据名(逗号)可选的一些参数。

读取软件自带数据集 sysuse

首先读取STATA自带的样例数据:

sysuse auto, clear

其中sysuse是一个命令,auto是汽车数据集的名称,clear是在读取数据之前先清空内存中已读取的数据。之后可以在变量窗口看到读取的变量。实际上这里的变量就是excel列表中的列标,每个变量代表一个列标。然后每个列标都有它对应的属性,属性定义了每列数据的类型和一些信息等。如下图:

STATA数据统计软件学习记录

浏览数据集 br

输入验证码查看隐藏内容

扫描二维码关注本站微信公众号 Johngo学长
或者在微信里搜索 Johngo学长
回复 svip 获取验证码
wechat Johngo学长

相关文章
人工智能

字节跳动-财经-校招内推

【团队介绍】 我们为字节跳动生态的抖音电商、直播、教育、健康、内容付费等场景服务,依托字节跳动的科技能力和产品,为用户提供更好的支付、消费金融、保险等金融服务体验。科技创新,普惠大众。 【地点】北京 ...
人工智能

机器学习之聚类

聚类是常见的一种无监督学习方法,该训练的样本标记信息是未知的,聚类过程仅能自动形成簇结构,而簇结构对应的语义(标签)需要训练者自身理解命名。 样本集D={x1,x2....xm}包含m个无标记样本,每...
人工智能

android apk内语音控制

最近的音频播放项目要求应用内支持语音控制 用的是讯飞的,大概整理一下作为笔记: 首先在lib目录下引入:XiriScene.jar和XiriFeedback.jar 然后在bulid.gradle文件...
人工智能

功效与样本量的计算

我经常被问到这样的问题:"做假设检验时,需要的样本量是多少", "我的实验究竟需要多少样本才有意义呢?",这类问题可以通过功效与样本量计算来解决。 什么是功效? 所有检验都不可能尽善尽美,总存在这样的...
人工智能

语音合成应用场景之一:配音平台总结

声明:本总结不涉及任意相关利益,主要总结语音合成在配音场景落地的几家编辑平台,而且主要总结在线编辑平台,移动端的app不在考虑之内。欢迎关注微信公众号:低调奋进 自媒体的短视频、文章的流行催生配音领域...
人工智能

深度学习中的固定学习率衰减策略总结

深度学习中的固定学习率衰减策略总结 深层神经网络的参数学习主要是通过梯度下降方法来寻找一组可以最小化结构风险的参数。 在梯度下降中学习率的取值非常关键,如果过大可能不会收敛,过小则收敛速度太慢。 通常...