今天我们分享的是数据分析、机器学习数据集、搜狗新闻行业分类数据集。这是我身边的大神高成就者使用的数据集,也被用作机器学习材料。根据自己的实验场景,我将训练集、测试集和验证集进行了划分。分别是三个文件。可以用来学用的。
[En]
Today we share a data analysis, machine learning data set, Sogou news industry classified data set. This is a data set used by high achiever, the great god beside me, and it is also used as machine learning materials. According to my own experimental scene, I have divided the training set, test set and verification set. Three files respectively. Can be used to learn to use.
下面是简单说明:
-
资源内容:大数据数据分析机器学习-搜狗新闻行业分类-数据集-训练集-验证集-机器学习数据分析师必备
-
使用目标:数据分析,机器学习学习用数据集
-
应用场景:数据分析,机器学习学习
-
特点:学习
-
适用人群:学生,算法工程师,研究生
-
使用说明:压缩包,里面有6个文件,分别是训练集测试集和验证集。分别有文本文件格式和Excel格式。两种格式内容一样。可以根据自己的需求重新划分。
下面是样例
有it,时尚,汽车,财经等多个类型。
其中
训练集:72827条
测试集:20887条
验证集:10423条
下面有下载地址。
Original: https://blog.csdn.net/qqhxmdq/article/details/122819394
Author: 卿卿和笑
Title: 数据分析,机器学习学习用数据集[1]-搜狗新闻行业分类数据集(已分好训练测试和验证集)

手把手医学知识图谱搭建案例

利用anaconda创建tensorflow环境并在jupyter和pycharm中使用

tensorflow hub模型下载不了问题解决
![[GAN]CelebAMask-HQ数据集处理、划分](https://www.itcode1024.com/wp-content/themes/begin/prune.php?src=https://www.itcode1024.com/wp-content/themes/begin/img/loading.png&w=280&h=210&a=&zc=1)
[GAN]CelebAMask-HQ数据集处理、划分

使用CNN/ResNet实现自动调制识别(RML2018.01a)

重磅!公开基于“内心对话”的EEG脑机接口数据集,助力语音意念控制研究

Metashape(Photoscan)【制作DOM和DEM】超级详细的步骤,文末有安装包

2021年最全Anaconda安装TensorFlow2.0GPU版本并且配置Jupyter notebook教程

librosa | 系统实战(一 ~ 四)

tensorflow2.2.0安装过程

End-to-end Audio-visual Speech Recognition with Conformers

学习 | 聚类分析

基于ZYNQ的帧差法多运动目标检测(开源)

数字化风控的八个应用场景(下)
