背景:[JAVA]前几天面试超碧,聊到其接触的项目,有抓取各类排行的实时数据,进行多国语言翻译,抓取目前比较火的语言是php、go,由于目前工作使用JAVA,因此也模拟实现了一下抓取百度热搜榜实时数据。
步骤:
1、寻址【百度热搜榜】https://top.baidu.com/board?tab=realtime&sa=fyb_realtime_31065
2、寻工具 【Jsoup】可按CSS、标签解析,感谢大牛的组件
3、分析新闻的主要消息,类型、图片、标题、内容、超链接、推荐指数
4、按照分类解析并存储
分享:
1、引用依赖
```
1
2 com.alibaba
3 fastjson
4 1.2.60
5
相关文章
idea-启动速度优化
原因:默认分配的内存太小了 解决方式:更改idea(64).exe.vmoptions配置 D:\ADBSpace\ProgramFiles\ideaIU-2021.2.win\bin 默认配置 ``...
Halo 开源项目学习(一):项目启动
项目简介 Halo 是一个优秀的开源博客发布应用,在 GitHub 上广受好评,正好最近在练习写博客,借此记录一下学习 Halo 的过程。 项目下载 前提设置 导入项目 因为 Halo 使用 Grad...
security学习笔记
spring security 入门案例 创建springboot工程 引入依赖 org.springframework.boot spring-boot-starter-security 2.创建c...
Dubbo系列之服务暴露过程
这周去苏州见大佬,没想到遇到一堆女粉丝,其中居然还有澡堂子堂妹,堂妹一遇到我就说敖丙哥哥我超级喜欢你写的dubbo系列,你能跟我好好讲一下他的服务暴露过程么? 我笑了笑:傻瓜,你想看怎么不早点说呢? ...
kafka单机部署、集群部署、命令实操
单机部署 安装配置zookeeper tar zxf zookeeper-3.4.10.tar.gz -C /usr cp zoo-sample.cfg zoo.cfg vi zoo.cfg data...
微服务入门之Hystrix
一、分布式系统面临的问题 复杂分布式体系结构中的应用程序有几十个依赖项,每个依赖项在某个时候都会不可避免地失败。[En]An application in a complex distributed ...
通过实现仿照FeignClient框架原理的示例来看清FeignClient的本质
前言 FeignClient的实现原理网上一搜一大把,此处我就不详细再说明,比如:Feign原理 (图解) - 疯狂创客圈 - 博客园 (cnblogs.com),而且关于FeignClient的使用...
Java学习 (26) 异常篇 异常结构&异常处理&自定义异常
异常结构 异常的定义 异常的分类 Error Expection Error和Exception的区别 具体讲解视频 异常处理 捕获异常 语法实例 抛出异常 语法实例 具体讲解视频 自定义异常 - 具...
MybatisPlus 快速入门
MybatisPlus 1.简介 官网:https://baomidou.com/pages/24112f/#特性 特性 无侵入:只做增强不做改变,引入它不会对现有工程产生影响,如丝般顺滑 损耗小:启...
Java 14中对switch的增强,终于可以不写break了
面对这样的 if语句,你是不是很难受呢? if (flag == 1) { log.info("didispace.com: 1"); } else if (flag == 2) ...
Apollo的docker配置详解步骤
Apollo 的docker配置 基础环境 centOS7 + Docker服务 + mysql服务 1. 下载Apollo的包 git clone https://github.com/ctripc...
MYSQL8-快速生成表结构(用于生成文档)
各种工具都有,没有特别趁手的。不如自己用sql处理。 SELECT column_name AS CODE, CASE WHEN column_comment IS NULL OR TRIM(colu...