一、爬取目标
您好,我是@马哥python说,今天继续分享爬虫案例。
爬取网站:雪球网的沪深股市行情数据
具体菜单:雪球网 > 行情中心 > 沪深股市 > 沪深一览
爬取字段,含:
股票代码、股票名称、现价、涨跌、年初至今、成交量、成交额、成交额、市盈率、股息率、市值。
[En]
Stock symbol, stock name, current price, up and down, up and down, year to date, trading volume, turnover, turnover, price-earnings ratio, dividend yield, market capitalization.
二、分析网页
在网页中,我们注意到,默认每页显示30条:
一共163页:
如果切换到每页90条,总页数就会变成55页: