量化投资—A股实时挖掘热点的3种方法-Python 实用宝典

量化投资—A股实时挖掘热点的3种方法

A股市场做短线投资,最重要的就是找到“市场合力”,找准资金的流向,找准市场情绪。

尤其对于打板策略而言,找准A股市场上的实时热点是最重要的。

今天二七阿尔量化就来讲讲几种挖掘市场上的热点的方法。

1.人气榜

在我们之前的文章中,曾经监控过人气榜的数据及变化:《Prometheus 实战教程 + Grafana + Python — 实时监控东方财富人气榜股票》,这篇文章讲述了如何抓取东方财富人气榜数据及如何监控股票的排名,有兴趣的朋友可以看看。

通过人气榜,我们能找到最近热门的股票(不一定是最新的):

根据人气榜前20名,结合同花顺的个股概念的前三个概念,我们能总结出最近的热点概念是什么,代码如下:

import requests
from collections import defaultdict
from bs4 import BeautifulSoup

for code in codes:
    res = fetch_code_ths_basic(code)
    print(f'{code}: {res}')
    for concept in res:
        results[concept] += 1
print(sorted(results.items(), key=lambda x: (x[1], x[0]), reverse=True))
000957: ['燃料电池', '新能源汽车', '无人驾驶']
000722: ['水利', '绿色电力', '养老概念']
000755: ['绿色电力', '地方国资改革']
002374: ['PPP概念', '污水处理', '区块链']
300068: ['动力电池回收', '锂电池', '储能']
000404: ['冷链物流', '家用电器', '节能环保']
002514: ['医疗废物处理', '换电概念', '智能电网']
300274: ['储能', '光伏概念', '充电桩']
000629: ['钒电池', '钛白粉概念', '半年报预增']
002466: ['盐湖提锂', '动力电池回收', '锂电池']
002090: ['电力物联网', '智能电网', '充电桩']
002031: ['机器人概念', '工业4.0', '工业母机']
002761: ['水利', '装配式建筑', '新型城镇化']
000601: ['绿色电力', '充电桩', '光伏概念']
002594: ['比亚迪概念', '无人驾驶', '新能源汽车']
300827: ['储能', '光伏概念', '智能电网']
002204: ['核电', '振兴东北', '半年报预增']
000155: ['动力电池回收', '宁德时代概念', '锂电池']
301120: ['绿色电力', '风电', '智能电网']
000625: ['华为汽车', '无人驾驶', '燃料电池']
[('绿色电力', 4), ('智能电网', 4), ('锂电池', 3), ('无人驾驶', 3), ('动力电池回收', 3), ('光伏概念', 3), ('充电桩', 3), ('储能', 3), ('燃料电池', 2), ('水利', 2), ('新能源汽车', 2), ('半年报预增', 2), ('风电', 1), ('钛白粉概念', 1), ('钒电池', 1), ('装配式
建筑', 1), ('节能环保', 1), ('盐湖提锂', 1), ('电力物联网', 1), ('污水处理', 1), ('比亚迪概念', 1), ('核电', 1), ('机器人概念', 
1), ('新型城镇化', 1), ('换电概念', 1), ('振兴东北', 1), ('工业母机', 1), ('工业4.0', 1), ('家用电器', 1), ('宁德时代概念', 1), 
('地方国资改革', 1), ('华为汽车', 1), ('医疗废物处理', 1), ('区块链', 1), ('冷链物流', 1), ('养老概念', 1), ('PPP概念', 1)]

可见,近期的热点是 "绿色电力", "智能电网", "锂电池", "光伏" 等概念。

但是,总结出来的这个热点概念具有一定的延迟,它并不一定能代表最新的市场热点,因为一次涨停、两次涨停并无法把该股带到前20名中。能在前20名的,很可能是最近连板的妖股。

最典型的比如这两天发酵的"储能"概念,只有一只股票在前20名中,但实际上储能概念这几天流入了不少资金。

2.人气飙升榜

那么有没有可能检测到正在飙升的概念呢?我觉得人气飙升板或许可以尝试一下:

我将飙升榜前一百名的股票都抓取后,统计它们的概念,结果如下:

[('专精特新', 13), ('新能源汽车', 12), ('科创次新股', 10), ('锂电池', 9), ('芯片概念', 8), ('宁德时代概念', 7), ('华为概念', 7), ('军工', 7), ('人民币贬值受益', 7), ('5G', 7), ('特斯拉', 5), ('注册制次新股', 5), ('机器人概念', 5), ('储能', 5), ('无人机', 4), ('新材料概念', 4), ('央企国资改革', 4), ('医疗器械概念', 4), ('超级电容', 3), ('航空发动机', 3), ('稀土永磁', 3), ('生物医药', 3), ('燃料电池', 3), ('消费电子概念', 3), ('氢能源', 3), ('比亚迪概念', 3), ('智能制造', 3), ('大飞机', 3), ('华为汽车', 3), ('OLED', 3), ('高铁', 2), ('高端装备', 2), ('郭台铭概念', 2), ('辅助生殖', 2), ('融资融券', 2), ('节能照明', 2), ('网红经济', 2), ('粤港澳大湾区', 2), ('第三代半导体', 2), ('眼科医疗', 2), ('特高压', 2), ('沪股通', 2), ('汽车电子', 2), ('污水处理', 2), ('标
普道琼斯A股', 2), ('机器视觉', 2), ('智能电网', 2), ('智能医疗', 2), ('无人驾驶', 2), ('工业母机', 2), ('工业4.0', 2), ('小米概 
念', 2), ('安防', 2), ('口罩', 2), ('动力电池回收', 2), ('冬奥会', 2), ('军民融合', 2), ('光伏概念', 2), ('健康中国', 2), ('两轮
车', 2), ('PCB概念', 2), ('鸿蒙概念', 1), ('集成电路概念', 1), ('钠离子电池', 1), ('金属回收', 1), ('金刚石(线)', 1), ('跨境电
商', 1), ('超级高铁', 1), ('节能环保', 1), ('自由贸易港', 1), ('腾讯概念', 1), ('肝炎概念', 1), ('网络直播', 1), ('网络安全', 1), ('统一大市场', 1), ('百度概念', 1), ('电子身份证', 1), ('生物疫苗', 1), ('特钢概念', 1), ('汽车拆解概念', 1), ('民营医院', 1), ('核准制次新股', 1), ('智能物流', 1), ('智能家居', 1), ('智慧灯杆', 1), ('智慧城市', 1), ('新冠治疗', 1), ('富士康概念', 1), ('壳资源', 1), ('培育钻石', 1), ('垃圾分类', 1), ('地方国资改革', 1), ('国产航母', 1), ('国产操作系统', 1), ('固废处理', 1), ('卫 
星导航', 1), ('医美概念', 1), ('北京自贸区', 1), ('北交所概念', 1), ('动物疫苗', 1), ('创投', 1), ('农机', 1), ('养老概念', 1), 
('共享单车', 1), ('光刻胶', 1), ('元宇宙', 1), ('传感器', 1), ('仿制药一致性评价', 1), ('互联网医疗', 1), ('云计算', 1), ('乡村 
振兴', 1), ('WiFi 6', 1), ('PPP概念', 1), ('PM2.5', 1), ('MSCI概念', 1), ('C2M概念', 1), ('3D打印', 1)]

除去专精特新和科创次新股这样的大概念,新能源汽车、锂电池、芯片概念位居前排,不愧是碳中和主赛道。

但是这个真的是实时热点吗?我还没有测试过,让我们多观察几天。

3.消息面

我觉得这一个是最能提前预测到热点板块的方法。比如这两天的储能,是由这个消息引爆的:

通过对这个简报进行自然语言处理分析,我们能迅速获得主题及感情色彩:

# 二七阿尔量化
from snownlp import SnowNLP

text = "【光伏发电迎爆发式增长 有储能企业订单量翻8倍】财联社7月13日电,据国家能源局数据显示,2022年1-5月,全国太阳能发电新增装机2371万千瓦,同比增幅为139%。截至5月底,全国太阳能发电装机容量约32789万千瓦,同比增长24%。随着光伏市场的火热,对于储能的需求也持续增长,甚至出现了供不应求的局面。在江苏常州新北区的一家光伏储能系统生产企业内,记者看到,整条产线都在满负荷运行,生产着储能系统所需要的锂电池电芯。负责人表示,现在生产量是去年的5倍,接到的订单量是去年的8倍。光伏发电具有波动性,无法满足电网的全天候调度需求,从2021年以来,宁夏、辽宁、安徽、江苏等地陆续在新能源上网等相关文件中提出了对储能配套等的具体要求。在当前光伏装机量攀升的背景下,储能系统的销量开始大幅增长。"
s = SnowNLP(text)
print('提取文本关键词([TextRank]:',s.keywords(3))
print('提取文本摘要([TextRank]:',s.summary(3))
print('感情色彩(输出为positive概率):',s.sentiments)  

结果如下:

提取文本关键词([TextRank]: ['储能', '增长', '月']
提取文本摘要([TextRank]: ['【光伏发电迎爆发式增长 有储能企业订单量翻8倍】财联社7月13日电', '在江苏常州新北区的一家光伏储能系统生产企业内', '对于储能
的需求也持续增长']
感情色彩(输出为positive概率): 0.7465336870736243

从中我们就提取出了储能这个关键词,并知道其感情色彩为正面。通过对一些简报和快讯进行命名实体识别,并识别其感情色彩,我们也能够快速分析一个概念是否可以成为热门概念。

A股市场判断热点和情绪的方法还有很多,比如韭菜公社的言论、淘股吧各路游资的言论,实际上都可以被量化为因子进行研究,有兴趣的同学可以试试。

我们的文章到此就结束啦,如果你喜欢今天的 Python 教程,请持续关注Python实用宝典。

有任何问题,可以在公众号后台回复:加群,回答相应验证信息,进入互助群询问。

原创不易,希望你能在下面点个赞和在看支持我继续创作,谢谢!


​Python实用宝典 ( pythondict.com )
不只是一个宝典
欢迎关注公众号:Python实用宝典

Pandas 性能优化
本文由 Python 实用宝典 作者:Python实用宝典 发表,其版权均为 Python 实用宝典 所有,文章内容系作者个人观点,不代表 Python 实用宝典 对观点赞同或支持。如需转载,请注明文章来源。
6

发表回复