【策略更新】量化策略之舆情挖掘项目

 

法律申明1、在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。2、在任何情况下,本公众号不对任何人...







法律申明



1、在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。

2、在任何情况下,本公众号不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。

3、本报告的内容仅为dataquant团队,近期学术研究成果展示。投资有风险,入市需谨慎!



随着互联网的日益发展,越来越多的人依赖网络、搜索信息和分享交流。同时,股市投资者也越来越倾向于通过网络平台来获取金融信息并交流投资观点。股评论坛包含着丰富的金融数据和投资者情感倾向信息,论坛的相关信息已经成为影响投资者心理和行为的重要因素。尤其是对于当前中国的股市,情绪化显现的尤其的严重。



在互联网时代,资本市场蕴含着巨大的数据资源,无论是机构还是散户,网络信息已经成为了投资决策的重要参考。在网络空间里,各类投资者产生的信息交融在一起,不仅反映了当下的市场状态,同时也响着其他人的投资决策,甚至还会对市场的未来走势产生重要影响。比如在当下的中国股市,一旦消息上有什么风吹草动,市场便会有较大的反应。

传统的技术面和基本面策略,其信息来源主要为行情价格数据和公司的财务数据。前者直接反应了当前的市场走势,但很多时候存在失真现象;而后者存在严重的滞后性,并且经常出现价值与价格长期相背离的奇怪现象。

网络大数据分析与传统的基本面、技术面分析并不相对立,两者是互补存在的。网络大数据分析不仅覆盖面更广,其包括了价格信息、公司信息、新闻动态以及网络舆情等众多非结构化据,而且时效性非常强。因此,网络大数据分析对于我们认清市场状态,把握市场动向有着非常重要的意义。

我们的工作任务是:以公开的网络数据为基础,通过分布式爬虫采集各类网站的评论、关注度以及新闻动态等多维度信息,并利用自创的舆情量化平台进行数据掘,构建舆情股票池;然后,根据基本面和技术面进行多因子量化分析,从而精选出我们的投资组合。

我们的团队成员来自于重庆大学金融协会量化投资分会,分会成立于2014年11月,成员包了括金融、计算机、物理、通讯以及化学等多领域的高材生,曾多次在国内外数学建模大赛中获奖。目前,依托自开发的舆情-多因量化子台,通过严格的逻辑推导以及历史回测优化,已成功研制出2套模型,并在此基础上,针对不同资金量、不同风险(波动)偏好的投资者,构建了4套组合,其基本的介绍如下:

1


[b]D
1号(DataQuant-1)

[/b]

(1)基本信息:组合包含100只股票,风险(波动)中

(2)投资建议:建议资金规模在200w以上的用户作投资参考

(3)模型思路:以全市场A股为参考样本,根据全市场个股关注度变化趋势,筛选舆情组合;同时,结合个股的价格动量、波动、技术形态以及财务质量等因子进行加权计算,取综合排名前100的个股构建“D矿1号”组合,持仓周期为20天。

成分股信息:暂不公开

历史净值走势:



2


[b]D
矿2号(DataQuant-2)

[/b]

(1)基本信息:组合包含50只股票,风险(波动)中

(2)投资建议:建议资金规模在100w以上的用户作投资参考

(3)模型思路:以全市场A股为初始样本,根据论坛里大V评论活跃度、历史选股能力以及自选组合变动状态,筛选舆情组合;同时,结合个股的价格动量、波动、技术形态以及财务质量等因子进行加权计算,取综合排名前50的个股构建“D矿2号”组合,持仓周期为20天。

成分股信息:暂不公开

历史净值走势:



3


[b]D
矿3号(DataQuant-3)

[/b]

(1)基本信息:组合包含12只股票,风险(波动)中上

(2)投资建议:建议资金规模在20w以上的用户作投资参考

(3)模型思路:根据模型DataQuant-1DataQuant-2结果,从中量化精选12只股票构建“D矿3号”组合,并不定期调仓。

成分股信息

'600218'    '全柴动力'

'002011'    '盾安环境'

'000789'    '万年青'

'300305'    '裕兴股份'

'000669'      '金鸿能源'

'002328'    '新朋股份'

'600780'    '通宝能源'

'002649'    '博彦科技'

'600704'    '物产中大'

'300005'    '探路者'

'603369'    '今世缘'

'300195'    '长荣股份'

历史净值走势:暂待

4


[b]D
矿4号(DataQuant-4)

[/b]

(1)基本信息:组合包含6只股票,风险(波动)高

(2)投资建议:建议资金规模在5w以上的用户作投资参考

(3)模型思路:根据模型DataQuant-1DataQuant-2结果,从中量化精选6只股票构建“D矿4号”组合,并不定期调仓。

成分股信息:

'600218'    '全柴动力'

'002011'    '盾安环境'

'000789'    '万年青'

'300305'    '裕兴股份'

'000669'    '金鸿能源'

'002328'    '新朋股份'

历史净值走势:暂待

更多的模型正在研制测试中,敬请期待……

关于Dataquant

我们的团队专注于A股市场的量化投资建模,除了定期在线上发布市场舆情信息以及D矿组合外,还会不定期开展线下交流活动,分享量化投资干货,请随时关注我们的微信号Dataquant。最后,祝各位投资者在新的一年里事业红红火火哦~

注:目前,我们只免费公布3号和4号组合,若要进一步了解相关信息,请您跟我们团队联系。邮箱:dataquanter@gmail.com
更多内容,敬请期待


    关注 Dataquant


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册