Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > Java基础相关 >

quantsp研究计划书 PDF 下载


分享到:
时间:2020-09-22 08:59来源:http://www.java1234.com 作者:转载  侵权举报
quantsp研究计划书 PDF 下载
失效链接处理
quantsp研究计划书 PDF 下载

本站整理下载:
 
相关截图:
 
主要内容:

一、研究方向
1.1 研究问题 
开发一种类似于 AZFinText(Arizona Financial Text System)的中文金融新闻
信息文本挖掘系统,实现对海量中文财经新闻的即时文本挖掘,由此对股价进行
预测,并结合一些常见的量化投资策略进行模拟程序化交易。根据不同策略组合
可以得到不同的投资回报率,而从这些回报率的分析上可以进一步得到市场中投
资者的行为模式信息。这一类研究的模板是 AZFinText 的开发者 Robert P. 
Schumaker 近年所发表的一系列论文,本研究亦可视为是其思路在中文环境下的
实现(差异不仅在于市场和投资人,更多的在于因语言的不同导致文本挖掘技术
的不同)。
1.2 研究现状 
国外使用文本挖掘技术来预测舆情、股价的文章有很多,但将文本挖掘和量
化投资结合起来的寥寥无几。尽管 AZFinText 很有名气1
,但并没有引起金融学
学者的关注(在谷歌学术搜索中有 16 次引用,无一来自金融学论文,这是令人
难以相信的忽视),更主要影响仅在信息管理领域。Schumaker R P, Chen H(2008)
研究了结合金融新闻文本挖掘预测系统(AZFinText)和量化投资策略进行选股
的回报率。数据和新闻的获取时间段选在 2005 年 10 月 26 日-2005 年 11 月 28 日 5 周共 23 个交易日(选择该时间段的原因在于无重大市场冲击发生),持股期也
选在该阶段(即没有卖出),期末计算回报率。使用的两种基本的投资策略是顺
势和逆势投资策略,分别是将时段长度为 f 的股票回报率进行排序,购买或卖空
排名在前 20%的股票称为顺势,而购买后 20%的则称为逆势(为了使结果具有稳
健性,f 分为 1-5 周五种情况)。投资的结果是结合使用全部金融新闻挖掘和量化
投资策略的投资在顺势、逆势等十种情况中回报率都远高于仅用部分金融新闻挖
掘或仅使用量化投资策略的投资回报(作为对比,顺势投资策略且 f=1 时,三者
的回报率分别是 20.79%,0.33%,-5.54%)。
国内学界对该领域使用文本挖掘技术来研究新闻对股市影响的文献更少,目
 1 相关新闻可见于 http://www.technologyreview.com/view/419341/ai-that-picks-stocks-better-than-the-pros/
前使用谷歌学术搜索所能检索到的仅有 Xiangyu Tang 等(2009)、赵丽丽等(2012)、
黄诒蓉(2013),甘甜甜(2012)几篇文献,并且无一和量化投资相关。在不进
行程序化交易的情况下,金融新闻文本挖掘和人工阅读新闻相比并没有多大的优
势。
至于国内业界,我使用谷歌搜索关键词 intitle:“文本挖掘” “量化投资”(表示
搜索以“文本挖掘”,“量化投资”作为标题的网页),返回的搜索结果仅为两页,和
业界相关的仅有“广发证券”的三个结果,其中真正涉及文本挖掘的仅有一个,“网
络文本挖掘方法介绍”,“量化投资专题”。该文档形成时间为 2012 年 4 月,但内
容也没有涉及到量化投资的应用。由此可以断定,即使有机构在从事这一方向的
研究,那也仍是处于起步阶段。
1.3 研究意义 
从研究现状来看,这是一项具有强烈市场需求但无论从学界还是业界来看都
仅仅处于起步阶段的研究。如果文本挖掘技术有所突破,预计未来几年将会对业
界有重大影响。例如业界对股评人、新闻分析师、行研报告撰写员等人才的需求
将会大幅下降。
文本挖掘的优势在于,在短时间内分析大量的信息,从而能快速判断市场期
望,而使用量化投资方法则能抢在期望实现之前完成交易。“扫描股票价格和金
融新闻,买入哪些它相信在 20 分钟之内会上升超过 1%的股票,然后在 20 分钟
之后卖出。”、“在进行长期预测时有很多因素需要考虑(因此这样的投资策略可
能不管用),但在短期,例如五分钟,十分钟之内,(新闻对股票价格的影响是最
主要的因素),这样做就很有优势。”2。
二、研究方案
2.1 新闻信息来源和提取 
新闻有多种来源,按权威性排序可分为:(1)证监会,银监会,央行等政
策发布的信息;(2)各上市公司发布的财务报告、著名评级公司评级;(3)各
大财经门户网站新闻;(4)股评人评论,知名博客自媒体文章等等。
为了能实时抓取这些信息,可以编写网页爬虫(web crawler)来抓取网页
信息


 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐