智能选股简史

 

这个世界的投资者,除了一部分人企图从天空找答案外,另一群人则把焦点放在了计算机上...





  • 关注秦朔朋友圈,ID:qspyq2015
  • 这是秦朔朋友圈的第2134篇原创首发文章
从数百年前人类有金融交易以来,投资人总是不断地思索,希望能够找出涨跌的规律,他们是从什么方法开始的?对,就是占星术,人们总是从非理性的技术开始不断进化,直到计算机出现,而后人工智能风行。

金融占星学
纽约证券交易所成立于1792年5月17日,当时24个证券经纪商在华尔街68号外的一棵梧桐树下,签署了“梧桐树协议”。协议中规范了股票经纪人只能与其他经纪人进行交易,以及股票交易佣金不得低于0.25%。这个时间也就是纽约交易所的生日,从西洋占星的角度来看,这时候太阳在金牛座27度。

“金牛座”,没错,出现了投资人最喜欢的动物,投资人都爱“牛”,有人说“牛市”一词,起因于价格上扬时,市场热络,投资人挤在狭小的证券交易所中,万头攒动,就如同传统市集中的牛群般壮观,故戏称为“牛市”。



事实上,在西方的语言学那里,资本(capital)与牛(cattle)本就来自于同一个拉丁字根(caput,意指“头”),英文的pecuniary(金钱的)这个字也源自于拉丁文的牛(percus)。而金牛座掌管的第二宫,代表的正是财务、价值、世俗。对于纽交所来说,应该没有比金牛座更适合的星座了。

若是觉得纽交所只是巧合,这些炒股的经纪商哪可能考虑到占星术?那我可以告诉各位蛮有趣的事实,目前全球四大交易所,除了科技股为主的纳斯达克不吃这一套之外,伦敦证券交易所是1801年5月18日开业的,东京证券交易所大楼是1988年5月23日开业的,毫无疑问它们都是金牛座。

所谓占星选股的概念也很简单,其实就是用该公司上市敲钟的那个时刻的行星排列来做为诠释的基础。(我承认我是个会西洋占星术的数据科学家)。

以日前才挂牌的小米为例(2018年7月9日,9:30,出生地香港)为例,就可以排列出当时的星图。很有趣的是,小米的太阳为巨蟹座,落在第十一宫,十一宫掌管的是社群、团体、自我认同感,太阳落入十一宫表达了在社群的号召能量,这与小米的调性不谋而合。至于小米的月亮,则是落在金牛座,意味着内部本质仍然注重落地与获利,对上市公司来说算是好的基础。今年五月中,天王星刚进入金牛宫,意味着虚幻的落地,但这里的落地可能是落地成功也可能是粉身碎骨。1934年也有过这样的星象,那年一月,美金本位取代了金本位,在这个时间点,小米的上市也将会受到市场严苛的检验,小米的上市预估价就是在这段期间从2000亿跌到低于500亿,反映着虚幻落地过程的艰辛。整个七月星空总计有火星、木星、土星、海王星与冥王星五颗行星逆行,整体来看还是会比较艰辛的(不只小米,这阵子整个盘势都会受此影响)。

太阳黑子


有人用占星来选股,也有人把希望放在太阳身上。在哈利‧邓特二世(Harry S. Dent, Jr.)的The Demographic Cliff: How to Survive and Prosper During the Great Deflation of 2014-2019(《经济大悬崖2014-2019》)一书中就提到,分析师将太阳黑子的活动周期(大约是11年,所以是不太实用的超长期指标)与美股的表现比对,发现两者间有高度相关性,当太阳黑子活动达到最高峰时,那时美股通常也会进入到波段高点,随着太阳黑子活动衰退,美股也会随之盘整大跌。

太阳黑子说之所以言之凿凿,是因为的确过去历史上几个重大事件都和太阳黑子的活动周期吻合。举例来说,从1630年底开始,太阳黑子活动量从低谷逐渐攀升,而1634年起,美丽的荷兰郁金香被投机分子看上,开始炒作,在M.戴许所著的《郁金香狂热》一书中有以下的描写:“1636年,一棵价值三千荷兰盾的郁金香,可以交换八只肥猪、四只肥公牛、两吨奶油、一千磅奶酪、一个银制杯子、一包衣服、一张附有床垫的床外加一条船。”到了1637年的2月起,郁金香的价格开始大崩盘,价格仅剩下高峰时的百分之一,让荷兰各大都市陷入金融乱局,这就是史上著名的近代欧洲三大泡沫事件之首的“郁金香狂热”。

各位可能觉得只是巧合,这些炒郁金香的人难道真的是被太阳黑子给弄得太嗨了吗?那我又要告诉各位一个有趣的事实,欧洲三大泡沫事件的剩下两件,南海泡沫事件(南海公司股价从1720年1月的每股128英镑上升到1720年7月的每股1000英镑以上,1720年12月份最终回落到124英镑)以及法国的密西西比公司(该公司的股票由1717年的8月从500里弗尔涨到15000里弗尔。但是在1720年夏天时,投资人对这间公司的信心大减,结果一年之内股票价格跌回500里弗尔。)这两个泡沫事件都发生在1720年,刚好这年是沉寂了60年的太阳黑子在冰河期后首次出现的活动高峰。

当然相信太阳黑子说的研究单位举出了很多相关事例,不过虽然比对过去一世纪太阳黑子理论几乎堪称神准,但是从2000年开始就持续失效,很难看出太阳黑子对于股市的影响(我个人猜测,随着互联网技术发展,很多交易是在晚上进行的,难怪太阳对股市失去了作用)。

各位应该会很想知道现在太阳的情况怎么样,目前是在太阳黑子的第24个周期后半,也就是太阳黑子的衰退期,甚至于2016年还曾经观测到数次“零黑子”的奇异现象,从太阳黑子的预测周期来看,应该会在2020年达到最低点(那年正好是美国总统大选年),2023~2024年达到下一次的太阳黑子活动高峰。


计算机交易
这个世界的投资者,除了一部分人企图从天空找答案外,另一群人则把焦点放在了计算机上。上世纪70年代开始了金融市场交易的计算机化,促成了运用计算机技术选股的策略问世。大体上,传统计算机选股的思路大致分为三种,一是认为股价是完全不可预测的,我们没法知道它精确的走向,但我们可以透过数学推估它可能的范围;第二种则是基于传统统计,尤其是根据相关性来设计避险交易以及时间序列建模来推估股价;第三种则是不企图做出一个放诸四海而皆准的模型,它关注的是如何找出下场交易的“信号”,让计算机根据拟定好的交易信号来自动执行交易,这种方法也就是现代大家常听到的“量化交易”。


第一种认为股价的变化,其实是随机的,随机不意味着无法预测。在物理学上有个很有名的观念称为布朗运动(Brownian motion,1827年英国植物学家罗伯特·布朗利用一般的显微镜观察悬浮于水中的花粉微粒时,发现微粒会呈现不规则状的运动,因而称之为布朗运动。布朗运动是微小粒子或者颗粒在流体中被液体分子随机撞击下所产生的无规则运动。整个过程是一种正态分布的独立增量连续随机过程,它也是随机分析中极为重要的基本概念。这种花粉被无数的随机液体分子碰撞的运动,虽然我们没办法预测它会飘到哪里去,但是至少可以预测在限定的时间范围内,它的移动范围有多大。这个思路被应用到股票交易上,股价犹如被无数的交易者的随机决策驱动,我们无法预测股价,但至少知道它的上下涨跌幅范围。
花粉颗粒与股价,这两者好像离得有点远啊。这个思路的实现者,也就是三位美国学者,哈佛商学院教授罗伯特·默顿(Robert Merton)、已故数学家费雪·布莱克(Fischer Black)和斯坦福大学教授迈伦·斯克尔斯(Myron Scholes),他们根据布朗运动延伸到市场交易这个思路,为他们赢得了1997年第29届诺贝尔经济学奖(发表时布莱克已经去世)。而得奖之作正是大名鼎鼎的布莱克·肖尔斯期权定价模型(Black Scholes Option Pricing Model),这个模型的重要性堪称为金融市场中的牛顿力学,1973年首次在政治经济杂志(Journal of Political Economy)被发表之后,很快就被芝加哥期权交易所给采用,而今已成为包括股票、债券、货币、商品在内的新兴衍生金融市场的定价基础。

至于第二个流派则是以统计为基础,运用统计技术来找出投资商机。最普遍使用的技术包括了相关性的检定以及时间序列。前者是用来找出有没有哪些股票呈现负相关,若有这样负相关的关系,那么在购买某一支股票时,就可以再购买负相关股票的看空期权,这就成为避险交易(Hedge)乃至于对冲基金(Hedge Fund)的理论基础。至于后者,时间序列则认为股市是具有时间周期性的序列,因此可以透过时间序列算法来分解以及预测。这个流派虽然还有不少支持者,但是已经日渐落寞了。原因是相关性检定太简单,虽然在90年代末到2000年初期,由于当时算力不发达,全面性运用历史数据做整个市场所有股票的相关检定这个任务可称相当艰巨,但是随着现代分布式计算的普及,这个已经进入到基本常识阶段,已经不再具有差异性壁垒。不过后来将股价波动相关性应用到复制大盘走势,也成为现代被动式管理基金的基础理论。

至于时间序列则日渐显露出许多统计假设在真实世界上的不合理,因此造成难以适用的情况。举例来说,计量经济学者都假设所有的股价数值应该都是定态(Stationary),翻译成人话的意思是——“从长远的时间尺度来看,这个数列应该要是基于一个平稳的固定数值来上下波动。”好吧,这个假设岂不是预设了大家都没法在证券市场赚到钱,但是日前看到朋友圈里有人发文提到“A股十几年前2700点,到现在还是2700点”这个怪奇现象,搞不好统计流派又能在A股市场中获得肯定。


至于第三个流派简单的来说就是现在所谓的量化交易(Quantitative Trading),与前面提到的统计流派最大差异在于,他们不企图建构一个模型来描述市场,而是透过算法去找寻市场上可能产生超额收益的大概率事件,并根据这些事件来设定交易策略。简单的来说,就是透过数据工具来找出可以赚钱的交易信号,而这种交易的成功不是靠单一股票的买卖,而是基于一篮子的交易策略下的整合套利成果。量化交易最大的优点可以用股神巴菲特(Warren Buffett)名言来诠释:“人总在贪婪的时候恐惧,恐惧的时候贪婪”,这句话点透了人性在金融市场的软弱,而量化交易正是用算法来替代人性,一切都理性地依照模型来执行交易。

但是这种完全理性的手法往往不能理解股票市场中充斥的各种非理性因素,加上算法复杂度有限,因此算法交易间接地成为1987年10月19日黑色星期一股灾火上加油的因素。当日全球股市在纽约道琼斯工业平均指数带头暴跌下全面下泻,但是原先程序看到股价下挫,便按编程中设定的机制加入抛售股票的行列,反而形成恶性循环让股价跌得更深。

人工智能
如果说量化交易属于浅层规则的代表,人工智能时代的核心深度学习,则开启了智能选股的新时代。透过深度学习的自然语言理解(NLU,nature language understanding)以及机器视觉技术,让选股技术从结构化数据延伸到非结构化数据。其中,最有名的人工智能辅助交易市场的案例,就是日前被信评机构S&P Global以5.5亿美元买下的Kensho



Kensho是一家什么样的公司? 《财富》杂志形容它是“一家让华尔街人神共愤”的公司。Kensho的创始人纳德勒(Daniel Nadler),是哈佛大学经济学博士,他和程序员Peter Kruskall在马萨诸塞州剑桥市联合创立了Kensho。Kensho这个字来自于日本佛教禅宗的意识状态“见性”,原意为“透过现象理解事物的本质”。

Kensho最核心的技术在于运用语意分析处理来自世界各地的各种可能影响投资目标价格的新闻来源,并且分析评估出对应的可能影响概率。其中打响它知名度的预测就是在川普当选后,美元一度强弹3%,当时Kensho就发布预测,受到美元升值冲击的科技股将止跌回升,结果预言成真,科技股是2017年的大赢家。而这也是为何Kensho将它的产品取名叫做华伦(Warren),正是意味着机器也有可能如同股神巴菲特一样用神准的眼光来看清市场。
随着市场整体变化,这些投资机构毛利大不如前,而高昂的人力就成为了投资效益的绊脚石。尤其是历经了巴菲特的赌局,证实了对冲基金绩效难以超越被动式管理基金,而其中最大关键就是在于获利几乎都被对冲基金管理人给吃光了。也因此这类人工智能选股机制开始风行,最早采用的高盛,原本2000年在纽约还有600名股票交易员,如今只剩两人。Kensho创始人Daniel Nadler预计,到2026年,有33%~50%的金融业工作人员会失去工作,他们的工作将被计算机所取代。不过这对于投资大众来说也许是好消息,这意味着基金管理成本降低,这对于华尔街业者的家人们也许还算是个好消息,正如前高盛顶尖交易员Anton Kreil曾形容“在一个节奏很快的环境中,常有赌上瘾的感觉。关键是学会如何去抑制这种感觉,并且能以一种近乎非人类的方式来做交易。”Trading in a non-human way,这么不人性的事,自然还是交给机器来做更为合适。

那么智能选股的未来会是什么,Kensho证明了自然语言技术应用在投资上的成功,还有哪些技术可能会成功?

在2017年上海BOT人工智能大赛(该竞赛开启于2016年,是中国首个国际性人工智能竞赛),两年赛题皆由笔者负责,2017年的题目就是智能投顾,赛题中选手尝试在没有任何结构化数据的输入,光靠新闻、公告、投研报告(初赛)以及K线图的图档(复赛)来预测未来三天股价,竞赛中成果显示利用自然语言看文件与机器视觉看K线图,分别可以达到75%以及68%的涨跌幅预测命中率。这意味着人工智能进入投资市场的无限潜力。

而让AlphaGo战胜人类一夜成名背后的技术“强化学习”,又是另一个未来可以期待的明星技术。相较于其他技术是预测涨跌幅,而强化学习的核心在于让机器学习如何制定最佳的策略。就像AlphaGo历经了在虚拟世界上亿次的左右互搏,未来的强化学习智能体也将会有可能在虚拟世界中经历过上亿次的股票买卖,根据虚拟世界的赚赔经历的累积,学会更有效地收集情报来拟订最佳的投资行动,包括文字数据与图像数据。

而我们不禁要问,当未来的市场全部都是智能体们互相斗智,而拥有最大算力的投资人将会拥有更厉害的智能体,这样随算力倾斜的市场,还能被其他投资人认同而保持流动性吗?老实说,我不知道,但我也很想看看未来会是如何变化的。
  • 作者为Deepbelief人工智能科学家。华院数据科学家。2002年在中国台湾创立亚洲资采,台湾第一个大数据公司。
「 本文仅代表作者个人观点 」
「 图片 | 视觉中国 」




秦朔朋友圈微信公众号:qspyq2015
商务合作|请联系微信号:qspyqswhz
投稿、内容合作、招聘简历:friends@chinamoments.org


    关注 秦朔朋友圈


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册