有没有可能将多因子模型用于国债期货转换因子计算市场

关于股票多因子模型我们的初探、思考、和顾虑 - 干货必读 - 优派
o 5月前发布
  首先说昨天的微信夜报文章答案:没有固定的对错,只是我们倾向于选择第二套CTA产品。原因有三:  1、它虽然只有48个交易单元,但是分配在双周期K线,对时间序列择时有经验的人知道,大周期和小周期K线天然有自己的优劣,在不同时段,会有不同表现。上周期货市场高位巨震(以黑色为例),大周期模型两边受敌,表现不好,此时小周期赚地如鱼得水。  2、它的夏普比率较高,8年运行下来夏普比率达到:2.2293,是4个产品里最高的,夏普比率的重要性特别是在组合类产品中,不言而喻。从上周它的回撤幅度-3.2791%也可以见其优势。  3、援引某保险资本风控总监的寄语:在这个收益率水平(80%以上)上看收益率都不是最重要的了,主要是夏普比例需要提高到2,这样使得资金曲线尽可能的稳,这样排除第3、4个。在第2个和第1个中风险收益比之类的都差不多,上周的回撤也不能说明问题(需要在历史行情中最极端的情况进行测试)。但是第2个占用的资金更少,更能实现灵活配置,并且多出来的60万还能进行期权等套保行为,所以第2个比较好。  好了,看来以后出这样的问题,要设置奖品,大家才更有动力是不是。嗯,你们真棒,我们的夜报写作成本又上升了……  今天见了一个数据提供商,也观察了他们的产品,你们知道是为什么,因为上周说过,我们马上要从CTA模型开发转向股票多因子模型开发了,CTA这部分进入了观察和迭代期。目前的重点是头寸管理方面。  说今天的主题。我本来想认真地写一点关于多因子的知识,结果一百度,笑喷了:  拜托同学们以后搜考试或者面试答案的时候,专业敬业一些,不要把括号也输入进去了。另外想写英文名的时候,直接用翻译工具即可。  我对多因子模型是有一些想法的,今天就讲讲这部分的浅显认知。  1、可靠性,最重要(!?)  本质上的股票因子(这里更多指基本面因子和经济财务类数据)是什么?它是市场参与者对价格运行要素的描述工具,这种工具更加标准化,利于信息传递和继承,利于定量化分析。  我们曾调侃到认为:因子是经济学家对市场模糊认知下的一个产物,用来写论文评奖(比如尤金法玛的《股票回报的交叉选择》(The cross‐section of expected stock returns)),论文认为小盘股和用低市净率的价值股会有更好的回报,这是著名的法玛/弗兰奇三因子模型。 &&  从这个角度出发,并不是怀疑大师的能力,而是我们认为它本质上和技术面分析方式一样,都是试图用一种归纳法解释价格运行的规律。问题来了,统计学、计量经济学,作为方法论学科, 以归纳的方法来研究问题,是证伪不证实的。  但是当我们对因子模型做了进一步研究之后,我们发现了很多因子拥有经济学稳健的理论支持,比如PE,PB,ROE,再比如某上市公司真实的销售数据在行业内的领先程度。这类因子大概率是可以将企业价值反应到其发行的股票中,而市场并非那么地无效,所以他们总会被资金发现。此时我们长舒一口气,因为如果因子基于可靠的经济学理论,反应持久而可靠的模式,那么这些因子的可靠性就强了很多。    换句话说,我们认为什么因子不可靠?或者我们的能力还无法理解这些因子?上图就是例子。这种基于各种指标合成的,特别是拥有奇怪系数的因子,无法判定其经济学原理,回避之(别以为我们不知道这种因子是如何造出来的,我们当年可是非常喜欢弄这种大新闻)。  2、建模拟合带来的有效期疑问(??)  作为一个CTA策略开发者,一时间还无法弄清楚因子的有效期如何计算,但是隐约感觉到这是一个极其危险的问题。如果我们的模型依靠的几个重要因子,在实盘阶段有效性因为市场参与者、竞争度、行政监管等原因大幅度衰减,模型就面临奔溃。  CTA模型过拟合奔溃的案例见过很多,接下来是不是要目睹多因子模型因为过拟合而奔溃了?这里就不仅是因子个体的问题,还有建模人的问题,过度地去修正一段时间的绩效,获得高alpha或者资金曲线高sharpe,会放大某些模糊的市场噪音,将其认为是信号。未来可就要遭殃了,模型大概率失效。我们之前也沉溺于于这种too young too simple sometimes native……  因子本身的有效期问题,希望之后的学习探索中,能对不同的因子的有效时间段进行分析,也会分享学习成果给大家。比如分牛市和盘整市进行回测,我们初步分析认为财务因子的重要性在盘整市中体现出来,一些白马股在此阶段大幅度跑赢市场,显著的alpha收益在这个阶段产生。  另一方面就是建模了,今天老门萨Gunix问了我们一道题:模拟绩效好的,实盘一定好吗?答案是:如果你相信样本外检验对样本内有证实或者强化作用,以此来说明自己的拟合是有效的,说明你哲学课翘课了。  3、超额信息带来超额收益(!!)  这是我们能够确认的,也是行业内所公认的。说到这里我又想到了郑老师……今年本科大四,22岁,其策略早已在更多更大的资管公司使用。他使用了很多前沿的科技,比如机器学习算法进行因子挖掘和加工……  他为量化投资者强化了一个观点——目前的数据抓取技术,正在急剧地改变量化的生态。超额信息或者说超额数据,只要善于分析,这里一定存在超额收益。但是前提是:你得有数据,你得有数据,你得有数据。  为了数据,有人投入极大精力做行研,有人不惜重金从各种渠道购买情报,有人发射卫星监控货运口岸判断上市公司业绩……超额信息如熊猫一般稀缺。当然了我们团队比较惨,作为一个兴趣自发组织,目前是用借来的账号从wind等平台下载数据加工……  今天拜访了国内一个知名的数据提供商ChinaScope数库,看到里面好贵的超额信息数据,然后我们又开始找机构的朋友借账号了。  在年中旬,我们观摩了京东举办的量化大赛,好友Chason还取得了第一名,当场拿走5万奖金。当时我们疑惑为什么京东做电商的也要在这个领域分一杯羹(因为优矿、聚宽、米矿类似的矿是在是太多了)。而且京东有什么独特的优势吗?  结果ChinaScope数库的分析师告诉我们,他们公司(穆迪和京东都有投资)的确有一部分并非财务面的行业大数据,其中有京东通过销售数据加工得到的行业和公司景气度数据,此外还有对于新闻舆情的准确分类能力。这些果然都是超额信息。  超额信息很重要,换句话说,我们在之前的初步分析中,也发现了一些问题:通过太寻常的已知的单因子,已经很难获得超额收益了。各位要做好这个思想准备,股票因子量化绝非依靠几份研报就能搭建出一个能盈利的模型,这个市场正在迎来更高烈度的数据源和加工方法竞争。  4、利用因子择时——数据和机器学习在这里发力(!!)  择时多依赖于技术面时间序列分析,但是在基本面因子分析法中,择时有着完全不一样的用法。比如兴业证券提供的思路:使用shibor数据,通过货币市场利率影响股市资金面供给,进行多空择时。这提示了我们,要通过不同维度指标合成择时系统,而不仅是在一段时间序列上蒙头搞。再比如说,利用动量效应(如成分股达到N周期高点与低点的差额,与成分股数量比值)。  而因子库择时的另一个研究方向,是舆情信息的快速收集和加工分析。在上次清华大学的量化峰会上,有一个机构的宣传册上有此方案的逻辑框架,今天我们通过数库的资料,也看到了类似的框架构建方式,直接截图如下:  这里包含了庞大的数据挖掘,以及通过机器学习甚至深度学习算法进行信息强度和语义正负面分类的研究。很多机器学习爱好者的重点应该放在这里,而不是时间序列特征提取与拟合。  暂时就想到这些问题,这个领域需要极大的精力去投入开发,毕竟市场容量和机会都很大,涉及知识面也更广,工具和数据是致胜关键。  上证指数:  状态:买入。仓位:60%。&  创业板指:  状态:买入。仓位:100%。  主观的说,我们感觉今天是下跌中继的概率较高。欢迎打脸。  点击底部【阅读原文】  跳转到我们发布的《打开量化交易大门 36节精选公开课》目录。  或者去优酷,也可以看到完整的课程专辑。  /albumlist/show?id=&ascending=1&page=1.html
创业者们,如果你或你的朋友想被优派网报道,请狠戳这里&&&&
文章总数0万总阅读量 最新文章
微信扫描,关注心理学与生活,在这里找到你内心的答案!
客服邮箱:
APP推广服务:
优派QQ2群():
优派QQ1群():上传用户:hgrrsrdqqo资料价格:5财富值&&『』文档下载 :『』&&『』学位专业:&关 键 词 :&&&权力声明:若本站收录的文献无意侵犯了您的著作版权,请点击。摘要:(摘要内容经过系统自动伪原创处理以避免复制,下载原文正常,内容请直接查看目录。)跟着量化投资概念活着界各地鼓起,量化投资也愈来愈多的遭到中国证券业界的存眷。与此同时,量化投资的思惟和理念曾经逐步被市场合接收,开端成为证券业界研讨的热门成绩。固然量化投资理念在中国方才起步,然则在中国市场中展示了较强的性命力和成长空间。在中国金融改造赓续推动的配景下,对量化投资的深刻研讨也是证券业成长的年夜势所趋。本文引见的多因子模子是今朝国际上主流的量化投资模子之一,也是今朝中国量化投资范畴的热门成绩。多因子模子试图经由过程建模的办法对驱动股票市场价钱变更的因子停止说明和剖析。多因子模子的研讨也将对券商和投资基金的运作具有必定的指点意义。今朝国际风行的许多量化投资模子都是树立多因子模子的框架基本上,是以研讨多因子模子的有用建模办法是今朝量化投资范畴业界存眷的一个主要成绩。本文第一部门引见了量化投资和多因子模子在中国的成长情形。第二部门,重要对多因子模子的构建办法停止了具体的论述和解释。第三部门是文章的重要部门,该部门对多因子模子建模进程评价和比拟,并试图寻觅出可以或许取得稳固逾额收益阿尔法。并依据现实的须要从截面数据和时光序列数据这两种分歧的维度对因子的有用性停止了磨练和解释。在停止多因子构建进程中,评论辩论了因子的收益的稳固性和因子组合冗余性磨练等成绩,为多因子模子构建供给了一种较为完全的思绪。本文着重于多因子模子的理论与运用,对今朝运用比拟普遍的三种多因子模子的绩效表示分离做了较为具体的比拟。别的,本文评论辩论了用股指期货对冲办法。并将股指期货对冲办法引入到投资设置装备摆设中,并获得了必定的后果。对冲办法的引入也将对进步多因子模子的适用性具有主要感化。Abstract:With the concept of quantitative investment around the world have also been more and more, quantitative investment Chinese securities industry concern. At the same time, quantitative investment thoughts and ideas have gradually become a hot market reception, beginning on the performance of the securities industry. Although the concept of quantitative investment in Chinese has just started, but show a strong vitality and growth space in China market. In the background to promote financial reform Chinese continuously under the big potential on the deep research and quantitative investment securities industry growth trend. This paper introduces the multi factor model is one of the quantitative investment model the current international mainstream, popular performance is also China quantitative investment category. The multi factor model to through the process of modeling method of factor driving the stock market price change to illustrate and analyze. Study of multi factor model will also have some guidance on the brokerage and investment fund operation. The current international popular many quantitative investment model is establish a multi factor model of the frame, is to study multi factor models useful modeling method is of concern for the current quantitative investment category industry a major achievements. This paper first introduces the quantitative investment department and multi factor in the Chinese mould growth. The second sector, an important way to construct the multi factor model to stop the concrete discussion and explanation. The third department is an important department of the Department, the evaluation of the multi factor model and modeling process of analogy, and try to find out can get stable over income Alfa. According to the practical need from these two different cross-section data and time series data of the dimensions of the usefulness of factor to stop training and interpretation. Stop in the process of constructing a multi factor, review the debate factor income stability and factor combination of redundancy and other construction achievements, provides a more complete thoughts as a multi factor model. This paper focuses on the theory and application of multi factor model, said separation made a more specific compared to the current use of multi factor models compared with three common performance. This article reviews the debate with other measures of stock index futures hedging. And the stock index futures to hedge the way into the investment of equipment, and obtained a certain result. The introduction of hedge measures will also be applied to the progress of multi factor model has an important role.目录:中文摘要6-7Abstract7第一章 绪论8-11&&&&1.1 选题背景8-9&&&&1.2 研究意义9&&&&1.3 文献综述9-10&&&&1.4 研究方法和思路10&&&&1.5 论文框架和创新点10-11第二章 量化投资理论介绍11-15&&&&2.1 量化投资的基本概念介绍11&&&&2.2 量化投资的发展历程11-13&&&&2.3 量化投资在中国的发展现状13&&&&2.4 量化投资的优势13-15第三章 多因子选股模型综述15-19&&&&3.1 超额收益与Alpha收益15-16&&&&3.2 多因子模型的基础——Fama-French模型16-17&&&&3.3 多因子选股模型介绍17&&&&3.4 常见的因子选股策略17-19第四章 多因子模型构建流程的讨论19-25&&&&4.1 基于因子排序的多因子模型19-20&&&&4.2 基于因子回归的多因子模型20-21&&&&4.3 基于打分的多因子模型21&&&&4.4 多因子模型的对冲21-25第五章 多因子模型在中国股市的实证检验和分析25-49&&&&5.1 数据预处理25-28&&&&5.2 单因子有效性检验28-39&&&&5.3 基于打分和基于排序的多因子模型检验39-42&&&&5.4 基于回归多因子模型构建42-44&&&&5.5 引入对冲的多因子模型44-49第六章 总结与展望49-51&&&&6.1 结论49&&&&6.2 多因子模型的不足49&&&&6.3 多因子模型研究展望49-50&&&&6.4 论文的不足之处50-51参考文献51-52致谢52-53学位论文评阅及答辩情况表53分享到:相关文献|[原]量化投资教程:股票持仓组合优化与多因子风控模型 - 简书
[原]量化投资教程:股票持仓组合优化与多因子风控模型
本文将分享一些我在实际生产中使用风控模型,并结合R语言代码对模型构建过程一一庖丁解牛。我们在实际构建风控模型时,结合自身业务特点,我们也基于多因子模型实现了一套行之有效的基金运营的风控系统。
风控系统架构
风控系统中的简单分析是指针对策略持仓的收益和风险做简单计算,不涉及财务或行业数据。我们也选用了常见的几个简单分析指标:
1. 夏普比率
表示每承受一单位总风险,会产生多少的超额回报酬。具体计算方法为 策略年化收益率-回测起始交易日的无风险利率策略年化收益率-回测起始交易日的无风险利率 / 策略收益波动率 。
calcSharpeRatio &- function(neatMat){
annualYieldRate &- calcAnnualYieldRate(neatMat)
annualVolatility &- calcAnnualVolatility(neatMat)
annualYieldRate / annualVolatility
2. 年化波动率
用来测量资产的风险性。具体计算方法为 策略年化收益的标准差x $\sqrt{252}$。波动越大代表投资组合风险越高。(年化波动率的计算时间为252个交易日)
calcAnnualVolatility &- function(neatMat){
dailyReturn &- neatMat[-1,"compoundReturn"] / neatMat[-nrow(neatMat),"compoundReturn"] - 1
sd(dailyReturn) * sqrt(252)
3. 累计收益率
表示从投资开始的预期收益率。具体计算方式为 截至分析日的资产净值/初值(初值为1)。
calcCompoundYieldReturn &- function(neatMat){
neatMat[nrow(neatMat),"compoundReturn"] / neatMat[1,"compoundReturn"] - 1
4. 最大回撤
描述策略可能出现的最糟糕的情况。具体计算方法为 min(策略当日净值/当日之前账户最高价值-1)
calcMaxDrawbackSeries &- function(neatMat){
maxDrawback &- matrix(0,nrow(neatMat),ncol=1)
for(i in 1:nrow(neatMat)){
if(neatMat[i,2]&max(neatMat[1:i,2])){
maxDrawback[i] &- neatMat[i,2] / max(neatMat[1:i,2]) - 1
data.frame(date=neatMat[,1],maxDrawback=maxDrawback)
calcMaxDrawback &- function(neatMat){
MaxDrawbackSeries &- calcMaxDrawbackSeries(neatMat)
min(MaxDrawbackSeries$maxDrawback)
5. 年化收益率
表示投资期限为一年的预期收益率。具体计算方式为 回测期间策略每日收益率总和 / 回测交易日数量 × 252。
calcAnnualYieldRate &- function(neatMat){
runTime &- as.numeric(difftime(neatMat[nrow(neatMat),"date"],neatMat[1,"date"]),unit="days")
compoundYieldRate &- (neatMat[nrow(neatMat),"compoundReturn"]/neatMat[1,"compoundReturn"]) - 1
compoundYieldRate / runTime * 252
复杂分析主要是采用一些财务数据、行业数据构建一些指标和模型对策略持仓做进一步细致的分析。我们在实际生产中主要分析以下几个方面:
1. 净敞口暴露分析(现金)
净敞口 = (股票多头市值+股指期货多头市值-股指期货空头市值)/总资产。若采用完全对冲策略时,净敞口非常小,一般在5%附近。但是,当股指期货基差较大,或投资管理人采取放开部分敞口策略时,净敞口会较大。
2. 风险因子敞口暴露分析
用10个风险因子描述市场价格波动风险的主要来源,一般的,股票持仓采用与基准对应的股指期货进行对冲,因此相对基准的风险因子敞口越大,风险越高。一般风险因子的敞口用标准差的倍数描述,持仓组合数量较多、控制严格的组合的风险因子敞口通常在0.5个标准差左右。完全无风险对冲会影响整体长期收益,因子投资管理人会根据其对市场的理解对风险因子敞口进行放开限制
3. 股票相对沪深300的行业偏差分析
由于属于同行业的股票的跌涨往往具有一定的一致性,国内股票市场具有行业轮动的特点,因此股票持仓与其对冲使用的基准的行业偏差是影响对冲效果的重要因素。一般的,行业偏差越大,对冲风险越大。
4. 资产配置比例分析
总资产中,现金、股票、期货的资产配比,是资产配置的直观体现。
5. 证券账户收益归因分析
分析股票的超额收益、主动管理收益、行业偏差收益、风险暴露收益、现金配置收益等。
6. 期货账户保证金占用情况分析
由于期货为当日无负债结算、采用保证金制度,一般情况下期货保证金占用比例为期货资金账户的60%~80%,占用过低则资金利用率低,占用过高则可能无法覆盖市场价格波动造成的资金风险。
什么是多因子模型
多因子模型是关于资产定价和风险管理的模型,关于多因子模型的构造也根据不同业务有不同的选择。
多因子模型通常使用下面的公式表示:
Ri = ai + βi(m) Rm + βi(1)F1 + βi(2)F2 +...+βi(N)FN + ei
Ri:表示标的 i 的单个标的回报率
Rm:表示大盘整体回报率
F(1,2,3...N) 表示N个因子的权值
β :每个因素对应市场(m)的 beta 值
e: 表示随机误差项(白噪声)
a:表示初始值(截距)
多因子风控模型
区别于上述模型,我们根据自身点业务特点,通常,我们将因子主要分为风险因子和行业因子两个大类。
其中风险因子用10个风险因子描述市场价格波动风险的主要来源,根据市场特点细分为:
1. Beta因子
2. 大小盘因子
3. 中盘因子
4. 估值因子
5. 盈利能力因子
6. 成长性因子
7. 杠杆因子
8. 流动性因子
9. 动量因子
10. 残余波动因子
而行业因子则是根据申银万国的一级行业分类构造28个行业的行业因子。这里需要指出的是,由于我们的 Benchmark 选用了沪深300,所以在行业敞口上也由于沪深300在银行和非银金融的比重较大而影响。
综合上诉38个因子,在实际生产中,经过长期检验,该模型能够比较好的反应出基金风控情况。当然,由于模型是根据历史数据来判断风控情况的,所以,它也不可能100%地预测未来值,毕竟模型不是万能的。
股票收益归因
股票收益归因表示通过定量分析总收益反应各种因子对总收益的贡献情况。(选择基准为沪深300)计算公式为:
总收益 - 基准指数收益 = 超额收益(主动管理收益)
超额收益 – 行业偏差收益 – 风险暴露收益 – 现金贡献收益 = 个股选择收益其中总收益、基准指数收益、行业偏差收益 、 风险暴露收益 、现金贡献收益由其他公式计算。
行业偏差收益 = 行业偏差 * 收益
风险暴露收益 =风险暴露 * 收益
现金贡献收益 = 净敞口 * 收益
作为分享主义者(sharism),本人所有互联网发布的图文均遵从CC版权,转载请保留作者信息并注明作者 Harry Zhu 的 FinanceR专栏:: harryzhustudio商业使用请联系作者。
FinanceR 是一个和金融与R语言相关的技术专栏,主要话题包括组合优化、风险管理和量化研究...

我要回帖

更多关于 期货市场资金流向模型 的文章

 

随机推荐