如果要分析一只新发行零息债券的到期收益率收益率,要考虑哪些因素?

债券价值分析
债券价值分析本章任务:通过收入资本化法计算债券的内在价值,从而对其进行价值评估。通过对影响债券价值各种因素的分析,总结债券定价原理,揭示债券价格的变动规律。从而帮助投资者更深入的了解债券,更理性的进行债券投资。学完本章后,你需要掌握:如何用收入资本化法(现金流贴现法)评估债券价值;债券属性与债券价值关系;债券定价的五个基本原理;马考勒久期的原理与计算;利用马考勒久期、修正久期计算债券价格变动;凸度、免疫的含义。第一节&&&& 收入资本化法在债券价值分析中的运用收入资本化法认为任何资产的内在价值取决于该资产预期的未来现金流的现值。根据资产的内在价值与市场价格是否一致,可以判断该资产是否被高估或者低估。从而帮助投资者进行正确的投资决策。它包括两个步骤:一是计算债券内在价值,二是在此基础上判断是否具有投资价值。一、债券内在价值分析收入资本化法认为任何资产的内在价值取决于该资产预期的未来现金流的现值。对于现金流流入具体方式不同的三种债券-------贴现债券(零息债券)、附息债券(直接债券)、统一公债(永久公债)而言,其内在价值计算公式分别如下:二、投资价值分析方法一:比较债券的内在价值与债券价格的差异比较内在价值 (V) 与债券价格 (P),当V大于P时,债券被低估,应当买入:反之卖出。即财务分析中的NPV法 :NPV=V - P当净现值大于零时,该债券被低估,买入信号。当净现值小于零时,该债券被高估,卖出信号。当净现值等于零时,债券的价格等于债券价值,市场处于均衡状态。方法二:比较两类到期收益率的差异预期的到期收益率:指投资者要求的收益率,一般指市场利率,即公式中的y承诺的到期收益率:即隐含在当前市场上债券价格中的到期收益率,用k表示,也是使净现值等于零的贴现率。&&以直接债券为例&&如果k & y,则该债券的价格被低估;如果k & y,则该债券的价格被高估;当y= k时,债券的价格等于债券价值,市场也处于均衡状态。即财务分析中的IRR法。第二节&&& 债券价值属性到期时间 (期限)债券的息票率债券的可赎回条款税收待遇市场的流通性违约风险可转换性可延期性一、到期时间(一)债券到期时间与价格波动之间的关系债券的到期时间决定了债券持有人获得未来现金流量的时间。债券的期限越长,其市场价格变动幅度就越大。假设有三种债券,面值、息票率都相同,分别为1000元及10%。它们的期限分别为10年、20年、30年,每半年支付一次利息,假设其他属性也相同,随着收益率变动,价格变动的情况如下表:表6-1& 期限不同的债券价格 当市场利率变动时的波动幅度市场利率上升一个百分点,10年期债券价格下降59.75,20年期债券下降80.23,30年期下降87.25。到期时间越长,价格下降幅度越大,反之,则越小。同时,随着债券到期时间的临近,债券价格变动幅度以递增的速度减少,反之,越远离到期时间,债券价格变动幅度以递减的速度增加。(对于同一只债券,此规律也成立)问题:两种期限不同的债券具有相同的票面利率、面值和收益率,那种债券的销售折价或溢价越小?(二)债券的市场价格时间轨迹无论是溢价发行的债券还是折价发行的债券,若债券的内在到期收益率不变,则随着债券到期日的临近,债券的市场价格将逐渐趋向于债券的票面金额(对比表5-4和表5-5)。表5-4 :20年期、息票率为9%、内在到期收益率为12%的债券的价格变化表5-5: 20年期、息票率为9%、内在到期收益率为7%的债券的价格变化折 (溢) 价债券的价格变动从图中可再次看出:如果债券收益率在整个生命周期内不变,则折扣和溢价的大小将随着到期日临近而逐渐减少;同时,随着债券到期时
分享这篇日志的人也喜欢
我陪你你陪我11
各位老板,剁手了没
一花一世界
小兔子陪你们一起过节哦!
把你加入购物车跟我回家
跳舞主播求守护
热门日志推荐
人人最热标签
北京千橡网景科技发展有限公司:
文网文[号··京公网安备号·甲测资字
文化部监督电子邮箱:wlwh@··
文明办网文明上网举报电话: 举报邮箱:&&&&&&&&&&&&
请输入手机号,完成注册
请输入验证码
密码必须由6-20个字符组成
下载人人客户端
品评校花校草,体验校园广场狼真的来了?论机器学习在分析新债发行收益率中的应用—兼论利差之谜在中国
本文的主要结论如下:
1、信用风险、基准利率在信用利差之谜中均具有重要解释力;外部评级对利差的解释力度很强;兴业主体评分排序靠前,说明评分在主体信用风险中具有较好的区分度;个券流动性溢价有影响,但不如信用风险溢价和基准利率对利差的重要性大。
2、我们定义偏差度为模型指示结果减去实际发行利差的绝对值,91%的测试数据偏差度在100bp以内,86%的偏差度在80bp以内,72%的偏差度在50bp以内,40%的偏差度在20bp以内,20%的偏差度在10bp以内。
模型构建按如下顺序展开:
1、根据利差理论,梳理并量化影响利差的债券性质。
2、模型按照8:2的比例随机分配80%的数据点作为训练集,即训练模型的样本。另外20%的数据点作为测试集,即模型测试样本。
3、用训练集的数据生成由200棵决策树构成的随机森林。
4、这200棵决策树作为200个投委会委员,以少数服从多数的原则,投票表决决定20%的测试集中每支新债的利差应该为多少。
5、特征重要性排序分析、比较模型指示结果和实际发行利差。
利差分解如下:
利差=平均预期损失率+杠杆可操作性+风险溢价+不可预期损失的要求回报率+市场摩擦因素溢价(公式1)
=平均违约率*(1-违约后回收率)+杠杆可操作性+(风险厌恶程度+资产波动性)+不可预期损失的要求回报率+流动性溢价+配置约束+税收溢价(公式2)
随机森林模型可以学习平均预期损失率、杠杆可操作性、风险溢价以及市场摩擦因素溢价等因素对利差的影响,但对不可预期的损失所对应的风险溢价部分学习能力有限。研究员还需要在模型指示结果的基础上,根据投资者结构变化、评级变动、违约事件风波及信用债市场相关政策等作为模型调整项对最终的申购收益率进行调整。
模型所是使用的指标总结如下:
随机森林模型的可延展性很强,未来随着兴业主体评分实现全覆盖以及加入担保特征,模型在加入更多的样本和更多相关的债券特征后,模型效果将有更大的提升空间。模型不仅可以用于无担保新债的发行利差,对有担保新债和存量债的定价也同样具有适用性。模型的数据输入无需依赖中债估值,对提升定价透明度具有一定意义。
风险提示:模型偏差风险
随机森林由多棵树构成,每棵树被称为决策树。决策树由节点和树枝构成,最先的节点称为根节点,最后的节点成为叶子节点,中间的节点称内部节点。如图表1所示,根节点和内部节点表示特征,以方形表示,树枝表示特征值判断条件,以箭头表示,叶节点表示分类结果,以椭圆表示。决策树的作用是根据特征值判断条件(树枝)将样本分为不同的类型(叶节点)。在本文中,不同的类型即为不同的利差。每一棵决策树生长的基本逻辑如下:从第一个根节点开始通过判断样本特征是否满足特定条件,将样本筛选入下一层的内部节点,不断生长,最终达到将样本分类的目的。
模型将会根据样本数据训练出上百棵如图表1所示的决策树,共同构成随机森林。不同的样本和不同的特征会训练出不同的决策树。训练决策树的样本集合称为训练集,另一部分样本点放入测试集中,用以测试决策过程的合理性。当测试集中的新样本点进入随机森林,每棵决策树会根据自己的分类逻辑将这个样本点进行归类,所有决策树将自己的分类结果告诉随机森林这个决策委员会,委员会最终以少数服从多数的原则最终决定新样本点的分类。
随机森林背后的逻辑是群体决策的社会学意义,也即个人的决策过程是局部片面的,结果是有偏的甚至是极端的,但群体决策可以克服这样的问题,使决策逻辑更全面,结果更有效。每棵决策树形成的过程中仅基于部分训练集的样本,以及部分特征。这是与个人的学习过程类似,个人根据自己的学习经验总结逻辑规律并做出判断,但由于个人的成长背景、文化环境、价值观和信仰等局限性,这些判断总是片面的。决策树同个人一样,通过学习部分数据和部分特征形成的分类逻辑也是局部片面的,但是上百棵决策树做出的决定则可有效避免这个问题。
随机森林不同于传统的计量模型,(1)模型无需过多考虑多重共线性,顾虑一般回归分析面临的多元共线性的问题;(2)由于模型随机选取样本和随机选取特征,使得模型具有很好的抗噪声能力;(3)模型还可以对特征进行重要性排序,对于相对估值法中筛选可比券具有重要意义。
结合模型的构建过程,本文的结构按如下顺序展开:
(1)根据利差理论,梳理并量化影响利差的因素,具体选择逻辑将在第2节信用利差理论中详细介绍。样本的统计性质请参见附录1。
(2)按照8:2的比例随机分配80%的数据点作为训练集,即训练模型的样本。另外20%的数据点作为测试集,即模型测试样本。
(3)用训练集的数据生成由200棵决策树构成的随机森林。技术细节请参见附录2。
(4)这200棵决策树作为200个投委会委员,以少数服从多数的原则,投票表决决定20%的测试集中每支新债的利差。
(5)结果分析。第3节随机森林模型结果及分析将详细介绍。
我们定义某信用债的发行时利差为票面利率减去同期限国开债的到期收益率。下面讨论利差的影响因素。
理论上,在无交易摩擦的市场,风险中性投资者的要求回报率为债券的平均预期损失率(=违约概率*(1-违约后回收率))。而风险厌恶的投资者所要求的利差完全可以被违约概率、违约后回收率以及风险溢价决定。其中风险溢价由两部分组成,对平均预期损失的不确定的溢价,以及对不可预期的损失的风险溢价。在非系统性风险可以被完全分散的情况下,第二部分的风险溢价应当为0。
所以理论上,我们只需考虑以下三个因素:
(1)违约概率:我们使用兴业主体评分、所属行业、所属地区、公司属性,以及外部评级。兴业主体评分分为1-5分共11档,作为违约概率主要指标。新债发行时外部评级过于集中在AAA、AA+和AA,粒度较粗,因此只作为补充。此外加入所属行业、所属地区、公司属性作为违约信息补充。
(2)违约后回收率:债项特殊条款、优先级顺序已经放在永续债这个特殊条款里,由于只涉及无担保债券,因此不考虑担保条件。特殊条款的指标包括是否永续、调整利率方向、是否含赎回、是否可质押、是否含回售、是否含提前偿还。
(3)风险溢价:风险溢价产生的根本原因是因为投资者都是风险厌恶的,由风险厌恶程度和资产的波动性决定。根据对于损失分布的方差要求一定的补偿,方差越大,风险溢价越高。一般而言,高评级的稳定性好于低评级主体的信用稳定性,因此低评级的风险溢价高于高评级的风险溢价。风险厌恶程度的影响因素主要有资金面、投资者结构及各自配置偏好等。其中资金面的松紧由基准利率指标代替。
但现实过程中,存在如下问题:
(1)投资可以运用杠杆增厚收益。通过质押其所持仓的信用债加杠杆这种方式,投资者可以增厚其收益率,导致实践过程中,投资人可接受信用债票面利率小于预期损失率。其背后的根本原因是资金融出方承担了部分违约损失风险,是否可加杠杆是影响利差的重要因素。
(2)投资者会为不可预期的损失要求风险溢价。在理想条件下,投资人可以构建足够大的债券组合,分散掉违约风险中不可预期的部分。但信用债收益率的负偏态性以及信用风险的系统传染导致实践中充分分散的成本过高,因此投资人对不可预期的损失部分也要求有相应的风险回报。当信用债自身的风险越高,且与其他资产违约相关性越高时,这部分的溢价也越高。因此,我们看到当违约风险集中爆发时,信用债的风险溢价也会大幅提升,除了预期违约损失率上升外,还因为信用债的违约相关性大幅提升。这些指标包括投资者结构变化、评级变动、违约事件风波及信用债市场相关政策变动等,但由于比较难量化,这部分因素暂时没有加入到模型中,而是作为模型调整项,由研究员判断决定。
(3)市场存在摩擦。市场摩擦主要体现在三个方面:信用债流动性受限;配置约束;税收因素。1)债券流动性:相比利率债而言,信用债的流动性较差,在信用债交易过程中市场摩擦更大,因此交易员在将债券换成流动性的过程中,需要花费更多的时间和精力,甚至折价卖出,这部分费用的预期会体现在流动性溢价中。我们采用债券发行场所、发行规模这两个指标。一般认为在两个场所同时发行的债券流动性好于只在其中一个场所发行的债券。发行规模适中的债券流动性好于规模过小或者规模过大的债券。2)配置约束:由于监管机构的限制或风控等原因,部分机构只能配置特定级别的信用债。我们采用外部评级这一指标。3)税收因素:由于本文采取的基准利率是同期限国开债的到期收益率,因此本文的利差影响因素中不包含税收因素。
因此我们将信用利差影响公式总结如下:
利差=平均预期损失率+风险溢价+杠杆可操作性+不可预期损失的要求回报率+市场摩擦因素溢价 (公式1)
=平均违约率*(1-违约后回收率)+风险厌恶程度*资产波动性+杠杆可操作性+不可预期损失的要求回报率+流动性溢价+配置约束+税收溢价(公式2)
在模型中我们共运用15个特征指标,总结见表3。
根据图表4,模型误差在200棵树后收敛,因此我们选择200棵决策树组成随机森林。
均方误差增量(Increase in MSE):描述的是当把一个变量变成随机数时,随机森林模型结果均方差的增加程度,该值越大表示该变量的重要性越大。
节点纯度增量(Increase in Node Purity):即残差平方和的减少,就等同于基尼指数的减少。基尼指数越小,纯度越高,集合的有序程度越高,分类的效果越好,因此该值越大表示该变量的重要性越大。
如图表5和图表6所示,15个特征指标中,按均方误差增量对重要性排序,所处省份、外部评级、公司属性、基准利率、兴业主体评分和行业编码排前6位。按节点纯度增量对重要性排序,外部评级、兴业主体评分、所处省份、公司属性、基准利率和行业编码排前6位。两种分类排序中,外部评级、兴业主体评分、行业属性、地区属性、公司属性、基准利率在分析利差时的重要程度在所有影响利差的特征中均排前40%。主要结论如下:
(1)信用风险、基准利率在信用利差之谜中均具有重要解释力。在信用风险未暴露前,投资者将信用债作为高beta的利率债进行交易,但目前随着刚性兑付的市场信仰被打破,信用风险在利差中的解释力度也很强,信用债只是高beta的利率债这种观点有失偏颇。
(2)外部评级对利差的解释力度很强。外部评级最受人诟病的是评级虚高,我们的样本中99%的数据点集中在AAA、AA+和AA,但是在解释利差时其效果十分显著,主要原因可能两个,一方面是外部评级结果将影响到投资者配置约束。例如由于监管规定或风控原因,部分机构只能配置外部评级为AAA的债券。第二个原因是尽管区分度不高,但外部评级是投资者唯一可以免费获取的违约信息指标。外部评级机构对受评主体信用资质的排序依然受到投资者一定程度上的认可。
(3)兴业主体评分排序靠前,说明评分在主体信用风险中具有较好的区分度。但需要注意的是行业属性、地区属性、公司属性三个哑变量对利差的解释也很重要,可能的原因是行业属性、地区属性和公司属性包含了丰富的违约信息,例如强周期行业比弱周期行业的风险更大,部分经济欠发达地区比长三角等经济发达地区的风险更大,民营企业比国有企业的风险更大等。但兴业主体评分并没有包含这些市场隐含的违约信息。值得注意的是,行业属性、地区属性、公司属性为哑变量,在相同情况下,随机森林模型会对特征值较多的变量赋予更大的重要性。但我们从原始数据中筛选了三个行业(或三个地区或三个公司属性)后发现其重要性依然排在前6,说明特征值较多并不是其重要性排名靠前的原因。
对其他因素的重要性排序分析如下:
(4)发行总额和发行场所的重要性排序居中,说明个券流动性溢价不如信用风险溢价和基准利率的影响大。
(5)特殊条款的重要性较弱。特殊条款方面,只有永续债的重要性居中,其余调整利率方向、是否含赎回、是否可质押、是否含回售、是否含提前偿还等特殊条款的解释力度均较弱。我们与新债投资者以及债券承销从业人员沟通后发现大家对永续债的理解分歧较大。部分投资者认为对于3+N的永续债相当于3年的普通债券,而部分投资者认为永续债相对于普通债券需要一定的溢价。此外,在与投资人的沟通过程中,我们发现投资人保护条款相对特殊条款更重要,但由于投资人保护条款从2016年9月才正式被推出,数据量较少,而分类较多,因此暂时没有考虑。之后随着数据的积累,可以在模型中添加投资人保护条款。
(6)债券期限和可质押性的排名较靠后,可能的原因是债券期限的因素很可能已经被基准利率解释了。而可质押性的解释力度较弱原因可能有两个,一是数据详细度不够,比如输入数据并没有说明可质押债券的折算率系数等;二是可质押性的解释力度被外部评级稀释了,因此损失了部分信息。我们定义偏差度为模型指示结果减去实际发行利差的绝对值,结果显示,91%的测试数据偏差度在100bp以内,86%的偏差度在80bp以内,72%的偏差度在50bp以内,40%的偏差度在20bp以内,20%的偏差度在10bp以内。作为对比,我们通过一个映射规则,将兴业主体评分对应中债隐含评级,然后用中债隐含评级对应得出推荐收益率。其结果对比如图表8所示,模型准确性有了显著提升。此外,我们还用日-9月18日wind渠道发行的78只新债做了测试,结果如图表9所示。
目前模型对误差在50bp-100bp内的准确率较高,但对于误差在20bp以内的准确度一般。不过由于随机森林的可延展性很强,未来随着兴业主体评分实现全覆盖以及加入担保特征,模型在加入更多的样本和更多相关的债券特征后,模型效果将有更大的提升空间。
本文采用随机森林模型对无担保新债的发行利差进行分析,所使用的数据包括2006年1月-2017年8月发行的所有无担保同时兴业研究覆盖有主体评分的短融、中票、公司债和企业债。本文所利用的随机森林模型对信用利差的解释变量进行了重要性排序,结果发现(1)信用风险、基准利率在信用利差之谜中均具有重要解释力;(2)外部评级对利差的解释力度很强;(3)兴业主体评分排序靠前,说明评分在主体信用风险中具有较好的区分度;(4)个券流动性溢价有影响,但不如信用风险溢价和基准利率对利差的重要性大。
目前模型对100bp内误差的指示结果很好,而对20bp内的准确率一般。但随机森林模型的可延展性很强,未来随着兴业主体评分实现全覆盖以及加入担保特征,模型在加入更多的样本和更多相关的债券特征后,模型效果将有更大的提升空间。模型不仅可以用于无担保新债的发行利差,对有担保新债和存量债的定价也同样具有适用性。模型的数据输入无需依赖中债估值,对提升定价透明度具有一定意义。不可否认,在未来两三年内,机器学习在债券定价过程中将扮演更重要的角色。
附录1、数据统计
附录2、随机森林模型原理
决策树是一种树型节构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。每个决策树可以依靠对源数据库的分割进行数据测试。即,每一父节点依据某一原则,每一次分裂形成两个(或多个)子节点。新形成的子节点作为新的父节点,继续分裂。当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。其中,最先的节点称为根节点,最后的节点称为叶子节点,将叶子节点存放的类别作为决策结果。
1、集合的基尼不纯度(基尼系数)
基尼不纯度又叫作基尼系数,表示在集合中一个随机选中的样本被分错的概率。
1)离散情况下的基尼不纯度G(S):
定义数据集
显然基尼不纯度越小,纯度越高,集合的有序程度越高,分类的效果越好;
基尼不纯度为 0 时,表示集合类别一致;
基尼不纯度最高(纯度最低)时,,此时,
2)连续情况下的基尼不纯度L(S):
连续情况下,基尼不纯度可以表示为平方损失:
2、分裂的基尼不纯度
如果将集合S分裂成两个子集L和R,则该分裂的基尼不纯度为两个子集的集合的基尼不纯度的加权平均:
3、分类与回归树(CART)
分类与回归树(Classification and Regression Trees, CART)是由Leo Breiman, JeromeFriedman, Richard Olshen与Charles Stone于1984年提出的一种算法,是决策树的一种,可以用来生成回归树也可以用来生成分类树。CART是一种二叉树,每次分裂,选择使得分裂后纯度最高的分裂方式,直到达到终止条件。
具体算法如下:
给定训练数据集S和F维特征:
输入:训练数据集S,
输出:CART决策树。
终止条件:节点上最少样本数s,节点上最少的信息增益m。
4、与ID3和C4.5算法区别:
1) CART使用Gini不纯度来选择特征,简化了运算;
2) CART是一种二叉树,简化了模型;
3) CART除了分类,还可以做回归。
随机森林是一个由很多无关联的决策树组成分类器。通过训练集构建完随机森林之后,可以得到随机森林的分类规则以及对特征的重要性排序。当有一个新的输入样本进入的时候,随机森林中的每一棵决策树分别对这个样本有一个测试结果。对于分类树而言,最终随机森林的结果为所有决策树结果的众数;对于回归树而言,最终随机森林的结果为所有决策树结果的平均值。
1、随机森林的算法
给定训练集S,测试集T,特征维数F。确定参数:决策树的数量B,每棵树的深度d,每个节点使用到的特征数量f,终止条件:节点上最少样本数s,节点上最少的信息增益m。
输入:训练集S
输出:随机森林和特征重要性排序
终止条件:节点上最少样本数s,节点上最少的信息增益m。
1)给定训练集S,测试集T,特征维数F,使用到的CART的数量B;
2)从原始训练数据集中,有放回地随机抽取B个新的样本集,并由此构建B棵CART树。
3)每个新样本集生长为单棵决策树。在树的每个节点处从F个特征中随机挑选f个特征(f≤F),按照分裂的基尼不纯度最小原则从这f个特征中选择一个特征进行节点分裂。
4)每棵树都做最大限度的生长,不做任何剪裁。
5)对于回归树,的估计为所有树判断的平均,即,
对于分类树, 的估计为所有树的众数。
2、重要性排序指标
对于特征,随机森林可以通过以下指标,对特征的重要性进行排序。
1)对于分类树:
平均精确度减量(Mean Decrease Accuracy):描述的是当把一个变量变成随机数时,随机森林模型指示结果准确度的降低程度,该值越大表示该变量的重要性越大。
平均不纯度减量(Mean Decrease Gini):通过基尼指数计算每个变量对分类树上每个节点的观测值的异质性影响。该值越大表示该变量的重要性越大。
2)对于回归树:
均方误差增量(Increase in MSE):描述的是当把一个变量变成随机数时,随机森林模型结果均方差的增加程度,该值越大表示该变量的重要性越大。等价于 Mean Decrease Accuracy。
节点纯度增量(Increase in Node Purity):即残差平方和(residual sum ofsquares)的减少,就等同于Gini 指数的减少,等价于Mean Decrease Gini.
3、判断指标
往往是将样本数据按照(8:2)或者(7:3)分成训练集和测试集。用训练集构建随机森林,用测试集上的准确性来评估此随机森林的效果。
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点閫夋嫨鍊哄埜闇}

我要回帖

更多关于 债券收益率曲线 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信