专利因子数据量化研究系列三:专利分类指标

德高行知情郎
关注

知情郎·眼|

侃透公司专利事儿

在上一篇中,向大家介绍了专利因子中的维持指标,相信大家对专利的存活期和企业的维持意愿有所了解。不同行业下的专利,其维持状况也会有所不同。因此,本篇从专利的分类角度出发,为大家介绍专利分类相关的一系列指标。

一、专利分类指标内容

专利为了方便进行组织、管理和检索,采用统一的分类法。在德高行的专利因子中,涉及到的分类方法为IPC分类和战略新兴产业两种。专利分类指标即统计的是专利的IPC分类数量以及战略新兴产业的专利数量。

IPC分类是国际通用的专利文献分类和检索工具,其将技术领域分为八个部类,分别是A部(人类生活必需)、B部(作业、运输)、C部(化学、冶金)、D部(纺织、造纸)、E部(固定建筑物)、F部(机械工程)、G部(物理)和H部(电学)。每个部类下又分为若干大类、小类、大组和小组,形成一个多层次的分类体系。

战略新兴产业是指具有重要战略意义、引领未来发展、带动产业升级的新兴产业,包括八大类,分别是新一代信息技术、生物、高端装备制造、新材料、能源新技术、节能环保、新能源汽车、数字创意等。两者都从不同维度上对专利进行了划分。IPC分类数越多,意味着专利涉及的技术领域越多,或者专利的技术创新性越高。其中,兴业证券在《基于专利分类的科技动量因子研究》中,以德高行提供的专利IPC分类数据为基础,通过引入科技关联度这一重要概念,构建了科技动量因子,选股能力得到较大提升。

具体内容如下:

上述指标均统计的是“有效专利”,即剔除了未缴费、寿命到期等因素而失去法律保护效应的专利,且包含了上市公司主体及其合并财务报表的子公司的专利。

二、专利分类指标的时间序列

通过绘制专利分类指标的时间序列图,我们可以分析2012~2022年过去十年间专利因子的变化趋势和稳定性。各专利分类指标的时间序列图如下所示,其中黑色曲线为存量指标的平均数,柱状图为1~5年系列增量专利指标的平均数,其中5年内的新生成的专利总数在最上方,而1年内的在最下方。

1.IPC分类号总数

TG_B006-B008指标平均数的时间序列图

TG_B007指标平均数的时间序列图

TG_B008指标平均数的时间序列图

2.战略新兴产业

TG_V051指标平均数的时间序列图

TG_V052指标平均数的时间序列图

TG_V053指标平均数的时间序列图

观察上图,我们可以发现,无论是存量还是增量,有效专利分类指标的走势整体上呈向上趋势,这与中国专利的稳定增长趋势是一致的。其中,战略新兴产业在2022年前后出现了异常情况。猜测可能是2022年的战略新兴产业分类发生变动,数字创意作为一个独立的类别,专利的重点领域发生变化所致。

三、行业间的因子差异

为了观察专利分类指标在不同行业间存在的差异,我们根据2022年的因子数据计算它们在各一级行业的平均数,如下图所示:

各一级行业TG_B006因子的中位数:

各一级行业TG_B007因子的中位数:

各一级行业TG_B008因子的中位数:

各一级行业TG_V051因子的中位数:

各一级行业TG_V052因子的中位数:

各一级行业TG_V053因子的中位数:

通过观察可以发现,在同一时间下,不同行业间专利因子的水平存在较大差异,而专利因子之间也存在着差异。专利因子依旧集中在家电行业,与以往不同的是,除此之外,发明授权专利在钢铁行业的IPC分类总数也比较突出,这与钢铁行业涉及多种技术领域和应用场景的情况也相契合。

四、不同规模公司间因子差异

除去行业对专利因子存在较大影响外,上市公司的规模也是对各专利因子产生作用的潜在因素。在使用因子进行选股时,如果与市值的相关性较高,则会导致选股的结果比较集中。我们对各专利因子计算了2012~2022年的因子值与市值因子之间的相关系数以及总体的均值,如下表所示:

TG_B006-V053因子与市值因子之间的相关系数

TG_B007因子与市值因子之间的相关系数

TG_B008因子与市值因子之间的相关系数

TG_V051因子与市值因子之间的相关系数

TG_V052因子与市值因子之间的相关系数

TG_V053因子与市值因子之间的相关系数

通过观察可以发现,单一的专利数量指标与市值因子相关性不强,但总体上呈正相关关系。

五、各因子的相关性

除去行业、市值外,我们观察专利因子之间的相关性表现。依次计算2012~2022年他们之间的相关系数,最后求均值,得到结果如下表所示。可以看到分类因子彼此之间的相关性较强。这个结果也非常正常,毕竟因子只是在分类的方法上有所差异,并无实质性上的不同。

专利因子在截面上的两两因子值相关系数均值:

六、因子IC

IC值(信息系数)是指个股第t期在因子i上的因子暴露(剔除行业与市值后)与t+1期的收益率的相关系数。通过计算IC值可以有效的观察到某个因子收益率预测的稳定性和动量特征,IC值越大,选股能力则越强。专利因子IC序列如下图所示:

TG_B006因子的IC序列图:

TG_B007因子的IC序列图:

TG_B008因子的IC序列图:

TG_V051因子的IC序列图:

TG_V052因子的IC序列图:

TG_V053因子的IC序列图:

由上图可以看到,专利因子的IC值多数为正值,均值位于零轴上方,说明专利因子多与下一期个股的收益率呈正相关性,专利因子值越高,下期的收益率越高。

七、因子IC累积值

我们将因子IC进行加总,从而观察因子方向的变化情况。

如下图所示:

可以看到,专利因子总体是呈正向的。其中TG5_B008、TG_B008、TG5_V051、TG5_V052、TG5_B006、TG_V052这六个因子的表现最优。分类因子方向总体较为稳定。

八、总结

本文按专利分类相关的36个指标进行了分析,分析结果表明,在家用电器以及钢铁行业中,IPC分类号数较多,有着更多的战略新兴产业专利。专利分类指标与市值因子存正相关性,且不同的分类指标彼此之间的相关度较高。专利分类指标有着正向的收益预测能力,总体的方向也较为稳定。

【转载请注明德高行·知情郎】

       原文标题 : 专利因子数据量化研究系列三:专利分类指标

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存