博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R语言k-Shape时间序列聚类方法对股票价格时间序列聚类
阅读量:6432 次
发布时间:2019-06-23

本文共 2744 字,大约阅读时间需要 9 分钟。

这次,我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列。

执行环境如下。

  • R:3.5.1

企业对企业交易和股票价格

 

在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性,而不是网络结构的分析。
由于特定客户的销售额与供应商公司的销售额之比较大,当客户公司的股票价格发生变化时,对供应商公司股票价格的反应被认为更大。 

 

 [Paparrizos和Gravano,2015]是一种关注时间序列形状的时间序列聚类方法。在我们进入k-Shape之前,让我们谈谈时间序列的不变性和常用时间序列之间的距离。

 

时间序列距离测度

欧几里德距离(ED)和动态时间扭曲(DTW)通常用作距离测量值,用于时间序列之间的比较。

两个时间序列x =(x1,...,xm)和y =(y1,...,ym)的ED,其中m是系列的长度如下。

  \ begin {eqnarray *} ED(\ vec {x},\ vec {y})= \ sqrt {\ sum_ {i = 1} ^ m(x_i-y_i)^ 2} \ end {eqnarray *}

DTW是ED的扩展,允许局部和非线性对齐。

  \ begin {eqnarray *} DTW(\ vec {x},\ vec {y})= min \ sqrt {\ sum_ {i = 1} ^ k w_i \ end {eqnarray *}

k-Shape提出称为基于形状的距离(SBD)的距离。

k-Shape算法

k-Shape聚类侧重于缩放和移位的不变性。k-Shape有两个主要特征:基于形状的距离(SBD)和时间序列形状提取。

SBD

互相关是在信号处理领域中经常使用的度量。使用FFT(+α)代替DFT来提高计算效率。

  \ begin {eqnarray *} CC(\ vec {x},\ vec {y})= F ^ {-1} {F(\ vec {x})* F(\ vec {y})} \ end {eqnarray *}

归一化互相关(系数归一化)NCCc是互相关系列除以单个系列自相关的几何平均值。检测NCCc最大的位置ω。

  \ begin {eqnarray *} SBD(\ vec {x},\ vec {y})= 1-max_w \ left(\ frac {CC_w(\ vec {x},\ vec {y})}} {\ sqrt {R_0 (\ vec {x},\ vec {x})\ cdot R_0(\ vec {y},\ vec {y})}} \ right)\ end {eqnarray *}

SBD取0到2之间的值,两个时间序列越接近0就越相似。

形状提取

通过SBD找到时间序列聚类的质心向量 有关详细的表示法,请参阅文章。

  \begin{eqnarray*} \vec{\mu}_{k}^{*} = argmax_{\vec{\mu}_{k}} \sum_{\vec{x}_i \in P_k} NCC_c(\vec{x_i}, \vec{\mu}_{k})^2 \\ = argmax_{\vec{\mu}_{k}} \sum_{\vec{x}_i \in P_k} \left(\frac{max_w CC_w(\vec{x_i}, \vec{\mu}_{k})}{\sqrt{R_0(\vec{x_i}, \vec{x_i}) \cdot R_0(\vec{\mu}_{k}}, \vec{\mu}_{k}})}} \right) \\ = argmax_{\vec{\mu}_{k}} \sum_{\vec{x}_i \in P_k} (\vec{x_i} \cdot \vec{\mu}_{k})^2 \\ = argmax_{\vec{\mu}_{k}} \vec{\mu}_{k}^{\mathrm{T}} \cdot \sum_{\vec{x}_i \in P_k} (\vec{x_i} \cdot \vec{x_i}^{\mathrm{T}})^2 \cdot \vec{\mu}_{k} \\ = argmax_{\vec{\mu}_{k}} \vec{\mu}_{k}^{\mathrm{T}} \cdot S \cdot \vec{\mu}_{k} \\ = argmax_{\vec{\mu}_{k}} \frac{\vec{\mu}_{k}^{\mathrm{T}} \cdot Q^{\mathrm{T}} \cdot S \cdot Q \cdot \vec{\mu}_{k}}{\vec{\mu}_{k}^{\mathrm{T}} \cdot \vec{\mu}_{k}} \\ = argmax_{\vec{\mu}_{k}} \frac{\vec{\mu}_{k}^{\mathrm{T}} \cdot M \cdot \vec{\mu}_{k}}{\vec{\mu}_{k}^{\mathrm{T}} \cdot \vec{\mu}_{k}} \end{eqnarray*}

k-Shape的整个算法如下。

k-Shape通过像k-means这样的迭代过程为每个时间序列分配簇。

  1. 将每个时间序列与每个聚类的质心向量进行比较,并将其分配给最近的质心向量的聚类
  2. 更新群集质心向量

重复上述步骤1和2,直到集群成员中没有发生更改或迭代次数达到最大值。

 R 语言k-Shape

 

> start <- "2014-01-01"> df_7974 %>%+     filter(date > as.Date(start))# A tibble: 1,222 x 10   date        open  high   low close   volume close_adj change rate_of_change  code                                  1 2014-01-06 14000 14330 13920 14320  1013000     14320    310       0.0221    7974 2 2014-01-07 14200 14380 14060 14310   887900     14310    -10      -0.000698  7974 3 2014-01-08 14380 16050 14380 15850  3030500     15850   1540       0.108     7974 4 2014-01-09 15520 15530 15140 15420  1817400     15420   -430      -0.0271    7974 5 2014-01-10 15310 16150 15230 16080  2124100     16080    660       0.0428    7974 6 2014-01-14 15410 15755 15370 15500  1462200     15500   -580      -0.0361    7974 7 2014-01-15 15750 15880 15265 15360  1186800     15360   -140      -0.00903   7974 8 2014-01-16 15165 15410 14940 15060  1606600     15060   -300      -0.0195    7974 9 2014-01-17 15100 15270 14575 14645  1612600     14645   -415      -0.0276    797410 2014-01-20 11945 13800 11935 13745 10731500     13745   -9

 缺失度量与前一个工作日的值相互补充。(K-Shape允许一些偏差,但以防万一)

每种股票的股票价格和股票价格变化率。

如果将“部分”指定为列表,则将tsclust(),zscore作为“preproc”,“sbd”作为距离,以及centroid =“shape”的系列数字向量的类型,它变为k-Shape。

聚类结果如下。

> df_res %>%+     arrange(cluster)  cluster centroid_dist code           name1       1     0.1897561 1928     積水ハウス2       1     0.2196533 6479 ミネベアミツミ3       1     0.1481051 8411         みずほ4       2     0.3468301 6658 シライ電子工業5       2     0.2158674 6804       ホシデン6       2     0.2372485 7974         任天堂

Nintendo,Hosiden和Siray Electronics Industries被分配到同一个集群。Hosiden在2016年对任天堂的销售比例为50.5%,这表明公司之间的业务关系也会影响股价的变动。

另一方面,MinebeaMitsumi成为另一个集群,但是在2017年Mitsumi与2017年的Minebea合并, 没有应对2016年7月Pockemon Go发布时股价飙升的影响 。

 

非常感谢您阅读本文,有任何问题请联系我们!

 

 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:(咨询服务请联系)

​QQ:3025393450

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

 

转载于:https://www.cnblogs.com/tecdat/p/10757389.html

你可能感兴趣的文章
PHP面向对象之接口编程
查看>>
使用 Docker Compose 管理多个容器实例
查看>>
ThinkPHP 删除数据记录 delete 方法
查看>>
Gradle学习笔记(二)--创建Java项目
查看>>
IntelliJ IDEA 快捷键
查看>>
qury-easyui DataGrid 整合struts2增删查该入门实例(三)
查看>>
if a point is inside a square with mathematics
查看>>
Ubuntu(Linux)使用Eclipse搭建C/C++编译环境
查看>>
skyline无插件web的数据加载解析
查看>>
python基础学习第一天
查看>>
硬盘存储双寡头之争 希捷重注中国市场或赢大丰收
查看>>
淘宝电影联合华谊的数据报告,还有哪些重要信息?
查看>>
编译安装PHP
查看>>
css position:static 的使用
查看>>
nfs永久挂载与临时挂载
查看>>
linux查看网络链接状况命令之-netstat
查看>>
我的友情链接
查看>>
UIView的layoutSubviews和drawRect方法何时调用
查看>>
mysql主从同步
查看>>
制作最简化的Linux系统
查看>>