PLSR的扩展性质

13 篇文章 32 订阅
订阅专栏

PLS回归算法可以分为两类,PLSR1和PLSR2,分别对应一个或者多个相应变量,本文为了简单起见,只讨论PLSR1这种情况。

下面主要讨论一下PLS1的系数计算和推导性质


1.基本性质

在前面偏最小二乘法 基本性质推导已经介绍了基本的性质,这里不再赘述,这里,根据PLS1的特点,重新定义一下基本公式

参照传统,公式中的下标做了调整,跟常见的文献和参考书中的下标表示一致

                                                                             \bg_white \fn_jvn \dpi{120} \bg_white \fn_jvn \\E_0=X \\F_0 = y \\v_n =F^T_{n-1}E_{n-1}w_n /\lambda \\ t_n =E_{n-1}w_n \\u_n = F_{n-1}v_n \\ p_n = \frac{E_{n-1}^Tt_n}{\left \| t_n \right \|^2} \\ q_n= \frac{F_{n-1}^Tt_n}{\left \| u_n \right \|^2}\\ r_n = \frac{F_{n-1}^Tt_n}{\left \| t_n \right \|^2} \\E_n = E_{n-1} - t_np_n^T \\F_n = F_{n-1} - t_nr_n^T

当响应变量为一个向量的时候,可以看到w_n \propto E^T_{n-1}F_{n-1},而v_n,r_n已经退化成标量,假如做归一化的,则恒为1


2 PLSR系数计算

2.1 基于得分矩阵的回归系数

                                                \small \\ E = t_1p_1^T+t_2p_2^T+...+t_rp_r^T=T*P^T \\ F = t_1r_1^T+t_2r_2^T+...+t_rr_r^T+F^* = T*R^T

求得系数r后,新的样本可以通过计算其得分,乘以回归系数r,得到预测值。这个方法是T关于F的最小二乘估计,在模型的解释上不是很理想,因此,在实际中,用的似乎比较少,至少我很少看到。

2.2 基于X的回归系数

在多数的情况下面,建模一般都想建立X关于Y的回归模型

                                              \small \\ E_n = E_{n-1}(I-w_{n-1}*p_{n-1}^T) =E_0\prod_i^{n-1}(I-w_ip_i^T) \\t_n = E_nw_n=E_0\prod_i^{n-1}(I-w_ip_i^T)w_n

                                           z_n=\prod_i^{n-1}(I-w_ip_i^T)w_n\Rightarrow t_n = E_0z_n\Rightarrow F_0 = E_0ZR^T

                                              B = ZR^T

考虑到计算需要,系数B可以推导出不同的形式。在PLSR1中,系数只是一个向量,不是数组

权值向量z可以看作w的变异版本,通过z,得分可以直接从原始的数据X数据直接得到,不需要再经过残差矩阵。从上述中,z的表达公式可以看出,Z的最小二乘解为

                                                Z= (E_0^TE_0)^{-}E_0^TT

下面介绍一下Z的其他表达形式,首先看一下z_n,p_n之间的关系

                                            z_i^Tp_j = z_i^TE_0^Tt_j/(t_j^Tt_j) = t_i^Tt_j/(t_j^Tt_j) = \begin{Bmatrix} 0,i=j\\ 1 ,i\neq j \end{Bmatrix}

P^T*Z = I_a  ,a 表示潜在变量的数量。

由Z的表达公式可以知道,Z所span的空间和W所span的空间是一样,可以由同一组基构成。

因此,Z可以表达为Z= WG,G是待确定的矩阵,由此可以得到

                                           P^T*Z =P^TWG =I_a\Rightarrow G = (P^TW)^{-1}

                                          Z= W(P^TW)^{-1}

最后则有b = Zr= W(P^TW)^{-1}r

类似地还可以得到b = W(W^TX^TXW)^{-1}W^TX^Ty

推导这么多公式地意义在于计算的需要,为了修改原先的算法,首先弄明白算法的原理,然后寻求尽量简单直观的表达公式,保证运算的准确性。如上述的两个关于b的公式,显然第一个要简洁多,但也需要看到,第二个公式只有一个未知的变量

另外,再想想最小二乘法的表达式,上述b的公式2很值得回味,看似杂乱中,体现出一些美感

                                                             b = (X^TX)^{-1}X^Ty


3 PLSR的其他性质

性质一

t_i = X(X^TX)^{-1}X^Tt_i

由于t_i = Xz_i  得到 t_iX各列的一个线性组合,所以,其在X的投影即为自身

性质二

                                        p_i = E_{i-1}^Tt_i/(t_i^Tt_i)=(E_0-\sum_{1}^{i-1}t_kp_k^T)^Tt_i/(t_i^Tt_i)\\ \Rightarrow p_i = E_0^Tt_i/(t_i^Tt_i)

性质三

 

\\p_i^T(X^TX)^-p_j = t_i^T/(t_i^Tt_i)X(X^TX)^-X^Tt_j/(t_j^Tt_j)\\ = t_i^T/(t_i^Tt_i)t_j/(t_j^Tt_j)=\begin{Bmatrix} 1/(t_i^Tt_i) i=i\\0 ,i\neq j \end{Bmatrix}

p_i是得分关于残差矩阵的最小二乘系数,本身并不存在正交,但是在(X^TX)^-空间内,或者说关于(X^TX)^-共轭正交。

性质四

\\M = (X^TX)^{-} \\T = X(X^TX)^{-}X^TT=XMX^TT \\X^TT=P (T^TT)= P(P^TMP)^{-1} \\\Rightarrow T =XMP(P^TMP)^{-1}

性质五

PLSR的系数求解是首先求y关于T的系数,因此y首先投影到T空间中,求得投影,再得到回归系数

y = Tb\Rightarrow \widetilde{y} = T(T^TT)^{-1}T^Ty

利用性质四,将上述公式进行化简得到

                                                \\\widetilde{y} = T(T^TT)^{-1}T^Ty \\ \widetilde{y} = XMP(P^TMP)^{-1}(T^TT)^{-1}((P^TMP)^{-1})^T(XMP)^Ty \\=XMP(P^TMP)^{-1}P^TMX^Ty

性质六

                                           E_n = E_0-\sum_{1}^{n}t_ip_i^T=E0-\sum_{1}^{n}t_i(t_i^Tt_i)^{-1}t_i^TE0

                                                              \\\tau =T(T^TT)T^T =\sum_{1}^{n}t_i(t_i^Tt_i)^{-1}t_i^T \\\tau^\perp = I_Q-\tau \\E_n = \tau^\perp E_0

很容易理解,X的残差矩阵就是提取与T所span的空间正交的部分。也可以换一个角度去看,用P的角度,由于P并非正交,所以并不能表示成上述那样的形式,但是我们也提到过,P是关于M共轭正交的,因此,采用一种斜投影的形式去表示P与残差En的关系。

\\t_i=XMp_i(p_i^TMp_i)^{-1} \\

E_n = E_0-\sum_{1}^{n}t_ip_i^T=E_0-\sum_{1}^{n}E_0Mp_i(p_i^TMp_i)^{-1}p_i^T \\

E_n = E_0-\sum_{1}^{n}t_ip_i^T=E_0-\sum_{1}^{n}E_0Mp_i(p_i^TMp_i)^{-1}p_i^T \\

由于\sum_{1}^{n}p_ip_i^T =PP^T,且有(P^TMP)^{-1}为对角阵,综上得到

E_n = E_0-\sum_{1}^{n}E_0MP(P^TMP)^{-1}P^T \\

\\\texttt{P} = (MP(P^TMP)^{-1}P^T)^T = P(P^TMP)^{-1}P^TM\\ \texttt{P}^\perp=I_Q- P(P^TMP)^{-1}P^TM \\ E_n = E_0(\texttt{P}^\perp)^T

小结一下,残差矩阵可以表达为如下这两种形式,在结果是等价的,几何意义上的区别是,前者是通过列空间,后者是通过行空间。所有才有左乘和右乘的区别。

\\E_n = \tau^\perp E_0= E_0(\texttt{P}^\perp)^T


PLSR的计算非常之多,虽然万变不离其宗,但是算法之间并不完全等价,有兴趣可以参考论文 A comparison of nine PLS1 algorithms。按文献描述,最稳定者还是最传统的NIPALS算法。

PLSR本质上是一种对原数据空间一种低秩逼近的方法,像共轭梯度法,按照一定的准则,每次确定一个求解方向,在残差基础上,不断做正交或者共轭正交的分解,用低维的空间逼近原先的空间。这种空间降维的方式可以克服纬度灾难,使得解更加稳定可靠。得到低维空间也可以表达为Krylov空间,以后再谈谈PLSR和共轭梯度,krylov空间三者之间的关系

 

机器学习笔记 - 偏最小二乘回归 (PLSR)
学以致用 知行合一
01-03 2437
偏最小二乘回归(PLSR)是机器学习和预测分析领域的一种流行算法。是一种用于技术。PLSR是一种在因素较多且高度共线性时构建预测模型的方法。它是一种基于回归的方法,旨在找到预测变量空间中解释预测变量和响应之间最大协方差的方向。算法找到与响应变量最密切相关的预测变量的线性组合。该方法在处理大量预测变量时特别有用,因为它有助于降低数据集的维数而不丢失太多信息。PLSR 属于监督学习的范畴,这意味着该算法需要标记的训练数据来构建模型。
偏最小二乘法回归(Partial Least Squares Regression)
wenyusuran的专栏
06-27 2011
1. 问题      这节我们请出最后的有关成分分析和回归的神器PLSRPLSR感觉已经把成分分析和回归发挥到极致了,下面主要介绍其思想而非完整的教程。让我们回顾一下最早的Linear Regression的缺点:如果样例数m相比特征数n少(m(n*n矩阵)的秩小于特征个数(即不可逆)。因此最小二乘法就会失效。      为了解决这个问题,我们会使用PCA对样本X(m*n矩阵)进行降维,不妨
PLSR(偏最小二乘回归浅析)
qq89127678的专栏
04-15 1万+
对向量,矩阵,张量求导 英文原文:Partial Least Squares (PLS) Regression. 目录 用 [TOC]来生成目录: 对向量矩阵张量求导 目录 Expanding notation into explicit sums and equations for each component 2 Removing summation notation
plsr matlab,matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
weixin_34634231的博客
04-09 1916
pls可以选择通过交叉验证来估计均方预测误差(MSEP),在这种情况下使用10倍CV。R1[X1,Y1,Xs,Ys,β,pctVar,PLSmsep]=plsregress(X,y,10,'CV',10);对于PCR,crossval结合用于计算PCR的平方误差之和,可以再次使用10倍交叉验证来估计MSEP。R1PCRmsep=sum(crossval(@pcrsse,X,y,'KFold',10...
偏最小二乘回归(PLSR)- 1 概览
weixin_30606461的博客
08-14 832
1. 概览 偏最小二乘算法,因其仅仅利用数据X和Y中部分信息(partial information)来建模,所以得此名字。其总体处理框架体现在下面两图中。 建议先看第2部分,对pls算法有初步了解后再看此框架,会有更全面深入的体会。 得到 转载于:https://www.cnblo...
Kernel-PLSR
最新发布
07-05
扩展了传统的Partial Least Squares (PLS)方法,将数据映射到高维特征空间,通过非线性的核函数(如径向基函数RBF)处理非线性和复杂的关系。在特征空间中找到最优投影方向后,模型可以更有效地拟合非线性模式,...
PyChem-开源
04-14
6. **化学计量学应用**:支持建立化学计量学模型,如偏最小二乘回归(PLSR)、部分最小二乘判别分析(PLS-DA)等,用于定量和定性预测。 7. **灵活性**:PyChem基于Python编程语言,允许用户自定义脚本,扩展其功能...
MATLAB工具箱大全-drEEM toolbox
02-09
而drEEM(Differential Reflectance and Emission Efficiency Matrix)工具箱是专为MATLAB设计的一个扩展工具,主要用于处理和分析光谱数据,特别是在光电子学、遥感、环境科学以及材料科学等领域有广泛应用。...
PLS_Toolbox21_偏最小二乘_PLS_Toolbox21_
10-03
- **建模与预测**:提供多种建模方法,包括标准PLS、正交PLS(OPLS)、部分PLSPLSR)等,支持单变量或多变量响应。 - **预处理工具**:包括中心化、标准化、归一化等多种数据预处理手段,有助于提高模型的稳定性...
plsr偏最小二乘
05-04
偏最小二乘
偏最小二乘回归方法(PLS)
01-04
偏最小二乘回归法( PLSRpartial least squares regression):是一种新型的多元统计数据分析方法,它主要研究的是多 因变量对多自变量的回归建模,特别当各变量内部高度 线性相关时,用偏最小二乘回归法更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。
SIMCA-P 偏最小二乘PLS使用手册(中文版)
09-29
文档是专门用于做偏最小二乘法PLS工具SIMCA-P的中文使用手册。介绍如何使用SIMCA-P,以及结果的解释。
偏最小二乘回归(PLSR)算法原理
flyingliufan的博客
09-24 6万+
PLSR是一种多因变量Y对多自变量X的回归建模方法,该算法在建立回归的过程中,既考虑了尽量提取Y和X中的主成分(PCA—Principal Component Analysis,主成分分析的思想),又考虑了使分别从X和Y提取出的主成分之间的相关性最大化(CCA的思想)。简单的说,PLSR是PCA、CCA和多元线性回归这三种基本算法组合的产物。
偏最小二乘回归(PLSR)和主成分回归(PCR)分析光谱数据
拓端研究室TRL
07-19 1178
全文链接:http://tecdat.cn/?p=2655此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性。当存在大量预测变量时,PLSR和PCR都是对因变量建模的方法,并且这些预测变量高度相关或甚至共线性。两种方法都将新的预测变量(称为成分)构建为原始预测变量的线性组合,但它们以不同的方式构造这些成分。PCR创建成分来解释预测变量中观察...
偏最小二乘(pls)回归分析 matlab
热门推荐
revitalise的博客
09-08 10万+
偏最小二乘用于查找两个矩阵(X和Y)的基本关系,即一个在这两个空间对协方差结构建模的隐变量方法。偏最小二乘模型将试图找到X空间的多维方向来解释Y空间方差最大的多维方向。偏最小二乘回归特别适合当预测矩阵比观测的有更多变量,以及X的值中有多重共线性的时候。通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型。 一、数学原理 为了实现偏最小二乘回归的基本思想,要求t1和u1的协方差最大,即求...
光谱数据处理:3.利用PLSR模型进行属性预测与关联分析
qq_53529450的博客
02-28 2258
利用PLSR模型进行光谱数据的两个应用及Python代码实现:应用一:比较光谱数据预测值与真实值的关系;应用二:建立样品属性与光谱数据的相关关系。
偏最小二乘法 Partial Least Squares
FanJin的博客
06-24 7万+
本文前部分摘自:偏最小二乘法回归(Partial Least Squares Regression),后半部分原创。 诸如基因组学、转录组学、蛋白组学及代谢组学等高通量数据分析,由于自变量数目大于病例数(未知数大于方程个数),无法直接使用传统的统计分析模型。比如,线性回归的窘境:如果样例数m相比特征数n少(m<n)或者特征间线性相关时,由于(n*n矩阵)的秩小于特征个数(即不可逆)。因此最...
深度探索:机器学习偏最小二乘回归(PLS)算法原理及其应用
qq_51320133的博客
04-08 1万+
偏最小二乘回归(Partial Least Squares Regression, PLSR)是一种统计学和机器学习中的多元数据分析方法,特别适用于处理因变量和自变量之间存在多重共线性问题的情况。该方法最早由瑞典化学家Herman Wold于上世纪60年代提出,作为一种多变量线性回归分析技术,广泛应用于化学、环境科学、生物医学、金融等领域,尤其在高维数据和小样本问题中表现出色。
偏最小二乘法PLSPLS回归的介绍及其实现方法
Enoch_klb的博客
12-03 7万+
1、偏最小二乘法PLS)介绍 偏最小二乘法是一种新型的多元统计数据分析方法,于1983年由S.Wold和C.Albano等人首次提出。偏最小二乘法实现了,在一个算法下,可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)。 PCA方法虽解决了自变量共线性的问题,但是并没有考虑自变量主元对于因变量变化的解释作用。所以删除的次要主元有可能包含对...
写文章

热门文章

  • 通过teamviewer访问内网 43939
  • Matlab license checkout failed -8 的坑 25464
  • 偏最小二乘法(NIPALS经典实现--未简化) 11755
  • beamer中block样式修改 10957
  • IAR 下 printf输出调试信息 Terminal I/O 10940

分类专栏

  • 偏最小二乘法 13篇
  • 工具 3篇
  • scratch 1篇
  • 日记 2篇
  • 编程 12篇
  • 网络安全 2篇
  • 游戏里的编程游戏 9篇
  • stm32 4篇
  • 杂谈 3篇
  • 数据科学 38篇
  • 写作 8篇
  • 机器学习 20篇

最新评论

  • 徒手下载谷歌图书(google books)

    小天安全s0k1y: 帮到大忙了

  • beamer中block样式修改

    billy145533: 简单的做法是插入空白行, \hspace*{\fill}

  • beamer中block样式修改

    m0_71801539: 我找了很久,都没有说这个的,后面发现只要用\vpace命令调整行距就行了表情包表情包

  • beamer中block样式修改

    m0_71801539: 就是他的文本盒子在ppt上的位置,如果只有一个文本框的话,那它默认居中,但是我想把他调在PPT的上面一点,

  • beamer中block样式修改

    billy145533: 指的是什么位置?

最新文章

  • 基于单样本的模型转移方法
  • Yolov部署在Windows和Android上
  • matlab livescript结合HEXO写博客
2024年2篇
2023年1篇
2022年3篇
2021年6篇
2020年38篇
2019年23篇
2018年1篇
2017年6篇
2015年9篇
2014年5篇
2008年1篇
2006年2篇
2005年5篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家西双版纳玻璃钢雕塑安装崇左玻璃钢花盆玻璃钢西瓜雕塑制造厂家上海玻璃钢雕塑卡通玻璃钢古代人物雕塑设计哪家好吉安玻璃钢雕塑销售厂家广场上玻璃钢农耕帽子雕塑山东玻璃钢雕塑供货商德兴玻璃钢伟人像雕塑佛山玻璃钢人物雕塑尺寸阳泉玻璃钢广场雕塑厂家山东小区装饰玻璃钢园林艺术雕塑玻璃钢雕塑怎么报价佛山玻璃钢人物雕塑定制价格广州暗黑色玻璃钢花盆庆阳动物玻璃钢雕塑厂家菏泽仿铜玻璃钢雕塑驻马店玻璃钢雕塑定做厂家伊春玻璃钢游乐场门头雕塑韶关玻璃钢动物雕塑批发主题玻璃钢卡通雕塑制作新化玻璃钢卡通雕塑热门形象卡通游乐园玻璃钢雕塑舟山商场组合玻璃钢花盆小品玻璃钢动物雕塑哪家便宜玻璃钢卡通蓝莓公仔娃娃雕塑资阳商场美陈西藏街道玻璃钢花盆酒泉玻璃钢花盆芜湖仿木玻璃钢雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化