【发布时间】:2019-02-06 09:12:50
【问题描述】:
我在 Stata 中执行了主成分分析 (PCA)。
我的数据集包含 9 个国家/地区的 8 个财务指标。
例如:
* Example generated by -dataex-. To install: ssc install dataex
clear
input str7 Country double(Investment Profit Income Tax Repayment Leverage Interest Liquidity) int Year
"France" -.1916055239385184 .046331346724579184 .16438012750896466 .073106839282063 30.373216652548326 4.116650784492168 3.222219873614461 .01453109309122077 2010
"UK" -.09287803170279468 .10772082765154019 .19475363707485557 .05803923583546618 31.746409646181174 9.669982727208433 1.2958094802269167 .014273374324088752 2010
"US" -.06262935107629553 .08674901201182428 .1241593221865416 .13387194413811226 25.336612638526013 11.14330064161111 1.954785887176916 .008355601163285917 2010
"Italy" -.038025847122363045 .1523162032749684 .23885658237030563 .2057478638900476 31.02007902336988 2.9660938817562292 6.12544787693943 .011694993164234125 2010
"Germany" -.05454795914578491 .06287079763890834 .09347194572148769 .08730237262847926 35.614342337621174 12.03770488195981 1.1958205191308358 .012467084153714813 2010
"Spain " -.09133982259799572 .1520056836126315 .20905656056324853 .21054797530580743 30.133833346916546 2.0623245902645073 5.122615899157435 .013545432336873187 2010
"Sweden" -.05403262462960799 .20463787181576967 .22924827352771968 .05655833155565016 20.30540887860061 10.392313613725324 .8634381995636089 .008030624504967313 2010
"Norway " -.07560184571862992 .08383822093909514 .15469418498932822 .06569716455818478 29.568228705840234 14.383460621594622 1.5561013535825234 .012843159364225464 2010
"Algeria" -.0494187835163535 .056252436429004446 .09174672864585759 .08143181185307143 34.74103858167055 15.045254276254616 1.2074942921860699 .011578038401820303 2010
"France" -.03831442432584342 .14722819896988698 .22035417794604084 .12183886462162773 28.44763045286005 12.727100288710087 1.405629911115614 .011186908059399987 2011
"UK" -.05002189329928202 .16833493262244398 .2288402623558823 .04977050186975224 27.640103129372747 11.17376089844228 1.1764542835994092 .008386726178729322 2011
"US" -.0871005985124144 .10270482619857023 .1523559355903486 .06775742210623094 26.840586700880362 10.783899184031576 1.454011947763254 .013501919089967212 2011
"Italy" -.1069324103590126 -.5877872620957578 -.47469302172710803 .2004436360021364 23.133243742952658 5.3936761686065875 4.532771849692548 .012586313916956204 2011
"Germany" -.05851794344524515 .09960345907923154 .136805115392161 .1373407846168154 32.6182637042919 14.109738344526052 1.5077699357228835 .013200993625042274 2011
"Spain " -.10650743527105216 -.015785638597076792 .1808727613216441 .05038848927405154 28.22206251292902 10.839614113486853 1.5021425852392374 .012076771099482617 2011
"Sweden" -.09678946710644694 .11801761803893955 .18569993056826523 .1481844716617448 27.439283362903794 5.771154420635893 5.493437819181101 .013820243145673811 2011
"Norway " -.04263379351591438 .09931719473864983 .14469611775596314 .0796835513869996 26.68561168581991 14.06385602832082 1.5200488174887825 .01029136242440406 2011
"Algeria" -.04871983526465598 .2139061303228528 .2728647845448156 .056537570099712456 22.50263575072073 16.919641035094685 .7539881754626142 .009734650338902404 2011
end
在轮换之后,我将我的第一个组成部分称为“负债”,将第二个组成部分称为“盈利能力”。
我有 2011 年、2012 年、2013 年、2014 年等的相同数据。我想使用 Stata 为 2010 年计算的权重矩阵,并将其分别应用于 2011、2012、2013 年。我的目标是随着时间的推移比较各国之间的债务和盈利能力。
为此,我使用estimate save 和estimates use 命令(Stata 手册第 20 章关于估计和估计后 PCA 命令帮助)。
但是,我无法理解 Stata 正在保存什么。它是保存为 2010 年计算的分数还是特征值和特征向量?
这是我使用的代码:
tempfile pca
save `pca'
use `pca' if Year==2010
global xlist Investment Profit Income Tax Repayment Leverage Interest Liquidity
pca $xlist, components(2)
estimates save pcaest, replace
predict score
summarize score
use `pca' if Year==2011, clear
estimates use pcaest
predict score
summarize score
您觉得这个方法和代码正确吗?
我还想保存权重矩阵并创建一个新向量
Z=b|1,1]*investment+...。
【问题讨论】:
-
请使用 Stata 中的
dataex命令向我们提供示例数据。屏幕截图没有帮助,没有数据,我们无法复制任何内容,从而为您提供帮助。请阅读How to Ask 以及如何创建minimal reproducible example 并相应地编辑您的问题。 -
@PearlySpencer 完成 :) 感谢您的反馈
-
我想保存特征向量矩阵。PCA 的目的是找到分量 Z(z1..zP),它们是原始变量 X1 的线性组合。我的原始变量是 2010 年的。PCA 计算矩阵 W 或特征向量矩阵。因此,我有 Z=W' X1。现在,假设 X2 是我 2011 年的数据。如果我使用第一步计算的矩阵 W 并将其乘以 X2。我应该获得 2011 年的组件,这将与 2010 年相当。也许我完全错了。但这对我来说似乎是合乎逻辑的。不过不知道-estimates save-这个命令好不好。
-
我没有使用 PCA 的经验,但要在 运行
pca命令后得到特征向量 = 组件的矩阵,请键入matrix A = e(L)。同样,对于特征值矩阵(已排序),您键入matrix B = e(Ev)。 -
据我所知,您的代码中没有任何旋转。