针对加性模型中预测变量线性和非线性结构的自动识别问题, 提出了一种基于Lasso和群Lasso方法的变量选择和参数估计方法LANEM. 首先结合Lasso惩罚和群Lasso惩罚, 通过使用三次自然样条基底同时选出无关变量、线性变量以及非线性变量, 并利用上证指数数据, 采用计算机仿真模拟方法进行股价预测. 结果表明, LANEM方法基于股票数据能自动识别出线性预测变量、非线性预测变量和无关预测变量, 且结合最小二乘方法得到的LANEMLS方法具有最小的预测误差. 同时, 稳健性检验证明了LANEM方法不受股票指标、类型和时间的影响, 应用股票场景广泛. 相较于Lasso和群Lasso方法, LANEM方法有效提高股票指数预测的准确率, 对股票的预测和趋势性研究具有现实意义. |