首页天道酬勤以一元线性回归模型为例,简述回归分析的一般步骤

以一元线性回归模型为例,简述回归分析的一般步骤

张世龙 05-13 05:15 82次浏览

文章福利: Python学习十佳书

建立回归模型的一般步骤如下图所示

1、具体(社会经济)问题

当我们想要解决一些现实生活、经济问题时,需要将具体问题量化为数据。 然后,从观察和事物(数据)之间的内在联系导出规律,从而解决现实经济问题(及时的止损、预测),朝着这个目标产生了几列可行性问题。

2、设置指标变量(量化具体问题)

可行性问题已经出现,接下来根据问题研究的目的设置原因变量y,然后选择几个与原因变量y具有统计关系的参数x1、x2 .

在此,必须明确原因变量y和自变量x是什么。 其实,一般理解是下图的因果关系

我们需要通过经济变量“果”来影响它,选择合理的变量“因”。 回归模型需要了解这两种变量的一些术语

因变量(果)也称为解释变量、内生变量;

自变量(因)也称为解释变量、外生变量;

注意01 :变量的选择涉及到广泛的研究不同问题领域,专业性强,因此对于完全不了解的领域,需要寻求该领域的专家或经验者的协助。 这样可以更好地确定研究问题的模型变量,避免蒙羞。

注意02 :回归模型解释变量的选择个数并不是越多越好,选择的变量之间有较大的信息重叠会产生共线性问题,变量多导致的计算量大、误差大,最终模型参数精度也不高。

一般在选择指标变量时往往不能一次完全准确,需要反复调整找出最佳指标变量。

3、收集、整理数据

指标确定后,接下来是收集必要的指标数据。 收集样本数据可以分为时序数据和横断面数据。

时间序列数据:

时间序列数据是按时间序列排列的数据,如下图所示,各指标数据随时间变化。

横截面数据:

横断面数据是指在同一时间断面上统计的数据集,如2018年中国各省市的GDP数据

注意事项:时间序列数据容易产生随机误差项的序列相关(处理方法:差分法) ) ) ) ) ) )。

4、回归模型的确定

上一步,数据已经准备好了。 然后,从这些数据中提取宇宙公式回归模型(数学格式)。 首先,必须在笛卡尔坐标系中绘制这些采样点的散点图

为什么要先画散点图呢? 我们知道回归模型的种类有线性回归、非线性回归等多种. 绘制散点图后,可以根据散点图的分布形式,大致决定建立哪个回归模型比较合适。

如果散点图无论如何都不确定模型的形状,可以对有争议的模型分别进行模拟,从模拟结果中选择模拟效果最好的模型作为最终的理论回归模型。

5、模型参数估计

确定回归模型的具体分类选择后,接下来估计模型中未知的参数。 常见的最典型的参数估计方法是最fqdkf乘法。

在最大fqdkf乘法的基础上派生了偏最大fqdkf乘法、主成分回归、岭回归等,都是为解决不满足模型基本假设而派生的新方法。

6、模型检验与修改

建立初步回归模型后,不能直接用于实际应用,模型是否正确解释了问题指标之间的因果关系还是个未知数,这就需要验证模型的可行性。

通常有两种方法来检查模拟的有效性。

1 统计性检验

2 具体问题(经济)意义检验

模型的侧面展示了具体的社会经济问题。 例如,我国GDP增长量与银行贷款发行量、耗电量等之间的关系从经济理论上看呈正相关,但如果模型中回归系数为负数,该模型也无意义。 这种现象的原因可能是自变量之间的多重共线性、数据质量问题等。

模型只有通过统计检验和经济意义检验联合检验才能有效。

7、回归模型的应用

经过以上种种困难,这个模式终于可以用于现实生活、经济问题了。

我们可以从模型的回归系数中发现研究的变量之间的结构关系,并给出量化的评价和建议。

调控:确定的回归模型在反馈经济变量之间的因果关系后,根据已知结果调整具体的经济指标数据等。

例如,为了将通货膨胀指标降低到5%以下,可以根据回归模型决定货币发行量、银行存款利率等。

预测:回归模型可以预测我国2022年国民收入等。

这些步骤是从创建回归模型到使用回归模型的所有过程,修改模型往往需要重复修改才能获得理想的模型。 修改这个重复模型的过程可以从写论文中感受到。

--- END ---

更多精彩内容请访问公众号数据与编程之美

原文地址:建立回归模型的完整步骤

数学建模多元线性回归模型,数学建模多元回归模型 python回归方程代码,用python做多元线性回归