1 多元线性回归简介

多元线性回归模型可以表示为如下所示的公式。

其中x1、x2、x3……为不同的特征变量,k1、k2、k3……则为这些特征变量前的系数,k0为常数项。

2 案例:客户价值预测模型

利用多元线性回归模型可以根据多个因素来预测客户价值,当模型搭建完成后,便可对不同价值的客户采用不同的业务策略。

2.1 案例背景

这里以信用卡客户的客户价值为例来解释客户价值预测的具体含义:客户价值预测就是指预测客户在未来一段时间内能带来多少利润,其利润可能来自信用卡的年费、取现手续费、分期手续费、境外交易手续费等。分析出客户价值后,在进行营销、电话接听、催收、产品咨询等各项业务时,就可以针对高价值客户提供区别于普通客户的服务,以进一步挖掘这些高价值客户的价值,并提高他们的忠诚度。

2.2 具体代码

import pandas as pd
from sklearn.linear_model import LinearRegression


df = pd.read_excel('客户价值数据表.xlsx')


X = df[['历史贷款金额','贷款次数','学历','月收入','性别']]
Y = df['客户价值']
model = LinearRegression()
model.fit(X,Y)

model.coef_,model.intercept_

这里通过model.coef_获得的是一个系数列表,分别对应不同特征变量前面的系数,即k1、k2、k3、k4、k5,所以此时的多元线性回归方程如下。

y=-208+0.057x^1+96x^2+113x^3+0.056x^4+1.98x^5

3 模型评估

import statsmodels.api as sm
X2 = sm.add_constant(X)
est = sm.OLS(Y,X2).fit()
est.summary()

4 线性回归优缺点

线性回归模型具有如下优缺点。

        ·优点:快速;没有调节参数;可轻易解释;可理解。

        ·缺点:相比其他复杂一些的模型,其预测准确率不高,因为它假设特征和响应之间存在确定的线性关系,这种假设对于非线性的关系,线性回归模型显然不能很好地进行数据建模。

参考书籍

《Python大数据分析与机器学习商业案例实战》

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐