一、数据说明

数据集:

通过网盘分享的文件:digital_campaign.csv
链接: https://pan.baidu.com/s/1dYw-9_alV7xahZRmCiOArg 提取码: 4bab

字段 说明
CustomerID 每个客户的唯一标识符
Age 客户的年龄
Gender 客户的性别(男性/女性)
Income 客户的年收入,以美元计
CampaignChannel 营销活动传递的渠道:电子邮件(Email)、社交媒体(Social Media)、搜索引擎优化(SEO)、付费点击(PPC)、推荐(Referral))
CampaignType 营销活动的类型:意识(Awareness)、考虑(Consideration)、转化(Conversion)、留存(Retention)
AdSpend 在营销活动上的花费,以美元计
ClickThroughRate 客户点击营销内容的比率
ConversionRate 点击转化为期望行为(如购买)的比率
WebsiteVisits 访问网站的总次数
PagesPerVisit 每次会话平均访问的页面数
TimeOnSite 每次访问平均在网站上花费的时间(分钟)
SocialShares 营销内容在社交媒体上被分享的次数
EmailOpens 营销电子邮件被打开的次数
EmailClicks 营销电子邮件中链接被点击的次数
PreviousPurchases 客户之前进行的购买次数
LoyaltyPoints 客户累积的忠诚度积分数
AdvertisingPlatform 广告平台:保密
AdvertisingTool 广告工具:保密
Conversion 目标变量:二元变量,表示客户是否转化(1)或未转化(0)。
加载数据

二、加载数据

查看前5行数据

三、数据基础性分析

可知,数据没有空值、异常值,非常标准。

再查看数据更多信息

四、客户转化预测

进行这一步前,先copy一下原数据,用备份数据预测

(一)ONE-HOT 编码处理

将 object 类型的字段列映射出来

AdvertisingPlatform, AdvertisingTool 列只有一个值,属于无效数据可以直接删除,其余数据做正常映射处理即可

再将上面剩下的18个字段做 one-hot 编码映射

'Female':0, 'Male':1

'Social Media':0, 'Email':1, 'PPC':2, 'Referral':3, 'SEO':4

'Awareness':0, 'Retention':1, 'Conversion':2, 'Consideration':3

(二)特征相关性

在进行相关性计算前,要先确认字段的类型都是数值型!

查看各个字段与 Conversion 的相关性

CustomerID 该列对结果无效删除。
对相关性小于 0.05 的列删除。(这里的正负号表示的是正负相关)

(三)模型数据处理

剩下10个字段,将其设为x,Conversion 列设为y。

(四)划分训练集和测试集

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3)
x_train.head(), x_test.head(), y_train.head(), y_test.head()

(五)训练模型

model = XGBClassifier(max_depth=3, learning_rate=0.01, n_estimators=100, gamma=0, min_child_weight=1, random_state=42)
model.fit(x_train, y_train)

(六)预测测试集并计算准确率

这个准确率还是不错的,再经过模型参数搜索后准确率会更高。

五、渠道与活动分析

在分析前,再将原数据 copy 一下,我们使用未处理前的初始数据。

(一)营销活动渠道分析

查看不同营销渠道下,用户数分别是多少

营销活动在不同渠道中都有,不需要改进

(二)营销类型分析

查看不同营销类型下,用户熟分别是多少

可知,不同类型下都有,且相差不大。

(三)营销活动花费分析

再将营销活动的花费划分成不同区间,查看每个区间都有多少用户。

由一开始的数据概况可知,营销活动花费均值5k美元,该数据整体花费分布均匀,应该是有规划的活动花费,无异常。

六、广告与策略优化

依旧 copy 原数据来进行以下处理。

(一)点击率分析

按 Conversion 字段分组,查看点击率 ClickThroughRate 字段的分布情况。

从点击率分布来看,点击率有点低,可以根据用户的喜好推送喜欢的内容,提升点击率,进而提升转化率。

(二)购买转化率分析

按 Conversion 字段分组,查看转化率 ConversionRate 字段的分布情况。

从点击率和购买转化率来看,提高点击率就可以进一步提高购买转化率,所以下一步着重加强用户的喜好分析和历史行为分析,加强推送质量

七、总结

与是否转化相关性最高的列分别是 TimeOnSite, EmailClicks, EmailOpens,其表示积极参加网站活动的用户转化率更高。后续在运营中加强活动的运营更有助于提高转化率。
需要加强分析用户喜好和历史行为,加强营销推送质量。
在保持转化率不变的基础上,可以适当降低营销费用花费,降低运营成本。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐