双重边际效应的案例(双重边际效应案例)

2023-06-09 16:18:56
股票学习网 > 股票新手入门 > 双重边际效应的案例(双重边际效应案例)

最近关于吴幽欠捐被母校告上法庭一事在互联网闹得沸沸扬扬。之前都是中国矿业大学单方面回应,随着另一位当事人吴幽终于露面对此事进行回应,舆论风向逐渐发生转变,众多吃瓜网友对此事有了更加深刻理解和阐述,此事也一度登上互联网热搜。

有网友认为吴幽既然在校庆活动上公开做出承诺且签订捐赠协议就要及时履行捐款义务。捐赠协议一旦签署了,对学校来说就是应收账款,不收就会被上级主管部门追责。当初承诺捐赠时财务状况肯定不错,拖着一直没兑现,后面因为疫情期间大环境导致公司经营暴雷,归根到底还是吴幽捐赠诚意不够。学校将其告上法庭也是给吴幽上的最后一课。校方教导学生要<strong>言而有信积极履约,防止以捐赠名义在获得公众好评后,反而消费了公众的信任,而破坏了社会风气

……

例如,今年双十一前夕出现了两类截然相反的现象,一方面是李佳琦、薇娅等淘宝头部主播销售额话题大热,同时带动电商、物流、品牌等相关利益方股价大涨;另一方面,另一方面,作为淘品牌代表的三只松鼠正在线上渠道大幅缩减SKU以实现降本增效,而在线下加速门店扩张。

(4)匹配:实验组对对照组根据得分进行匹配的时候,比较常见的有几种方法。knn: 进行 1 对 K 有放回或无放回匹配。radius: 对每个策略影响用户,匹配上所有得分差异小于指定 radius 的用户

双重机器学习假设所有混淆变量(既影响D又影响Y的变量)都可以被观测,所以在做特征选择时要格外注意尽量将这些特征加入模型。

有的时候虽然看似理解了一些,但是真正应用的时候还是不太清楚什么场景应该选择什么方法。

Q4:如何选择混淆因素,实际发现X选择对 DML 影响很大,如何判断结果的置信度?

田忌赛马般的婚恋市场

大到重要功能上线,小到一个文案修改,都可以去衡量这个策略的效果,比之前提升了多少,对整体数据贡献了多少。

那些梦想着吃大锅饭的年轻人,就是不懂基本的科学原理,把他丢到隔壁的计划经济庄园去住上一个月,就知道当年健身是多么的愚蠢。

一、背景

二、四类分析场景与对应解决方法概览三、分析场景与适用方法

1. 场景一:非实验场景策略效果评估

举个例子,业务在上线‘主播连麦PK功能’后,发现使用连麦PK功能的用户比未使用此功能的用户开播率高4.3%,于是认为该功能提高了主播开播率。这个场景该如何做效果评估?

按照1:1的匹配比例,最终匹配上26w对用户数据。其中策略组用户开播率13.1%,对照组为11.2%,两组diff为1.9%,假设检验通过。因此从数据角度证明该功能确实能提高开播率,但提升效果为1.9%而不是4.3%。

其次,疫情前的时期是完美拟合的,这表明我们的合成控制可能发生过拟合。因为我们的对照组用了30个城市,所以我们的线性回归模型有30个参数可以使用,这给模型提供了过多灵活性,产生过拟合风险。此时可以使用Ridge或者Lasso回归来解决此问题,这里不过多赘述。

2. 场景二:实验场景下的正向用户下探

首先,它会把数据分成训练集和估计集,一部分训练集去构造树,另一部分估计集去估计因果效应和方差。

其次,在树的分区方式上,使用各个节点的方差对目标函数加以修正。给定训练集Str= {(Xi,Di,Yi)},其中Di=1代表实验组,Di=0代表对照组,目标是预测E( (Yi(1) – Yi(0)) | Xi)。其中

通过建模,我们发现Causal Tree的第一个分裂点是用户是否是创作者,说明创作者受到了更大的实验负向影响。

3. 场景三:策略敏感人群探究

假设有N个用户,用户i在没有优惠券的购买结果为Yi(0),在有优惠券时购买结果为Yi(1),此时发送优惠券对该用户的增益就是uplift score (i)=Yi(1)-Yi(0)。

最后,我们总结一下Uplift模型可能的应用场景:

4. 场景四:因果影响指标分析

举个例子,假设我们通过模型对一个顾客估计出CATE=2,说明价格减少一个单位,销量会多出2个单位。

X:统计第一个时间周期的用户消费行为特征(习惯偏好、消费行为、互动行为、消费内容垂类、作者相关画像信息等)

D:统计第二个时间周期的用户消费应为特征(D为需要计算因果效应的特征)

Y:第三个周期的用户活跃天数

随机选取第二个时间周期的活跃用户,拆分训练集和测试集,关联第一个时间周期的特征指标及第三个时间周期的因变量;

作者:piikee | 分类:股票新手入门 | 浏览:46 | 评论:0