妈妈背患病儿子一路读到清华博士究竟什么情况?妈妈背患病儿子一路读到清华博士时间过程详解( 七 )


此外 , K老师项目训练了我的编程 , 数据分析和逻辑思维技能 。 在项目1中 , 我们通过数据分析和数据可视化探索了向上移动性 。 我们发现旧金山的汇集平均向上流动性(38405.54)高于地图集(34311.68) , 而来自低收入家庭的儿童通常对高收入家庭的人来说效果更好 。 在项目2中 , 我们通过阈值和回归分析的数据图检查班级规模是否对学生得分产生影响 。 在项目3中 , 我们进行了一个实证项目 , 以分析与金县公共住房管理局(KCHA)和西雅图公共住房管理局(SHA)合作进行的试点研究的数据 。 愿意接受CMTO服药的家庭随机分为对照组和实验治疗组 。 结果显示 , 随机分配接受治疗增加了移动到高机会邻居的概率提高了18个百分点 , 而对治疗的治疗增加了23% 。 公共住房管理局有证据表明治疗效果异质性 , 而家庭收入缺乏治疗效果异质性的证据 。 在项目4中 , 我们使用来自Google DataCommons的变量来使用机器学习方法来预测代际移动性 。 我们将关注的代际流动性衡量标准是一个孩子的平均等级 , 其父母在每个县的国民收入分配的25%(kfr_pooled_p25) 。 我的目标是使用其他变量构建对此结果的最佳预测 , 这是创建向上移动性预测的重要步骤 , 可以在其结果数据可用之前用于后代 。 我们发现随机森林在这个数据集中表现最好 。 随机森林有许多优点:在许多当前的数据集中 , 它比其他算法具有很大的优势 , 并且表现良好;它可以处理非常高维(特征很多)的数据 , 而不需要进行特征选择(随机选择特征子集);培训结束后 , 它可以哪些功能更重要;在创建随机森林时 , 没有偏差估计的泛化误差和模型泛化能力很强 。 训练速度快 , 易于制作并行化方法;在训练过程中 , 可以检测到特征之间的相互作用;实施相对简单;对于不平衡的数据集 , 它可以平衡错误;如果大部分功能丢失 , 仍可保持准确性 。 然而 , 已经证明随机森林在一些嘈杂的分类或回归问题上被过度指定;对于具有不同值的数据 , 具有更多值的属性将对随机森林产生更大的影响 , 因此随机森林对此类数据生成的属性权重不可信 。 因此 , 我们需要在其他最新升级的模型(即LightGBM或深度神经网络)上进行测试 , 我们还可以提出一种新颖的方法来改善性能 。
In sum, thanks to professor again for cultivating an academic aptitude for independent thinking and an interest in economic research.
总之 , 再次感谢教授培养了我独立思考的学术才能和对经济研究的兴趣 。
科研报告(节选)
【妈妈背患病儿子一路读到清华博士究竟什么情况?妈妈背患病儿子一路读到清华博士时间过程详解】妈妈背患病儿子一路读到清华博士究竟什么情况?妈妈背患病儿子一路读到清华博士时间过程详解
文章图片

妈妈背患病儿子一路读到清华博士究竟什么情况?妈妈背患病儿子一路读到清华博士时间过程详解
文章图片

推荐信(节选)
She was a highly engaged and active learner. In our program, I mainly introduced data processing, modeling and testing of R. Miss. S could always complete the tasks I assigned ahead of time, in a high quality. Also, she never hesitated to share her resources with her peers. Miss. S also impressed me deeply with her enthusiasm in academic discussions. For example, while processing economic data, she was confronted with an urgent problem. Despite of continuous efforts, she failed to solve the problem. Thus, she turned to me for guidance. Her open mind enabled her to solve most problems creatively.


推荐阅读