ITPub博客

首页 > 大数据 > Hadoop > 刘鹏博士主讲的《计算广告学》

刘鹏博士主讲的《计算广告学》

Hadoop 作者:lcjvip11 时间:2013-01-09 09:08:38 0 删除 编辑
 转自: 品味生活

持续六周的计算广告学的学习今天画上了圆满的句号。通过这六周的学习,我从对计算广告学一无所知到现在基本了解了广告的本质,了解在线广告为什么有 这么多种形态,这些形态是如何一步一步演化过来的,每种广告形态中有哪些基本问题,用到了哪些算法,虽然这些算法我还没有全部搞明白,但是我知道了自己以 后的努力方向。对于这么好的一门课程我不敢独乐,希望与大家分享:-)课程网址:http://sheetoo.com/app/course/overview?course_id=200 (网上课程2012年12月17日正式开课,我是在录制过程中学习的。)

      刘老师不但对计算广告有深入的了解,还是一个语言学大师,他从 合约式广告系统,到竞价广告系统,再到广告交易市场,向大家娓娓道来,让人感觉如沐春风,增长知识不再是一个痛苦的过程,而成了一种享受。每次听完课之 后,走在路上,满脑子都是Audience Targeting, DSP, SSP Ad Exchange……等等名词在碰撞。此时终于明白古人讲的“余音绕梁,三日不绝”是个怎样的场景了 :smile:
      本次课程学到的用于长query检索的Weighted-AND算法还解决了我在公司进行内容推荐过程中的一个算法优化问题。

刘老师为什么要给大家分享计算广告学相关的技术?

      刘老师为了准备这门免费的公开课花了大量的精力,他图的是啥呢?虽然之前刘老师在课堂上也说过他为什么要免费给大家开设这么一门课,比如“学然后知不足,教然后知困”。但是刘老师在最后一次回顾课中提到了根本原因:Make the world better。他希望他自己能给这个社会的进步和发展做出一些自己的贡献,他说以前做过的唯一 一件有意义的事情是将一些老唱片、戏、相声等进行数字化并供别人下载,他希望讲授《计算广告学》成为第二件有意义的事情。我感觉他已经做到了,因为这个事情已经让我的生活更美好了:-)

刘老师的国学功底:
       刘老师每次上课之前都会引几句儒家经典中的几句话,显示了他深厚的文学功底和对传统文化的深入研究,也许正是刘老师在这些为人处世之“道“的研究,才使他能够在“术“的方面能够有更深的造诣。

       最后感谢宋波校长提供的这么一个平台,宋波校长的理想让中国人平等地接受教育,因此创建了类似coursera的教育平台师徒网, 在这里宋波校长会请各个领域内比较知名的专家来给大家讲述本领域内的知识并录制成视频,大家可以跟着在线课程一起学习,每次课程学习完之后会有一些测验, 还有老师在线答疑。通过这种方式降低教育门槛,让大家平等地介绍教育,享受最前沿最权威的饕餮大餐。宋校长做了一件功在当代,利在千秋的事情,希望大家能 够支持他的工作,多多宣传这个网站,让更多的人知道这么一个优秀的平台。

下面我自己对这门课程主要内容的整理,理解错漏之处希望大家批指正,thanks very much!

主讲人:刘鹏     前 MediaV首席科学家, 前Yahoo!高级科学家

      刘鹏于2005年1月获得清华大学电子工博士学位后加入微软亚 洲研究院从事语音, 手写等智能人机交互技术的研究, 有多项创新应用于Vista, Windows Mobile等系统中. 2009年1月,参与创建雅虎北京研发中心并任高级科学家. 2010年9月, 共同创建雅虎北京研究院, 担任广告和内容推荐的负责人. 其团队负责雅虎全球多个产品的架构和算法研究, 对若干广告市场的收入优化起到了关键作用(如他及其团队为日本雅虎在2010年带来的35million$的收入提升), 并负责研发新一代个性化推荐引擎. 2011年6月-2012年7月, 刘鹏出任聚胜万合(MediaV)首席科学家, 全面负责MediaV的计算广告产品和算法技术, 协助公司在取得了超过5亿元人民币的年度营收.

本次课程的主要内容介绍:
1、第一周:广告的基本知识。
      介 绍了广告的目的和广告的有效性模型;介绍了在线广告的特点(技术和计算导向,可衡量性,标准化);引出了计算广告核心问题:Find the best match Between a given User u, in a given context c, and  a suitable ad a,即在给定的User u和上下文 c的情况下,找到一个使ROI最大的广告a;接着将ROI分解为点击率(CTR)和点击价值的乘积;最后给出了在线广告系统架构。
2、第二周:合约广告系统
      首 先承接上周,介绍了如何用开源工具(Hadoop, Storm, Thrift, Scribe 等等)搭建在线广告系统,然后介绍了在线广告的最初形式:合约式广告系统。合约广告系统包括直接媒体购买,担保式投送(Guaranteed Delivery,GD)。在GD中,主要问题可以建模为一个在线分配问题,这个问题可以用拉格郎日对偶法求解;接着介绍了流量预测指导下的GD在线分配 问题;最后介绍了如何利用开源工具进行统计学习。
3、第三周:受众定向
   在流量不再增长的时候,媒体(比如yahoo)希望将它们的广告按照不同的 受众划分进行售卖,从而产生了受众定向的需求。受众定向即为advertise、User、Context打标签的过程;介绍了做受众定向的代表公司 Audience Science;受众定向的方式包括行为定向,上下文定向;为了更好地进行上下文定向,需要了解网页主题,在这里介绍了Topic Model相关的模型,包括PLSI、LDA,并介绍了PLSI和LDA之间的关系:LDA可以视为PLSI的经验贝叶斯(Empirical Bayes)版本;最后介绍了数据加工交易和数据管理平台(Data Management Platform), 这里的数据很多就是用于受众定向的用户标签。
4、第四周:竞价广告系统
      首 先介绍了位置拍卖理论,定价机制(包括VCG和广义第二高价-GSP);接着介绍了广告网络的架构图;然后介绍了广告检索相关方法,包括布尔表达式检索 (Index算法)和长Query情况下的相关性检索方法(WAND算法);接着又介绍了流量预测方法;最后介绍了大家都很关注的问题点击率(CTR)预 测方法,介绍了逻辑回归优化方法,包括L-BFGS算法和ADMM方法,还介绍了利用多层次点击反馈等动态特征预测CTR的方法。
5、第五周:搜索广告、广告网络Demand端技术
      承 接上周介绍了归一化点击率特征的方法(COEC)、点击反馈的平滑方法(经验贝叶斯),以及如何通过探索和利用(Explore and Exploit)为长尾组合创造出合适的展示机会以积累数据,从而更正确地预测CTR(介绍了UCB算法和Contextual Bandit 方法)。针对市场上份额较大的搜索广告形式,介绍了其特殊的方法,包括查询词扩展,用户相关的个性化搜索广告决策和短时用户行为反馈,另外简单地介绍了流 式计算平台Storm。针对广告网络Demand端技术,介绍了非RTB流量的ROI优化。
6、第六周:广告交易市场
      针 对广告交易市场,介绍了广告交易平台,实时竞价模式(RTB)以及代表公司RightMedia,给出了Ad Exchange系统架构图,实时竞价设计的关键技术(比如Cookie Mapping)。介绍了广告交易市场的一个参与方-供应方平台(Supply Side Platform, SSP)以及代表公司ADMELD, 介绍了广告交易市场的另一个参与方-需求方平台(Demand Side Platform, DSP)以及代表公司InviteMedia。介绍了DSP面临的流量预测问题(Bid landscape Prediction)和点击价值估计问题。接着介绍了DSP受众定向的方法:重定向(网站重定向,搜索重定向,个性化出重定向),新客推荐。
最后总结了广告流量的交易方式,分别从需求方和供应方角度进行解读;并以所有参与在线广告市场的公司构图总结了本次课程。

     

最后附上刘老师自己对这门课的介绍:
      互 联网的从业者们都知道,是广告收入支撑着互联网的大半壁江山。自从Andrew Broder提出Computational Advertising这个课题以来,计算广告中的许多有趣问题得到了学术界和工业界的广泛探讨和深入研究。我们从实践出发,认为很有必要把其中的系统、 算法和技术做一次全面的回顾。以此为目的,我们录制了此课程。本次课程是希望对此有兴趣的朋友能够准确地理解行业背景,快速地进行知识准备,以及深入思考 将来努力的方向。本次课程我们的重点只有一个,就是把广告里的问题讲清楚。我们将从计算广告各个阶段所遇到的市场挑战为出发点,争取解释清楚广告市场纷繁 复杂的产品逻辑,并且对其中的关键的技术和算法做深入的探讨。准备参与此次课程的朋友,请你们不要把计算广告这门课程想得很神秘,因为这门课所用到的算法 和技术很多都生发于你所熟悉的领域,比如Information Retrival, Data Mining, Machine Learning, Distributed Computing,甚至经济学;当然你也不能把它想象得过于简单,因为计算广告中的问题都要放到具体的业务需求中去理解其根本,因此在解决一个具体问题 时所需要的技术要求也是比较高的。我们在这次课程中将会介绍诸如在线分配(Online Allocation),点击率预测(Click Modeling),广告检索和实时竞价(Real-time Bidding)方面许多具体的技术和算法。本次课程的发展逻辑,我们将以广告系统业务形态的需求和变化为主线,依次介绍合约广告系统 (Agreement-Based Advertising),竞价广告系统(Option-Based Advertising),广告交易市场(Ad Exchange)。我们将把这些市场中的问题和技术做深入探讨,并且对业界典型方案进行回顾。

<!-- 正文结束 -->

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26256111/viewspace-1119880/,如需转载,请注明出处,否则将追究法律责任。

下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2011-09-08

最新文章