当前位置: 首页 > 新闻 > 信息荟萃
编号:2686
计算广告:互联网商业变现的市场与技术.pdf
http://www.100md.com 2020年2月7日
第1页
第7页
第15页
第26页
第43页
第191页

    参见附件(17515KB,382页)。

     计算广告:互联网商业变现的市场与技术,这是一本关于互联网广告变现的,在书中为读者讲述了整个互联网不同的变现渠道,帮助你能够更好商业变现。

    计算广告内容提要

    计算广告是一项新兴的研究课题,它涉及大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学等诸多领域的知识。本书从实践出发,系统地介绍计算广告的产品、问题、系统和算法,并且从工业界的视角对这一领域具体技术的深入剖析。

    《计算广告:互联网商业变现的市场与技术》立足于广告市场的根本问题,从计算广告各个阶段所遇到的市场挑战出发,以广告系统业务形态的需求和变化为主线,依次介绍合约广告系统、竞价广告系统、程序化交易市场等重要课题,并对计算广告涉及的关键技术和算法做深入的探讨。

    无论是互联网公司商业化部门的产品技术人员,还是对个性化系统、大数据变现或交易有兴趣的产品技术人员,传统企业互联网化进程的决策者,传统广告业务的从业者,互联网创业者,计算机相关专业研究生,都会从阅读《计算广告:互联网商业变现的市场与技术》中受益匪浅。

    计算广告作者资料

    刘鹏(@北冥乘海生),现任奇虎360高级总监、商业产品首席架构师,负责360的变现产品及工程。刘鹏在清华大学获得博士学位后,加入微软亚洲研究院,从事人工智能领域的研究,后曾参与创建雅虎北京研究院,出任高级科学家。刘鹏还曾经担任MediaV首席科学家等职。

    刘鹏一直致力于计算广告和数据变现产品技术的普及工作,他讲授的《计算广告学》在网易云课堂和师徒网共有12000多名学生参与,已经成为业界相关公司进行相关培训的基础教程之一。此课还作为北京大学计算机系、北京航空航天软件学院的研究生课程和清华大学公开课讲授。

    王超(@德川),于北京大学获得硕士学位后,曾就职于百度、微博、搜狐集团的广告变现部门,现任汽车之家广告算法经理。王超多年来专注于计算广告中机器学习算法的研究和实践,曾参加Criteo举办的广告CTR预估比赛,在718个参赛队中排名第7,同时是开源模型xgboost的代码贡献者。

    计算广告章节目录

    第一部分 计算广告关键技术

    第1章 在线广告综述

    第2章 计算广告基础

    第二部分 在线广告产品逻辑

    第3章 在线广告产品概览

    第4章 合约广告

    第5章 搜索与竞价广告

    第6章 程序化交易广告

    第7章 移动互联与原生广告

    第8章 在线广告产品实践

    第三部分 计算广告关键技术

    第9章 计算广告技术概览

    第10章 基础知识准备

    第11章 合约广告核心技术

    第12章 受众定向核心技术

    第13章 竞价广告核心技术

    第14章 程序化交易核心技术

    第15章 其他广告相关技术

    本书适合哪些人来读

    互联网公司的商业化、大数据和用户增长部门的朋友;

    传统广告与数字广告从业者;

    对推荐、大数据、人工智能技术的应用有兴趣者;

    转型中的传统企业和创业公司的战略决策者;

    计算机相关专业学生。

    计算广告:互联网商业变现的市场与技术截图

    目录

    封面

    扉页

    版权

    对本书的点评

    序一

    序二

    序三

    前言

    第一部分 计算广告关键技术

    第1章 在线广告综述

    1.1 大数据与广告的关系

    1.2 广告的定义与目的

    1.3 在线广告创意类型

    1.4 在线广告简史

    1.5 泛广告商业产品

    1.6 延伸思考

    第2章 计算广告基础

    2.1 广告有效性原理

    2.2 互联网广告的技术特点

    2.3 计算广告的核心问题

    2.3.1 广告收入的分解

    2.3.2 结算方式与 eCPM 估计的关系

    2.4 在线广告相关行业协会

    2.4.1 交互广告局

    2.4.2 美国广告代理协会

    2.4.3 美国国家广告商协会

    2.5 延伸思考

    第二部分 在线广告产品逻辑

    第3章 在线广告产品概览

    3.1 商业产品的设计原则

    3.2 需求方层级组织与接口

    3.3 供给方管理接口

    3.4 延伸思考

    第4章 合约广告4.1 广告位合约

    4.2 受众定向

    4.2.1 受众定向方法概览

    4.2.2 受众定向标签体系

    4.3 展示量合约

    4.3.1 流量预测

    4.3.2 流量塑形

    4.3.3 在线分配

    4.3.4 产品案例

    4.4 延伸思考

    第5章 搜索与竞价广告

    5.1 搜索广告

    5.1.1 搜索广告产品形态

    5.1.2 搜索广告产品新形式

    5.1.3 搜索广告产品策略

    5.1.4 产品案例

    5.2 位置拍卖与机制设计

    5.2.1 定价问题

    5.2.2 市场保留价

    5.2.3 价格挤压

    5.2.4 定价结果示例

    5.3 广告网络

    5.3.1 广告网络产品形态

    5.3.2 广告网络产品策略

    5.3.3 产品案例

    5.4 竞价广告需求方产品

    5.4.1 搜索引擎营销

    5.4.2 媒体购买平台

    5.4.3 产品案例

    5.5 竞价广告与合约广告的比较

    5.6 延伸思考

    第6章 程序化交易广告

    6.1 实时竞价

    6.2 其他程序化交易方式

    6.2.1 优选

    6.2.2 私有市场

    6.2.3 广告交易方式谱系6.3 广告交易平台

    6.4 需求方平台

    6.4.1 需求方平台产品策略

    6.4.2 出价策略

    6.4.3 重定向

    6.4.4 新客推荐

    6.4.5 产品案例

    6.5 供给方平台

    6.5.1 供给方平台产品策略

    6.5.2 产品案例

    6.6 数据加工与交易

    6.6.1 有价值的数据来源

    6.6.2 三方数据划分

    6.6.3 数据管理平台

    6.6.4 数据交易平台

    6.6.5 产品案例

    6.7 在线广告产品交互关系

    6.8 延伸思考

    第7章 移动互联与原生广告

    7.1 原生广告相关产品

    7.1.1 信息流广告

    7.1.2 搜索广告

    7.1.3 软文广告

    7.1.4 联盟

    7.2 移动广告的现状与挑战

    7.2.1 移动广告的特点

    7.2.2 移动广告的创意形式

    7.2.3 移动广告的挑战

    7.3 原生广告平台

    7.3.1 表现原生与意图原生

    7.3.2 植入式原生广告

    7.3.3 产品案例

    7.4 原生广告与程序化交易

    7.5 延伸思考

    第8章 在线广告产品实践

    8.1 媒体实战

    8.1.1 变现方式和产品决策8.1.2 数据支持方案决策

    8.2 广告主实战

    8.3 数据提供方实战

    8.4 延伸思考

    第三部分 计算广告关键技术

    第9章 计算广告技术概览

    9.1 个性化系统框架

    9.2 各类广告系统优化目标

    9.3 计算广告系统架构

    9.3.1 广告投放引擎

    9.3.2 数据高速公路

    9.3.3 离线数据处理

    9.3.4 在线数据处理

    9.4 计算广告系统主要技术

    9.5 用开源工具搭建计算广告系统

    9.5.1 Web 服务器 Nginx

    9.5.2 分布式配置和集群管理工具 ZooKeeper

    9.5.3 全文检索引擎 Lucene

    9.5.4 跨语言通信接口 Thrift

    9.5.5 数据高速公路 Flume

    9.5.6 分布式数据处理平台 Hadoop

    9.5.7 特征在线缓存 Redis

    9.5.8 流计算平台 Storm

    9.5.9 高效的迭代计算框架 Spark

    9.6 延伸思考

    第10章 基础知识准备

    10.1 信息检索

    10.1.1 倒排索引

    10.1.2 向量空间模型

    10.2 最优化方法

    10.2.1 拉格朗日法与凸优化

    10.2.2 下降单纯形法

    10.2.3 梯度下降法

    10.2.4 拟牛顿法

    10.2.5 Trust-Region 法

    10.3 统计机器学习

    10.3.1 最大熵与指数族分布10.3.2 混合模型和 EM 算法

    10.3.3 贝叶斯学习

    10.4 统计模型分布式优化框架

    第11章 合约广告核心技术

    11.1 广告排期系统

    11.2 担保式投送系统

    11.2.1 流量预测

    11.2.2 频次控制

    11.3 在线分配

    11.3.1 在线分配问题

    11.3.2 在线分配问题举例

    11.3.3 极限性能研究

    11.3.4 实用优化算法

    11.4 延伸思考

    第12章 受众定向核心技术

    12.1 受众定向技术分类

    12.2 上下文定向

    12.2.1 半在线抓取系统

    12.2.2 文本主题挖掘

    12.3 行为定向

    12.3.1 行为定向建模问题

    12.3.2 行为定向特征生成

    12.3.3 行为定向决策过程

    12.3.4 行为定向的评测

    12.4 人口属性预测

    12.5 数据管理平台

    12.6 延伸思考

    第13章 竞价广告核心技术

    13.1 竞价广告计价算法

    13.2 搜索广告系统

    13.2.1 查询扩展

    13.2.2 广告放置

    13.3 广告网络

    13.4 广告检索

    13.4.1 布尔表达式的检索

    13.4.2 相关性检索

    13.5 点击率预测13.5.1 点击率预测模型

    13.5.2 优化算法

    13.5.3 点击率模型的校正

    13.5.4 点击率模型的特征

    13.5.5 点击率模型评测

    13.5.6 智能频次控制

    13.6 探索与利用

    13.6.1 UCB 方法

    13.6.2 考虑上下文的 bandit

    13.7 延伸思考

    第14章 程序化交易核心技术

    14.1 广告交易平台

    14.1.1 cookie 映射

    14.1.2 询价优化

    14.2 需求方平台

    14.2.1 定制化用户标签

    14.2.2 DSP 中的点击率预测

    14.2.3 点击价值估计

    14.2.4 出价策略

    14.3 供给方平台

    14.4 延伸思考

    第15章 其他广告相关技术

    15.1 创意优化

    15.1.1 程序化创意

    15.1.2 点击热力图

    15.2 实验框架

    15.3 流量保护和效果监测

    15.3.1 反作弊

    15.3.2 广告监测

    15.3.3 广告安全

    15.4 隐私保护和数据安全

    15.4.1 隐私保护问题

    15.4.2 程序化交易中的数据安全

    15.5 延伸思考

    第四部分 附录

    附录A 主要术语及缩写索引

    参考文献计算广告 互联网商业变现的市场与技术

    刘鹏 王超 著

    人民邮电出版社

    北京图书在版编目(CIP)数据

    计算广告:互联网商业变现的市场与技术刘鹏,王超著.--北京:人

    民邮电出版社,2015.9

    ISBN 978-7-115-39249-7

    Ⅰ.①计… Ⅱ.①刘…②王… Ⅲ.①计算技术—应用—广告学—研

    究②数据处理 Ⅳ.①F713.80-39②TP274

    中国版本图书馆GIP数据核字(2015)第163370号

    内容提要

    计算广告是一项新兴的研究课题,它涉及大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学等诸多领

    域的知识。本书从实践出发,系统地介绍计算广告的产品、问题、系统

    和算法,并且从工业界的视角对这一领域具体技术的深入剖析。

    本书立足于广告市场的根本问题,从计算广告各个阶段所遇到的市

    场挑战出发,以广告系统业务形态的需求和变化为主线,依次介绍合约

    广告系统、竞价广告系统、程序化交易市场等重要课题,并对计算广告

    涉及的关键技术和算法做深入的探讨。

    无论是互联网公司商业化部门的产品技术人员,还是对个性化系

    统、大数据变现或交易有兴趣的产品技术人员,传统企业互联网化进程

    的决策者,传统广告业务的从业者,互联网创业者,计算机相关专业研

    究生, 都会从阅读本书中受益匪浅。

    ◆著 刘鹏 王超

    责任编辑 杨海玲

    责任印制 张佳莹 焦志炜

    ◆人民邮电出版社出版发行 北京市丰台区成寿寺路11号

    邮编 100164 电子邮件 315@ptpress.com.cn

    网址 http:www.ptpress.com.cn

    北京艺辉印刷有限公司印刷

    ◆开本:800×1000 116

    印张:20.25

    字数:388千字 2015年9月第1版

    印数:1–4000册 2015年9月北京第1次印刷

    定价:69.00元

    读者服务热线:(010)81055410 印装质量热线:(010)

    81055316

    反盗版热线:(010)81055315对本书的点评

    以下点评分领域以点评人的姓氏笔画为序排列。

    互联网公司管理层

    在线广告市场是比较复杂的体系,它贯穿了互联网生态链的各种角

    色。刘鹏的著作既从商业角度介绍了在线广告,也深入到了广告的技术

    和算法层面,还包括对于一个大规模竞价市场在市场设计方面的相关原

    理和优化机会。这本书不仅是了解在线广告市场的途径,也是了解互联

    网商业和盈利模式设计的窗口,同时对于互联网产品设计会有很好的参

    考作用。

    ——王华(@超凡Derek),阿里巴巴副总裁,阿里妈妈负责人

    这是一本非常系统、全面地介绍计算广告的书,一本在线广告专业

    人员必读的书,一本值得强烈推荐给想利用互联网力量的企业主和决策

    制定者和对大数据价值感兴趣的研究人员和工程师的书。虽然我亦曾亲

    眼目睹广告业在 20 世纪 90年代开始的革命,一直积极参与在线广告的

    演变,但阅读完这本书,我对计算广告整个图景以及很多细微之处有了

    更多更深刻的理解。

    ——毛建昌,微软Distinguished Engineer和Bing广告工程负责人,前雅虎实验室广告科学副总裁

    十多年的实践证明,互联网最有效的商业模式莫过于可以把流量直

    接变现的在线广告模式。从最初铺天盖地的横幅广告起步,到人群及兴

    趣精准定向的搜索广告与推荐引擎,直到与内容环境融为一体的原生广

    告,用户需求与口味的不断变迁促使着广告产品与技术持续不断地升级

    与发酵。本书最大的亮点在于,作者从中国互联网广告发展全过程亲历

    者的视角,极为系统地讲述了计算广告的产品设计思维与技术理论基

    础,涵盖从广告呈现到计价策略乃至算法实现并直接运用于互联网流量

    变现课题的方方面面。无论是产品经理还是工程师,如若准备投身于这

    一互联网最大的金矿领域,此书是手边必须常备的工具书与教材。

    ——刘子正(@刘子正),微博常务副总经理

    本书内容全面且与时俱进,对核心技术的介绍深入浅出,是计算广

    告领域一本难得的好书。本书视野宽阔,涵盖了在线广告市场及核心技

    术的各个方面,除了主流技术以外,对一些其他著作很少涉及的方面,如广告创意优化、反欺诈、隐私保护等也进行了介绍。本书内容新颖,把近年涌现出的一些新的广告形式和技术,如实时竞价的广告交易、原

    生广告等,都囊括其中。另外,本书行文流畅、逻辑清晰,对核心技术

    的介绍深入到位,包含了重要的算法细节以及理论探讨,对计算广告的

    从业者而言,是一本非常实用的参考书。

    ——刘铁岩(@刘铁岩),微软亚洲研究院首席研究员

    在互联网深入改造传统行业的进程中,所谓“羊毛出在猪身上”的后

    向变现商业策略至关重要。市场上并不乏关于这一策略的推崇和讨论,不过本书从实战的角度出发,对其中关键的商业逻辑和产品结构作了全

    面的梳理,而这些对于商业化战略的落地至关重要。因此,我推荐所有

    正处在互联网化变革行业的从业者们阅读本书,结合各自的知识背景和

    行业问题,相信你们一定可以从本书中找到有指导意义的内容。

    ——陈彤(@老沉),小米内容运营和投资副总裁

    刘鹏博士是我以前在微软时的同事,他博学睿智,融会文理,给我

    留下深刻印象。他将多年积累的相关经验与成果整理成国内第一部正式

    出版的计算广告著作,值得向大家强烈推荐。这本书将该领域的实际商

    业问题与技术解决方案结合起来,让读者对计算广告的理论与实践、应

    用与技术、系统与方法有全面深入的了解和认知。对于已经掌握了机器

    学习、数据挖掘技术的从业者、技术人员、教师和学生,如果想进入计

    算广告及其相关领域,这是一部极佳的指南。

    ——李航(@李航博士),华为诺亚方舟实验室主任

    互联网业内人士都清楚流量的作用,流量之于互联网,正如血液之

    于人体。不同之处在于,互联网上的流量是趋利的,变现能力决定了流

    量的方向和价值。计算广告是流量变现最重要的方式之一。只有了解了

    互联网广告的精髓,才能真正懂得互联网上流量的奥秘,也才能懂得互

    联网的奥秘。本书作者对互联网广告的市场、产品和技术做了全面、深

    刻的剖析,为业内外人士理解并踏入这个领域提供了一条捷径。尽管本

    人从事互联网广告研发多年,也是第一次读到如此系统的著作,受益匪

    浅!

    ——沈抖(@沈抖),百度高级技术总监

    我们的团队花了大量精力寻找和调研国内外的相关资料和文献,却

    一直苦于没有一套相对完整的知识体系来帮助我们的业务和技术人员加

    快学习、少走弯路。因此,我期待这样一本书的出现至少已经有两三年

    的时间。作为一门方兴未艾而发展迅猛的新兴产业,我相信刘鹏的这套

    科学且实际的知识体系,将对数字营销领域的同仁有非常大的指导价

    值。程序化营销、大数据应用是发展异常迅猛的产业,涉及大量的产

    品、工程以及算法,也涉及相当多的商业逻辑的深刻洞察。而刘鹏通过

    对产业内在逻辑的诠释和推演贯穿程序化营销产业的发展,对我们真正把握大数据给各个产业带来的深刻变化和影响,具有深刻的指导意义。

    ——杨炯纬(@杨炯纬),360副总裁,聚效广告CEO

    如果说当年Yahoo! 广告首席科学家Andrei Broder在斯坦福开设的课

    程第一次把计算广告学作为一门学科,那么这本《计算广告》堪称这门

    新兴学科的第一本教科书,因为这是首次全面系统地阐述计算广告学的

    著作,覆盖了商业逻辑、产品结构、关键技术、工程实践和应用实例。

    在内容结构编排上,本书由浅入深,从宏观背景到技术细节,从经典的

    搜索广告到最新的实时竞价,既适合作为从事在线广告的商务运营人员

    的参考书,也适合作为一线技术开发人员的实战指导。

    ——余凯(@余凯西二旗民工),百度研究院副院长,深度学习实

    验室主任

    计算广告近年来特别热,全球大小互联网公司有大量的算法工程

    师、系统工程师、数据科学家在从事与此相关的工作。正如刘鹏在书中

    指出的,流量变现和数据变现是很多互联网公司商业模型的核心。虽然

    学术界和工业界有大量与计算广告相关的文章,但或侧重于算法,或侧

    重于系统,抑或侧重于商业逻辑,却很少能像本书一样把这几个维度融

    会贯通地串在一起,既有连贯性、有广度,又有足够的深度。刘鹏过去

    几年中花了大量的精力在清华大学、北京大学以及一些在线教育平台分

    享他对计算广告的深刻理解,影响了不少人,我过去和现在的团队都有

    他的粉丝、他的学生。现在刘鹏又把他对计算广告的深刻理解集结成

    书,能影响到更多的人。为刘鹏点赞!

    ——张小沛(@Joyce在路上),宜信CTO,前Hulu全球副总裁

    计算广告学纷繁复杂,刘鹏以一个科学的实践家的态度抽丝剥茧,全面、系统地阐述了其技术架构与产品生态,为入门者普及了概念,为

    从业者开阔了眼界。

    ——罗征,腾讯广点通总经理

    互联网广告在近十余年里一直保持着爆炸式的发展,支撑着谷歌、脸书、阿里、百度等数个百亿、千亿级互联网公司。或许其发展过于迅

    猛,或许其涉及领域过于宽泛,以至于近几年来一直没有一本优秀的书

    能够系统、全面地对互联网广告加以介绍。这本书把这件早就应该有人

    去做的事情漂亮地完成了。从业务模式到技术架构,从算法模型到工程

    实现,从理论基础到实现细节,从历史背景到最新动态,这本书都做了

    翔实、系统的讲解。相信对于每一位置身于互联网广告业的朋友,不论

    其在这纷繁复杂的行业里承担什么样角色,这本书真值得一读。

    ——顾大伟(@小米大伟),小米广告负责人

    很高兴看到刘鹏博士把自己在互联网广告领域的多年经验和智慧整

    理成书,其中既有他对商业产品的理解,也有算法和工程实现的总结。本书不仅第一次全面梳理了互联网广告产品形态,针对每个产品描述了

    相应的核心算法和系统实现,而且全面描述了以媒体和广告主为核心的

    生态圈,以及技术如何一步步促使生态圈演化,不断创造出更大的商业

    价值。对于互联网广告从业者来说,相信读后一定获益良多。

    ——贾志峰(@贾志峰Michael),汽车之家技术副总裁

    来自互联网创业者

    如果你正从事或准备进入互联网广告行业,本书应该是你的职业生

    涯中必不可少的读物之一。无论在中国或是放眼世界,作者以更深、更

    广的视角向读者展示了当今互联网行业的市场与技术。在享受互联网大

    数据带来乐趣的同时,书中介绍的中西市场案例将助力中国互联网从业

    者(包括产品技术人员)开拓创新思维。本书为推动中国互联网发展赋

    予了更重要的意义。

    ——闫瞾(@闫曌AdMaster),AdMaster创始人、CEO

    今天,大数据浪潮正在席卷全球。数字技术正在改变我们的生活方

    式,同样也在驱动着商业、营销和广告业的未来。营销不再只是关于策

    略、创意和idea的,更和技术的发展紧紧地捆绑在一起。进入 2015年

    后,我们看到全行业正在迎接大数据的风口,从数据的沉积分析和管理

    到数据的真正打通,这是一场时代的演进。刘鹏博士的这本书正是对这

    个变革时代营销技术变化的实录,他对最新数字广告技术方方面面的精

    到剖析,不仅是对广告知识体系的实时更新,更是对未来新的数字营销

    体系架构的有益探索。希望今天我们在勇于探索和开拓的也正是未来被

    写进历史的故事。

    ——吴明辉,秒针系统创始人、董事长兼CEO

    随着互联网的高速增长,广告开始往精细化发展,如何在有限的资

    源里获得最大化的广告综合收益是一个非常复杂、重要且有趣的问题,这也是计算广告研究的方向。刘鹏作为这个方向的专家,在本书中从计

    算广告问题的提出开始,介绍了计算广告的产品形态以及关键技术,非

    常适合互联网广告的从业者系统性地了解计算广告领域。

    ——周霖(@周霖-KCN),搜易贷联合创始人,前搜狐高级副总

    裁

    这本书逻辑清晰,非常贴近实战,值得网络广告从业人员仔细阅读

    与思考。无论是媒体、广告代理还是广告主,谁能更好地获取数据、理

    解数据、应用数据,谁就能在日益激烈的市场竞争中脱颖而出。

    ——赵士路(@赵士路),WiseMedia创始人、CEO

    互联网和移动互联网广告生态圈正在发生翻天覆地的变化,广告形

    式、产品形态、市场格局及产业链模式不断推陈出新,让人目不暇接。

    同时,基于营销大数据的计算广告技术也日益成熟。刘鹏博士的这本书将两者有机结合,既能帮助从业人员了解互联网广告全貌及流量变现的

    现状,也能帮助技术人员掌握计算广告的核心技术,是一本兼顾商业产

    品逻辑和技术实践的难得一见的佳作。

    ——唐健,智云众创始人、CEO

    互联网广告是一个千亿级的市场,如果把互联网比作一辆车的话,互联网广告就是汽油,因为大多数网站都是依靠广告盈利。刘鹏博士的

    这本书涉及大量的基础知识、概念和商业模式,是目前此领域比较全面

    的一本广告技术著作。书的内容深入浅出,讲述了搜索广告、广告交易

    平台、广告基本算法以及开源系统等重要概念,也介绍了不少相关广告

    技术公司以及他们在互联网广告这个产业链上的各种典型产品,非常适

    合从业人员以及有兴趣进入这一阳光产业的同学学习。

    ——唐朝晖(@唐朝晖_adSage),艾德思奇创始人、CEO

    过去5年是移动互联网发展最快的时期,开发者创造出如此多的应

    用和内容,用户行为习惯和数据积累发生如此惊人变化。在此过程中,在线广告作为最主要的变现形式,逐渐成为广大从业人员必须掌握的知

    识和技术。然而,由于此领域学习门槛较高,对于很多从业人员来说迷

    雾重重。大部分相关文章只是对于广告相关一些术语进行了罗列或介

    绍,无法让大家“知其然而知其所以然”。这本书的出版将弥补这一空

    白,它系统性地介绍在线广告的发展历史和逻辑,以及流行的程序化购

    买关键技术与算法。更为可贵的是,刘鹏在本书中融入了自己多年对于

    计算广告领域的理解和经验,使得整本书的思路和编排极为流畅。本书

    既适合想了解此领域的初学者或业务人员泛读,也适合专家以及产品人

    员对特定的知识点精读。本书将成为广大互联网从业人员必备的读物,特此重点推荐给大家。

    ——崔晓波(@崔晓波_TalkingData),TalkingData创始人、CEO

    来自媒体与行业专家

    本质上讲,互联网经济与广告经济都属于信息经济的具体技术形态

    或产业形态,核心要素是数据,经济学特征则是“所有能够传播信息的

    商品,其售价都会趋向其边际成本”。因此,确定数据商业化与广告产

    品化之间转换的逻辑、方法和路径极为重要,计算广告恰恰是这样一种

    经过多年实践的有效体系。刘鹏先生所著的这本书对相关的技术、创新

    与商业作了极好的刻画、梳理与论述。

    ——马旗戟(@马旗戟),原尼尔森高级副总裁

    这本书于我而言,是打开了一扇窗,让我看见了在巨大的互联网广

    告产业后面蕴含的数学模型和算法基础。计算广告学中蕴含的各种方法

    让我想到了管理方法论中很著名的一句话:“If you can’t measure it,you

    can’t manage it!”量化的方法使得计算广告学成为计算机科学与工程的一个崭新和重要的方向。非常感谢作者的知识分享。

    ——陈怀临(@湾区评论),弯曲评论创始人

    我有两个身份,既是从 20世纪开始工作的广告主,同时又是大学

    老师,但面对的却是一样的问题和困惑。营销方法尤其是广告形式推陈

    出新,众多科技层出不穷,受限于自身的学问背景,不可能全部都了

    解。所以有拜读本书内容的机会我特别欣喜,终于有由业内专家执笔且

    技术含量特别高、非常实用的书了。广告主可以从中了解不同的展现方

    式,利用书中的广告主在线营销决策过程择善而为。媒体也可以凭借类

    似的广告变现决策,揭示未来的发展方向。专业人员可以进一步了解背

    后的技术,找出最有针对性的广告投放,提升推广成果。因此,我非常

    推崇本书的实用价值及参考价值。

    ——杨仕名(@楊仕名),香港大学SPACE中国商业学院副总监,营销与传媒管理中心主任

    广告带来的后向变现是互联网经济中核心的变现模式之一,也是互

    联网商业模式的重要根基,而本书对这一领域作了一次全面的总结。我

    们希望互联网企业、广告服务和技术公司,以及艾瑞这样的数据服务公

    司,以本书的出版为契机,认真探讨互联网商业模式上的分工协作,推

    动行业的变革与发展。

    ——杨伟庆(@杨伟庆),艾瑞咨询总裁

    世界上有一种沟通是付费的,这就是广告的本质。然而,近几年互

    联网改变了整个广告生态的格局,目前世界上最叱咤风云的互联网公司

    几乎都依赖广告。刘鹏博士的这本书系统性地介绍了这种深层次的变

    化,以及整个产业链迸发出的各种技术手段与学问。此书由浅入深系统

    地介绍了几乎每个互联网广告的生态位置以及背后运作的机理,是我目

    前见过国内最系统的介绍计算广告的著作。此书对互联网、媒体、广告

    公司、市场营销人士,甚至消费者都是一本了解互联网广告的佳作。

    ——张迪(@广告技术流adexchanger),Adexchanger.cn创始人

    有了互联网才有了计算广告学:计算广告学把传统的无法定向投放

    和无法度量的广告变得可以定向投放和可以量化度量效果。刘鹏博士在

    工作之余,把计算广告学的系统性知识和多年实战经验总结成书,对从

    事计算广告的工程师和想了解计算广告的工程师都非常有帮助。

    ——张栋(@张栋_机器学习),前Google研究员

    对计算广告技术和商务人才的需求近两年迅速高涨,但计算广告是

    一个新兴交叉学科,一直缺乏全面系统的专著。这本书全面介绍了这一

    领域的商业背景知识、业务需求和详细的技术实现思路。本书一个重要

    特色是将该领域的商业挑战与技术的选择、应用、实现进行了融汇中西

    的系统化介绍,让不同知识背景的读者都能从中获得认识提升。此外,本书对于整个计算广告技术知识体系的梳理全面、准确,囊括了从业人

    士和学术研究需要关注和了解的主要知识点,对于已有一定基础和实践

    经验的读者也能从中温故知新和查遗补缺。此书的出版对于促进中国相

    关行业人才池的增长大有裨益。

    ——范秋华(@RTBChina),RTBChina创始人

    互联互通正领跑,眼球经济网民包。创收多多靠广告,变现书籍好

    难找。计算广告学走俏,廿年蔚然成林悄。理论实践兼顾到,刘鹏此书

    及时抛。入门登堂先介绍,市场规模大蛋糕。产品技术两面刀,块块切

    尝大与小。搜索推广竞价搞,合约展现包推销。程序交易争分秒,移动

    平台憋新招。信息流起人社交,原生广告置混淆。探索利用平衡高,点

    击建模测验校。背景逻辑打夯牢,核心技术窥其奥。照葫芦可画出瓢,立竿见影编码跑。十载面壁勤思考,刘鹏功成发大招。油翁多年练广

    告,情不自禁拇指挑!

    ——洪涛(@zhazhaba ),打油诗人,前百度高级科学家序一

    2009年11月,我在香港参加CIKM'09,听Andrei Broder等几位学者

    讲了一个导学课——Introduction to Computational Advertising(计算广告

    导论),耳目一新,觉得在我们的大学中应该有这样一门课。

    回来后了解了一下周围青年教师的情况,没有发现能够开这种课的

    人。后来,好像首先是在微博上,知道了刘鹏是这方面的专家。一联

    系,果然如此。与其探讨在北大开一次这种课的可能性,他欣然应允。

    时间定在2013年夏天,我安排实验室的青年教师彭波做助教,目的之

    一,就是希望通过助教工作学会计算广告这一套知识,然后独立在北大

    开出课来。

    刘鹏的课进行得很顺利,彭波每次都参加,我也去听过一次。2014

    年秋,彭波勇敢地开出课来了。课程结束后我问他感觉怎么样,他说内

    容太多,把握得还不好,而且没有教材,对老师学生都是个困难。

    其实,最初我请刘鹏来上课的时候就谈到过教材的问题。他答应考

    虑,但因为他在公司里的工作很忙,所以需要比较长的时间。但他没有

    忘记!两年多过去了,一天他给我发邮件说书稿完成了,希望我能为他

    的书写个序,令我十分欣喜。

    这本书不厚,但比较全面地覆盖了基于互联网服务的广告的市场背

    景、产品逻辑与关键技术,给出了一个宽阔的视野。作者基于多年的从

    业经验,从市场行为出发演绎对产品与技术的需求,而不是就技术讲技

    术,提高了本书的立意,因而也适合更广泛的读者群,包括计算机相关

    专业的研究生。应该说,这本书的风格不同于通常的教材,如果直接用

    于教学,对教师的要求会比较高,但不失为一本优秀的教学参考书。尤

    其是在其内容铺陈中展现出来的数据加工、利用与交易的思维主线,能

    让计算机专业的学生看到活生生的技术需求。而在互联网广告的背景下

    对数据的充分强调,让读者对大数据的意义有了一种更具体的体会。

    国内大学中的计算机专业教育(尤其是高年级和研究生的)现在困

    难和问题还比较多。比较明显的一点就是,教学内容的时代感不够强。

    这一点在广度和深度上都有反应。跟不上业界的发展,一些重要的课程

    不能及时有效地开,我认为“计算广告”就是其中之一。这种情况和蓬勃

    发展的信息技术和产业是不相适应的。因此,我们欢迎业界中对技术和

    产业有比较透彻理解且对教育有情怀的专家参与到大学教学活动中来,让我们的学生学到更多的真本事,适应产业发展的需要。刘鹏2013年在

    北大首开“计算广告”课程就是这样一种表率,他这本书的面世也是这个

    意义上的一种奉献,当予祝贺。

    李晓明,北京大学计算机系教授序二

    所有互联网公司都对广告变现的地位和价值并不陌生。在每一个用

    户产品成长的各个阶段,除了认真解决需求痛点、优化用户体验,也应

    该不断地对流量和数据的价值进行评估,并积极探讨商业变现的战略与

    产品。而在各种商业化产品当中,以计算为导向的广告变现无疑是最为

    重要的。

    在产品选型、开发和运营的初期阶段,如果能对产品未来产生的数

    据和流量价值有正确的评估,并了解如何利用广告产品将这些资产变

    现,对于判断该产品的成长空间和商业价值非常重要。另外,早期的产

    品推广会用到许多广告营销产品,而对于计算广告原理的深入了解也将

    有利于高效地做好营销。

    当产品得到市场认可,获得了一定的用户规模以后,积极制定系统

    性的商业化战略,用合理的变现方式获得现金流,从而支撑产品的快速

    发展,则是每一个互联网公司成长过程中必须经历的关键步骤。如果能

    洞悉互联网广告市场的产品技术全貌,无疑对此阶段的决策大有帮助。

    虽然广告技术在互联网行业至关重要,长期以来,却只有一些只鳞

    片爪的专题文章,对业界系统架构与算法的介绍,从世界范围来看,都

    非常缺乏系统性的整理和总结。这一方面是由于广告市场发展迅速,从

    搜索竞价到程序化交易,再到移动互联网下的原生广告趋势,日新月异

    的产品进化速度让整个工业界来不及停下脚步做小结;另一方面是广告

    产品的内在逻辑不像用户产品那样直觉,要进行全面透彻的整理和剖

    析,需要兼有丰富的实践经验和相当的理论抽象能力。也正由于缺乏系

    统性的资料,互联网工业界在这方面的人才培养也不够系统,导致在广

    告产品技术这样一个重要的领域,人才一直是短缺的。

    刘鹏博士曾经与我在搜狐集团有过一段时间的同事经历。从简短的

    几次接触中,我知道他在对媒体的流量变现和需求方广告产品方面都有

    丰富的实践经验,并曾在Yahoo! Labs对计算广告领域进行过系统性的研

    究,是对这一领域做全面总结的合适人选。如今,终于看到他不吝时间

    和精力,将计算广告领域的产品技术和商业逻辑整理成书,这将是令整

    个互联网工业界受益之举。

    带着期待读完本书,我的第一印象是,其内容全面而富有条理:本

    书既有计算广告全线产品的介绍,又有对其商业逻辑和原理的透彻解剖,还有对应的技术架构和关键算法的深入讨论。另外,除了受众定

    向、点击率预估、实时竞价等热点问题的讨论,还有详尽的周边产品和

    技术的介绍。相信认真读完此书的读者,一方面会对整个广告生态的全

    貌有全局性的了解,不会只见树木,不见森林;另一方面又可以按图索

    骥,再碰到各种实际问题时在本书中找到具体思路甚至解决方案。

    当然,本书的另外一项重要意义就是,它是计算广告领域第一本系

    统性的正式出版物。非常希望以此为契机,从合理配置资源的角度出

    发,整个互联网领域能够在流量和数据变现上逐渐走向标准化与分工协

    作。这也许会从一个侧面促进中国互联网企业摆脱恶性竞争的囚徒困

    境,走向合作共赢之路。

    最后,祝贺此书的出版,并希望它能够给你些许启示。

    王小川,搜狗公司 CEO序三

    广告营销处在历史转折点,技术对传媒的驱动和融合趋势让数字营

    销充满变数,这变化颇有乐趣却又让人不安。原因很简单,一方面,技

    术驱动下的数字生态百花齐放,程序化营销渐入佳境;另一方面,数字

    世界各式各样的广告技术概念让市场营销者感到困惑。

    不可否认,营销行业有专业的技术型人才和数据科学家帮助我们实

    践和创新这些技术,似乎有了需要的一切。可想象一下,某个下午时

    光,当和我们的客户坐在一起,他可能会问起这样的问题:未来你们能

    帮我们做什么?

    如果说技术代表营销的未来,那么技术到底是什么呢?技术为什么

    存在?技术可以帮助做些什么?我常想,要拨开这些技术迷雾,营销人

    具备的知识背景应该能跨越技术理解的盲点,能洞察到真正关键且清晰

    的归因,把这些问题的答案清晰和简单地传递给我们的客户。所以我期

    待行业中有人能把广告技术的真实情况和作用讲出来,无论是 DSP、DMP 或是RTB这些商业产品概念,还是“预测模型”“机器学习”和“人群

    定向”之类的技术名词。

    带着这个期待,我阅读了刘鹏博士这本广告技术专著。我想说,我

    的这些疑惑在阅读这本书的过程中都得到了解答或者找到了线索。

    刘鹏博士在互联网领域,特别是广告变现产品领域有着非常丰富的

    从业经验。从雅虎全球研发中心到微软研究院,再到今天作为360首席

    商业架构师,他既主持过需求方营销产品和供给方变现产品的设计开

    发,又兼有从产品到系统和算法的全面把握能力,而这些经验都成了本

    书丰富实用内容的基础。

    一本好的广告书不会大谈趋势,而是会从细节观察出发,探知商业

    逻辑;一本好的技术书不会大谈常识,而是剖析实践领域的真知灼见。

    刘鹏博士编写的《计算广告》就是这样一本跨越领域、兼而有之的作

    品。

    很愿意分享两点阅读感受。第一是繁纷复杂的数字生态和技术说

    辞,刘鹏对此做了系统的梳理和介绍,即使高度专业的产品概念、逻辑

    及算法应用,非技术背景的读者也能对这些概念建立统一的认识。第二

    是概念之外,书中列举了国际国内经典的广告平台产品,分析其形态、技术、策略,描绘了商业和产品之间相互关联、相互促进的有趣演进。这些来自于作者多年从业实践和积累并给营销人带来“互联网+”的思考

    角度更难能可贵。而书中列举了很多详实的数据和图例,反映了刘鹏博

    士对技术和治学的严肃态度。

    如果你需要了解在线广告的产品和技术,就应该马上行动,打开这

    本书,努力去学习和探索。

    愿每位从事数字广告事业的营销人,都能读到此书。

    李桂芬,安吉斯媒体集团大中华区首席执行官前言

    互联网的快速发展改变了整个世界。从门户网站到搜索引擎、从社

    交网络到电子商务,从免费Wi-Fi到应用市场,层出不穷的在线服务不

    仅方便了人们的生活,甚至颠覆了原有的产业。而且更为神奇的是,这

    些服务大多是免费的。在今天,“互联网思维”这个名词被越来越多互联

    网行业内外的人们追捧和畏惧,而其中很多人的困惑都在于:这么多免

    费的服务是如何获得收入,乃至赚得盆盈钵满呢?实际上,如果把多样

    的互联网产品或服务看成各式硬币的正面,那么我们会发现,其中许多

    硬币的背面都有着一样的图案,这就是以广告为核心的后向变现体系。

    正面的免费服务是为了获得流量和数据,而背面的广告业务则是将这些

    流量和数据变成金钱,这就是互联网最关键的思维模式之一。

    在能够获得充分的流量或高价值数据后,我们认为,所有能够传播

    信息的商品,其售价都会趋向其边际成本。这样的观点对许多传统行业

    商业模式的影响是深远的,也是我们认为大家应该在互联网时代深入了

    解广告、了解变现产品的原因。因此,本书的内容虽然以介绍互联网广

    告的产品和技术为核心,但并不是想让大家都学会搭建一个广告系统。

    我们的核心目的,是让读者在清晰地了解互联网广告全貌的基础上,在

    遇到与后向变现相关的产品问题时,能够以合理的思维逻辑和背景知识

    来应对。实际上,在互联网时代,不论你身处哪个行业,只要用心留

    意,会发现这类问题可能比你想象得更为常见,也更为重要。对其中最

    重要的几类问题,我们来看看下面几个具体的例子。(1)商业模式探索。例如,电影是一种边际成本很低,同时信息

    传播量又很大的典型商品。那么现在电影的票价为什么这么高?能否探

    索一种售价很低,而充分利用其信息传播能力的电影行业发行模式,获

    得更高的经济效益和社会效益?

    (2)流量变现。例如,互联网电视厂商除了硬件销售的回报以

    外,还可以获得一部分用户流量。这些流量的性质和价值如何,应该以

    什么方式变现?

    (3)数据变现。例如,室内导航技术是近年来快速发展的新型互

    联网应用。如果以向用户免费的方式运营室内导航产品,会得到什么有

    价值的数据资产,从而支撑相应的后向变现,又应该采用哪种具体的商

    业产品来支撑?

    (4)商业产品建设和运营。例如,团购、游戏联运、返利购买、积分墙这些推广模式与一般的展示或搜索广告有什么内在联系?是否可

    以共用某些产品和技术平台?

    这4类问题的典型性和价值不言而喻。不过,要回答这些问题,仅

    靠独立的深入思考是不够的,你还必须对当前互联网流量和数据变现市

    场的商业逻辑和产品现状有相当程度的了解,并在需要具体产品实施时

    有相应的方案可以参考和选择。而为读者提供这方面的帮助,正是本书

    希望能做到的。

    从传统的视角看广告,会有人认为互联网服务中的广告破坏了用户

    体验,这实际上是一种观念上的误解。首先,互联网广告不再像线下广

    告那样,以宣教性的横幅为主,而是以各种自动决策的付费信息的方式

    存在,这其中既包括传统的创意形式,也包括游戏联运、团购、返利、原生广告等更加契合用户意图的新传播形式。虽然,从微观上看,部分

    不顾及媒体价值、盲目变现的广告产品确实存在这样的问题,但从宏观

    上看,恰恰是因为广告这一后向变现模式的存在,互联网产品的整体用

    户体验才达到了前所未有的高度。在传统的企业中,一般会根据产品线

    分设若干事业部,每个事业部在研发自己产品的同时还要对营收和利润

    负责。而在互联网企业或者按照互联网方式运营的企业当中,还存在另

    外一种组织方式,即面向用户的免费产品部门只负责优化产品体验,不

    对营收负责,而专门面向客户的商业产品部门通过广告等后向变现方式

    为企业创造营收。实践证明,在这样的组织方式下,用户产品部门往往

    能够心无旁骛,专心为了提高用户体验而努力。因此,我们会看到,比

    起传统软件企业,互联网企业的产品在把握用户需求、优化用户体验方

    面往往能够做得更加优秀。

    因此,在互联网的世界里,广告不再只是广告公司的事,而是每一

    个互联网公司都要关心的事。从结果来看,在线广告实际上成为互联网最重要的发动机。从营收上看,它支撑着互联网业务的大半壁江山。当

    然,广告的概念本身在互联网业务中也已经发生了脱胎换骨的变化:首

    先,在互联网广告中,服务于中小商家、以直接销售为目的的广告取代

    品牌广告成为主流,这也创造了全新的巨大市场;其次,它的关键不再

    是创意、策略等人工服务,而是以数据支撑的流量规模化交易为典型特

    点。也就是说,机器和算法取代了人员与服务,成为在线广告最鲜明的

    特色。可以说,互联网广告的灵魂就在于数据与计算,因此,也就产生

    了“计算广告”这一名词以及后面复杂的产品与技术。

    计算广告这个课题,逐渐成形于以Google AdWords 为代表的竞价

    广告业务产生以后,并且在展示广告进入程序化交易阶段以后愈加成

    熟。而将其整理成一个新的研究方向,则要归功于时任Yahoo! 广告首

    席科学家的Andrei Broder。他在斯坦福开设的“Computational

    Advertising”这门课,第一次全面而系统地介绍了在线广告中的计算挑战

    以及工业界实用的算法。既然有了计算广告的相关课程,为什么还要再

    整理这本计算广告的书籍呢?首先当然是因为这一领域变化太快,在“计算广告”这个词诞生后的几年里,它的内涵和外延都已经发生了重

    大的变化,而且这几年的变化使得这个领域逐渐完备起来。因此,有必

    要在此时对当下的计算广告领域做一个阶段性的小结。另外还有一个重

    要原因:那就是我们在几次计算广告的教学实践中发现,对于在校学生

    或者刚刚接触此领域的朋友们来说,最主要的理解障碍不在于算法和技

    术本身,而在于广告的商业逻辑和产品目标。以此为出发点,本书的组

    织方式将以广告产品为核心。在清楚地了解计算广告的产品逻辑与商业

    价值的基础上,我们再来有针对性地讨论其中的算法和架构问题。因

    此,商业逻辑驱动的在线广告产品和技术的升级将是本书最重要的一条

    主线。

    另外,本书还有一条潜在的主线,即数据的加工、利用与交易。熟

    悉了计算广告业务和产品的读者会有认识,广告业务的收益只能来自于

    三个方面:数据、流量和品牌属性。其中后两点是媒体的专属,而大量

    的广告平台在做的事情,主要就是数据的加工与利用。不夸张地说,计

    算广告对于数据利用的广度和深度是空前的,而且产业的各环节也是比

    较完备的。在各行各业都在强调大数据思维与方法的今天,深入了解计

    算广告产品与技术具有特别强的范本意义。因此,本书在内容组织上特

    别强调数据这条线索,努力向读者解释清楚如何在广告产品进化过程中

    一步步地更有效地利用数据。

    读者对象

    既然在线广告不再只是广告公司的事,那么需要了解这一业务及其

    背后产品技术的人群也就相当广泛了。我们希望下面几类读者可以从本书中找到有价值的内容。

    (1)互联网公司商业化部门的产品、技术和运营人员。对互联网

    公司来说,商业化产品中最重要的就是广告产品,不过我们发现,囿于

    各公司具体的产品形态,仅仅从自己的业务中全貌地了解广告产品技术

    并不容易。因此,本书最主要面向的读者就是这些广告产品相关的人

    员,希望他们通过阅读此书,对互联网广告的全貌以及复杂的技术产品

    系列有整体的了解,避免只见树木不见森林。

    (2)对个性化系统、大数据变现或交易有兴趣者。计算广告在各

    种个性化系统中具有典型性,又因为其商业逻辑的存在而相对复杂;此

    外,计算广告还催生了对大规模数据利用和变现的直接市场。因此,推

    荐等个性化系统的产品技术人员以及大数据相关的产品技术人员都非常

    有必要通过了解计算广告的产品和技术,对个性化系统架构、约束下的

    效果优化、大数据变现和交易等诸多问题在实际工业界的落地有一定的

    理解。

    (3)传统企业互联网化进程的决策者。传统企业在互联网化的过

    程中需要借鉴的绝不仅仅是利用互联网的技术和产品,更重要的是按照

    互联网企业形成的高效运营和变现模式来改造传统业务。从这个意义上

    说,互联网企业以广告为基础的后向变现体系是整个互联网化过程中至

    关重要的一环。因此,在这样的传统企业中,互联网化进程的决策者对

    广告的原理和市场必须有一定程度的了解。

    (4)传统广告业务的从业者。传统广告业务与互联网广告业务既

    有密切的联系又存在着巨大的差别。以技术为导向、精准地面向受众的

    广告策略正深刻地影响这整个广告市场。并且随着互联网广告规模的迅

    速扩大,这样的策略越来越为广告主接受和青睐。因此,传统广告业务

    的从业者必须要顺应潮流,理解和运用计算广告的方法与策略,将线下

    资源与线上资源整合起来,才能更好地服务于广告主和媒体。

    (5)互联网创业者。我们接触过不少互联网行业的创业者,对他

    们来说,找到用户产品的痛点并漂亮地解决问题往往并不是十分困难。

    不过,一个企业最终需要的是利润,而许多对变现逻辑和思考方法不熟

    悉的创业者往往面对产品得到的流量和数据不知所措,而商业化进程的

    缓慢也会大大拖慢用户产品的运营进度,甚至因此错过企业的黄金发展

    机会。从这个意义上说,了解一些流量与数据变现的思路无疑会对创业

    方向的选择、创业过程的加速、创业果实的收获都有巨大的帮助。

    (6)计算机相关专业研究生。计算广告的人才在互联网行业相当

    稀缺,而目前学校对这样与工业界关系密切的实际问题在教育上是有些

    脱节的。我们整理此书的一个重要目的是希望为具有一定的计算机科学

    基础并且对工业界实际问题有兴趣的同学们提供一次指导旅行,让他们对思考和设计商业产品、运用技术解决产品问题形成正确的思考方法。

    内容组织

    前面说过,我们整理本书,并不是简单地为了介绍计算广告的产品

    和技术,更重要的目的是希望提供一个新的视角,让大家通过了解广告

    变现的内在逻辑,进而对互联网时代的用户产品如何将体验做到极致、将变现做到最高效有一个宏观的认识。在我们看来,如果不了解广告变

    现产品和市场,就谈不上真正透彻地了解互联网,也一定会在用户产品

    的设计和运营上有诸多掣肘。基于这样的目的,本书在内容上组织成三

    个部分。

    (1)第一部分介绍在线广告领域的一些基本问题和背景知识。虽

    然内容比较容易理解,但这部分是全书的基础,特别是对很多相关概念

    和术语的集中介绍,请不要略过。

    (2)第二部分主要面向产品、运营、销售等人员,以及互联网产

    品的宏观决策者,其内容重点在于介绍计算广告的市场结构、交易模式

    和主要产品。这部分内容将依在线广告产品发展的顺序展开,希望能帮

    助大家理解各种复杂的广告产品和交易机制产生的内在规律。

    (3)第三部分主要面向系统工程师、算法工程师和架构师。与前

    一部分的广告产品相对应,这部分也以在线广告产品发展的顺序,重点

    阐释实现各种广告产品的关键技术挑战,并提供基础的解决方案。

    一般来说,对于那些想运营一项在线广告业务,或者想了解如何用

    在线广告对用户产品怎样变现的读者来说,可以重点阅读第一部分和第

    二部分,并且对其中的产品与商业逻辑要深入理解;对于那些重点关注

    工程实现和收入优化的读者来说,在了解了前面两部分之后,还要花一

    些精力深入阅读第三部分,特别是其中与自己关注的广告产品相关的技

    术章节。计算广告这个领域的复杂性在于,对于任何一项产品或技术都

    需要放在相应的商业背景下去判断其合理性;而想要了解商业产品上能

    达到的目标,还需要对技术的现状和难点有相当的认识。因此,我们推

    荐的阅读方式还是尽可能地通读全书,对其中确实不相关或者知识背景

    上无法理解的部分简单跳过就可以了。另外,除第 10章外,其他各章

    结束后我们都准备了若干开放性的延伸思考问题。这些问题往往并没有

    确定的标准答案,只是为了帮助大家进一步深入思考该章中的关键或有

    趣的问题。

    在讨论在线广告市场的产品技术过程中,会涉及大量的术语和专业

    名词。对于对变现业务不太熟悉的读者来说,这些术语会给阅读带来一

    定的障碍。为了帮助读者检索和查找术语的相关内容,我们在附录中对

    主要术语及缩写给出了索引,以方便大家的阅读。

    由于篇幅限制,本书中有些内容的细节或背景知识无法全面展开,在这种情形下会给出相应的参考文献。但是由于本书并非学术著作,在

    引用文献时并不会保证完备性,因此当正文足以说明观点和方法时其原

    始文献不一定还会列出,请读者谅解。另外,在本书的第三部分中,为

    帮助读者理解,会对一些比较关键的算法给出相应的代码片段。不过本

    书中的代码都是示例性代码,目的仅仅是为了更清楚地描述逻辑,而并

    非可以直接编译执行的程序,其中一些特别容易理解实现的子函数调用

    也可能会略去其具体实现。

    本书的内容主要是由刘鹏在清华大学的公开课,以及在北京大学、北京航空航天大学的研究生课程的内容整理加工而成的,并且在整理时

    针对更广泛的读者群体做了内容本身和顺序上的调整。在两位作者中,刘鹏为主要执笔者,负责主体部分的写作和内容的整体组织,王超负责

    其中产品案例和算法示例代码的部分。由于作者的水平有限,再加上时

    间仓促,书中难免出现错漏之处,敬请读者多多批评指正。此外,本书

    撰写的过程中,我们邀请了一些业内的专家和从业者帮忙对内容进行把

    关,得到了他们的很多有益的建议,这些建议使本书更加完备和实用,我们在此一并表示感谢,并将其中部分专家对本书的评价附在书中。第一部分 计算广告关键技术第1章 在线广告综述

    在线广告,也称为网络广告、互联网广告,顾名思义,指的是在线

    媒体上投放的广告。与传统广告不同的是,在线广告在其短短十几年的

    发展过程中,已经形成了以人群为投放目标、以产品为导向的技术型投

    放模式。在线广告不仅为广告主带来了以准确接触目标受众为方法论的

    全新的营销渠道,也为互联网免费产品和媒体提供商们找到了规模化变

    现的手段。可以说,不论你在做一款用户产品还是商业产品,不深入了

    解在线广告,就不太可能全面地了解互联网业务。因此,所有互联网行

    业的从业者们花一些时间把现代的在线广告原理和产品搞清楚,不仅是

    有益的,而且是必须的。

    从另外一个角度,即数据的角度来看,在线广告开启了大规模、自

    动化地利用数据改善产品和提高收入的先河。可以不夸张地说,在过去

    相当长的一段时期内,大数据(big data)这一方法论在实践中唯一形成

    规模化营收的落地行业就是在线广告,只不过当年大数据这个词还不那

    么流行罢了。即便在今天,计算广告仍然是大数据应用中最为成熟、市

    场规模最大的行业。因此,对大数据感兴趣的读者认真研究在线广告发

    展过程中遇到的技术挑战和产品问题,会对探索其他的大数据应用有莫

    大的帮助。

    熟悉在线广告市场的朋友都知道,这一领域的产品形态和业务逻辑

    相当复杂。为了对在线广告有宏观上的把握,我们在本章中将从两个方

    面来探讨:一是它的内涵,即这种商业活动的定义与目的;二是它的外

    延,即在线广告发展的简要历史和发展过程中产生的关键产品形态。对

    其中的许多概念和观点,读者未必能够马上形成清晰的印象,然而随着

    内容的展开,读者能够剥茧抽丝般层层递进地加深理解,这正是本书希

    望做到的。另外,本章还有另外一个目的,就是尽可能集中地介绍互联

    网广告的产品和技术术语,以方便后面的讨论。

    相比传统的线下广告,在线广告的产品和创意形式由于互联网媒体

    形态、交互方式等方面存在非常大的差异,也呈现出各种各样的表现形

    式。我们也将对其中比较常见的创意形式作简要介绍,希望读者能对在

    线广告的具体表现有直观的了解。

    本章的内容与计算基本无关,目的在于让读者在进入计算广告领域

    之初就建立起一些重要观念。首先,广告不完全等同于搜索或推荐,它

    首先是一项商业活动,然后才是一项在互联网环境下需要技术优化的商业活动;其次,在这一商业活动中,广告主、媒体和用户的利益都需要

    被认真考虑和满足,这样才能达到整个市场的平衡和不断发展。在线广

    告市场所有产品和商业形式的演进,都是在这一主题下发生的。在商业

    逻辑的框架下思考和探索计算广告技术对理解本书中提到的产品、架构

    和算法非常关键。

    1.1 大数据与广告的关系

    近年来,大数据思维和技术渐成显学。然而,大数据这一概念至今

    为止并没有一个内涵上准确的界定。在参考文献[56]中,作者用

    Volume(规模)、Variety(多样性)、Velocity(高速)和Value(价

    值),即所谓的4V特征来描述大数据问题的特性,但并没有给出这类

    问题的界定标准。然而,从实际操作的角度来看什么是大数据问题或许

    要比理论上的定义简单一些:如果有的数据处理问题无法通过数据采样

    的方法来降低处理的复杂程度,就必须利用一些专门为海量数据处理而

    设计的计算和存储技术(如 MapReduce、NoSQL数据库等)来实现。于

    是,这样的问题也就从工程上归为大数据问题,图1-1阐释了这一视

    角。图1-1 大数据问题的特性示意

    在图1-1中,我们考察的是某一个有确定目标函数的数据处理问

    题。图中的三条曲线是三类有代表性的数据问题。

    (1)C类问题。从工程方便的角度来看,如果通过数据采样能够显

    著降低数据处理的复杂程度,同时解决问题的效果(即目标函数)没有

    太大的下降,那么显然应该这样做。这类问题可以用图1-1 中的 C 曲线

    来示意。由于可以通过很低的采样率解决问题,并不需要大规模分布式

    的计算架构,用传统的数据方案就可以解决,因此,这类问题应该归为

    传统数据处理问题,而非大数据问题。一般的统计报表、报告等往往属

    于这类问题。

    (2)A类问题。另外有一些数据问题基本上不可能通过只处理一

    小部分数据来达到处理全量数据所能达到的效果,或者说随着数据采样

    率的降低,解决问题的收益会快速下降,这类问题是典型的大数据问

    题,用图1-1 中的 A 曲线来示意。由于需要处理大规模的全量数据,传统的存储和计算架构都不再合适,必须寻找新的方案,这实际上是推动

    大数据技术发展的原动力。个性化推荐(personalized recommendation)

    和计算广告(computational advertising)需要用到每一个人的行为进行

    定制化推送,而无法只采样其中的一部分人来处理,因此可以认为是典

    型的大数据问题。大数据问题由于无法利用传统的计算架构和数据仓库

    来处理,因此才会产生Hadoop等新的基础设施和NoSQL数据存储等技

    术。

    (3)B类问题。当然,实践当中大数据问题和一般数据处理问题并

    不是泾渭分明的。有一些问题,其处理效果随着数据量的上升有一定提

    高,但当数据大到一定规模以后,再增加数据量价值就不大了,这类问

    题可以用图1-1 中的 B 曲线来示意。一个典型的例子是文本主题模型

    (topic model)。我们用 1000万文档往往会得到比 10万文档更稳定、更有意义的主题,然而用10亿文档和用1亿文档差别可能就会不那么明

    显。在解决这类问题时,往往是选取一个有较大规模但并非全量的数据

    集来处理。针对这种中等规模问题上的复杂算法,也产生了像Spark这

    样更加灵活高效的计算框架。

    很显然,从以上观点出发,计算广告是非常典型的大数据应用。实

    际上,在以往相当长的一段时期里,我们认为唯一得到充分商业化和规

    模化的大数据应用就是计算广告。计算广告为各行各业大数据的落地提

    供了非常有价值的借鉴范本,下面几点尤其值得了解和关注。

    (1)计算广告为规模化地将用户行为数据转化为可衡量的商业价

    值提供了完整产品线和解决方案,并且实际上创造了互联网行业大部分

    的营收。

    (2)在线广告孕育和孵化了较为成熟的数据加工和交易产业链,并对其中的用户隐私边界有深入探讨,这值得所有涉及用户数据的互联

    网应用学习和借鉴。

    (3)由于有了商业上的限制条件,计算广告的技术和产品逻辑比

    单纯的个性化系统更加复杂周密。因此,理解在线广告的产品和市场对

    于设计正确有效的商业产品大有益处。

    由于以上这些原因,如果你是一位从事大数据或商业产品的产品经

    理、工程师或管理者,我们强烈建议你认真了解一下广告的产品和技

    术,相信你一定会有很大的收获,也会快捷地了解到这一领域真正有挑

    战的问题是什么。本着这样的目的,我们在本书后续部分中将广告市场

    的产品和技术演进作为一条明的主线,而将这一市场对数据的利用程度

    作为一条暗的主线来展开。希望读者能够通过阅读本书,具体地了解数

    据是如何通过广告市场规模化地创造商业价值的。1.2 广告的定义与目的

    在了解计算广告之前,我们先从了解一般广告的目的开始。什么是

    广告?可以参考William F.Arens在《当代广告学》[3]

    中给出的定义:

    广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服

    务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的

    信息传播活动。

    这一定义中有两个关键点。首先,它指出了广告活动的两个主动参

    与方——出资人(sponsor)和媒体(medium)。在数字广告这样更加

    复杂的市场结构中,我们可以用一般性的术语来描述它们:需求方

    (demand)和供给方(supply)。这里的需求方可以是广告主

    (advertiser)、代表广告主利益的代理商(agency)或其他技术形态的

    采买方;这里的供给方可以是媒体,也可以是其他技术形态的变现平

    台。另外,要特别注意的是,广告还有一个被动的参与方,即受众

    (audience)。请大家从现在开始就牢牢建立起这样的概念:出资人、媒体和受众这三者的利益博弈关系是广告活动永远的主线,这一主线将

    贯穿于商业和产品形态的整个演化过程。另外,该定义还阐明了广告必

    须是有偿的、非人员的信息传播活动。这两点限制,前者使得广告的目

    标变得明确,后者使得这一目标可以采用计算的方式来优化,而这些都

    是计算广告产生的基础。

    广告这一商业行为,其本质目的是什么呢?在不同的时代,广告主

    与媒体对这一问题存在着不同的认知。在传统媒体时代,供给方与需求

    方在市场地位上有相当的距离,不论你运营的是电视台、机场或杂志,都与大多数广告主需要的转化行为之间有相当大的差距。因此,这一阶

    段广告的目的是希望借助媒体的力量来快速接触大量用户,以达到宣传

    品牌形象、提升中长期购买率与利润空间的目的。这种目的的广告称为

    品牌广告(brand awareness)。当然,也有许多广告商希望能利用广告

    手段马上带来大量的购买或其他转化行为,这种目的的广告称为直接效

    果广告(direct response),有时也简称为效果广告。

    在传统广告产品中,大量投送和优化效果广告的能力显然是缺乏

    的。这是因为,对短期效果的追求要求广告精准地送达目标人群,而这

    在传统媒体上缺乏有效的技术手段。我们能够想起的以效果为目的的传

    统广告恐怕只有在写字楼下散发的快餐传单,而数字媒体的出现使得效

    果广告空前蓬勃地发展起来。这主要有两方面的原因:一是数字媒体的

    特点可以让我们低成本地投送个性化广告;二是一些在线服务,如搜

    索、电子商务,由于可以更清楚地了解用户的意图,也就使广告效果的

    优化更加容易。互联网广告兼有品牌和效果两方面的功能。不过要说明的是,到目

    前为止,互联网广告行业的高速发展主要是由于效果广告市场带来的巨

    大红利。从表1-1[1]

    中可以看出,网络广告的市场规模发展迅猛;与此同

    时,传统广告渠道则增长乏力或快速下降。对比来看,网络广告的迅猛

    成长并没有直接带来电视广告的市场萎缩。这是因为网络广告的主要场

    景仍然集中在搜索引擎营销、效果类广告网络等直接效果类的广告活动

    上,而这部分相对于电视的品牌广告更多地是增量而非替代。另一方

    面,报纸广告则随着互联网的快速崛起而下降,这一方面是因为报纸占

    据的用户时间大幅被互联网抢走,另外也是由于报纸上一部分的分类信

    息广告与互联网效果类广告重叠较大。目前,随着数字媒体越来越多地

    占据了人们的时间以及在线视频等冲击力更强的媒体的普及,网络渠道

    也必将在品牌广告方面有更多的用武之地。

    表1-1 中美主要广告市场规模(单位:亿美元)

    既然有品牌和效果这两种目标,究竟如何描述广告这种商业活动的

    根本目的呢,我们仍然借用《当代广告学》中的见解:

    广告的根本目的是广告主通过媒体达到低成本的用户接触。

    也就是说,按某种市场意图接触相应的人群,进而影响其中的潜在

    用户,使他们选择广告主产品的几率增加,或者对产品性价比的苛求程

    度降低,这才是广告的根本目的。至于短期内的转化效果,由于市场意

    图或媒体性质的不同,并不是直接可比。换句话说,如果仅仅以转化效

    果为目的来思考问题,可能会背离投放广告的正确方法论。举个例子,某感冒药广告商如果以短期效果为导向,那么最佳的策略是把广告投放

    给那些现在感冒的人,不过这显然是一个荒谬的决策;再比如,某汽车

    广告商为了提升自己的品牌形象,希望对自己竞品品牌的用户加强宣

    传,而对于这部分人群,广告的直接效果甚至有可能比随机投放还要差。认清这一概念,使得大家在遇到多种广告渠道的效果比较时能够避

    免偏颇的结论。关于这一点,有所谓整合营销(integrated marketing)

    的概念,即通过多种渠道的有机配合来达到整体投放效果的最优,这并

    非本书讨论的重点,有兴趣的读者可以参考其他文献。

    广告的“低成本”是与那些由市场或销售人员完成的劝服活动成本相

    对而言的,实际上是广告搭了媒体流量和影响力的便车。要确定是否真

    的成本较低,需要用到投入产出比(Return On Investment,ROI)这一

    评价指标,即某次广告活动的总产出与总投入的比例。在实际中,广告

    活动的总投入容易确定,但总产出的确定却不那么容易,特别是在投放

    以中长期收益为目标的品牌广告时。因此,绝对的 ROI 有时难以计

    算,不过通过各个渠道之间的对比,我们仍然可以评估广告的成本是否

    令人满意。

    需要说明,在互联网环境中,广告的本质虽然没有变化,但是由于

    大量直接效果需求的产生,其表现形式越来越丰富和灵活了。不论是与

    线下类似的横幅、搜索竞价排名,还是软文,甚至是表面上与广告并不

    相干的游戏联运,其本质都是付费的信息推广,从产品和技术的角度来

    看都可以归在广告的范畴下。因此,对于互联网广告,我们有如下的认

    识:

    一切付费的信息、产品或服务的传播渠道,都是广告。

    那么,在线广告主要有哪些表现形式呢?我们将在1.3节中介绍。

    1.3 在线广告创意类型

    在线广告除了产品有诸多形态,与用户接触的创意形式也有多种多

    样的选择,并且随着互联网产品的发展变得越来越丰富。诸多在线广告

    的创意类型在投送方式和用户交互方式等方面有不同的选择,下面我们

    对其中一些常见的类型进行简要介绍。

    (1)横幅广告(banner ad)。这是展示广告中最传统也是最典型

    的形式。横幅广告一般是嵌入在页面中相对固定位置的图片,需要占据

    固定的版面,因此,这种广告一般要有底层的备选广告素材,以防没有

    合适的广告匹配时页面上开天窗。目前,横幅广告大多数也都不再是静

    止的图片,而是由Flash或其他技术方式实现的动态素材。图1-2中给出

    了横幅广告的一个示例。图1-2 横幅广告示例

    (2)文字链广告(textual ad)。这种广告的素材形式是一段链接

    到广告主落地页的文字,在搜索广告中为主流形式,同时在展示广告中

    也被广泛采用。文字链广告有时像横幅广告那样占据固定的版面,有时

    也可以穿插在大量内容链接条目中。在后一种情形下,广告投放引擎可

    以灵活决定是否投出该文字链广告,以及投出的条目数。典型的例子就

    是搜索广告,如图1-3所示。

    图1-3 文字链广告示例

    (3)富媒体广告(rich media ad)。这类广告往往是利用视觉冲击

    力较强的表现形式,在不占用固定版面位置的情况下,向用户侵入式地

    投送广告素材。富媒体广告常见的形式有弹窗、对联、全屏等。它比较

    适合在高质量的媒体做一些品牌性质比较强的广告投放,但是对用户的

    使用体验往往影响也较大。富媒体广告与横幅广告不同,在未售出的情

    况下可以静默,因而没有防天窗的问题。一些门户网站的首页有时会为

    某个品牌广告主提供专门定制的、交互形式很复杂的富媒体广告,这样

    的广告一般不采用按人群投放的逻辑,也主要强调创意的冲击力和交互

    形式的特色。图1-4中给出了一个富媒体广告中的弹窗广告示例。图1-4 富媒体广告示例

    (4)视频广告(video ad)。随着在线视频的快速发展,在视频流

    播放的间隙插入的广告也成为互联网广告的一种重要形式。根据插入位

    置的不同,视频广告又可以分为前插片、后插片、暂停等类型。视频广

    告由于载体的独特性质,其效果和广告创意比较类似于线下的电视广

    告。相应地,有关视频广告的效果评价,除了计算与横幅广告一样的点

    击率,还可以采用用户观看时长等更接近于用户印象的指标。

    视频广告有两种最主要的形式:在视频内容播放之前的前插片广告

    以及视频播放暂停时的广告。图1-5 中给出了这两种视频广告形式的示

    例。前插片广告一般采用短视频的形式,创意的冲击力和表现力要远远

    强于普通的展示广告,因此价格往往也比较高;暂停广告则与普通的横

    幅广告区别不大。图1-5 视频广告示例:前插片广告(左)暂停广告(右)

    (5)社交广告(social ad)。社交网络的兴起给广告的传播渠道和

    能力都赋予了新的空间。在社交网络环境下嵌入的广告可以通称为社交

    广告。社交广告中最典型的形式是插入在社交网络信息流中的广告,这

    种方式最早见于Twitter,产品称为“Promoted Tweets”。这种方式力求在

    用户自然关注的交互过程中尽可能自然地插入广告,也被归于原生广告

    的范畴中。我们认为,“社交广告”与“社交网络中的广告”是两个不同的

    概念,如在社交网络页面上竞价售卖的文字链或横幅广告,其本质并不

    因为处于社交网络中有太大的变化。社交广告希望达到的效果是通过用

    户的扩散式传播获得更大的影响力和口碑,从这个意义上讲,在信息流

    的交互中挖掘价值前景光明。图1-6中给出了社交网络信息流广告的一

    个示例。图1-6 社交网络信息流广告

    (6)移动广告(mobile ad)。移动互联网在近几年爆发式地增

    长,并且大有取代桌面互联网之势。严格来说,移动互联网上的广告形

    式与桌面电脑上的广告没有本质的区别,不过由于移动设备上应用的大

    量普及,广告也由 Web 访问的页面上搬进了应用里。于是,也产生了

    在应用中插入广告的SDK和相应的广告网络。目前移动广告典型的形式

    有横幅、开屏、插屏、积分墙或推荐墙等。图1-7中给出了移动广告形

    式的一些示例,我们将在第7章中具体讨论与移动广告和原生广告相关

    的产品问题。

    (7)邮件定向营销广告(E-mail Direct Marketing,EDM)。这是

    通过电子邮件的方式向目标用户传递推广信息的一种网络营销手段。与

    上面各种广告形式都不同,EDM是一种主动的广告形式,它不需要等

    到用户接触的机会出现时才被动地提供广告,而是可以随时向认为合适

    的用户发送推广信息。不过也正因为如此,EDM非常容易变成垃圾邮

    件的主要来源。因此,对EDM的运营者而言,精准地把握用户兴趣、非常有节制地提供对用户用价值的相关信息是非常关键的。比起展示广

    告,EDM 中受众定向的利用更加直接,也更为重要。图1-8中给出了邮

    件营销广告的一些示例。另外,通过短信、iMessage等方式投放的广告

    与邮件营销广告也非常相似。

    图1-7 移动广告形式示例

    图1-8 邮件定向营销广告(EDM)示例

    当然,由于广告的本质是一切付费的信息、产品或服务的传播渠

    道,在线广告实际上的产品范畴远远不是上面介绍的这几种创意形式可

    以包罗的。除了上面这些以创意为载体的推广的狭义广告形式,还有很

    多的付费推广类商业产品也可以认为是广义的广告产品,其本质的产品

    技术框架与普通广告非常类似,我们将在1.5节进一步介绍这些泛广告产品。

    1.4 在线广告简史

    在讨论广告技术之前,我们先浏览一下在线广告发展的历程。因为

    广告市场的概念、技术和术语繁多,如果不是对这些有基本的了解,很

    难深入探讨具体的产品。

    回到 20 世纪末,那时的在线媒体(如 AOL、Yahoo! 等网站)刚刚

    产生不久。他们已经取得了不错的流量规模,可是投资人当然希望这些

    媒体也能够给他们带来真金白银。要对这些线上流量进行变现,最直接

    的方法就是把网站的 HTML页面当成杂志的版面,在里面插入广告位。

    供给方有了,那么需求方呢?线下的广告代理公司也就把这些网站当成

    一本本新的杂志,按原来的思路和逻辑进行采买。这种在互联网上展示

    广告创意的产品形式称为展示广告(display advertising),也叫显示广

    告。这一阶段的展示广告售卖模式称为合约广告(agreement-based

    advertising),即采用合同约定的方式确定某一广告位在某一时间段为

    某特定广告主所独占,并且根据双方的要求,确定广告创意和投放策

    略。当然,这样的采买模式还没有对计算的需求,因为此时唯一需要的

    就是把广告主的创意作为一个HTML的片段插入到媒体的页面中。然

    而,情况变化很快,互联网媒体为了营收的增长,希望逐年甚至逐季提

    高自己的广告位报价。在流量快速增长或者数字广告逐渐为广告主认知

    的阶段,提价是比较容易被市场接受的。可是当媒体的流量和品牌认知

    度都相对稳定以后,又有什么新的提高收入的办法呢?

    互联网广告运营者们经过探索,很快就发现了在线广告不同于传统

    媒体广告的本质特点:我们可以对不同的受众呈现不同的广告创意!在

    今天看来再平常不过的这个观念,实际上是在线广告的效果和市场规模

    不断发展的核心驱动力。认识到这一点,媒体找到了一条能使广告位报

    价继续提高的思路。例如,可以把某广告位的男性受众和女性受众卖给

    不同的广告主,比如对男性受众展示某剃须刀品牌的广告,而对女性受

    众展示某化妆品品牌的广告。这样的广告投放方式称为定向广告

    (targeted advertising)。很显然,这样的广告系统已经对计算技术产生

    了两个具体需求:一是受众定向(audience targeting),即通过技术手

    段标定某个用户的性别、年龄或其他标签;二是广告投放(ad

    serving),即将广告投送由直接嵌入页面变为实时响应前端请求,并根

    据用户标签自动决策和返回合适的广告创意。由于从传统的品牌广告延

    伸而来,此时的定向广告仍然以合约的方式进行。媒体向广告主保证某

    个投放量,并在此基础上确定合同的总金额以及投放量未完成情况下的赔偿方案。这种担保式投送(Guaranteed Delivery,GD)的交易方式逐

    渐成为互联网合约式广告的主要商业模式。一般来说,这样的合约仍然

    主要面向品牌广告主,并且遵循按千次展示付费(Cost per Mille,CPM)的计费方式。

    合约广告系统中有一个重要的计算问题,即在满足各合约目标受众

    量要求的同时尽可能为所有广告商分配到质更好的流量。这一问题有两

    个难点:一是如何有效地将流量分配到各个合约互相交叉的人群覆盖

    上;二是要在在线的环境下实时地完成每一次展示决策。这个问题称为

    在线分配(online allocation)。如果将各合约的量看作约束条件,将某

    种度量下的质看作目标函数,可以利用带约束优化(constrained

    optimization)的数学框架来探索这一问题。为了得到在线环境下切实可

    行的解决方案,学术界和工业界的同仁在理论和工程方面进行了大量的

    研究,有一些高效且简便的实用方案已经为各媒体广泛采用。

    需要注意,展示广告领域定向投放的最初动机是供给方为了拆分流

    量以获得更高的营收。如果一开始就提供非常精细的定向,反而会造成

    售卖率的下降。因此,最初的定向标签往往都设置在较粗的粒度上,最

    典型的是一些人口属性标签。受众定向显然更符合需求方的口味和利益

    ——不要忘了,广告市场的钱全部是来自需求方的,他们的利益被满足

    得越好,市场的规模就会越大。因此,受众定向产生以后,市场向着精

    细化运作的方向快速发展。这一发展主要有两方面的趋势:一是定向标

    签变得越来越精准;二是广告主的数量不断膨胀。在这些趋势下,仍然

    按照合约的方式售卖广告会遇到越来越多的麻烦。首先,很难对这些细

    粒度标签组合的流量做准确预估;其次,当一次展示同时满足多个合约

    的时候,仅仅按照量约束下的在线分配策略进行决策有可能浪费掉了很

    多本来可以卖得更贵的流量。既然量的约束带来了这些麻烦,有没有可

    能抛弃量的保证而采用最唯利是图的策略来进行广告决策?这样的思路

    催生了计算广告历史上革命性的产品模式——竞价广告(auction-based

    advertising)。在这种模式下,供给方只向广告主保证质即单位流量的

    成本,但不再以合约的方式给出量的保证,换言之,对每一次展示都基

    本按照收益最高的原则来决策。

    上面是从展示广告的发展看竞价产生的原因,实际历史的足迹却并

    非如此。竞价广告产生的最初场景是在互联网广告最主要的金矿——搜

    索广告(search ad)中。在以 Google 为代表的搜索引擎在技术成熟以

    后,迅速成为互联网新的入口。与门户网站不同,搜索引擎从一开始就

    没有被当作媒体来看待,因此搜索流量的变现也采用了与服务自然结合

    的付费搜索(paid search 或 sponsored search)模式。从广告的视角来

    看,也可以把付费搜索看作一种定向广告,即根据用户的即时兴趣定向投送的广告,而即时兴趣的标签就是关键词。很显然,这种定向广告从

    一开始就直接达到了非常精准的程度,也就很自然地采用了竞价的方式

    售卖。

    搜索广告产生了巨大的收益以后,搜索引擎开始考虑将这样的变现

    方式推广到其他互联网媒体上:将用户的即时兴趣标签由搜索词换成正

    在浏览页面中的关键词,可以将这套竞价广告系统从搜索结果页照搬到

    媒体页面上,这就产生了上下文广告(contextual advertising)。上下文

    广告的初期,创意的形式也是与搜索广告一样的文字链接。许多产品讨

    论将它与展示广告分开对待,不过当我们把它与上一段中精细化定向的

    展示广告对比来看时就知道,这样的区分实际上没有必要,或许从创意

    形式上把展示广告和文字链广告区别开更符合分类的逻辑。

    从宏观市场上看,竞价广告与合约广告有很大的不同。没有了合约

    的保证,大量的广告主处在一个多方博弈的环境中。与直觉不同的是,在如何收取广告主费用这一点上,我们并非按照微观上最优的方案实施

    就可以达到整个市场最大的收益。关于定价机制的深入研究,产生了广

    义第二高价(Generalized Second Price,GSP)这一竞价重要的理论。

    基于竞价机制和精准人群定向这两个核心功能,在线广告分化出了

    广告网络(ad Network,ADN)这种新的市场形态。它批量地运营媒体

    的广告位资源,按照人群或上下文标签售卖给需求方,并用竞价的方式

    决定流量分配。广告网络的结算以按点击付费(Cost per Click,CPC)

    的方式为主,这一点有数据和业务方面多层次的原因,在本书的后面会

    详细探讨。虽然我们不太能指这种方式的千次展示收益(Revenue per

    Mille,RPM)可以达到合约式品牌广告的水平,但它使得大量中小互

    联网媒体有了切实可行的变现手段:这些媒体有一定的流量,但还不值

    得建立自己的销售团队面向品牌广告商售卖,直接把自己的广告库存

    (inventory)托管给ADN,借助ADN的销售和代理团队为自己的流量变

    现。

    ADN既然只通过出价接口提供价格约定,那么由谁来保证量呢?自

    然会有需求方的某种产品来完成。当ADN产生以后,代理公司当然也要

    对广告采买方式做出调整,因为此时的流量采买发生了几点显著变化:

    一是更多地面向受众而非媒体或广告位进行采买,这当然是与受众定向

    的流行有直接关系;二是需求方的代理需要采用技术的手段保证广告主

    量的要求,并在此基础上帮助广告主优化效果。这又是一个与在线分配

    类似的带约束优化问题。但是实际上,这个问题有着本质的不同:由于

    只能在ADN定义好的定向标签组合上预先指定出价,而不能控制每一次

    展示的出价,因此,市场看起来像一个黑盒子,需求方只能靠选择合适

    的标签组合以及阶段性调整出价来间接控制效果。这种面向多个ADN或媒体按人群一站式采买广告并优化投入产出比的需求方产品,我们称为

    交易终端(Trading Desk,TD)。

    在ADN中,核心的竞价逻辑是封闭的,这不能满足需求方越来越明

    确的利益要求。试想下面两个例子:(1)某电子商务网站需要通过一

    次广告投放来向它的忠实用户推广某产品;(2)某银行希望通过自己

    的信用卡用户在网络上找到类似的潜在用户群,并通过广告争取这批潜

    在用户。很显然,ADN 很难直接为这两个需求提供人群标签。定制化

    需求催生了一种开放的竞价逻辑,让需求方按自己的人群定义来挑选流

    量,这就是实时竞价(Real Time Bidding,RTB)。它是将拍卖的过程

    由广告主预先出价,变成每次展示时实时出价。只要把广告展示的上下

    文页面URL以及访客的用户标识等信息传给需求方,它就有充分的信息

    来完成定制化的人群选择和出价。于是,市场上产生了大量聚合各媒体

    的剩余流量并采用实时竞价方式为他们变现的产品形态——广告交易平

    台(ad Exchange,ADX)。这个名称让我们很容易联想起股票交易

    所。事实上,如果我们把ADN的交易方式想象成场外交易市场(over-

    the-counter market),那么ADX与股票交易所确实有着类似的作用。

    通过实时竞价的方式,按照定制化的人群标签购买广告,这样的产

    品就是需求方平台(Demand Side Platform,DSP)。由于实时竞价主要

    采用按展示次数计费的方式(本书后面部分会具体讨论其原因),DSP

    需要尽可能准确地估计每一次展示带来的期望价值。在这一点上,DSP

    比TD要方便多了,因为充分的环境信息使得深入的计算和估计成为可

    能。基于DSP的广告采买非常类似于股票市场上的程序交易,我们把这

    样的广告采买方式也叫作程序化交易(programmatic trade)。除了RTB

    以外,还有其他几种程序购买的交易方式,如优选(preferred deals)以

    及私有交易市场(Private Market Place,PMP)等。可以预见,在线广

    告中程序化交易的作用和地位将会不断加强,这是由数字广告的本质特

    点以及广告主利益最大化的趋势所决定的。

    初次接触在线广告的读者可能对这部分中提到的大量概念和商业逻

    辑感到无所适从。不过没关系,上面所有用楷体字标出的关键概念在本

    书后面章节出现时会进行详细讨论。而我们写这一段的目的也仅仅是让

    大家对本书讨论的范畴有一个全局性的认识,从而在后面章节中接触到

    某个具体问题时不会只见树木,不见森林。

    由于在线广告存在着较为复杂的市场结构,LUMA Partners 对北美

    市场的主要代表公司进行非常全面的总结,并绘制成了图1-9中

    的“display LUMAscape”[2]。这一图谱的骨架与上面我们介绍的在线广告

    简史有着非常紧密的联系,因此也是本书在广告产品方面重要的提纲。

    基本上可以说,这一图谱是从两端向中间逐渐发展和形成的:首先是合约阶段,广告主通过代理公司从媒体方采买广告,而媒体方的广告投放

    机则负责完成和优化各个广告主的合约;然后,市场进化出了竞价售卖

    方式,从而在靠近供给方产生了ADN这样的产品形态,而需求方的代理

    公司为了适应这一市场变化,孵化除了对应的媒介采买平台(media

    buying platform);最后,当市场产生了实时竞价方式交易时,供给方

    进化出了 ADX,而需求方则需要用DSP与其对接来出价和投送广告。

    图中的下半部分,多是一些对这一骨干市场结构起支持作用的产品或者

    在细分领域的特异化产品。我们在后面介绍到相关部分时,将会给出相

    应的介绍。图1-9 LUMA总结的展示广告市场结构和代表公司图谱

    图1-9中的个别术语与本书略有区别(如媒介采买平台),我们会

    在书中用相近似的产品概念TD来代替,请大家留意。

    总结一下,在在线广告发展的历史上,定向技术和交易形式的进化是一条主线。从最初的固定位置合约交易发展到进行受众定向、按展示

    量结算的合约交易,再到竞价交易方式,并最终发展成开放的实时竞价

    交易市场。这条主线的核心驱动力是让越来越多的数据源为广告决策提

    供支持,从而提升广告的效果。除了这条交易形态的主线,互联网广告

    产品还有另外一条发展线路,即产品展现逻辑上的发展:在展示广告的

    最初阶段,广告位作为与内容相对独立的单元来决策和运营,并且完全

    以优化收入为目标;但同时,人们从搜索广告和社交网络信息流广告中

    得到了启发——将内容与广告对立起来未必是一个好的选择。搜索广告

    和社交网络信息流广告这两种广告产品正是由于与内容的展现和触发逻

    辑有着高度的一致性,才使得它们的效果突出。沿着这样的思路,将内

    容与广告以某种方式统一决策或排序的广告产品——原生广告(Native

    AD)在近年来得到了工业界越来越多的关注。如何将原生的决策方式

    与前面介绍的广告市场已经非常成熟的规模化交易逻辑相结合是目前互

    联网广告产品发展的热点。需要特别说明的是,原生广告的思路在移动

    设备这样屏幕尺寸受限的环境下将会成为一个非常有前景的发展方向,这方面的进展我们将在第7章中具体讨论。

    1.5 泛广告商业产品

    下面要讨论的这些泛广告商业产品的本质都是付费推广。虽然这些

    付费推广模式的表现方式更加多样化,用户的感知程度和参与程度也大

    不相同,但是产品和销售模式却与狭义广告基本相同。希望读者在看完

    此书以后,能够认识到这些商业产品本质上也是在线广告,能够以统一

    的视角来理解和规划这些变现方式。图1-10 团购产品示例

    (1)团购。团购本质上是一种按照效果付费的泛广告产品,其特

    殊性在于广告主除了付推广费用外,还向用户让利以获得转化。团购推

    广的主要广告主是一些本地化的店铺,主要目的是为了获得新客户。如

    图1-10 所示,对团购平台来说,团购商品在一定环境下的排序与广告是

    一样的问题。不过团购销售很少采用竞价的方式,而多是预先约定价

    格。另外,团购的广告库中是付费信息而非创意,这有利于发展原生广

    告的推广方式,参见第7章。

    (2)游戏联运。游戏联运根据用户的最终游戏内消费在推广渠道

    和游戏开发商之间分成的商业产品,这仍然是一种按效果付费的泛广告

    产品。在页游和手游的推广中,联运是一种非常常见的发行模式,读者

    在各种产品中看到的图1-11所示的游戏下载专区,其背后的商业模式往

    往都是联运。实际上,在中国的各大Android应用市场中,游戏联运的

    收入远远超过其他类型的广告收入。如果将联运收入也算在广告收入中

    的话,互联网总体收入的广告占比还会提高不少。不同的联运渠道分成

    比例可能相差很大,经过我们调研,在Apple Store这样典型的国外市场

    中,渠道的分成比例一般为30%,但是在中国,有些强势的联运渠道分

    成比例甚至可以达到 90%以上。游戏联运也完全可以按照广告产品思路来设计和运营,另外其广告库同样具有易于原生化的特点。

    图1-11 游戏联运产品示例

    (3)固定位导航。这主要包括网址导航站的位置入口(如图1-12

    所示)、应用分发平台的推荐位置等付费推广位置。一般来说,这种产

    品的销售都采用按时间付费的固定位模式,而不是动态的竞价决策模

    式。这是因为广告主除了引流以外,往往更加关注这些入口位置的橱窗

    效应。这种广告的销售和运营模式与按天购买的合约广告相同。

    (4)返利购买。返利购买是电商行业常见的一种推广模式,它与

    团购有些类似,也是采用折扣或积分的方式激励用户购买。显然,这种

    方式可以获得非常高的ROI,但是也会带来一些老用户转而由返利网下

    单,因此实际的效果远没有那么好,特别是在获取新客户方面的价值值

    得考量。

    需要特别说明,当一个公司同时运营普通广告和上述一种或多种泛

    广告产品时,它们之间甚至是和用户产品之间,经常会出现争夺广告位

    或其他入口资源的问题。面对这样的问题,最合理的分配方式是通过它

    们之间的竞价来决策,这是非常重要的内部流量货币化的运营理念。图1-12 网址导航产品示例

    1.6 延伸思考

    1.考虑到品牌广告和直接效果广告的目的性差异,两者在创意设

    计、投放策略、媒介选择等方面应该有什么区别?

    2.请你从自己熟悉的领域中找出几个泛广告产品的例子,并探讨其

    与典型广告产品的区别。第2章 计算广告基础

    从现在开始,我们开始接触在线广告中与“计算”有关的问题。在线

    广告中计算到底是为了解决什么问题,以及解决这些问题需要什么样的

    业务描述框架,将是本章重点关注的内容。

    我们将先对传统广告中发展起来的广告有效性理论做简要的回顾。

    通过把广告产生效果的过程分解为若干阶段,并讨论其中各阶段关键的

    影响因素,可以对在线广告情形下受众定向、创意优化及其他有价值的

    技术点有感性认识。虽然这部分与具体的计算技术无关,却对计算广告

    中的一些根本原理有深入的揭示,希望读者有所了解。

    在互联网广告中,计算之所以可以发挥巨大的作用,与它的一些根

    本技术特点有很大关系,这是本章的出发点。总的来说,可衡量的效果

    以及相应的计算优化是在线广告区别于线下广告的主要特点。在这些特

    色的基础上,我们对Andrei Broder提出的计算广告核心挑战稍做推广,得到贯穿本书的计算广告核心问题,即利润优化问题的概念性框架。

    在大多数广告产品中,可以通过计算优化的主要是收入部分。而千

    次展示期望收入(expected Cost Per Mille,eCPM)正是计算广告中最为

    核心的量化指标之一。与广告的信息传达过程相关,eCPM又可以分解

    为点击率和点击价值的乘积,这两个指标是各种广告产品在计算过程中

    经常碰到的,也是产品运营需要深入理解和重点关注的。

    同时,这样的收入分解方法还对在线广告产品市场结构和计费方式

    的理解很有帮助。大家将会看到,在线广告多种多样的计费方式实际上

    反映着市场结构的分工不同。具体来说,供给方和需求方如何分工估计

    点击率和点击价值,与整个市场的资源优化配置有关。对若干常见计费

    方式的深入理解,对于把握计算广告领域的核心问题,以及评估每个问

    题在特定情形下的难度有很重要的指导意义。

    本章的最后,还介绍了若干广告和在线广告领域中重要的行业协

    会。了解这些协会在广告业务中代表的利益方以及他们对整个在线广告

    市场产品和技术形态的推动作用,对于有志从事广告技术和业务的读者

    来说也是必要的。

    2.1 广告有效性原理

    为了探讨用技术手段优化广告投放效果,我们先看看广告从产生用户接触开始是如何产生最终效果的。这一问题是广告领域一个传统重要

    的研究课题,我们直接借鉴了前人的研究成果,按照方便计算广告讨论

    的原则,用一个三段式信息传播模型来解剖广告由物理上产生到最终产

    生转化行为的全过程,这一模型如图2-1所示。

    图2-1 所示这一有效性模型把广告的信息接收过程分为选择

    (selection)、解释(interpretation)与态度(attitude)三个大阶段,或

    者进一步分解为曝光(exposure)、关注(attention)、理解

    (comprehension)、接受(acceptence)、保持(retention)与决策

    (decision) 6个子阶段。下面我们分别来讨论每个阶段的意义和关键

    点。

    图2-1 广告效果产生过程示意

    (1)曝光(exposure)阶段。这一阶段指的是广告物理上展现出来

    的过程,此阶段的有效程度往往与广告位的物理属性有关,并没有太多

    可以通过技术优化的空间。实际的广告实践中,曝光的有效性对最终结

    果的影响往往远远高于其他技术性因素,所以才会有传统广告中“位置

    为王”的说法。像纽约时代广场那组著名的广告牌(见图2-2中左图)以

    及北京东三环北端京信大厦外立面正对着东三环北路的广告牌(见图2-

    2中右图)就有非常好的曝光效果。在互联网广告中,位置的影响有时

    会更加显著,因此如何从算法上消除由此带来的点击率预估偏差,是一

    个非常重要的实际问题。图2-2 曝光效果突出的广告位示例(左:纽约时代广场 右:北京东

    三环京信大厦)

    (2)关注(attention)阶段。这一阶段指的是受众从物理上接触到

    广告到意识上注意到它的过程。对广告而言,曝光并不一定意味着关

    注。举个例子,有一天我的一位好友在浏览社交网站时,他的小儿子在

    旁边喊道:“爸爸,快看网页上的恐龙!”而这位朋友找了一分多钟都没

    有找到恐龙。实际上,恐龙就在网页上端最醒目的广告位上。这个例子

    说明,强曝光并不能等同于用户实际有效的关注。那么如何使得关注阶

    段的效率提高呢?有几个重要的原则。首先,尽量不要打断用户的任

    务。这一点是上下文相关的广告投送的原理基础,也是当今讨论原生广

    告产品的出发点之一。上面的例子也可以用这个原则来解释,当用户明

    确辨识出某个固定不变的广告位,并且不再认为它与自己当浏览网页的

    任务有关联时,他会下意识地屏蔽其中的内容。其次,明确传达向用户

    推送此广告的原因,这一点是受众定向广告创意优化的重要方向。另

    外,内容符合用户的兴趣或需求,这是行为定向的原理基础。

    (3)理解(comprehension)阶段。用户关注到了广告的内容也并

    不意味着他一定能够理解广告传达的信息。再举一个例子,笔者有一次

    试玩了一款网页游戏,然后被某游戏广告定向到,并多次看到某宣传“四维城战新模式”的游戏广告。应该说这样的定向是精准的,我也非

    常认真地关注了广告的内容,不过这些内容我确实不能直观理解,也就

    谈不上后续的转化。理解阶段有哪些原则呢?首先,广告内容要在用户

    能理解的具体兴趣范围内,这说明了真正精准的受众定向有多么必要。

    其次,要注意设定与关注程度相匹配的理解门槛。例如,在电视广告

    中,可以用有一定情节的短故事来宣传品牌;在路牌广告中,创意制作

    原则是将若干主要市场诉求都表达出来;而对于互联网广告,由于用户

    的关注程度非常低,我们应该集中强调一个主要诉求以吸引用户的注意

    力。

    (4)接受(acceptance)阶段。受众理解了广告传达的信息,并不

    一定表示他认可这些信息。广告领域有一句名言:“我知道有一半的广

    告预算浪费了。”实际的情况还有可能更糟,如果表达的信息不适当,甚至有可能有三分之一的广告展示起到负面效果!在使用幽默、性感这

    样非常规的广告手段时,要特别注意这一点。广告的上下文环境对于广

    告的接受程度有着很大的影响,同一个品牌广告出现在某游戏社区上和

    门户网站首页上,用户会倾向于认为后者更具说服力,这也就是优质媒

    体的品牌价值。在定向广告越来越普遍的今天,如何让合适的广告出现

    在合适的媒体上,即广告安全(ad safety)的问题,正在引起大家越来

    越多的关注。

    (5)保持(retention)阶段。对于不仅仅追求短期转化的广告商,当然希望广告传达的信息给用户留下长久的记忆,以影响他长时间的选

    择,因此品牌广告商在创意设计上花了大量的精力提高此阶段效果。我

    们想想那些充满艺术性或浪漫气质的电视汽车广告,可以对此有直观的

    认识。

    (6)决策(decision)阶段。成功广告的最终作用是带来用户的转

    化行为,虽然这一阶段已经离开了广告的业务范围,但好的广告还是能

    够为转化率的提高做好铺垫。特别是对于电商或团购业务,在创意上强

    调哪些信息以打动那些价格敏感的消费者是有相当的学问的。

    定性地说,越靠前的阶段,其效果的改善对点击率的贡献越大;而

    越靠后的阶段,其效果的改善对转化率的贡献越大。但是以上各个阶段

    的划分绝非孤立的和绝对的,而某一项具体的广告策略或技术也往往会

    对几个阶段的效果同时发生影响。虽然这样的有关广告有效性模型的讨

    论多见于传统广告的研究中,然而其规律显然也对在线广告的产品方向

    有很强的指导作用。

    2.2 互联网广告的技术特点从前面的讨论中,大家一定已经发现了不少在线广告不同于传统广

    告的特点。在这些不同点当中,有一些对我们正确理解在线广告市场并

    探究合适的效果优化方案有着非常重要的指导意义。

    (1)技术和计算导向。数字媒体的特点使在线广告可以进行精细

    的受众定向,而技术又使得广告决策和交易朝着计算驱动的方向发展。

    实际上,受众定向这一思想在线下广告中也曾经被尝试过,比如试图把

    信用卡纸质账单背面的广告按照信用卡用户的年龄和性别做一些定制

    化,不过由于非数字的媒体上这么做的成本太高,因而无法规模化。在

    数字媒体上进行受众定向,其成本可以控制得非常低,这也直接催生了

    在线广告的计算革命。除了受众定向,由于在线广告存在着独特的竞价

    交易方式,因而广告效果精确的预估和优化能力也是非常重要的。

    (2)效果的可衡量性。在线广告刚刚产生之时,大家对这种广告

    最多的称道之处是它可以以展示和点击日志的形式直接记录广告效果,并且可以利用这些日志优化广告效果。不过,点击率这一指标从是否在

    绝对意义上能够反映广告效果是值得探讨的。从1998年到今天,横幅展

    示广告的点击率从10%一路降至0.1%,难道这说明广告的效果下降了两

    个数量级吗?快速增长的市场规模显然给出了否定的回答。我们认为,在不同的产品或时代中,点击率绝对值的比较并没有那么重要,而在一

    个特定时期不同广告和算法表现出来的差异才是更有意义的。从这一点

    来看,可衡量性仍然可以认为是在线广告的一个重要特点。

    (3)创意和投放方式的标准化。标准化的驱动力来自于受众定向

    与程序购买。既然需求方关心的是人群而非广告位,创意尺寸的统一化

    与一些关键接口的标准化非常关键。这些接口标准中,比较典型的有视

    频广告的 VAST 标准[40]

    和实时竞价的 OpenRTB 标准[41]

    等。实践表明,有

    越来越多的广告产品和平台愿意根据这些市场标准来设计自己的规范和

    接口,因为这样大家可以充分利用整个市场的流动性,更快地创造更多

    的价值。

    (4)媒体概念的多样化。随着Web 2.0和移动互联的普及,赋予了

    更多交互功能的互联网媒体与线下媒体有已经有了本质差别。随着交互

    功能的不同,这些媒体与转化行为的距离也就不同。举个例子,对在线

    购物行业而言,门户网站、垂直网站、搜索引擎、电商网站、返利网,在转化链条上一个比一个更靠近购买行为。我们从直觉上就可以知道,越接近转化的媒体上的广告带来的流量一定可以达到越高的ROI,不过

    离“引导潜在用户”这样的广告目的也就越远。因此我们在从需求方看在

    线广告时,应该注重各种性质媒体的配合关系,并从整合营销的角度去

    审视和优化整体的效果。试想,如果一家电商只用返利网作为线上广告

    渠道,ROI一定可以做到很高,可是这样的营销能给他带来大量潜在用户吗?[3]

    (5)数据驱动的投放决策。与工业革命时期机器化的根本驱动力

    ——电力相类比,互联网化的根本驱动力可以认为是数据的深入加工和

    利用。这一点在大数据概念被广泛认知的今天已经成为老生常谈。前面

    提到的在线广告的计算技术在很大程度上也要依赖于对于数据的大规模

    利用。广泛收集用户的行为数据和广告反馈数据,利用云计算的基础设

    施对用户打上合适的标签,同样根据数据在多个广告竞争同一次展示时

    作出决策,再将投放的结果统计数据反馈给广告操作人员以调整投放策

    略,这已经成为在线广告的基本投放逻辑。因此可以认为,现代的在线

    广告系统就是一个大数据处理平台,而且其对数据处理的规模和响应速

    度的要求都相当高。可以说,从来没有任何传统广告形式像在线广告那

    样,需要大规模地收集并利用数据,而这正是在线广告最吸引人之处。

    2.3 计算广告的核心问题

    Andrei Broder在提出计算广告这一概念的同时也给出了该课题的核

    心研究挑战(注意是“核心挑战”而非“定义”)。对于这一核心挑战,他

    的表述是“Find the best match between a given user in a given context and a

    suitable advertisement”[1]。我们结合近年来市场的发展以及实际业务中的

    一些体会,对此表述稍作加工,给出如下计算广告的核心问题:

    计算广告的核心问题,是为一系列用户与环境的组合找到最合适的

    广告投放策略以优化整体广告活动的利润。

    与 Andrei Broder的表述相比较,我们主要进行的两方面的微调。首

    先,强调广告问题优化的是一组展示上的效果,而非孤立的某一次展示

    上的效果。这是由于广告活动中普遍存在着量的约束,在这一约束下进

    行利润优化,其最优解往往与每次展示独立决策时有很大的不同。其

    次,描述中去掉了“given”的字眼。这是由于在某些广告产品中,系统并

    不一定能拿到确定的用户或上下文唯一标识,但这并不意味着完全无法

    进行计算优化。同样地,我们也强调优化的结果是“广告投放策略”而不

    一定是具体的广告,这也是因为有些产品的策略并不是直接决定最后的

    展示。相信读完本书后面的部分,大家就能更深入地体会这些调整的原

    因。

    上面的计算广告核心挑战需要转化为数学上可以优化的目标才能利

    用计算技术来解决。把它用下面的最优化问题来表达:这里的i代表从第1次到第T次之间的某一次广告展示。我们优化的

    目标就是在这T次展示上的总收入(r)与总成本(q)的差,即广告活

    动的利润。当某次广告活动的预算一定,即 是一个常数时,很容易验证优化公式2.1与优化另一个广告中更常见的目标投入产出

    比,即ROI= 也是一致的。进一步考虑收入与成本具体

    依赖的因素,上面的优化问题可以写成:

    表达式中的a、u、c三个变量,分别代表广告、用户与环境,即广

    告活动的三个参与主体,显然,广告展示的收入或成本与这三个因素都

    有关系。实际上,对除了 DSP以外的大多数广告产品来说,要么是自营

    或包断资源,要么按以收定支的方式与媒体分成,其成本也对应为常数

    或正比于收入,在这种情形下,成本部分可以从上面的优化公式中去

    掉。

    注意,这里有一个隐含的假设,即整体的收入或成本可以被分解到

    每次展示上。显然,这一假设并不是十分合理的,但是考虑到实际线上

    决策时,必须对每次展示马上完成计算,所以,从实用出发我们仍然采

    用这一假设。在实际的系统中会采用频次控制、点击反馈等方法来对付

    多次展示之间效果相关性的问题。

    在具体的广告产品中,优化公式2.2可能会省略掉一些内容或参

    数,或者增加一些约束条件,构成该广告产品独特的优化问题。在后面

    我们谈到若干广告产品的关键技术时,也会给出其具体形式。

    2.3.1 广告收入的分解

    下面,我们再来进一步分解广告收入,以便引出关于在线广告市场

    计费方式的重要分析。对一个广告市场中具体的产品形态,我们往往能

    够主动优化的是收入而非成本,因此,可以主要关注收入优化的部分。

    在一次广告展示产生后,有可能发生哪些后续行为呢?参见图2-3:当

    用户在媒体页面的广告位上看到广告以后,如果产生兴趣,首先产生的

    是点击行为,广告点击与广告展现的比率称为点击率(Click Through

    Rate,CTR);点击行为成功以后,将会打开广告主的落地页(landing

    page),落地页成功打开次数与点击次数的比例称为到达率,这是在广

    告主网站上发生的;如果用户从落地页开始,进一步完成下单等操作,则称为转化,转化次数与到达次数的比例称为转化率(Conversion

    Rate,CVR),这是在广告主网站上或线下发生的。

    图2-3 在线广告产生效果的步骤

    按照媒体网站和广告主网站上的行为段对回报 r 进行分解,是实践

    中比较合理且容易操作的方式:

    在后文中,我们都沿用这样的符号表示:用μ表示点击率,用ν表示

    点击价值(click value),即单次点击为广告产品带来的收益。其中前

    一部分描述的是发生在媒体上的行为,后一部分描述的是发生在广告主

    网站上的行为。而这两部分的乘积定量地表示了某次或若干次展示的期

    望 CPM值,就是我们前面提到的eCPM[4]。请大家特别关注 eCPM这个指

    标,因为它是计算广告中最常被提及,也是最关键的定量评估收益的指

    标,本书的计算问题大都是围绕它展开的。在对多个检索候选进行排序

    时,是根据 eCPM 还是 CTR 排序也是区别广告产品和用户产品的重要

    策略特征。进一步,如果我们将所有的点击价值都等同起来,那么根据

    eCPM排序和根据 CTR排序实际上将得到一样的结果。因此,可以认为

    根据 CTR排序是根据eCPM排序的一种特例,这也使得将内容与广告统

    一排序的原生广告成为可能。

    eCPM一般指的是估计的千次展示收益,它有两个很相近的概念:如果讨论的是千次展示收入,往往用RPM;如果讨论的是千次展示成

    本,往往用CPM。这三个术语有时在实用中的区别并不明显,请大家注

    意。

    根据图2-3 所示的流程,点击价值还可以进一步分解为到达率、转

    化率和客单价的乘积。由于这部分的深入解剖与行业密切相关,而且更

    多地属于站内运营而非广告的范畴,因此在本书中将只在14.2.3节进行

    简要的讨论。

    2.3.2 结算方式与 eCPM 估计的关系

    对于大多数广告产品来说,需要计算给定(a,u,c)三元组的

    eCPM以进行决策。可是由于广告市场的协作关系复杂,并非每个广告

    产品都可以对 eCPM中的两个步骤做出较准确的估计。根据 eCPM的分

    解决定哪部分由谁来估计是广告市场各种计费模式产生的根本原因,也

    是广告市场中商业逻辑与产品架构衔接的关键一环。下面,我们来逐一

    分析下市场上主要的几种广告计费模式。

    (1)CPM结算,即按照千次展示结算。这种方式是供给方与需求

    方约定好千次展示的计费标准,至于这些展示是否能够带来相应的收

    益,由需求方来估计和控制其中的风险。对于品牌广告,由于目标是较

    长时期内的利益,很难通过对短期数据进行分析的方式直接计算点击价

    值,而点击率也因为对于用户接触的核心要求变得不是唯一重要的因

    素。在这种情况下,由需求方根据其市场策略与预算控制流量的单价并

    按CPM方式结算是比较合理的交易模式。实际上,在大多数互联网品牌

    广告,特别是视频广告中,CPM都是主流的结算方式。

    (2)CPC 结算,即按点击结算。这种方式最早产生于搜索广告,并很快为大多数效果类广告产品所普遍采用。在这种方式结算方式下,点击率的估计是由交给供给方(或者中间市场)完成的。点击价值的估

    计则由需求方完成,并通过点击出价的方式向市场通知自己的估价[5]。

    这样的分工对于互联网广告,特别是以效果为导向的互联网广告而言,有着清晰的合理性:供给方通过其收集的大量用户行为数据可以相对准

    确地估计点击率;而转化效果是广告商站内的行为,当然他们自己的数

    据分析体系也就能更准确地对其作出评估。因此,以CPC方式结算,在

    效果类广告市场中具有接近垄断的地位。

    (3)CPS(cost per sale)CPA(cost per action)ROI结算,即按

    照销售订单数、转化行为数或投入产出比来结算。这些都是按照转化付

    费的一些变种。这是一种比较极端的结算方式,即需求方只按照最后的

    转化收益来结算,从而在最大程度上规避了风险。在这种结算方式下,供给方或中间市场除了估计点击率还要对点击价值作出估计,这样才能合理地决定流量分配。这里存在两个很明显的问题。一是转化行为为用

    户在广告商站内的行为,并非供给方能够直接监测和控制,因此无法进

    行准确的估计和优化。只有那些转化流程和用户体验类似的广告商组成

    的广告平台按转化付费才比较可行,典型的例子就是淘宝客广告。二是

    实际执行中,存在广告主故意扣单以降低转化率,从而低成本赚取大量

    品牌曝光的可能。因此,我们认为这种方式主要适合于一些垂直广告网

    络(vertical ad network)。另外在DSP中,由于需要完全代表广告主利

    益出价和优化,因此也会出现一些跟广告主之间按照CPS计费的情形。

    总体而言,对于那些与广告主收益直接挂钩的需求方广告产品来说,CPS在一定条件下是可行的;但是对于普通的中间市场广告产品来说,CPS并不是一种趋势性的结算方式。而 CPA 广告在移动应用下载的场

    景下,由于转化流程统一在 Apple Store 或 Google Play中,且存在较完

    善的第三方转化监测,因而市场较为成熟。

    (4)CPT(cost per time)结算,这是针对大品牌广告主特定的广

    告活动,将某个广告位以独占式方式交给某广告主,并按独占的时间段

    收取费用的方式。严格来说,这是一种销售方式而非一种计费模式,因

    为价格是双方事先约定,无需计量。这种方式主要适用于一些强曝光属

    性,有一定定制性的广告位。在一般的展示广告中,这种方式在欧美市

    场市场并不经常采用,但在中国的门户网站广告中,CPT仍然是一种主

    流模式。CPT这样独占式的售卖虽然有一些额外的品牌效果和橱窗效应

    产生,但是非常不利于受众定向和程序交易的发展,因而从长期的角度

    来看,其比例会有下降的趋势。

    表2-1展示了以上几种结算方式概要的对比。综合来看可以认为,对于效果广告,CPC计费方式最有利于发挥供给方和需求方的长处,因

    而在市场上被广泛接受;对于品牌广告,由于效果和目的有时不便于直

    接衡量,可以考虑按照 CPM的方式计费;而 CPS的计费方式只在一些

    特定的环境下才比较合理。

    表2-1 在线广告结算方式比较既然广告有计费的需求,也就同时产生了效果监测的需求。在CPM

    类品牌广告中,由于曝光在媒体上产生,广告主往往会委托第三方的广

    告监测公司对曝光量、点击量等指标作技术核实,并以此作为结算的依

    据。在 CPC或 CPS结算的广告交易中,由于计费的指标,即点击或转化

    在广告主的网站上产生,所以并不需要特别的监测服务。因此,可以认

    为广告监测主要服务的对象是品牌广告主。随着CPM广告定向方式越来

    越复杂,广告监测也从简单的展示和点击记数到频次、人口属性等信息

    的验证和计量。关于这方面的问题和技术,我们将在第15章中再作介

    绍。

    2.4 在线广告相关行业协会

    由于供给方和需求方的博弈关系,需要一些行业协会来约束和规范

    市场。关注这些行业协会的立场与使命对更清晰地认识广告的商业逻辑

    大有帮助。以最重要的北美市场为例,主要有三个行业协会需要了解。

    2.4.1 交互广告局交互广告局(Interactive Advertising Bureau,IAB,http:www.iab.net)成立于20世纪末,是在线广告领域最重要的行业协

    会,其使命是致力于推动在线广告市场的发展。IAB主要是站在供给方

    的长远利益上来研究和影响市场。换句话说,IAB主要关注的是在线广

    告供给方的利益。正如IAB在自己网站标题上声明的那样,这一组织存

    在的使命是“dedicated to the growth of interactive advertising market”,即

    致力于交互广告市场的壮大。而这个方向的受益者主要是各在线媒体与

    广告技术公司。因此,IAB的典型会员是Google、Facebook、Yahoo!、Microsoft这样的广告供给方以及AudienceScience、MediaMath这样的广

    告技术公司。广告技术公司和产品的发展是为了更好地服务广告主和提

    升在线广告效果,以利于更多的预算进入在线广告领域。从具体工作上

    看,IAB与互联网大量媒体和广告平台合作,制定了一系列意义重大的

    标准和规范,这些都极大地促进了在线广告行业的健康发展。其中包括

    如下几个重要的规范。

    (1)横幅广告创意尺寸标准。2001年 IAB 公布的标准仅仅支持 7

    种创意尺寸,即120×600(摩天大楼)、160×600(宽摩天大楼)、180×150(长方形)、300×250(中级长方形)、336×280(大长方

    形)、240×400(竖长方形)、250×250(正方形弹出)。创意尺寸的统

    一化,对于在线广告市场淡化广告位概念、推广受众定向有着非常根本

    的促进作用。中国市场与此对比,由于广告位尺寸非常复杂,因而各个

    网站之间的壁垒较高,非常不利于定向广告和程序采买的发展。

    (2)视频广告标准VAST(digital video ad serving template)。由

    于视频广告创意和展示形式比较复杂,消耗资源也较多,IAB 制定了一

    套统一的 XML Schema用于向在线视频媒体投放视频流内的广告,并对

    其用户进行规范化的描述,这一标准实际上减少了进入视频广告领域的

    技术障碍,使得视频广告市场规模快速发展成为可能。

    (3)通用实时竞价接口标准OpenRTB。实时竞价的技术我们将在

    第 6章中介绍,简单来说,这种采买方式是为了方便需求方按照自己的

    受众划分高精准地采买流量。假设各个广告交易平台的实时竞价接口不

    同,将意味着需求方需要付出几倍的技术成本以完成广泛的市场对接。

    于是,IAB制定了统一的 OpenRTB标准,将横幅广告、视频广告、移动

    广告情形下的实时竞价接口做了统一的规范。

    2.4.2 美国广告代理协会美国广告代理协会(American Association of Advertising Agencies,4A)并不是一个专门从事互联网广告的组织,而是线上线下各种广

    告,特别是品牌广告的代理商在美国的行业协会。4A 公司向其会员代

    理公司约定,至少要向广告主收取一定比例的服务费用,这一方面是为

    了避免行业内的恶性竞争,另一方面也是确保广告代理公司能够站在广

    告主的利益角度考虑问题,而后一点对于市场的长期健康发展是有很大

    帮助的。4A公司的典型代表有奥美(OgilvyMather)、智威汤逊

    (JWT)、麦肯(McCann)等。值得注意的是,由于4A是一个美国协

    会,因此严格意义上的4A公司都是美国公司,不过对于另外一些国际

    影响力较强、业务方式和准则与其类似的非美国广告代理公司,我们也

    往往都将其归为广义4A公司的行列,典型的例子如日本的电通

    (Dentsu)公司。

    2.4.3 美国国家广告商协会

    美国国家广告商协会(Association of National Advertisers,ANA)

    是一个广告主的协会,也是最彻底地代表需求方利益的组织。其会员多

    是ATT、宝洁(PG)以及NBA等这些拥有大量广告预算的广告主。

    ANA对广告主利益的维护可以从一件小事中得到体现:在微软宣布考虑

    在IE10支持限制第三方cookie滥用的“do not track(DNT)”协议时,是

    ANA明确声明对这样的计划表示反对,因为这样将会使得在线广告市场

    精确投送广告的能力受到很大影响,而这显然是与广告主的利益相违背

    的。

    2.5 延伸思考

    1.CPAROI的结算方式看似对广告主有利,实际也催生了一些变形

    的推广方式。请考察你接触到的CPAROI渠道,并研究其与CPM或CPC

    渠道的关键差异。

    2.对广告产品而言,优化利润与优化ROI有什么区别?

    3.在社交网络中发生的传播营销过程与典型的展示、点击、转化流

    程有很大不同,请对此建立一个合理的模型,并分析其中的关键量化指标。

    注 释 [1].数据来源于 IAB(http:www.iab.net)、艾瑞(http:www.iresearch.cn)等机构的市场调研报告。

    [2].资料来源于 http:www.lumapartners.comintroducing-the-marketing-technology-lumascape。

    [3].2012年年底,淘宝发布声明,宣布终止与以现金形式返利的淘宝客网站的合作,这正反映了市场对此问题的认知正在趋向一致和理性。

    [4].由于 CPM 是千次展示的收益,因此 eCPM 实际上还要乘以 1000 才能与其相比较,为了表达简单起见,我们在本书中略去 1000 这一固定系数。

    [5].当然需求方不会完全按照其点击价值来出价,而是会寻求更低的价格以获得套利空间。因此,如何在市场机制上避免广告主积极地调整出价,以促进市场竞争的激

    烈程度,是竞价体系设计的关键。我们将在第 5 章中讨论这一问题。第二部分 在线广告产品逻辑第3章 在线广告产品概览

    在线广告不同于传统线下广告,其产品形式(这里说的并非创意形

    式)相当丰富。在1.4节中,我们对在线广告的整个发展历程有了初步

    了解,如果从产品的视角将这一过程提炼出来,可以用图3-1来示意。

    图3-1 在线广告产品进化示意

    我们将图3-1中的产品分为4个部分,这些将在后面几章中分别介

    绍。

    (1)合约广告产品:它由线下广告的交易形式衍生而来,又可以

    分为按照时段售卖的CPT广告和按照约定展示量售卖的 CPM广告。这类

    广告产品主要服务于后续效果不宜直接衡量的品牌类广告主,在门户网

    站和视频网站较为常见。

    (2)竞价广告产品:其最重要的形式是搜索广告,其产品形式为

    对搜索关键词的竞价。这种广告在拓展到站外展示广告流量时,演进成

    了对页面关键词或者用户标签竞价的产品形式,也就是 ADN。竞价广告的商业逻辑与合约广告完全不同,也是解决效果类广告需求的关键产

    品形式。

    (3)程序化交易广告产品:竞价广告的进一步发展催生了实时竞

    价的交易形式。实时竞价使得需求方可以更灵活地划分和选择自己的目

    标受众,也使得更广泛的数据使用和交易迅速发展起来。以实时竞价为

    核心的一系列交易方式逐渐演变为机器之间以程序化的方式完成广告交

    易决策,因此,这类产品称为程序化交易广告产品。

    (4)原生广告产品:广告的产品体系除了自身的演进,另一个重

    要课题是如何处理与非商业化内容的关系,让广告与内容尽可能以“原

    生”的方式共存。搜索广告和社交网络信息流广告对此作了非常有价值

    的探索,不过这样的原生广告在规模化和交易化方面也遇到了很多的问

    题。然而,随着近年来移动设备对于原生广告的强烈渴求,像标准ADN

    那样的原生广告平台正在快速发展中。

    对于每一种广告的产品形态来说,都可能会有三个主要的组成部

    分:面向需求方的接口、面向供给方的接口、中间的投放系统及匹配策

    略。根据产品的不同,其中接口的形式可以是面向人工操作的界面,也

    可以是机器间通信的接口。这些广告中的产品环节,都属于商业产品的

    范畴,我们将先对这类产品设计的主要原则以及需求方和供给方界面的

    一般情形进行介绍,为后面几章中按上述的四个部分分别介绍广告产品

    做准备。

    3.1 商业产品的设计原则

    商业产品指的是面向商业客户而非一般用户的产品,其中最典型的

    代表就是互联网广告产品。其他的一些面向客户的互联网产品,如客户

    关系管理(Customer Relation Management,CRM)、网站分析(Web

    Analytics,WA)以及后面要提到的数据管理平台(Data Management

    Platform,DMP)等,也属于商业产品的范畴。商业产品的设计和运营

    有着一定的共性原则,我们有必要在这里提一下。

    互联网是一个产品驱动的行业。熟悉产品设计的读者应该了解,用

    户产品演进的根本驱动力是人们追求方便的天性。因此,用户产品的设

    计原则总是朝着更简单、更直观、更快捷的方向努力。而相应的产品设

    计重点也集中在关键功能的突出、操作过程的流畅等方面。

    然而,如果有机会参与商业产品的设计和运营,你就会发现,其中

    关注的重点和运营的方式有相当大的区别。有时候良好的用户体验,并

    不一定能带来一款商业产品良好的口碑或市场上的成功,这是为什么

    呢?简单来说,商业产品一般都有一个明确的商业目标,而商业产品的使用者选用一款产品的动力也是为了优化这个商业目标。例如,广告,其使用者不论是媒体、代理或广告主,都是为了优化自已的利润。因

    此,对这类产品的选择标准是客观的,也是可衡量的。Google AdWords

    之所以为大量的中小广告主广泛采用,主要原因并不是因为 AdWords的

    使用便捷性远超同类产品,而是因为其推广效果有目共睹。因此,商业

    产品的任何一项功能改进,只要能带来其对应商业目标的提升机会,即

    使在使用流程上引入一些不便,也是可以接受的。这样的产品原则带来

    的结果正如图1-9所示,整个广告市场的交易环节越来越复杂,使用门

    槛也越来越高,这与用户产品简化的大趋势是非常不同的。

    在优化既定商业目标这一商业产品的总体原则下,我们在商业产品

    运营过程中有一些需要注意的关键点。

    (1)相对于产品功能,要特别关注产品中的策略部分。策略本身

    是商业产品非常关键的环节,以广告为例,竞价中的机制设计、冷启动

    时的数据探索、受众定向的标签体系都是产品策略需要考虑的内容。策

    略上看似简单的调整往往能带来广告系统收入上巨大的变化。与一般产

    品不同,这些策略的制定既需要对于广告市场深入的了解,又需要许多

    扎实的基础知识。对于刚开始进入广告产品领域的读者,将关注点集中

    在这些“看不见的产品特征”上是需要下大工夫体会和实践的。

    (2)要特别关注数据,让运营和产品优化形成闭环。由于商业产

    品的目标是确定和可优化的,所有产品特征和策略的成功与否要严格根

    据数据的反馈来判断。同时,新产品功能的规划也要在洞察历史数据和

    其他用户产品数据的基础上进行。从数据分析开始,以数据结束,这样

    的闭环式迭代是最适合商业产品的开发模式。

    (3)当然,在所有与使用者打交道的产品界面上,用户产品追求

    便捷性的设计原则依然非常重要。不过在商业产品中,实现功能以外过

    于新奇、炫酷的产品外观和交互模式是应当避免的。

    由于本书探讨的是计算广告这一典型的商业产品,我们也会将重点

    放在广告投放、交易、策略、数据使用和交易等产品环节上,而对于广

    告系统与需求方或供给方的界面接口,将只在下面作简要的介绍。

    3.2 需求方层级组织与接口

    由于广告市场的复杂性,一个广告系统的需求方有可能是广告主、代理公司、TD或者DSP。无论面对哪种需求方,一般来说,我们都需要

    一个操作界面让其对预算、广告投放条件和其他策略做设置。

    一般来说,需求方提供的广告是分层次管理的。在市场上大多数的

    产品中,广告的层次分为广告主、广告(推广)计划(campaign)、广告(推广)组(ad goup)、广告创意(creative)等几个层级,参见图3-

    2。其中广告主层级管理一个广告主的通用信息,而其他三个层级则与

    具体的投放管理相关,我们来分别介绍一下。

    图3-2 广告层级关系示意

    (1)广告计划概念上对应于广告主的一次投放合同,其中包括了

    预算、时间范围等基本信息,参见图3-3中的示例。除了这些信息以

    外,图中还有另外的一些相关设置,例如,(a)在有多个广告产品可

    供选择时,要在广告计划中确定投放的是哪个产品,如图中的“选择投

    放网络”部分;(b)预算的分配策略(pacing),即图中的“预算分配控

    制”部分。对于大多数广告计划,较为均匀地分配预算可能比较合理,但是对于游戏开服、移动应用冲榜等类型的推广,预算的集中花费则很

    重要。图3-3 广告计划设置示意

    (2)广告组对应于一个具体的广告投放策略,主要是设定受众定

    向条件和出价,参见图3-4中的示例。广告组最重要的功能是设置各种

    各样的定向条件,因而是广告效果优化的关键层级。另外,对媒体的选

    择也可以认为是一种定向条件。值得注意的是出价——在后面我们将要

    介绍的竞价类广告产品中,出价是由广告主自行设置,而非预先约定。

    而对于出价与能获得流量的规模和质量的关系,广告主很难有直觉上的

    认识。因此,从产品的角度来说,往往需要给出一些有意义的提示,如

    根据当前出价做的流量预估,或者如图3-4中所示比较直接的“建议出

    价”。图3-4 广告组设置示意

    (3)广告创意则是最终展示出来的素材,可能在同一个组策略下

    有不同尺寸的创意存在,参见图3-5中的示例。对于文字链类型的创

    意,基本素材包括标题、描述等内容;而对于图片类型的创意,则直接

    上传图片素材。另外广告创意的必要设置还应包括展示和点击的监测地

    址等。为了方便广告投放人员直观地看到创意的展示效果,往往还会提

    供创意预览功能(如图3-5右侧的“预览区”)。

    关于需求方设置管理的细节功能,在不同的产品中可能会有较大的

    差别,但是这样的4层级组织方式是比较通用的。除了业务管理的便捷

    性,这样的层级结构还为数据统计和建模提供了天然的、合理的层级结

    构,让新创意的冷启动问题变得容易一些。在后文介绍各类广告产品

    时,我们会重点关注其商业逻辑和产品策略,而对于界面上投放管理的

    功能不再展开讨论。图3-5 广告创意设置示意

    对于投放规模很大的广告主或代理,所有的操作都通过类似上面的

    界面人工完成是非常低效的。对于这样的情形,广告平台一般会提供与

    界面功能相对应的API接口[1]

    ,以便大的需求方用编程的方式进行批量投

    放和优化。不过,需求方也有可能大量滥用 API来做一些组合或测试投

    放,这会使得投放系统的压力大增,因此在实际运营中要对带宽或操作

    次数作一定的限制。

    3.3 供给方管理接口

    在目前的主流的广告交易逻辑中,供给方即媒体对业务的控制比起

    需求方来要弱很多。供给端的资源组织主要分媒体和广告位两个层次。其中媒体可以是网站,也可以是移动应用开发者。

    媒体的操作比广告主方要简单,一般来说,添加、删除广告位以及

    查看各广告位的运营数据是主要的功能需求。这一接口的功能性示例见

    图3-6(广告位名称已经被隐去)。

    图3-6 媒体广告位管理示意

    对于其中的某个具体广告位,根据产品功能的不同,需要的操作功

    能也不同。但一般来说,设定广告位尺寸、取广告投放代码或SDK以及

    设定该广告位对广告类型的要求是一些通用的需求。在广告管家或SSP

    之类的供给方产品中,往往还会有精细的流量分配功能。需要注意的

    是,广告平台会维护各个广告位对应的域名或应用名,以防其他域名的

    流量盗用广告位代码。

    上面介绍的这种比较简单的供给方管理接口主要用于一般的 ADN

    或 ADX,而在媒体需要深度参与的原生广告中,这样简单的对接方式

    不再适用,关于这部分内容参见第7章。

    3.4 延伸思考

    1.请研究你熟悉的某一个商业产品,并探讨其与用户产品在设计和

    运营方面的不同之处。

    2.如果向需求方提供API来替代一般的UI投放方式,会对广告产品

    的运营产生什么样的影响?第4章 合约广告

    从本章开始,我们将对在线广告一些主要的产品形态和相应的商业

    逻辑展开讨论。先从按照合约的方式售卖的广告产品开始,这部分产品

    在整体产品演进过程的中的位置如图4-1所示。

    图4-1 合约广告产品

    互联网广告业务的初始阶段,拥有流量的媒体与需要广告资源的代

    理商是市场的主要参与者。线下广告的商业逻辑也被照搬到了线上,由

    广告代理公司和媒体签订协议,确保某些广告位在某时间段为指定的广

    告商所占有,同时广告商按整体合同支付广告费用。这种按CPT结算的

    广告位合约方式对技术的依赖性较小,只需要用到简单的广告排期系

    统。

    合约式广告的重点是按CPM计费的展示量合约广告。这种方式仍然

    以合同的方式确定一次广告活动的投放总量和展示单价,但是售卖的对

    象已经由“广告位”进化到了“广告位+人群”。这可以说是在线广告发展史上的一个重要里程碑,而数据也被直接应用在广告的商业活动中。从

    供给方产品和技术的复杂程度来看,CPM合约甚至比以后的竞价系统更

    加复杂,其复杂性主要来源于多个合约对投放系统提出的量的约束。

    在展示量合约广告中,需求方的产品技术并没有太大发展。这是因

    为所有广告投放的执行要求都以合约的形式交由供给方来完成了,需求

    方并没有技术上优化的空间。而正是由于需求方对深入优化效果的需求

    进一步发展,才产生了按照竞价方式来售卖的广告系统,希望大家通过

    本章中合约广告的讨论,能够理解这种交易形态进化的内在动力。

    4.1 广告位合约

    广告位合约是最早产生的在线广告售卖方式。它是指媒体和广告主

    约定在某一时间段内、在某些广告位上固定投送该广告主的广告,相应

    的结算方式为 CPT。这是一种典型的线下媒体广告投放模式,在互联网

    广告早期也很自然地被采用。这种方式的缺点非常明显,即无法做到按

    受众类型投放广告,因而也无法进行深入的效果优化。可以说,广告位

    并不是目前互联网广告的主流模式。

    不过,这种方式在一些特定的场景下也有一定的好处:首先,在一

    些强曝光属性的广告位[2]

    上采用这种独占式的广告投放,往往可以有效

    地给用户带来品牌冲击;而在其他一些横幅位置长期独占式的购买有利

    于形成“橱窗效应”,塑造不断攀升的品牌价值和转化效果;还有一点,这种销售模式由于可以向广告主提供一些额外的附加服务,比如同一个

    页面上的竞品互斥,使得高溢价的流量变现成为可能。

    随着受众定向技术的发展,广告位独占式售卖的执行方式也发生了

    很大的变化。即使某个广告位全部投放一个广告主的创意,也并不意味

    着一定要投放同样的一款创意,而受众定向在其中也可以起到很重要的

    作用。例如,某汽车生产商广告主旗下可能有多个系列的产品,如小型

    车、紧凑型车、豪华车、SUV等,而这些车型的潜在购买人群其实也有

    很大的区别,如果能够对这些系列的受众分别投送相应的创意,就可以

    取得更好的效果。另外,即使在受众上无法区分的情形下,也可以利用

    频次控制的方式向同一用户递进式地展示一系列创意,以达到更好的效

    果。这些与受众定向结合的广告位独占式售卖实际上与其他非独占式的

    售卖在系统实现上没有本质区别了。

    广告位合约还有一种变形的形式,即按照广告位的轮播售卖。在这

    种方式中,同一个用户对同一个广告位的一系列访问,被依次标上一组

    循环的轮播顺序号,如 {1,2,3}。将其中具有同样顺序号的展示作为

    一个虚拟的广告位,售卖给广告主。需要注意的是,对某一个用户而言,第一次展示的顺序号不应该设为1,而是应该按相等概率从所有轮

    播顺序号中随机选取一个,并从此开始累加和循环。这样做是为了保证

    各个轮播分配到的流量一致。这种轮播的售卖方式在广告位独占式售卖

    库存不够而广告主又需要确定的展现规则保证时,被较广泛地采用,特

    别是在中国门户网站的品牌广告中。

    在CPT售卖的情形下,供给方和需求方的计算需求和技术成分都不

    太高。广告主的营销需求往往是4A或其他代理公司进行媒介采买

    (media buy)。而对于广告质和量两方面的要求,也都是根据代理公司

    人员对媒体广告位的历史经验以及对广告主业务的了解通过人工优化的

    方式来满足。对于供给方,即媒体而言,往往会使用一种在合同确定以

    后自动地执行合同的广告管理工具,或者称为广告排期系统。

    广告排期系统的代表性产品有DoubleClick的DFP以及中国市场上好

    耶(Allyes)的类似产品,还有免费给中小网站使用的百度广告管家

    等。当然,排期等基础功能都是这些产品早期的形态,随着受众定向、实时竞价等广告投放方式越来越普及,这些产品的功能也都逐渐演进,从简单的广告排期管理逐渐拓展出其他售卖方式下媒体需要的功能,如

    果结合了动态分配和RTB等功能,也就接近于供给方平台了。

    4.2 受众定向

    从我们马上将要谈到的展示量合约开始,大多数广告产品的基础是

    按照受众售卖。因此,受众定向是其非常重要的支持技术。当然,受众

    定向本身的重要性和应用范围远远超过合约广告领域,而在各种竞价广

    告产品中也尤其重要。因此,我们先对受众定向这一核心的广告产品策

    略进行整体介绍。

    随着在线广告技术和业务的发展,产生了各种各样的受众定向方

    法,这些方法的综合应用使得广告的精准程度越来越高。在考察某种定

    向方法时,主要有两个方面的性能需要关注:一是定向的效果,即符合

    该定向方式的流量上高出平均 eCPM 的水平;二是定向的规模,即这部

    分流量占整体广告库存流量的比例。当然,效果好、覆盖率又高的定向

    方法是我们追求的目标,不过往往难以两全。因此,广告系统有必要同

    时提供多种定向方法的支持,以达到整体流量上质的最优化。

    4.2.1 受众定向方法概览

    我们先来看一些市场上比较流行的定向方式。按照其有效性和在广

    告信息接受过程中起作用的阶段,对照第1章中的广告有效性模型,我

    们把这些定向方式按照粗略的定性评估表示成图4-2。在图4-2中,水平方向表示的是定向技术在广告信息接收过程中大

    致起作用的阶段,而垂直方向为定性的效果评价。对受众定向的一些典

    型方法,我们举例说明如下。

    (1)地域定向(geo-targeting)。这是一种很直觉也很早就被广泛

    使用的定向方式。由于很多广告主的业务有区域特性,地域定向的作用

    相当重要,也是所有在线广告系统都必须支持的定向方式。地域定向也

    可以认为是一种上下文定向,不过其计算简单,仅仅需要简单的查表就

    可以完成。地域定向是一种不可或缺的流量选择手段。举个例子,假设

    某电商网站只在北京运营和送货,那么其效果广告一般来说应该定向在

    北京的区域内,否则一个其他省的顾客点击广告进入购物环节后,如果

    发现无法结算,将会是非常差的用户体验。

    图4-2 常见受众定向方法一览

    (2)人口属性定向(demographical targeting)。人口属性定向虽

    然在效果上未必特别突出,但是由于在传统广告的话语体系中大量使用

    这类标签来表达受众,因此它特别为品牌广告主所熟悉。在在线广告的

    品牌合约中也经常会有对人口属性的要求。人口属性的主要标签包括年

    龄、性别、教育程度、收入水平等。人口属性有一点与兴趣标签不同,那就是它是可以监测的,即可以用采样加调研的方法来判断一次人口属

    性定向广告活动受众中有多少比例是正确的。因此,在按CPM结算的广

    告中,人口属性比其他定向标签为广告主接受的程度更高。

    需要说明的是,除非有特别的专门数据来源,如实名制 SNS的注册

    信息或在线购物的消费记录等,一般情况下要进行准确的人口属性定向

    并不容易。在人口属性数据覆盖率不足的情况下,如果要按照这种定向进行CPM售卖,我们可以用已知人口属性的用户作为训练集,构造分类

    器对人口属性进行自动标注。一般来说,采用分类器的方法确定人口属

    性准确程度有限。在单纯效果类的广告活动中,预测人口属性的必要性

    不太高,因为预测出来的人口属性也是根据用户其他行为特征得到的,并不能提供额外的信息量。

    (3)频道定向(channel targeting)。频道定向是完全按照供应方

    的内容分类体系将库存按照频道划分,对各频道的流量投送不同的广

    告。这种定向方式比较适用于那些离转化需求比较近的垂直类媒体,如

    汽车、母婴、购物导航等。对于内容覆盖面比较宽的媒体,这种方式取

    得的效果是有限的。举一个极端的例子,如果我们把某网站的军事频道

    作为一个定向标签,那么很难找到直接匹配的广告需求。

    (4)上下文定向(contextual targeting)。将频道定向这种方法加

    以推广,可以根据网页的具体内容来匹配相关的广告,这就是上下文定

    向。上下文定向的粒度可以是关键词、主题,也可以是根据广告主需求

    确定的分类。上下文定向的效果在不同类别的内容上有很大的区别,但

    是这种方式有一个非常大的好处,那就是覆盖率比较高。对大多数广告

    展示,不论对当前访问用户的信息了解有多少,往往都可以根据当前浏

    览的页面推测用户的即时兴趣,从而推送相关广告。由于覆盖率高,上

    下文定向也是ADN中首选的定向方法之一。

    (5)行为定向(behaviorial targeting)。行为定向是展示广告中非

    常重要的一种定向方式,其框架是根据用户的历史访问行为了解用户兴

    趣,从而投送相关广告。行为定向之所以重要是因为它提供了一种一般

    性的思路,使得在互联网上收集到的用户行为数据可以产生变现的价

    值。因此,行为定向的框架、算法和评价指标也就奠定了在线广告数据

    驱动的本质特征,并催生了相关的数据加工和交易的衍生业务。如果把

    上下文定向看成是根据用户单次访问行为的定向,那么行为定向可以认

    为是一系列上下文定向的融合结果。因此,上下文定向是行为定向的基

    础,而且对各种类型的上下文定向都可以有相对应的行为定向方式。例

    如,地域定向是根据用户当前访问的 IP来确定地理区域,相应地,也可

    以根据用户过去一段时间内的访问中最频繁的地理位置来定向,这种方

    式实际上得到的更接近于用户的经常居住地,业界有人称其为“where-

    on-earth”定向。

    (6)精确位置定向(hyper-local targeting)。在移动设备上投放广

    告时,我们有可能获得非常精准的地理位置。例如,利用蜂窝信息或者

    GPS,地理定位的精度完全可以达到街区的粒度,如果进一步利用Wi-

    Fi、蓝牙等设备的室内定位技术,精度可以进一步达到数米级。这就使

    得基于精确地理位置的广告成为可能,也使得大量区域性非常强的小广告主(如餐饮、美容等)有机会投放精准定位的广告,这已经与传统意

    义上的地域定向有了质的变化,也成为移动广告最重要的机会之一。在

    桌面环境中,也有数据提供商(如Experian)可以提供根据IP信息得出

    的电脑精确定位,在这些数据的支持下,桌面在线广告也可以进行精确

    位置定向。

    (7)重定向(retargeting)。这是一种最简单的定制化标签,其原

    理是对某个广告主过去一段时间的访客投放广告以提升效果。显然,某

    个广告主的访客是其独有的信息,因此这属于定制化标签。重定向被公

    认为精准程度最高、效果最突出的定向方式,不过其人群覆盖量往往较

    小。这是因为,重定向的覆盖投放量是由广告主固有用户的量和与媒体

    的重合比例共同决定的。关于重定向的原理,我们将在第6章中具体介

    绍。

    (8)新客推荐定向(look-alike targeting )。由于重定向的量太

    小,而且无法满足广告主接触潜在用户的需求,因此不能仅仅依靠它来

    投送广告。新客推荐定向的思路是根据广告主提供的种子访客信息,结

    合广告平台更丰富的数据,为广告主找到行为上相似的潜在客户。这一

    方法的目的是希望在同等用户覆盖比率的情况下,达到比一些通用的兴

    趣标签更好的效果,这也从实质上体现了广告主数据的核心价值。新客

    推荐只能说是一种大致的思路,而非具体的方法,其基本原理我们也将

    在第6章中介绍。

    (9)团购(group-purchase)。这并不是一种定向广告技术,却与

    其有一定的关联,因此我们在这里一并说明。根据我们的观点,团购也

    是一种变相的广告形式,这种广告有两个显著的特点:首先是一般都针

    对区域性的广告主,因此地域定向或者直接按照地域分类组织是必要的

    功能;另外,团购主要是利用价格工具,直接降低用户在决策阶段的门

    槛,使得价格敏感的用户转化效果有明显的提升,当然,这一手段也是

    要付出成本的。用类似的手段在创意上直接显示打折或降价的促销信息

    也被其他的电商类广告广泛使用。

    4.2.2 受众定向标签体系

    在一些反映用户兴趣类的受众定向方法(如行为定向、上下文定向

    等)中,我们需要一个标签体系,将每个用户映射到其中的一个或几个

    标签上去。如何规划合理的标签体系对广告产品的运营影响非常大,因

    此,这是产品策略中特别关键的一环。一般来说,这样的标签体系有两

    种组织方式:一种是按照某个分类法(taxonomy)制定一个层次标签体

    系,其中上层的标签是下一层的父节点,在人群覆盖上是包含关系。一

    些面向品牌广告的受众定向往往采用这种结构化较强的标签体系。需要指出,这一体系中的标签是根据需求方的逻辑而制定,某些在媒体方意

    义很大的分类标签,如军事等,由于没有明确的需求对应,不宜出现在

    标签体系中。

    另外一种兴趣标签的组织方式,是根据广告主的具体需求设置相应

    的标签,所有的标签并不能为同一个分类体系中所描述,也不存在明确

    的父子关系。这种半结构化或非结构化的标签体系往往包含一些比较精

    准的标签的集合,因而主要适用于多种目标,特别是效果目标并存的广

    告主的精准流量选择要求。

    选择结构化兴趣标签体系还是非结构化的兴趣标签体系更多地是商

    业上的决策,主要需要考虑下面两种情形。

    (1)当标签作为广告投放的直接标的时(包括 CPM 广告及竞价广

    告中直接可被广告主选择的人群),这些标签既要能够为广告主所理

    解,又要方便广告主的选择。因此,在这种情形下,结构化的层级标签

    体系往往是较合理的产品方案,特别是在CPM广告中,标签的划分不能

    过细(原因将在4.3.3节中讨论)。这种结构化标签体系的一个典型代表

    是表4-1所示的Yahoo! 行为定向标签体系。从表4-1可以看出,这样的标

    签体系非常易于理解和操作,在面向品牌广告主售卖时较为适用。

    表4-1 Yahoo! GD 受众定向标签体系(2)当标签仅仅是投放系统需要的中间变量,作为 CTR 预测或者

    其他模块的变量输入时,那么结构化的标签体系其实是没有必要的,应

    该完全按照效果驱动的方式来规划或挖掘标签,而各个标签之间也不太

    需要层次关系的约束。这样的标签体系,比较典型的代表是Bluekai的标

    签体系,由于其面向的对象是追求效果或特殊人群定位的广告主,因而

    组织上的规整性也就让位于效果的精准性了。关于Bluekai标签体系的更

    多介绍,参见6.6.5节。

    还有一种特殊的标签形式,即关键词。直接按照搜索或浏览内容的

    关键词划分人群和投放广告,往往可以达到比较精准的效果。关键词这

    种标签体系是无层级关系、完全非结构化的,它虽然很容易理解,但并

    不太容易操作。不过由于搜索广告在整个在线广告中的重要地位,选择

    和优化投放关键词这样一项专门技术已经发展得相当充分,因此这种标

    签也是实践中常用的。

    4.3 展示量合约

    在今天,广告位合约的方式并非互联网广告的主流,哪怕是以品牌为目的的投放。实际上,互联网主流的品牌广告投放方式是按照CPM结

    算的展示量合约。展示量合约指的是约定某种受众条件下的展示量,然

    后按照事先约定好的单位展示量价格来结算。这种合约还有一个名称,就是担保式投送即GD,其中的“担保”指的就是量的约定。实际执行

    中,在未能完成合约中的投放量时,可能要求媒体承担一定的赔偿。

    很多情况下,我们也会把展示量合约通俗地称为“CPM 广告”。实

    际上,CPM 广告还包括另一种按 CPM 结算,但是不约定展示量的售卖

    方式,如广告交易市场中的广告售卖。而那样的非保量CPM实际上属于

    竞价广告而非合约广告,其商业逻辑差别较大。因此,这里我们采用展

    示量合约的说法。

    我们从供给方和需求方两方面来看这种售卖方式出现的合理性。媒

    体从按固定广告位售卖变为按CPM售卖,初衷是为了在受众定向的基础

    上提高单位流量的变现能力,可是面向的仍然是原来的品牌广告主。广

    告主按广告位采买时,比较容易预估自己拿到的流量,可是按照人群定

    向的方式采买,流量有诸多不确定的因素。因此,需求方希望在合约中

    加入对量的保证,才能放心地采买。

    展示量合约虽然以人群为显式标的进行售卖,但是请注意一个非常

    重要的事实:

    展示量合约并没有摆脱广告位这 ......

您现在查看是摘要介绍页, 详见PDF附件(17515KB,382页)