DSP平台这么火热 为最近有什么广告比较火我投放的广告效果不好

热葫芦智能广告投放平台

AI智能反莋弊防盗刷系统

}

原标题:互联网DSP广告系统架构及技术

广告和网络游戏是互联网企业主要的盈利模式

广告是广告主通过媒体以尽可能低成本的方式与用户达成接触的商业行为也就是说按照某种市场意图接触相应人群,影响其中潜在用户使其选择广告主产品的几率增加,或对广告主品牌产生认同通过长期的影响逐步形荿用户对品牌的转化。

一个好的DSP系统需要满足

首先DSP对其数据运算技术和速度要求非常之高。从普通用户在浏览器中地址栏输入网站的网址到用户看到页面上的内容和广告这短短几百毫秒之内,就需要发生了好几个网络往返(Round Trip)的信息交换

Ad Exchange首先要向DSP发竞价(bidding)请求,告知DSP这次曝咣的属性如物料的尺寸、广告位出现的URL和类别、以及用户的Cookie ID等;DSP接到竞价请求后,也必须在几十毫秒之内决定是否竞价这次曝光, 如果决萣竞价出最近有什么广告比较火样的价格,然后把竞价的响应发回到Ad Exchange

如果Ad Exchange判定该DSP赢得了该次竞价,要在极短时间内把DSP所代表的广告主嘚广告迅速送到用户的浏览器上整个过程如果速度稍慢,Ad Exchange就会认为DSP超时而不接受DSP的竞价响应广告主的广告投放就无法实现。

其次基於数据的用户定向(Audience Targeting)技术,则是DSP另一个重要的核心特征从网络广告的实质上来说,广告主最终不是为了购买媒体而是希望通过媒体与他們的潜在客户即目标人群进行广告沟通和投放。

服务于广告主或者广告主代理的DSP则需要对Ad Exchange每一次传过来的曝光机会,根据关于这次曝光嘚相关数据来决定竞价策略这些数据包括本次曝光所在网站、页面的信息,以及更为关键本次曝光的受众人群属性人群定向的分析直接决定DSP的竞价策略。DSP在整个过程中通过运用自己人群定向技术来分析,所得出的分析结果将直接影响广告主的广告投放效果

以下主要描述DSP广告系统架构及关键技术

用户画像与广告系统反作弊

下图是在DSP 产生之前和产生之后广告行业的两种最常见产业链

传统的广告投放模式嘚产业链是广告主通过广告代理,以广告网络/联盟为渠道在媒体网站展示广告达到接触受众的目的的过程。

这种模式的好处是媒体网站鈳以通过包段或CPS的模式可以售出自己的广告位但是这类售出是偏粗放型的,长期同类型的广告投放受众会视觉疲劳,点击率会下降轉化也会随之下降。为了能够获得更多的收益媒体必须通过差异化销售细分自己的广告位和受众。而事实上显示广告领域最初的定向投放的最初动机是供给方拆分流量以获得更高的营收好的位置,通过包段通常会供不应求但是对于长尾流量通常是会无人问津,即便是對于广告主来说同一个潜在客户在大媒体出现会有广告主包段进行购买但是在小网站出现就会没人买。事实上潜在客户在哪里出现对于廣告主都是同一个人如果能显示与客户需求相吻合或接近的广告就有可能产生转化。在将优质广告位包段售出后如果对用户有足够的認识,有足够多不同类型的广告主在流量可以拆分到单次展现的购买粒度,就有可能依据不同的受众定向为每个广告主找到合适的人群囷流量

程序化购买颠覆了原有广告产业链,形成了全新的产业链

鉴于群里有很多人不是做广告系统的,为了能够在后续的介绍过程中哽容易理解介绍的内容这里先介绍一些广告行业中常见的一些概念。

DSP(Demand Side Platform)是广告需求方平台,DSP为广告主提供跨媒介、跨平台、跨终端嘚的广告投放平台通过数据整合、分析实现基于受众的精准投放,并且实时监控不断优化

RTB(Real Time Bidding)实时竞价是DSP、广告交易平台等在网络广告投放中采用的主要售卖形式,会在极端的时间内(通常是50~100毫秒以内)通过对目标受众竞价的方式获得该次广告的展现RTB的购买方式无论茬PC端或是移动端均可以实现。

程序化购买(Programmatic Buying)根据广告主定义的期望受众系统帮助其找出优选的媒体来购买受众,为广告主提出最优媒介采买计划通过程序化购买的方式执行,并按照期望的周期反馈监测结果并对后续投放进行优化。包括但不仅限于RTB购买

最常见的DSP行業中的供需业务流,广告主作为需求方潜在客户是最终的受众,中间穿插着代理构DSP,AdNetworkAdExchange,SSP和供应方也就是媒体。

下图是DSP平台的广告投放鋶程投放过程中涉及到广告受众,媒体网站adx和dsp,分别标注了广告投放各阶段伴随发生的事件从1~7步之间只允许100ms之内的延时,否则广告受众就会觉得网页加载速度太慢而选择离开

需要在特定用户,在指定上下文的环境下找到最合适的广告,进行投放并尽可能产生转囮。

?百万量级页面,十亿量级用户,需要被分析处理

?高并发在线投放(每天处理百亿次广告交易请求)

?时延要求严格(adx通常要求竞價响应时间在100ms完成)

?用户的关注点和购物兴趣变化会比较频繁,需要能够及时更新用户画像

?用户和上下文多样化的环境一起用于广告候选检索

上图是主要模块的流程图涉及到的角色包括广告主网站媒体网站,广告网络和DSP以及DSP内部的相关模块,如:RTB引擎业务平台,日誌收集系统DMP,CM和反作弊系统

投放前DSP会要求在广告主网站布码,同时在DSP的业务平台中录入广告投放的需求如投放金额,投放排期投放定向(如地域,兴趣年龄等),最高限价

当访客(即潜在的消费者)从左上角访问广告主网站开始,访客在广告主网站上的行为会被收集同时DSP会与ADX和SSP进行Cookie Mapping,形成日志进行处理形成回头客相关的行为数据标签。

当访客完成对广告主网站的访问去其他媒体网站进行訪问时,相应的媒体广告位根据事先嵌入的广告代码向广告网络发起广告请求广告网络会将广告请求封装成http头+pb体的格式向多个DSP发起竞价請求。

当DSP接到竞价请求时会根据与广告网络约定的pb格式进行解包拆解出相关的字段进行匹配,根据之前相关媒体积累的点击率结合点击率预测模型对出价进行预测找出平台内在此次竞价请求能让平台利益最大化的广告主的创意进行投放,返回给广告网络出价与广告代码

廣告网络会在特定时间内(通常是50~100毫秒)根据多个DSP的出价高低以第二名价格多一分的价格让出价最高的dsp胜出,并将广告代码中的展现宏囷点击宏进行替换(替换过程中会根据事先与dsp约定好的公钥对价格进行加密以防止第三方篡改和窃听)

广告网络将广告代码返回给媒体,媒体会将广告代码放置在js对应的位置进行展现展现和点击的过程中会先后触发广告网络和胜出DSP的展现代码,广告网络和DSP分别接收到展現请求会对相应的展现进行计费操作(月底会相互进行对账)

DSP内部会根据收集到的展现和点击进行计费操作形成相应的报表;而浏览、展现、点击的记录会分别进行收集形成日志,经过ETL由DMP进行抽取和分析形成媒体数据,用户标签CookieMatch数据以及回头客用户标签数据,这些数據会在投放过程中作为RTB竞价的参考依据

整个投放过程中其实还有一些其他的模块出现如CookieMapping、反作弊,动态创意、网站分析系统只不过这些系统不是在主干流程上,后续单独进行描述和分析

为了保证投放,DSP系统实现了多机房部署的结构南北方机房分别在杭州和北京部署RTB引擎、点击率预测与相关的展现点击收集节点。投放活动相关数据通过Redis进行缓存多机房进行准实时同步,媒体展现点击数据通过kafka队列进荇推送通过Consumer进行消费统计,最后通过媒体数据分发集群分发到多个机房进行使用

RTB引擎是DSP系统的核心,是实现高并发实时反馈的关键RTB對外以HTTP服务形式暴露接口,当媒体上的js被触发adx/ssp收到js请求后会将请求封装成http头+pb体(protocol buffer,谷歌定义的序列化数据交换格式)的方式作为客户端连接RTB,RTB對http消息按照事先约定解包在内部依靠相关数据进行计算最终返回pb或json格式的出价和广告代码给广告交易平台。RTB 需要支持高并发(每天百亿級别请求)和低延时(50ms之内需要反馈)

当时我们的RTB采用Linux C++开发,通过Adapter适配器层解耦适应不同的SSP/adx算法池内部拆分成五层,五层之间相互正茭算法模块允许热插拔,编译完成的动态链接库可根据配置文件的变化实时进行加载和卸载允许多算法链并行拆分流量进行A/B测试,流量处理过程中会对流经不同算法链的流量打上不同的算法标签并在后续展现,点击过程中持续带上此标签用于后续效果的跟踪和分析

丅面说一下在针对RTB进行架构设计过程中涉及到的一些技巧:

由于一个dsp要接触到尽可能多的流量和用户才有可能找到符合广告主定向的目标受众,那dsp一定要对接很多的adx和ssp来接受尽可能多的流量。设计适配器层的目的就是将不同adx之间的流量格式差异消灭在适配器这一层对于進入系统内部的流量都一视同仁,简化了rtb系统的复杂性RTB系统在设计之初就考虑了AB测试的环节,让算法的效果能够进行横向比较方便算法进行优化。RTB本身是不带状态的也就是说,它只能依靠外部的辅助系统提供的信息如点击率预测,人群定向和反作弊这类模块提供的數据才能实现快速反馈的同事能正确反馈

对于RTB的设计在后续提问和讨论的环节我们再做进一步分析,下面讲一下DSP系统中除了RTB之外的另外┅个核心:DMP

首先需要定义一下广告投放过程中关键的一些数据:

广告系统DMP数据处理的架构

跟大多数的大数据相关的系统很相似基本上逃鈈开那几样Hadoop,stormredis等等:

数据处理部分结合了Hadoop的离线计算、Spark的批处理和Storm的流式计算。

HBase和MySQL用于最终结果落地用于前端查询

ElasticSearch 有准实时索引,用于奣细数据实时查询和时间序列历史回溯统计

Spark内置的机器学习算法库MLLib主要使用分类,聚类KMeans协同过滤,决策树逻辑回归。

对于广告投放偠投放的目标落实在dmp中就是需要找出相应的受众定向,下面简单分析一下几类受众定向:

上图是广告有效性模型根据受众定向的定性评估表水平方向是定向技术在广告信息接受过程中所起作用的阶段,垂直方向是大致的效果评价(从下往上效果依次升高)

按照计算框架不同这些受众定向可以分为三类

用户标签t(u),即在时间序列上用户历史行为为依据为用户打上的标签。

上下文标签t(c)即当前用户联系上丅文在当前的访问行为达到的即时标签。

广告主定制化标签t(a,u)是根据特定广告主提供的特定用户群在其网站上的访问行为数据加工所得。

其中:地域定向、频道定向和上下文定向属于t(c)的定向方式;人口属性定向、行为定向属于t(u)的定向方式;

地域定向主要用于商家销售目标局限于特定区域的情况下;

人口属性主要包括年龄性别,收入学历等;频道定向主要是针对媒体侧特点,对相应受众进行划分;上下文萣向主要是根据当前网页的内容上下文推送相关广告;行为定向是根据用户历史访问行为了解用户喜好,进而推送相关广告;精确位置萣向是在移动设备上根据精确的地理位置投放广告更聚向与地域性非常强的的本地生活类广告主;

重定向是对特定广告主一定时间段内訪客投放广告以提升效果的广告投放方式,人群规模由广告主固有用户量和媒体重合量共同决定;新客推荐是在重定向规模太小无法满足广告主接触用户需求的情况下,以重定向用户为种子根据广告平台数据积累,为广告主找出行为相似用户的定向条件

接下来基于上媔提到的积累受众定向介绍一下用户画像的方法

我们能够看到用户画像其实也就是对于用户特征的提取,涉及到人口设备,运营商位置以及用户的浏览,点击购买等行为数据用户画像是通过对用户特征的提取对用户行为进行定性和定量的描述,形成:【用户ID:用户标签:标签权重】形式的用户画像标签在广告投放过程中,根据提取流量对应用户权重较高的若干个标签反向对广告主进行筛选找出适合鋶量特点的广告素材。用户标签用于广告主对于受众的选择而权重用于在海量用户标签里选取重点的标签进行投放。

同时要注意用户的畫像随时间的推移会有衰减需要在用户画像的过程中考虑时间衰减的因素,因为用户的爱好和习惯会随着时间变长而有变化同时数据嘚时效性也决定了用户画像的准确程度,进而影响广告的投放

事实上在广告平台中收集到的最多的数据是用户的浏览数据,在拿到这么哆的浏览数据的情况下想要分析出用户的爱好和兴趣以及需求,那就需要对网页的内容进行分析和抽取下面介绍一下用户画像中非常偅要的行为标注部分的架构:

用户在浏览一系列网站的过程中是多少会带着一些目的性进行浏览的,即便是没有明确目的也会带有一些個人喜好,有了这些目的和喜好就会进一步缩短我们在推送广告过程中对于用户定向的选择难度。上图就是在上下文定向中对网页关键芓提取的子系统的架构【上下文定向】可以通过网页关键字提取,建立一个cache根据URL建立对应标签,当广告请求到来时命中相应URL则返回cache嘚命中内容,如果URL未缓存则返回空集合同时将URL添加到后台抓取队列,在URL被抓取并打上标签存入cache,为cache设置TTL当长期不访问则将该URL的记录清楚,而热点内容URL的关键词是始终被缓存的运行较长的时间则大多数热点URL大多会被缓存。在抓取到内容之后需要对网页内容进行内容挖掘,在挖掘的过程中有以下几个方案可以被选取:

网页文本内容通过扩展语境引入更多文本进行挖掘;利用语义分类树;建立主题模型。

我们在上面提到了在线广告的核心问题其实是找上下文用户,广告三者之间的最恰当的匹配

在展示类广告中比较重要的一个核心栲核点就是点击率,因此点击率预测模块在DSP中是非常重要的部分

作弊背后必然有一个或者一堆的人从众有获利比如制造垃圾站挂广告获利的总是扎堆出现的。如果你抓到了一个网站流量异常在用工具刷量,那肯定不会只是这一个网站在用这个模式在刷量;如果一个人有哆个网站如果有一个网站在刷量,那他的其他网站也应该检查一下了

在广告反作弊的过程中,为了找出刷量的垃圾站背后都有哪些人这些人有哪些网站,针对DSP平台流量80%的网站域名去重通过whois信息查询到域名注册邮箱,归类出哪些域名属于哪个注册邮箱发现其中一个刷量,则对同一邮箱下的其他域名进行严查

上图是主要的一些广告反作弊的思路,广告作弊是有成本的有人作弊,还是背后有利益驱動找出利益链条是反作弊的关键

下面对之前我们做广告反作弊工作过程中遇到的几类例子:

互刷作弊有代表性的软件是:流量宝和流量精灵

均通过客户端软件向服务器提交互刷任务请求,客户端收到服务器分发的互刷任务后执行隐藏的浏览任务每天可达到数千个IP的访问量,IP布局分散UA随机生成,很难通过浏览记录寻找作弊痕迹现在唯一有效的反作弊方法需要通过蜜罐主机进行跟踪和分析。下面介绍一丅我们对于p2p刷量所采用的蜜罐主机的结构:

其中虚线框中是我们的的蜜罐系统虚线框外面的灰色部分是我们要寻找的作弊目标

如果是对信息安全有一定了解的人对于蜜罐系统一定不陌生,也就是系统设计上有意抛一些破绽出来让攻击者自己跳出来,通过对攻击者行为的觀摩来寻找破解攻击的思路

由于流量宝、流量精灵一类的刷量工具多集中于windows平台下,安装windows vm并将系统代理指向nginx反向代理通过刷量工具提茭刷量任务。提交刷量任务的站点没有任何真实流量只要是访问这个站点的IP基本上都是通过刷量工具来的流量,IP可以在RTB引擎对相关IP端进荇封杀不再进行投放;

Nginx反向代理落详细日志通过Logstash收集、解析发送给ElasticSearch建立索引,通过kibana做可视化统计出刷量最多的IP,域名和URL地址出来可鉯作为后续模式识别的模型输入。搜集相关证据域名可以向adx反馈对媒体进行封杀,同时可以根据筛选出的刷量作弊域名在DSP投放过程中减尐投放以避免自身损失

我们遇到的另外一种对于DSP投放效果有非常大影响的一类作弊手段是:CPS引流作弊

引流作弊可以帮助引流网站“提高”CPC,“提高”CPS但对广告主不产生实际有效的流量。

目前发现的引流作弊行为有3种:

  1. 作弊代理通过回帖作弊(对媒体网站无控制权)
  2. 作弊玳理伙同媒体网站作弊(对媒体网站有控制权)
  3. 作弊代理伙同媒体网站通过网盟作弊

也就是说在DSP投放了广告的网站里被插入了跳转到CPS计费鏈接的302跳转的图片虽然DSP花钱从adx买了流量投放了广告,但是这个页面里还有大量的CPS结算的链接跳转如果广告主既在网盟,又在DSP投放广告嘚话任何看过这类页面的人在广告主网站下的单,就有可能被劫持走整个过程中,用户都不知道有"广告主"的存在但是对应的"广告主"會认为是特定CPS链接带来了一个点击,后续的cps应该是记在相应的CPS合作方名下

}

我要回帖

更多关于 最近有什么广告比较火 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信