计算机视觉及智能影像行业深度研究报告

描述

1. 计算机视觉领跑 AI 产业,应用场景广阔

1.1 什么是计算机视觉?让机器“看懂”影像的 AI技术 

计算机视觉是 AI 核心研究领域,目的在于让机器具备人类的“眼力”。计算机视觉是人工智能的 分支之一,目的在于通过电子化的方式来感知和理解影像,让计算机具备和人一样的"眼力",能够 识别、理解周围的世界。人脑接受的 80%的信息来自眼睛(视觉),50%的大脑活动都与处理视觉 信息有关,可见视觉在信息传递中的重要性和复杂性。 

应用场景广阔,技术价值巨大。计算机视觉应用领域广阔,包括安防中的智能监控、人脸识别,金 融中的身份验证,零售中的商品识别,自动驾驶,文娱领域智能营销、AR 特效等,技术价值巨大。 

人工智能

人工智能

为了“看懂”世界,计算机必须具备两大能力——感知智能和认知智能,通过两大能力,计算机将 感知到图像中包括哪些物体、人、物,并识别表达。 

能力 1 ——感知智能:图像中有什么 

感知能力既通过方法,机器可知道影像中有什么,主要是局部像素分类及识别,如物体和人的识别、 分类、定位等。以下图为例,计算机视觉的感知智能即为识别出图像中包括了狗、猫、花朵、篮子、 绿叶这些物体。 

从具体技术来看,视觉感知智能有 5 大核心技术,分别为图像分类、物体定位、物体识别、语义分 割、三维重建。

图像分类:根据图像主要内容进行分类。此为最基本视觉任务,它将一副图像分类到一个属 于已知的类别集合中的类别,比如将带有猫的图片归属到猫类。流行的基本方法就是用深度 卷积网络(CNN)提取特征并分类,将图片输入网络直接得到物体的类别。 

物体定位:定位包含主要物体的图像区域,以便识别区域中的物体。当一副图像内的不同位置 存在不同物体时那就不能简单地将图片分为某一类了。这时需要找出图像中有几类物体,准确 地标注出它们所在位置,并把物体在图像中框出来。 

语义分割:把图像中每一个像素分到其所属物体类别。用目标检测方法把物体在图像中框出来, 框一般是用矩形框,但物体一般是流线形的,为了进一步标注出物体,需要指出图像中哪些像 素是对应哪一类的物体——既图像语义分割,效果如下图所示(图 3)。语义分割可看做分类 问题,可以借鉴分类算法把每一个像素划分到某一类物体。

物体识别:定位并分类图像中出现的所有物体。这一过程通常包括:划出区域然后对其中的 物体进行分类。此为图像分类、物体定位和语义分割的结合。 

三维重建:由二维图像升级到立体视觉。三维重建一般是指基于二维图像通过图像预处理、 点云配准与融合、生成表面等过程把真实的三维场景从二维图像中恢复出来。

能力二——认知智能:图像表达了什么

在图像识别基础上,机器还需知道各个局部之间关系、整体关系,即理解和推断物体之间关联,推 测人的情绪和意图,对整体场景判断等,甚至进行决策。具体如下图: 

1)图像识别:男士、女士、餐桌、酒杯、食物、鲜花、灯光

2)人物的动作、表情以及情绪:吃东西、微笑、快乐 

3)图像各部分的关联:男女注视对方、男女是情侣关系、男女在餐桌上吃饭

4)整体场景的含义:一对情侣在餐厅约会,彼此很开心

具备了感知智能和认知智能,计算机就可以像人脑一样处理视觉信息,甚至在识别人脸、物体和场 景的准确率上超过人类,并且在此基础上进行推理、决策。而这种能力洽洽是安防、自动驾驶、金 融、医疗等领域存在强烈需求,计算机视觉技术随着不断成熟将广泛应用于各个行业。

1.2 计算机视觉领跑 AI 产业,安防领域应用最深 

计算机视觉是中国 AI 行业的最大组成部分,市场规模飞速增长。根据中国信通院报告数据,2017 年中国人工智能市场中计算机视觉占比 37%,据艾瑞咨询预测 2018 年计算机视觉市场规模达 120 亿元。从全球来看,MarketsandMarkets报告显示,2017 年基于人工智能的计算机视觉全球市场规 模为 23.7 亿美元,预计 2023 年会达到 253.2 亿美元,预测期内复合年增长率 47.5%。 

从投融资角度来看,计算机视觉最被国内一级市场看好。据清科资本研究中心,2018 年中国计算机 视觉相关企业融资额达 158 亿元,占比 25%,位居大 AI 行业第一,同时也远超美国的 73 亿元。 自动驾驶、智能机器人等 AI 方向同样依赖计算机视觉技术,所获融资中亦有大量投入到计算机视 觉研发中。 

计算机视觉应用场景广阔,商业化变现空间大。计算机视觉能极大提升机器的图像感知能力和认知 能力,因此应用场景十分广阔,例如在安防影像分析、泛金融身份认证、手机和互联网娱乐、批发 零售商品识别、工业制造、广告营销、自动驾驶、医疗影像分析等领域都具有巨大应用价值。 

安防领域:落地最快。安防是人脸识别技术最成熟的落地领域,也是 AI 视觉公司普遍首先切 入的细分领域。例如对道路卡口、车站、地铁站、机场等的监控视频进行智能分析,检测出视 频中的人脸与黑名单库中的影像记录实时比对,比对成功则报警。 

金融领域:人脸识别广泛应用。人脸识别在金融领域已出现多种解决方案,伴随识别准确率上 升,远程开户已在互联网金融行业得到广泛应用,人脸支付、刷脸取款等开始被各大银行采用。

医疗影像:数据门槛高。医疗影像的数据标注门槛较高,需由专业医师标注,且非典型病例的 标注意见较难统一,因此数据可得性较差。标注工作之外,医疗影像分析对数字化程度、数据 量、临床路径、对应检测量都有着苛刻的要求, 

无人驾驶:技术难度大。无人驾驶涉及采集摄像头、雷达等多种数据,并根据多重数据进行车 辆、物体、道路、行人等不同识别后进行决策,计算机视觉将在环境感知(周围有什么)和地 图绘制(我在哪儿)中发挥重要作用。 

安防行业应用程度最深、规模最大,广告营销紧随其后有望加速发展。安防影像分析是目前计算机 视觉最大的应用,2017 年在计算机视觉市场规模占比约 67.9%。广告营销作为第二大应用领域占 比达 18%,计算机视觉技术能够智能挖掘影响内容广告位,构建新型营销模式,AI 营销市场份额 或加速增长。 

渗透率受数据可得性、算法难度和需求弹性影响,智能营销、自动驾驶、智能医疗或加速发展。从 目前的落地进展来看,安防、移动互联网领先,渗透率相对较高,医疗、无人驾驶则更多还在研发 测试阶段,基本尚未商业化应用。安防行业、移动互联网由于人像数据相对易得、人脸识别需求迫 切,成为较早应用视觉 AI 技术的行业,而医疗行业则由于数据不够系统化、识别专业性强,虽然有充足需 求但尚未大规模应用。未来随着图像数据结构化和技术成熟,我们认为智能营销、自动驾驶、医疗 影像分析、动态安防等垂直市场将加速增长。 

2. AI 视觉赋能大视频行业,成就智能影像黄金赛道 

对于互联网大文娱行业来说,我们判断视频+AI 是未来发展趋势,该赛道的新兴模式正快速发展, 尤其计算机视觉领域下智能影像生产赛道,原因如下:1)定位黄金赛道,5G 渐行渐近,视频将是 未来最主要的信息传播方式,视频中 AI 应用场景广阔;2)技术上已具备可能性,AI 赋能下,视 频广告营销模式将走向精准化、实时化、智能化、文娱生产模式走向自动化,而且这两个赛道均是 大规模赛道具有应用深度。 

2.1 定位黄金赛道,视频成为最主要信息载体及传播方式 

视频呈现已是互联网大势所趋。过去 20 年里,互联网的信息主阵地经历了门户网站到以谷歌、百 度为代表的搜索引擎,再到Facebook、Twitter、微博、微信社交平台的进化过程。当前随着各类 PGC、UGC 平台、直播、短视频和 VR 的兴起,视频将逐渐取代图文成为主要的互联网信息表达 和传递方式。正如谷歌、百度将文字结构化一样,在一个视频成为主要信息呈现方式的时代,计算 机视觉也将作为一项不可或缺的底层技术,开拓诸多应用场景,提高生产效率和生活便利程度。 

目前 BATT 的产品均主要以视频为呈现方式,如手百信息流(视频占比 80%)、字节跳动(抖音 短视频、今日头条以短视频为体现方式)、甚至阿里淘宝/天猫(加入视频、直播等方式)等等。 我们从总时长角度来看,中短视频已呈现爆发式增长。根据 QM 统计,从 2015 年至 2019 年 4 月, 长短视频占互联网用户总时长由 9.7%提升至 21.1%,增长超 100%,尤其短视频,由之前仅占互联 网用户总时长 0.5%到 13.4%,呈现爆发式增长。此外,新闻增长也因目前新闻产品均以视频信息 流分发为主。总体上看,各大互联网公司均大力开发短视频产品。 

2021年预计视频流量将占据全球所有网络用户流量的82%,为计算机视觉奠定数据基础。据思科 公司评估,2021 年单月上传至网络的视频总时长将超过 500 万年,每秒将诞生 1 百万分钟的网络 视频内容,网络视频流量将占据全球所有网络用户流量的81.7%。快速增长的视频内容规模蕴含海 量信息,也为计算机视觉的深度学习算法进化提供了大数据支持。

5G技术加速视频信息流增长,信息视觉化趋势继续强化。5G 将带来超高速(4G 速度 100X)、低 延时(4G 延时 1/50)以及海量链接(连接设备超过地球人口100x)。复盘通讯技术从 2G 到 4G 的进化对传媒内容形态的影响,可以看出随着 5G 时代渐行渐近,视频会越来越成为互联网主要信 息表达方式。

2.2 图像感知智能日益成熟,为商业化落地奠定基础支持 

上文我们已经论证大视频行业是未来3-5年的黄金赛道,需求端有望持续高速增长,同时,我们认为计 算机视觉技术也日益成熟,为商业化落地奠定坚实基础,现有技术能力也已经能够支撑在广告营销、 内容自动、安防等领域的应用。 

深度学习推动计算机视觉算法取得突破式发展。2012 年深度学习方法应用于图像识别,将 ImageNet图像识别大赛的识别错误率由 25.8%降低至 16.4%,由此开启计算机视觉算法的飞跃发展,到 2017 年图像识别错误率降低至 2.25%,人脸和物体识别准确度都已超过人类,商业化已具备基础技术支 持,尤其是侧重于感知的图像分类和人脸识别技术已经在安防、身份认证和广告营销领域实现商用 价值。 

视频结构化技术将影像解析,积累海量可用数据。和文字、语音、图片相比,视频是信息容量最大、 信息传递效率最高的载体,但也正因为信息容量大、信息组织方式非线性(不像文字、代码有标准 规则),所以也最难转化为线性数据。而视频结构化技术系统通过图像处理、图像识别、内容识别、 语义融合等技术,将视频转化为结构化的能被计算机处理的数据,而数据就是互联网时代的核心资 源,奠定大视频行业发展基础。 

综上所述,视频已逐步成为最主要的信息载体和呈现方式,视频行业必然为黄金赛道;同时算法进 化推动图像感知智能日渐成熟,视频结构化技术将非线性的视频转化为线性数据。智能营销商业化 也已经落地,视频 AI+大文娱产业发展前景值得期待。 

3. 智能影像应用场景:智能营销已商业化落地,内容审 核、影像自动生产起步 

智能影像目前已经商业化落地的领域主要是广告营销,即利用AI技术创新视频广告生产模式,精 准化场景营销,另外影像自动化生产也已展开探索,下文我们将具体展开。 

3.1 视觉 AI+营销:智能植入广告成为主赛道,直播、电商跃跃 欲试 

我们可以将计算机视觉在广告营销领域的应用简单概述成,首先要有底层数据(视频流量、视频中 包含的信息)的积累、通过中层技术(如何提取信息、分析信息)的信息处理、最终落实到上层应 用(既落地的商业模式将数据变现),数据层和技术层两大驱动力的快速发展,目前文娱的垂直应 用领域已涉及到植入广告、直播营销、文娱电商。 

3.1.1 视频广告智能化,智能植入商业模式初具规模 

商业模式——利用计算机视觉为视频广告增量提价的平台生意。智能植入平台输出计算机视觉技术, 全网内容方或视频平台输出视频,二者共同创造出视频内广告位(具体可能以图贴、物体、热点链 接、红包等形式出现),供所有广告主或代理商投放。所得广告费收入再向内容方或视频平台进行 分成。此外,智能植入平台与传统 DSP、SSP 本质区别在于,它并不是简单的渠道方,更是技术服 务提供者,通过视觉 AI 技术在原生视频中挖掘广告位,并根据场景。智能植入平台的价值不仅在 于作为渠道连接视频流量方和广告主,更在于供给增量广告库存和通过精准投放提高广告价值。 

视频结构化标签为精准营销提供丰富数据。基于对人、物的数据的深度学习,计算机视觉可以进一 步分辨出场景标签,形成自有的大数据沉淀及闭环。以极链科技的VideoAI视频结构化数据平台为 例,依靠算法优化和深度学习,识别准确率已经满足商业化应用要求,积累了庞大的视频结构化标 签数据库,明星的识别准确率已经达到 99.6%,物体识别准确率 99%,场景识别准确率 99.4%,品 牌识别准确率 98.8%。 

更进一步,通过视频结构化技术扫描海量视频,对人物、物体、场景进行标签化处理,对明星进行 标签化场景化标注,一方面效果广告主实时投放时可以更多匹配植入食品类广告,提升营销精准度; 另一方面也可以为品牌广告主提供明星信息,寻找更合适的代言人,将明星与商品精准结合。

此外,从替代角度来看,在线长视频平台付费率加速提升,广告形式变化为必然趋势。我们从另一 维度去验证产业发展轨迹,以季度末公布的付费会员数量和该季度移动端MAU的比率定义为付费 渗透率,爱奇艺、腾讯视频的付费渗透率目前在15%左右,相比 Netflix 40%的渗透率,趋势必然 提升。用户成为会员后即可跳过贴片广告,而头部剧集、综艺的贴片广告时长在60-90秒左右,长 期来看付费渗透率提升将对贴片广告总时长形成挤压是趋势所在。

3.1.2 植入广告优势明显 

总结来看,我们认为相比贴片和传统植入广告,智能植入广告优势主要有以下3点:1大幅优化转 化效率:可根据合适场景匹配广告内容进行投放,精准营销提升 CTR;2规模化生产:智能批量 识别广告位,规模化高校植入;3降低门槛,吸引更多广告主:效果化实时投放,降低投放门槛, 吸引海量中小广告主投放。 

优势 1:识别场景精准投放,更可直达购买界面,闭环营销显著提升转化效率。智能植入并 不只是识别出视频中的可植入空间进行投放,更在于判断出视频的情景进行精准匹配。以极 链科技广告案例为例,将长隆旅游广告植入电视剧《人民的名义》中,广告曝光量 381 万次, 广告点击率 6306 次,CTR 为 0.16%;而植入综艺节目中海洋乐园的场景后,广告曝光量 224 万,广告点击率 6.7 万次,CTR 为 1.96%,提升 10 倍以上。在场景基础上还可以通过植入电 商链接,触发用户点击跳转至购买页面促进销售,长隆旅游电商平均跳转率21.74%,而传统 贴片电商转化率 0.3%,超出 72 倍。 

优势 2:智能批量识别广告位,规模化高效植入。无需人工判别,智能识别拆分视频流像素, 低成本、高效率、精准发现增量广告位。传统植入方式工序繁琐,智能植入可以极大节省工时, 效率提升在百倍以上。 

优势 3:降低投放门槛并提供效果监测,吸引更多中小广告主参与。传统植入广告一般发生在 影视剧和综艺的制作过程中,需要提前签约且为品牌广告,广告效果好坏完全取决于电视剧或 影片、节目的收视情况,之前门槛太高,只有大型品牌广告主才有实力做投放,大幅限制了视 频广告的市场规模。而智能植入则可不受剧集或节目限制在进行全网投放(只要有空余广告位), 实现实时投放和程序化购买,对广告曝光、点击和转化效果实时监测,植入广告走向效果化。 智能植入广告实现以 CPC、CPM 计价,广告主可以像投放搜索广告、信息流广告等充值,不 同预算体量可以灵活投放,例如极链科技CPM大多在 100-150元左右,把原有动辄百万的传 统植入门槛大大降低,能够充分吸引中小广告主投放。

综上所述,未来视频广告模式正在发生进化,智能植入广告将替代传统贴片广告成为重要的视频广 告形态,相比贴片和传统植入,智能植入广告优势明显:精准化、规模化、门槛降低均将推动行业 快速发展,智能植入广告已是计算机视觉最易落地的商业化形态之一。

3.1.3 直播互动、文娱电商改善互动体验,闭环营销进一步提升转化效果 

除了主赛道——智能植入广告外,视觉AI在智能营销中不仅可以应用于爱奇艺、芒果TV等 PGC 点播视频平台,还可应用于直播平台提升互动体验,更进一步还可以通过植入电商链接、电商购物 小程序、IP商业开发服务等打造文娱电商系统,直达购买行为,实现视频场景内的闭环营销。

直播互动提升营销体验,助力流量变现。直播场景本身粉丝和互动性,视觉 AI 在直播过程中创建 抽奖、投票、红包、卡牌收集等互动形式,在网络直播中将用户互动和内容营销融为一体。

3.2 其他场景:自动审核、视频信息检索和内容自动生产起步 

以智能植入为代表的智能营销已经借助视觉AI技术实现规模化的商业开发,除此之外,行业也在 探索将 AI技术应用于视频内容审核、视频信息检索和视频内容自动生产等场景的可能性。虽然这 些领域尚处于早期阶段发展规模较小,还没有的成熟商业模式,但我们认为放眼长期仍值得关注。 

3.2.1 视频内容自动审核 

基于视觉感知智能和视频结构化技术,视觉AI可以对视频中的图像进行检测,及时发现涉黄涉暴、 政治敏感、问题明星等风险内容。1)敏感人物:凭借人脸识别技术和名人图像库,计算机可以自 动准确监测视频中是否存在敏感人物,还可以灵活配置人物黑名单、同步辨识敏感和普通人物,一 旦普通人物变为敏感人物,可快速屏蔽相关视频。2)敏感言论和行为:图像认知智能会帮助计算 机理解视频信息和场景,并实时全网比对。 

相比人工审核,AI 智能审核优势明显。1)成本优势:据腾讯财经报道,快手于18年 4 月急招 3000 人内容审核员,审核团队规模达 5000 人,抖音审核团队亦有数千人,可见视频内容审核需求旺盛 且随视频流规模扩大而增长。相比人工肉眼审核,AI 视频审核最大优势在于自动化批量审核提高 效率,能够大大节约人工成本;2)实时更新:视觉 AI 在审核内容的同时也是学习全网视频的过 程,通过深度学习,计算机可以实时更新黑名单和样本库,不断提高识别准确度。

3.2.2 视频信息检索与版权保护 

计算机视觉突破视频检索技术瓶颈,有望实现“用视频找视频”。视频信息检索如我们前文所述, 图像感知、认知智能和视频结构化技术使得影像也能被解析成线性数据,这也为视频信息的检索打 破了技术瓶颈。长期以来搜索引擎智能检索文字信息,后来随技术进步实现了以图搜图。AI 通过 视频结构化技术对视频帧拆分,进而给视频和帧打上标签,可实现海量视频分类、信息提取、视频 比对,未来随技术成熟,上传影像片段或截图后检索视频源或相关视频也可实现。 

影像智能赋能视频版权保护。目前视频版权保护的一大痛点在于,传统技术难以实现自动化的视频 比对和侵权判定。影像智能感知技术成熟后,由于 “视频指纹”是根据视频多模态特征的唯一标 识,不会随媒体文件格式转换、剪辑、压缩旋转而产生变化,基于此构建的智能媒资搜索引擎还可 以在全网进行视频比对,应用于视频版权保护。 

3.2.3 智能影像生产 

除了对已有视频进行解构、分析,将影像转化为数据,挖掘下游应用场景,视觉AI技术还可以从 数据(内核)到视频(呈现方式),切入上游内容生产,提供智能视频编辑、短视频自动生成、后 期特效自动化和信息可视化服务等,视频相较于其他信息媒介固然信息容量最大、传播效率最高, 但同时创作难度、耗费时间和成本也最多,智能影像生产可以提升视频生产效率、降低内容制作成 本。 

智能视频编辑:例如针对综艺节目的大量精彩镜头,1 个小时的原始视频需要专业人员数个 小时才能完成,而通过智能影像技术可摆脱专业设备、专业编辑软件及专业人员的限制,大 大降低制作成本。利用智能影像技术对人物、姿态、动作,运动轨迹进行全景分析并自动剪 辑和合成,最快只需十到几十秒,将生产效率提升超过 10 倍。 

影视轻工业:面向高端、专业视频内容生产市场的特效、三维等后期制作服务,我们认为随 着技术成熟,专业影视生产领域中一些并不复杂但需耗费人力的特效处理工作将被视觉 AI 替代,降低后期成本,提升影视工业化水平。 

视频信息可视化:依靠大数据平台基础,借助可视化模型技术,以数据地图、时间线、气泡 图、交互性图表、人物关系图等方式呈现多维数据信息,实现信息可视化加工生产。 

一个应用实例:智能影像生产技术赋能智慧媒体。2019 年两会期间光明网借助影谱科技的智能影 像 AGC 技术,根据语义场景生产视频内容,影像跟随语义、表情、手势等实时变化演绎,从而可 视化、智能化地呈现政协委员履职作业。这不仅让政协委员履职内容更加直观易懂,相比普通视频 承载的内容也更加丰富趣味。例如政协委员讲到校园进行远程的沉浸式非常强的互动的教学时,其 身后背景便成了一面学术感十足的画面,VR 眼镜也自动戴在人物眼镜上。 

4. 视觉 AI+大文娱领跑者:影谱科技和极链科技 

影谱科技和极链科技均重点涉及国内计算机视觉应用的大文娱行业,他们目前均把智能营销作为公 司主要业务之一,说明广告营销是视觉 AI+大文娱行业落地最顺利的应用领域。同时各自业务和商 业模式、产品服务形态又各有侧重, 

4.1 影谱科技:依靠计算机视觉打造智能营销平台,探索内容 自动化生产

影谱科技是领先的数字媒体可视化技术服务者和原生视频营销引领者,其商业模式包括两大核心:

ACM 内核:可自由支配的自动化生产广告库存(Automatic Content Marketing),即智能植 入广告业务,目前已规模化落地。其商业模式如上文所述,主要依靠接入内容方或视频平台 的视频,依靠视频结构化技术发掘植入广告位并进行精准投放,获取广告发布费用,成本主 要是向上游内容方和视频平台的分成,以及技术成本等。 

AGC 内核:机器自动化生产的视频内容(Automatic Generated Content),包括短视频自动生 产,影视轻工业和信息可视化服务,目前尚处于商业化落地早期,但随视频化程度提升未来 空间较大。 

公司智能营销平台由“植入易”和“Video 易”两大核心产品构成:“植入易”通过智能计算、浮 层架设和实时植入三大技术,自动扫描发现视频中广告位,结合场景精确植入,展现形式包括贴纸、 LOGO、道具、画中画等多种形态,重在品牌和产品展示;而“Video 易”可视化技术服务平台将 视频内容延展,实现内容与观众互动营销,产品包括直链 URL、投票抽奖红包小程序、电商链接 等,重在互动和转化。 

携手商汤科技,引入领先技术聚焦 AI+大文娱产业。影谱的底层技术架构接入了商汤 SenseMedia互联网广电视频结构化解决方案和SenseAR增强现实绘制平台的功能,共同聚焦于AI+大文娱产 业。双方凭借在计算机视觉、视频结构化、深度学习、大数据、视频广告投放、网络视频互动技术 等领域的独特优势,面向互联网、影视、视频等大文娱产业细分领域提供 AI 影像商业化服务,挖 掘视觉技术的多维度应用价值,拓展商业边界。 

覆盖海量视频流量,为场景营销提供大数据支持。公司与湖南卫视、芒果TV、华数 TV、火星文 化等多家内容制作方签署合作协议,同时为腾讯视频、乐视TV、迅雷、搜狐视频、暴风影音等多 家视频平台提供视觉营销技术服务。

创新营销方式,赢得众多品牌广告主青睐。公司已帮助蒙牛、雀巢、汇源、立邦、蓝月亮等多家知 名广告主进行场景营销,植入案例深受广告主认可,目前合作的品牌广告主丰富,标杆效应助力未 来客户拓展。 

4.2 极链科技:视觉 AI 赋能场景经济,营销应用矩阵丰富

视觉 AI 技术驱动,“广告+电商+互娱”打造视频场景产业闭环。极链科技是一家以视频 AI 技术 为核心,对全网视频进行场景解析,进而驱动场景新经济发展的人工智能科技公司,核心技术为VideoAI视频智能系统、VideoOS视频小程序系统,主要业务为广告、电视和互娱。极链除了在植 入广告上有 AI场景营销平台(智能植入广告),还布局了视频电商、视频互娱等,在智能营销的 产品矩阵更丰富,但尚未向上游切入内容生产。

技术积淀卡位视频流量场景,收入实现爆发增长。公司表示合作方覆盖了65%的头部流量视频平 台,主要为其提供视频互动操作系统,实现广告自动投放和电商自动投放;支持移动端、PC 端、 OTT 跨屏组合投放。公司为芒果 TV、爱奇艺、中国蓝 TV、凤凰网、风行网、搜狐、一直播、抖 音等视频、直播、短视频平台提供AI电商、互动娱乐、情景广告、视频搜索、视频头条等系统应 用。月服务用户达 4.2亿,和百家品牌、商家、供应链建立深度合作,协同全网APP构建了完整 的视频场景产业闭环,目前在AI+视频行业已实现大批量商用。据华尔街见闻报道,公司 2017 年 营收 1.5 亿并实现盈利,2018 年收入 5.8 亿,其中 12 月单月营收超过 1 亿元。 

场景营销精准匹配受众,互动形式实现品效合一。ASMP 系统是极链科技打造的视频 AI 情景营销 平台,将海量视频内容结构化,进而将商品与内容场景精准融合。ASMP 系统首先通过独创的 Video AI(以视觉识别为基础的视频结构化数据平台)自动扫描视频中的场景,搜索视频内中互动广告 可投放的点位,然后借助 Video OS(广告创建程序),自动植入云图、气泡对话、视频内投票等 互动广告。投放过程中还可以通过 Video Data 大数据系统实时监测投放效果。 

4.3 Mirriad: 英国智能植入广告公司,海外流媒体格局和商业 模式阻碍植入广告变现 

Mirriad是一家英国视频植入广告技术服务商,通过专利技术系统能够自动扫描视频,识别人物和 物体,自动标注适合进行广告植入的位置,进行批量植入,盈利模式为和内容方对广告收入进行分 成,分成比例 20%左右。2017 年和优酷合作进行弹个车广告植入,为公司当年最大单一项目。

该公司于 2017 年 12 月在伦敦 AIM 市场上市,2017 年收入仅为 87.4 万英镑,尚处于起步阶段,17/16年收入超过一半来自中国。目前公司广告投放方式仍为合约投放的项目式,尚未实现程序化购买实 时投放。我们认为这与国外视频网站的竞争格局和商业模式有关,公开资料显示 Mirriad 并未接入 国外主流视频平台。 

Netflix稳居海外流媒体龙头,商业模式不依靠广告变现。国内长视频平台中,爱奇艺、腾讯视频 和优酷土豆三足鼎立,活跃用户和付费渗透率差距不大;而海外流媒体则以 Netflix占据绝对龙头 地位,无论是在订阅用户规模、渗透率上都远远领先Amazon和 Hulu,更重要的是海外流媒体基 本以用户订阅费用为主要收入,基本不通过广告变现,不存在植入广告空间,比如Netflix收入中 97.7%都来自订阅费用。Mirriad的 2017 年收入一半以上来自中国,印度占比 23%,也是由于中国、 印度的视频平台基本都以免费+广告的模式起家,付费率仍然较低。 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分