Netflix数据管道的演进历程

消耗积分:1 | 格式:rar | 大小:0.3 MB | 2017-10-12

分享资料个

去年12月我们的Keystone数据管道正式投入使用，本文我们就来讲讲这些年Netflix数据管道的变化历程。
　　数据是Netflix的中心，很多的商业决策和产品设计都是依据数据分析而做出的决定。在Netflix，数据管道的目的是对数据进行收集归纳和处理，几乎我们所有的应用都会用到数据管道。下面我们先来看看有关Netflix数据管道的一些统计数据：
　　每天约5000亿个事件，1.3PB的数据高峰时段约每秒800万个事件，24GB数据
　　我们用另外的Atlas系统来管理运营相关的数据所以它并没有出现在上面的列表中。
　　由于需求的变化和技术的进步，过去几年我们的数据管道发生了很大的改变。下面我们就来介绍一下。
　　V1.0 Chukwa数据管道
　　最初数据管道唯一的目的就是把事件信息上传到Hadoop/Hive。如下图中所示，整个架构是比较简单的。Chukwa收集事件信息并将sequencefile写入亚马逊S3，之后大数据平台部门会进一步处理并写入Hive。从事件发生到以Parquet格式写入Hive整个过程不超过十分钟，对于每小时甚至每天才运行一次的batch job来说已经足够了。
　　 Netflix数据管道的演进历程

　　V1.5 能够进行实时处理的Chukwa数据管道
　　随着Kafka和Elasticsearch等技术的发展，公司内部对于实时分析的需求愈加强烈，我们必须保证处理所需时间在一分钟之内。
　　 Netflix数据管道的演进历程

　　除了将数据写入S3，Chukwa还可以将数据发送到Kafka，新的实时分支（虚线框住的部分）处理的事件大约占到总事件的30%。处于实时处理分支中心位置的是事件路由模块，它负责将数据从Kafka传递到Elasticsearch和下一级Kafka（进行数据的筛选）。终端用户可以自由选择趁手的工具进行分析，比如Mantis、Spark或其他定制工具。
　　Elasticsearch在Netflix的应用过去两年经历了爆炸式的发展，现在共有约150个集群和约3500个节点，总数据量约1.3PB，而这其中大部分数据都是通过我们的数据管道采集处理的。
　　数据路由的部分是由我所在的小组管理的，下面是一些我们碰到过的问题：
　　Kafka high level consumer会丧失消息分区的所有权并停止读取一些分区，唯一的解决办法是重启。有时部署代码之后high level consumer在rebalance时会出错。我们有几十个集群用于事件路由，运营上的开销正持续增长，所以对于路由job的管理还要想个更好的办法。

Netflix

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

暂无相关数据

Netflix数据管道的演进历程

迈向100A的演进历程μModule稳压器

氢气管道渗漏问题的解决方法

用于管道和洗涤器腐蚀保护的耐高温重防腐涂层

怎么解决管道腐蚀问题？

PVC氢气管道渗漏用什么堵漏好

简述输油管道腐蚀与防腐的相关知识

石油化工行业管道专业用什么软件

STM32的ADC学习历程

上位机MFC的串口使用历程资源汇总

涡扇发动机风扇管道声模态识别测量综述

可将关系数据转换为图数据的数据管道工具

基于水流分割的石油钻井管道水流异常检测

基于天然气输送管道内厚度测量的复合传感器

基于音频定位的埋地非金属管道定位仪

Duffing振子在天然气管道泄露检测中的应用

超声导波在管道缺陷检测中的成像技术综述

超声界面波在液金属复合管道的特性分析

无线通信的发展历程

LTE发展演进及关键技术

通用串行总线USB技术演进及测试方案

老式焊烙铁的演进故事资料下载

电子管收音机的发展历程资料下载

TD-SCDMA及其增强和演进技术

面向5G回传的IP RAN网络演进方案设计

5G网络演进方案及网络运营研究现状分析

DSP的发展历程是怎么样的

嵌入式操作系统于物联网的教材推荐历史演进与物联网未来

51单片机历程之protues仿真100例

RTC日历程序详细中文资料（免费下载）

基于89c51单片机IO口操作的几个历程资料分享

LNG低温管道保冷结构分析

Netflix起诉博通，指控VMware虚拟机专利侵权

差压表的技术演进与实际应用探讨

GPT的定义和演进历程

Netflix将弃用Windows UWP应用，转而采用Web格式

Netflix利润创新高，付费用户数达2.696亿，季度报告公布

数据中台的演进与实践——构建企业的数字核心

linux管道概述

Netflix暂不考虑在苹果Vision Pro开发原生应用

GIS管道精密对接设备机械系统的设计与研究

深度解读汽车电子电气架构演进历程

浅谈移动通信网的演进历程

阐述匿名管道和命名管道

Linux匿名管道和命名管道的区别

下秒数据CEO蔡致暖：云原生时代数据管道的迭代之路

在哪里可以找到Netflix代码

污水管道网数据监管系统

管道铺设监控之海底管道铺设监控

分析师：苹果公司最大的战略错误在于没有收购Netflix

苹果最大的战略错误或是没有收购Netflix

Netflix 表示：目前没有测试 AirPods Pro 和 AirPods Max 的空间音频支持

一个关于Netflix应用程序在新机顶盒上启动的问题

Netflix“空间音频”功能即将正式上线

索尼FX6通过Netflix认证

NetApp使用AI的漂亮描述作为数据管道

Netflix进军亚太地区 称“潜力巨大”

Netflix的5个小技巧

Netflix与Google做了同样的事情

Netflix印度在移动和基本计划中测试高清视频质量

管道检测机器人助力管道检查 专治管道堵塞

智能终端技术演进与未来趋势

下载排行榜

Netflix进军亚太地区称“潜力巨大”

管道检测机器人助力管道检查专治管道堵塞