讲师:Ted Malaska (Blizzard Entertainment )

13:30–17:00 周四, 2017-07-13

Hadoop内核&发展, 英文讲话 (Presented in English)

地点: 多功能厅5B+C

观众水平:Intermediate


必要预备知识

The tutorial will include a live demo of the full project on Cloudera's QuickStart VM. The code for the demo is available on GitHub. Download it here to follow along.


您将学到什么

How to build a fraud-detection app on Hadoop


描述

设计实现一个可扩展、低延迟的架构需要广泛了解各种框架,比如Kafka、HBase、HDFS、Flume、Spark、Spark Streaming和Impala等。好消息是现在有非常充沛的资源(书籍、网站、会议等)来深入了解和这些项目相关的信息。坏消息则是对于如何集成这些部件并实现完整的解决方案的信息却是相当得匮乏。

Ted将会指导参会者搭建一个欺诈检测系统,并使用一个端到端的案例研究作为一个具体的例子,展示如何使用Apache Hadoop组件(比如Kafka、HBase、Impala和Spark)来架构和实现一个实时系统。他会介绍架构设计实时应用的最佳实践和考虑点,为那些已经了解Hadoop和熟悉分布式数据处理系统的开发人员、架构师或是项目领导提供如何利用Hadoop组件来实现实时应用的更多的洞察。

主题包括:

  • 在Kafka、HBase和Hadoop里建立数据模型,并为数据选择最优的存储格式

  • 集成多个数据采集、处理和存储系统

  • 收集和分析基于事件的数据,比如日志、机器生成的数据,并在Hadoop里存储这些数据

  • 对数据做查询和出报表


讲师介绍

Ted Malaska (Blizzard Entertainment)

Ted Malaska is a group technical architect on the Battle.net team at Blizzard, helping support great titles like World of Warcraft, Overwatch, and HearthStone. Previously, Ted was a principal solutions architect at Cloudera helping clients find success with the Hadoop ecosystem and a lead architect at the Financial Industry Regulatory Authority (FINRA). He has also contributed code to Apache Flume, Apache Avro, Apache Yarn, Apache HDFS, Apache Spark, Apache Sqoop, and many more. Ted is a coauthor of Hadoop Application Architectures, a frequent speaker at many conferences, and a frequent blogger on data architectures.




Strata Data Conference北京站已经打开注册系统,阅读原文可浏览截止到目前为止的讲师名单和已经确认的议题,最优惠票价期截止到5月5日为止尽快注册以确保留位

Hadoop应用的架构:欺诈检测


相关文章: