课程介绍:
《深入大数据架构师之路,问鼎40万年薪》大数据在这几年火得一塌糊涂了,甚至上升到了国家战略的高度,职场上30万-50万年薪的职位比比皆是。无数先知先觉的小伙伴已经华丽转身,实现了人生的小目标,你还在观望吗,还不赶紧上车,做一只随风飞舞的猪?还想着下趟车会有卧铺!!!
大数据真的很难吗?不见得,如果你想做个开发工程师的话,map reduce、spark 的编程范式对于有一定开发经验的程序员来说,上手是很快的。但根据讲师自己多年的经验来说,单纯做程序员很容易思维固化、眼界局限,重复的发明轮子。但是要想再往高一层的level晋升,比如架构师级别,那hdfs、yarn、hive、hbase、kafka、zookeeper、impala、presto、phoenix、kylin、CAP、ELK、Solr一大堆面目可憎的小怪兽就成了拦路虎。
大数据的难点在于它的生态系统太庞杂,家族血统太混乱,面对一个企业场景有n多的方案说“我行,我不是一般人”。就好比吃顿午餐,既可以端着碗吃,也可以就着锅吃,甚至倒到桌上手抓。每种吃法都能吃饱,但有的吃相很自然、很舒服,有的吃法很别扭,很猥琐。如何温文尔雅、如沐春风这就体现架构师的水平了。
本课程根据老师多年在国内一线互联网公司实际工作经验,整理提炼的一套侧重培养大数据架构师级别的实战课程,讲重点介绍大数据在一线企业中的使用方案,对于各个组件,除了详细介绍必须掌握的操作要领,更重点介绍不同业务场景下的设计和应用技巧。绝不同于市面上大多数的操作手册朗读者。
本课程设计包括如下几个层面:
1.大数据集成:主要介绍目前很火的ELK框架中的filebeat和logstash,相比较flume更轻量、更容易上手。
2.大数据传输:主要介绍kafka的原理和使用技巧
3.大数据落地:主要介绍hive和hbase这两款标准组合的原理和使用,并结合具体的业务场景揭秘高级设计和应用。
4.大数据使用:主要介绍企业中最有用的sql on hive、sql on hbase的解决方案,如何让hive速度提升十倍,如何让hbase像个rdbms,如何在hive中实现scd2等实际问题。
5.大数据搜索引擎:主要介绍目前很火的ELK框架中Elasticsearch,并详细演示从常规操作到高阶查询的全实战内容。
相信通过本课程的学习,勤奋的您已经深入到大数据的架构师层面,剩下来的就是在工作中不断的填坑不断的打怪升级,最终圆满。
课程目录:
第1节课程体系介绍
第2节hadoop精讲之map reduce原理及代码演示
第3节hadoop精讲之hdfs详解(1)
第4节hadoop精讲之hdfs(2)
第5节hadoop产品选型
第6节实战.基于hadoop streaming的wordcount
第7节实战.topn的实现原理和实战
第8节实战.join的实现原理和实战
第9节实战.对join实现的改进——优化reducer
第10节hive概述
第11节hive必须要会的操作演示
第12节分区表和动态分区的使用
第13节函数概述和udf演示
第14节UDF实战:实现udf
第15节UDAF实战:实现udaf
第16节数据说明和重要操作演示
第17节用户内容偏好实战
第18节什么是SCD以及技术难点
第19节如何在hive中实现sequence功能
第20节数据仓库实战:在hive中实现 scd2的完整案例实战
第21节数据仓库实战:在hive中实现事实表
第22节presto是什么.presto的架构
第23节presto运行机制和配置文件详解
第24节presto on hive 实战.实现数据仓库的Scd2和fact
第25节kafka架构深度剖析_1
第26节kafka架构深度剖析_2
第27节架构师装逼必备CAP理论以及在架构设计中的应用
第28节kafka数据复制高可用的原理
第29节kafka数据复制演示
第30节选学深入解释leader和follower数据同步机制
第31节kafka数据一致性参数详解
第32节数据一致性的实战
第33节配置zookeeper集群并验证
第34节配置kafka集群并验证两个集群正常工作
第35节修改kafka在zookeeper上的配置目录以及consumer的使用方式
第36节kafka consumer 剖析
第37节kafka consumer代码实战
第38节kafka consumer balance 实战
第39节实现轮询的producer
第40节hbase概述和web界面
第41节hbase架构详解.1
第42节客户端数据读写流程以及zookeeper的作用
第43节hbase架构详解.2
第44节hbase高可用能力
第45节hbase data model详解
第46节数据操作实战.hbase工具功能
第47节column family的进阶设置实战
第48节二级索引技术解密
第49节电商应用的二级索引设计实战
第50节项目背景概述
第51节第一版设计及问题分析
第52节第二版设计及问题分析
第53节第三版设计及问题分析
第54节最终设计方案ddi
第55节hive on hbase概述
第56节hive on hbase实战.把产品成本表加载到hbase
第57节phoenix及对比hive on hbase
第58节phoenix实战.1.通过view映射hbase中的用户表并分析其特点
第59节phoenix实战.2.通过table映射hbase中的用户表并分析其特点
第60节phoenix实战.3.通过table映射hbase中的用户表并体会其特点
第61节项目实战
第62节hbase事务机制概述
第63节hbase事务之mvcc详解以及和sql数据库的对比
第64节hbase物理存储原理解析
第65节和hbase存储机制有关的一个大坑
第66节禁用掉自动split后如何维护
第67节python_hbase开发实战
第68节python_phoenix开发实战
第69节项目实战.python_hbase_phoenix_用户行为分析
第70节kylin概述和工作原理
第71节数据仓库核心概念
第72节cub的设计和构建过程
第73节实时cube的设计和构建
第74节案例实战
第75节和传统bi工具的结合
第76节运维管理
第77节elk技术栈介绍
第78节安装配置zookeeper
第79节安装配置kafka
第80节验证kafka安装成功
第81节安装配置filebeat
第82节验证filebeat配置成功
第83节配置logstash
第84节安装配置elasticsearch
第85节安装配置kibina
第86节安装ik索引做中文分词
第87节几个辅助工具的安装演示
第88节通过restapi操作Elasticsearch的演示
第89节elasticsearch基本概念(index,type,setting,mapping)
第90节深入解析mapping.字段类型
第91节深入解析analyzer
第92节索引机制详解
第93节几个高级参数介绍all、source、store、doc_values
第94节动态映射
第95节字段的动态mapping
第96节字段的动态mapping之dynamic_template
第97节index template详解
第98节索引模版和索引别名
第99节最简单的logstash演示
第100节实战2.多个输出目标
第101节实战3.解析日志内容
第102节实战4.解析json格式日志
第103节实战5.如何把@timestamp修复成本地时间
第104节实战6.把logstash收集的数据保存到hdfs
第105节实战7.如何用access_time替代@timestamp
第106节实战8.利用插件获取更多的信息
第107节查询语法总结
第108节match搜索
第109节range搜索
第110节term搜索
第111节terms进阶用法-关联查询
第112节exists和not exists
第113节bool查询
第114节filter查询
第115节聚合功能概述以及度量函数说明
第116节聚合功能概述值度量函数的使用演示
第117节聚合功能概述之分组聚合函数说明
第118节聚合功能之分组函数实战之terms实战
第119节聚合功能之分组函数实战之histgram和range
第120节聚合同能之分组函数实战之data_histgram
第121节聚合功能之分组函数实战之filter and filters
第122节terms分组统计 vs query中的term terms
第123节向桶中添加统计指标
第124节桶中桶和联机OLAP
评论0