首页 > 选课中心 > 分布式系统 > 【快班】Hadoop数据分析平台
【快班】Hadoop数据分析平台
此课程所属 【大数据攻城狮专业】, 【hadoop大数据工程师职业方向】专业,报名专业套餐,可享受0元学习特惠!点击了解详情
2017年07月10日 17点 共1课 ★★☆
开课时间 课程周期 难易度
招生中

立即报名
Hadoop 数据分析 架构 集群 案例
课程介绍
【注意】从第22期开始全部更新为第四版课程。与第三版课程(第13-21期)内容相比,增加和修订了CDH体系,maven,Map-Reduce综合案例,impala,各子项目集成为企业数据分析平台,Zookeeper分布式系统开发,Hadoop与机器学习等内容,总体内容比第三版增加约30%

这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cou和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。

Hadoop这个开源产品的出现,打破了对数据力量的压制。Hadoop源于Nutch这个小型的搜索引擎项目。而Nutch则出自于著名的开源搜索引擎解决方案Lucene,而Lucene则来源于对Google的学习模仿。在Hadoop身上有着明显的Google的影子。HDFS是GFS的山寨版,Map-Reduce的思想来源于Goolge对Page rank的计算方法,HBase模仿的是Big Table,Zookeeper则学习了Chubby。Google巨人的力量尽管由于商业的原因被层层封锁,但在Hadoop身上得到了完美的重生和发展。

从2006年Apache基金会接纳Hadoop项目以来。Hadoop已经成为云计算软件的一个事实标准,以及开源云计算解决方案的几乎唯一选择。对于想用低成本(包括软硬件)实现云计算平台或海量数据分析平台的用户,Hadoop集群是首选的对象。由于Hadoop在各方面都打破了传统关系型数据库的思路和模式,对于新接触Hadoop平台的人,往往会觉得困惑和难以理解,进而转化为畏惧。我们的《Hadoop数据分析平台》课程,正是为了帮助传统关系型数据库用户和数据分析者进入这个领域而开设,力求做到架构与实施并重,原理和实践结合,希望大家能在这个网络课程里学有所获,而我们也可为开源大业作出微薄的贡献。
课程大纲
第1课 Hadoop的源起与体系介绍;实施Hadoop集群;CDH家族
第2课 分布式文件系统HDFS原理与操作,HDFS API编程;2.x下HDFS新特性,高可用,联邦,快照
第3课 具有全部新特性的2.x企业级集群实施
第4课 Map-Reduce原理、体系架构和工作机制,eclipse与Hadoop集群连接,使用maven
第5课 Map-Reduce编程实战,日志分析
第6课 Map-Reduce复杂应用案例,Hadoop流
第7课 新一代计算框架YARN
第8课 Pig原理,部署与Pig Latin语言,应用案例
第9课 Hive体系架构、安装与HiveQL
第10课 Hive应用案例,impala子项目
第11课 Zookeeper与分布式系统开发
第12课 HBase体系架构,集群部署,管理
第13课 HBase数据模型,实战案例建模剖析
第14课 数据集成Sqoop,Flume,Chukwa,商业数据库与Hadoop集群的连接
第15课 与应用连接,REST和Thrift接口,UDF实战,RHadoop,数据分析软件与Hadoop集群的连接
第16课 进军Hadoop源代码
第17课 Hadoop在互联网企业中的应用案例;集成各个子项目形成企业级数据分析平台;Hadoop与机器学习
课程环境
至少3个虚拟节点,每个节点1G以上内存,也就是有一台4G的物理机即可
授课对象
具有linux操作一般知识(因为hadoop在linux下跑),对Java有一小点认识,对Hadoop及其子系统有兴趣的IT人或学习者
收获预期
能独立架设Hadoop集群,HBase集群等,并应用于数据分析工作
课程试听
课程学费
学费:400元(固定学费:300元 + 逆向学费:100元)
新颖的课程收费形式:“逆向收费”约等于免费学习,课程收取300元固定收费 + 100元逆向学费,学习圆满则全额奖励返还给学员!
特别说明如下
本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。 在 报名时每位报名者收取400元,其中300元为固定 收费,另外100元是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面作业,则100元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!
课程授课方式

1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。

2、 学习作业:每课均有布置课后作业,学员完成书面作业后则可进入下一课学习。

3、 老师辅导:通过论坛站内信及邮件等多种方式与老师进行一对一互动。

4、 完成课程:最后一课作业交纳后,老师完成作业批改,即可完成课程并取回相应剩余的逆向学费。

联系我们
咨询Email :edu01@dataguru.cnedu02@dataguru.cn
课程入门讨论咨询QQ群:706821899(群内有培训公开课视频供大家免费观看)
咨询QQ: 点击这里给我发消息 点击这里给我发消息
您是否对此课程还有疑问,那么请 点击进入FAQ,您的问题将基本得到解答
全国统一咨询热线: 4008-010-006
最新技术热点、 最新行业资讯,最新培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注!
打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!!

授课老师

黄志洪黄志洪
tigerfish,ITPUB创始人,炼数成金创始人。中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。曾经讲授炼数成金上《机器学习》、《数据分析、展现与R语言》、《数据分析与SAS》、《Hadoop数据分析平台》等多门受欢迎课程。他将带领他的数据分析团队完成整个授课工作。

其他快班课程

【快班】赢在大数据-人工智能的应用实践
【快班】【免费公开课】《数据科学入门手册》——DSX架构与部署
【快班】【免费公开课】数据科学无难事
【快班】【免费公开课】《Hadoop入门手册》之 虚拟机的安装和使用
【快班】【免费公开课】玩转数据艺术-数据展示技巧应用实战
【快班】【免费公开课】玩转数据科学——IBM DSX
【快班】【免费公开课】《Hadoop入门手册》——Apache Hadoop集群安装
【快班】【免费公开课】赢在大数据-数据化运营落地实战
【快班】大数据管理
【快班】Streams流计算引航公开课
【快班】抽样调查
【快班】LATEX公式排版系统引航
【快班】Watson Analytics数据分析应用实战公开课
【快班】数据陷阱解读
【快班】R七种武器之文本挖掘包tm
【快班】R七种武器之可视化JS库HTMLWidgets包
【快班】R七种武器之数据加工厂plyr
【快班】R七种武器之交互化展示包shiny
【快班】R七种武器之网络爬虫RCurl
【快班】R七种武器之数据可视化包ggplot2
【快班】R七种武器之金融数据分析quantmod
【快班】Java经验谈
【快班】Go语言实战编程
【快班】DB2 V11新特性全解析
【快班】DB2数据库引航公开课
【快班】STATA统计分析入门
【快班】初识正则表达式
【快班】perl语言入门
【快班】Scala语言入门
【快班】Puppet 运维自动化
【快班】Qt编程快速入门
【快班】数据治理及数据仓库模型设计
【快班】DevSecOps安全交付应用实战
【快班】JavaScript突击-从精通到项目实战
【快班】R语言魔鬼训练营
【快班】基于案例学习bash脚本编程
【快班】量化投资基础计算与模型
【快班】老板说服术之玩转数据展示
【快班】数据库系统实现技术内幕
【快班】Goldengate从入门到精通
【快班】Oracle 12C RAC集群原理与管理实战
【快班】Mycat从入门到精通
【快班】基于案例学SQL优化
【快班】大型电商分布式系统实践
【快班】深入理解Storm与大数据实战
【快班】Java魔鬼训练营
【快班】Excel数据分析师突击—从入门到精通到项目实战
【快班】自己动手实践神经网络
【快班】自然语言处理软件实验
【快班】应用系统架构优化方法与案例实战
【快班】数据分析与SAS
【快班】比特币
【快班】机器读心术之文本挖掘与自然语言处理
【快班】机器读心术之神经网络与深度学习
【快班】快速上手Jmeter性能测试工具
【快班】软件性能测试
【快班】软件自动化测试Selenium2
【快班】大数据必知的java基础
【快班】快速数据挖掘平台RapidMiner
【快班】R语言编程技巧
【快班】深入BI之Kettle篇
【快班】基于案例学Java服务器端程序设计
【快班】Scala从基础到开发实战
【快班】供应链物流—电商发展的“核”动力
【快班】详解SQL与PL/SQL
【快班】Oracle职业直通车
【快班】深度玩转Excel
【快班】Hadoop应用开发实战案例
【快班】大数据的Linux基础
【快班】机器学习
【快班】量化投资
【快班】SPSS数据分析入门与提高
【快班】Python数据分析
【快班】NoSQL与NewSQL数据库引航
【快班】大数据算法导论
【快班】大数据的矩阵计算基础
【快班】R语言数据分析、展现与实例
【快班】大数据的统计学基础

热招课程

◆ MySQL性能优化最佳实践(第六期)
◆ 【免费公开课】Python 的安装与部署(第一期)
◆ 机器学习(第24期)
◆ Web全栈开发理论与实践(第二期)
◆ python网络爬虫应用实战(第二期)
◆ 从零入门金融业信贷风控算法(第一期)
◆ Tensorflow工程师职场实战技(第一期)
◆ 【免费公开课】验模神器AMOS(第七期)
◆ 【免费公开课】OpenAI gym 安装教程(第一期)
◆ zabbix企业级实践(第五期)
◆ Spark大数据平台应用实战(第五期)
◆ 数据科学家养成:从零入门机器学习
◆ 金融的人工智能革命(第五期)
◆ 深入浅出设计模式(第三期)
◆ Python3入门到精通实战特训(第二期)
◆ 人脸识别90天速成特训班(第一期)
◆ 【免费公开课】企业级Hadoop大数据平台实践(第16期)
◆ Oracle DBA从小白到入职实战应用(第八期)
◆ 大数据算法导论(第16期)
◆ 左飞的机器学习十八般算法武艺详解(第五期)
◆ 实战Java高并发程序设计(第14期)
◆ 深度学习框架Tensorflow学习与应用(第七期)
◆ 【免费公开课】R七种武器之金融数据分析quantmod(第38期)
◆ 人工智能前沿系列之生成式对抗网络(第七期)
◆ Oracle SQL Tuning(DSI系列Ⅲ)(第二期)
◆ Python数据分析(第14期)
◆ 机器读心术之文本挖掘与自然语言处理(第12期)
◆ 深入浅出Spring(第七期)
◆ 让服务飞起来:实时计算及其应用(第五期)
◆ 【免费公开课】《Hadoop入门手册》——Apache Hadoop集群安装(第二期)
◆ 金融市场基础(第八期)
◆ Node.js项目实战:从编写代码到服务器部署(第六期)
◆ Python机器学习Kaggle案例实战(第七期)
◆ 黄美灵的Spark ML机器学习实战(第四期)
◆ OpenAI强化学习实战(第二期)
◆ 【免费公开课】数据陷阱解读(第32期)
◆ 深入浅出Oracle(第九期)
◆ Python数据分析案例实战(第九期)
◆ R语言数据分析、展现与实例(第33期)
◆ 大数据必知的java基础(第十期)
◆ 股票投资高手武器系列之缠论系统(第二期)
◆ 【免费公开课】《Hadoop入门手册》之 虚拟机的安装和使用(第二期)
◆ python魔鬼训练营(第11期)
◆ ELKStack及Solr企业级搜索引擎实战(第九期)
◆ Oracle特殊恢复原理与实战(DSI系列)(第四期)
◆ Python金融投资分析实践(第八期)

GMT+8, 2018-7-23 00:36 , Processed in 0.109905 second(s), 23 queries .