首页 > 选课中心 > 分布式系统 > 【快班】Hadoop数据分析平台
【快班】Hadoop数据分析平台
此课程所属 【大数据攻城狮专业】, 【hadoop大数据工程师职业方向】专业,报名专业套餐,可享受0元学习特惠!点击了解详情
2017年07月10日 17点 共17课 ★★☆
开课时间 课程周期 难易度
招生中

立即报名
数据分析 Hadoop 架构 集群 案例
课程介绍
【注意】从第22期开始全部更新为第四版课程。与第三版课程(第13-21期)内容相比,增加和修订了CDH体系,maven,Map-Reduce综合案例,impala,各子项目集成为企业数据分析平台,Zookeeper分布式系统开发,Hadoop与机器学习等内容,总体内容比第三版增加约30%

这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cou和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。

Hadoop这个开源产品的出现,打破了对数据力量的压制。Hadoop源于Nutch这个小型的搜索引擎项目。而Nutch则出自于著名的开源搜索引擎解决方案Lucene,而Lucene则来源于对Google的学习模仿。在Hadoop身上有着明显的Google的影子。HDFS是GFS的山寨版,Map-Reduce的思想来源于Goolge对Page rank的计算方法,HBase模仿的是Big Table,Zookeeper则学习了Chubby。Google巨人的力量尽管由于商业的原因被层层封锁,但在Hadoop身上得到了完美的重生和发展。

从2006年Apache基金会接纳Hadoop项目以来。Hadoop已经成为云计算软件的一个事实标准,以及开源云计算解决方案的几乎唯一选择。对于想用低成本(包括软硬件)实现云计算平台或海量数据分析平台的用户,Hadoop集群是首选的对象。由于Hadoop在各方面都打破了传统关系型数据库的思路和模式,对于新接触Hadoop平台的人,往往会觉得困惑和难以理解,进而转化为畏惧。我们的《Hadoop数据分析平台》课程,正是为了帮助传统关系型数据库用户和数据分析者进入这个领域而开设,力求做到架构与实施并重,原理和实践结合,希望大家能在这个网络课程里学有所获,而我们也可为开源大业作出微薄的贡献。
课程大纲
第1课 Hadoop的源起与体系介绍;实施Hadoop集群;CDH家族
第2课 分布式文件系统HDFS原理与操作,HDFS API编程;2.x下HDFS新特性,高可用,联邦,快照
第3课 具有全部新特性的2.x企业级集群实施
第4课 Map-Reduce原理、体系架构和工作机制,eclipse与Hadoop集群连接,使用maven
第5课 Map-Reduce编程实战,日志分析
第6课 Map-Reduce复杂应用案例,Hadoop流
第7课 新一代计算框架YARN
第8课 Pig原理,部署与Pig Latin语言,应用案例
第9课 Hive体系架构、安装与HiveQL
第10课 Hive应用案例,impala子项目
第11课 Zookeeper与分布式系统开发
第12课 HBase体系架构,集群部署,管理
第13课 HBase数据模型,实战案例建模剖析
第14课 数据集成Sqoop,Flume,Chukwa,商业数据库与Hadoop集群的连接
第15课 与应用连接,REST和Thrift接口,UDF实战,RHadoop,数据分析软件与Hadoop集群的连接
第16课 进军Hadoop源代码
第17课 Hadoop在互联网企业中的应用案例;集成各个子项目形成企业级数据分析平台;Hadoop与机器学习
课程环境
至少3个虚拟节点,每个节点1G以上内存,也就是有一台4G的物理机即可
授课对象
具有linux操作一般知识(因为hadoop在linux下跑),对Java有一小点认识,对Hadoop及其子系统有兴趣的IT人或学习者
收获预期
能独立架设Hadoop集群,HBase集群等,并应用于数据分析工作
课程试听
课程学费
学费:400元(固定学费:300元 + 逆向学费:100元)
新颖的课程收费形式:“逆向收费”约等于免费学习,课程收取300元固定收费 + 100元逆向学费,学习圆满则全额奖励返还给学员!
特别说明如下
本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。 在 报名时每位报名者收取400元,其中300元为固定 收费,另外100元是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面作业,则100元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!
课程授课方式

1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。

2、 学习作业:每课均有布置课后作业,学员完成书面作业后则可进入下一课学习。

3、 老师辅导:通过论坛站内信及邮件等多种方式与老师进行一对一互动。

4、 完成课程:最后一课作业交纳后,老师完成作业批改,即可完成课程并取回相应剩余的逆向学费。

联系我们
咨询Email :edu01@dataguru.cnedu02@dataguru.cn
课程入门讨论咨询QQ群:706821899(群内有培训公开课视频供大家免费观看)
咨询QQ: 点击这里给我发消息 点击这里给我发消息
您是否对此课程还有疑问,那么请 点击进入FAQ,您的问题将基本得到解答
全国统一咨询热线: 4008-010-006
最新技术热点、 最新行业资讯,最新培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注!
打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!!

授课老师

黄志洪黄志洪
tigerfish,ITPUB创始人,炼数成金创始人。中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。曾经讲授炼数成金上《机器学习》、《数据分析、展现与R语言》、《数据分析与SAS》、《Hadoop数据分析平台》等多门受欢迎课程。他将带领他的数据分析团队完成整个授课工作。

其他快班课程

【快班】Puppet 运维自动化
【快班】数据治理及数据仓库模型设计
【快班】DevSecOps安全交付应用实战
【快班】JavaScript突击-从精通到项目实战
【快班】R语言魔鬼训练营
【快班】基于案例学习bash脚本编程
【快班】量化投资基础计算与模型
【快班】老板说服术之玩转数据展示
【快班】数据库系统实现技术内幕
【快班】Goldengate从入门到精通
【快班】Oracle 12C RAC集群原理与管理实战
【快班】Mycat从入门到精通
【快班】基于案例学SQL优化
【快班】深入理解Storm与大数据实战
【快班】Java魔鬼训练营
【快班】Excel数据分析师突击—从入门到精通到项目实战
【快班】自己动手实践神经网络
【快班】自然语言处理软件实验
【快班】应用系统架构优化方法与案例实战
【快班】数据分析与SAS
【快班】比特币
【快班】机器读心术之文本挖掘与自然语言处理
【快班】机器读心术之神经网络与深度学习
【快班】快速上手Jmeter性能测试工具
【快班】软件性能测试
【快班】软件自动化测试Selenium2
【快班】大数据必知的java基础
【快班】快速数据挖掘平台RapidMiner
【快班】R语言编程技巧
【快班】深入BI之Kettle篇
【快班】基于案例学Java服务器端程序设计
【快班】Scala从基础到开发实战
【快班】供应链物流—电商发展的“核”动力
【快班】详解SQL与PL/SQL
【快班】Oracle职业直通车
【快班】深度玩转Excel
【快班】Hadoop应用开发实战案例
【快班】大数据的Linux基础
【快班】机器学习
【快班】量化投资
【快班】SPSS数据分析入门与提高
【快班】Python数据分析
【快班】NoSQL与NewSQL数据库引航
【快班】大数据算法导论
【快班】大数据的矩阵计算基础
【快班】R语言数据分析、展现与实例
【快班】大数据的统计学基础

热招课程

◆ ELKStack及Solr企业级搜索引擎实战(第八期)
◆ 数据库系统实现技术内幕(第12期)
◆ 深度学习框架Caffe学习与应用(第七期)
◆ Python数据分析案例实战(第八期)
◆ 【免费公开课】企业级Hadoop大数据平台实践(第15期)
◆ 左飞的机器学习十八般算法武艺详解(第四期)
◆ Spark企业级大数据项目实战(第三期)
◆ 金融的人工智能革命(第四期)
◆ Oracle 12c特性解读-容器数据库和灾备(第五期)
◆ 基于案例学习时间序列分析(第四期)
◆ python网络爬虫应用实战(第一期)
◆ 【免费公开课】R七种武器之金融数据分析quantmod(第36期)
◆ 深入浅出Oracle(第八期)
◆ 【百万年薪系列】视觉的盛宴:深度玩转人脸识别(第二期)
◆ 黄美灵的Spark ML机器学习实战(第三期)
◆ Python数据分析(第13期)
◆ 股票投资基础之技术分析(第二期)
◆ Oracle SQL Tuning(DSI系列Ⅲ)(第一期)
◆ 人工智能前沿系列之生成式对抗网络(第六期)
◆ 【免费公开课】R七种武器之网络爬虫RCurl(第18期)
◆ JavaScript从入门到精通(第七期)
◆ Hive数据仓库实践(第七期)
◆ Python机器学习Kaggle案例实战(第六期)
◆ Oracle特殊恢复原理与实战(DSI系列)(第三期)
◆ Java Web开发精讲(第二期)
◆ OpenAI强化学习实战(第一期)
◆ 【免费公开课】数据陷阱解读(第30期)
◆ 让服务飞起来:实时计算及其应用(第四期)
◆ 突击pyspark:数据挖掘的力量倍增器(第四期)
◆ R语言数据分析、展现与实例(第32期)
◆ Hadoop集群原理与运维实践(第四期)
◆ 大数据的统计学基础(第23期)
◆ 股票投资基础之缠论(第一期)
◆ 【免费公开课】数据库设计(第26期)
◆ 互联网金融中的交易反欺诈模型(第二期)
◆ Redis技术实战 (第十期)
◆ Python机器学习(第七期)
◆ OpenCV计算机视觉产品实战(第五期)
◆ HBase从入门到精通(第八期)
◆ DL4CV实战——构建基于深度学习的智能图像识别系统(第一期)
◆ 【免费公开课】Julia快速数据分析(第五期)
◆ 机器读心术之神经网络与深度学习(第11期)
◆ 大数据的矩阵计算基础(第15期)
◆ 知识图谱实战(第三期)
◆ MySQL DBA从小白到大神实战(第九期)
◆ django打造电商项目(第三期)
◆ 大型企业数据库自动化构建(第一期)

GMT+8, 2018-5-26 06:19 , Processed in 0.185778 second(s), 39 queries .