炼数成金 门户 培训 查看内容

深入BI:Kettle篇

2013-5-15 13:15| 发布者: cruiser| 查看: 37292| 评论: 0|原作者: cruiser

工具 Hadoop 开源 ETL Kettle

快速报名:深入BI之Kettle篇(第八期)

此课程所属【大数据攻城狮专业
该专业内有15门
推荐课程,目前平台推出【专业课程0元学】活动,只需0元即可在15门专业课程中任选5门学习,超值优惠,助您快速成长!点击这里了解

有人统计过,在整个数据分析过程里,收集、整理数据的工作大致占全部工作量的90%,建模过程不足10%,可见ETL是数据处理流程中一个非常重要的环节。ETL工程师,在数据仓库类职位中占有很大比例,而且薪水都不差。IT人一下子转型数据分析师可能跳跃度比较大难度高,先转型数据仓库/ETL工程师再择机往更高处走是合理选择之一。在ETL软件中,使用最多的是开源的Kettle,完全免费,功能和性能不弱于datastage这类商业ETL软件,使用Kettle和其它开源数据平台软件,例如MySQL集群,Hadoop集群等组合在一起,是性价比极高的架构选择。本课程系统讲解Kettle及其秘密。

     ETL (Extract,Transformation,Load)工具是构建数据仓库、进行数据整合工作所必须使用的工具。目前市面有多种商业 ETL 工具,如Informatica,Datastage等。目前市场上开源且实用的 ETL 工具比较少,Kettle 就是这不多的开源 ETL 工具之一。 本课程将主要讲解开源 ETL 工具 Kettle 的基本使用和二次开发方法,并结合实际项目案例,讲解 Kettle 如何在实际中应用,以及应用中可能会出现的问题。针对目前大数据的应用情况,本课程也将结合大数据,讲述 Kettle 如何支持 Hadoop、HBase、MongoDB、MapReduce 等大数据技术。除了Kettle 的使用,在本课程的后几个课时,将讲述 Kettle 的二次开发: 包括 Kettle 代码阅读指导, Kettle API 的说明以及使用方法, Kettle 插件的开发方法。

课程内容
第一课:ETL 的概念,Kettle 的概念、功能、操作
第二课:Kettle 资源库、日志、运行方式
第三课:输入步骤(表输入、文本文件输入、XML 文件输入...)
第四课:输出步骤(表输出、更新、删除、文本文件输出、XML文件输出...)
第五课:转换步骤(过滤、字符串处理、拆分字段、计算器...)
第六课:转换步骤(字段选择、排序、增加校验列、去除重复记录...)
第七课:应用步骤、流程步骤(处理文件、执行程序、发送邮件、空操作、阻塞步骤、中止等...)
第八课:查询步骤、连接步骤(数据库查询、流查询、合并记录、记录集连接、笛卡尔...)
第九课:脚本步骤(Javascript,Java Class、正则表达式...)
第十课:作业项(拷贝、移动、ftp、sftp…)
第十一课:Kettle 的参数和变量、Kettle 集群
第十二课:Kettle 代码编译、代码结构、应用集成、各种配置文件
第十三课:插件开发 - 步骤、作业项
第十四课:作业设计技巧、错误处理、调试转换、循环和分支
第十五课:大数据插件(Hadoop 文件输入/输出,HBase输入/输出,MapReduce输入/输出,MongoDB输入/输出)

授课时间:
课程3月23日开课,课程持续时间为17周。

目标人群
1. ETL 工程师,Java 开发工程师,
2. 经常要做数据处理的 DBA
3. 有一定数据库基础 和 Java 基础的学生。

收获预期
1. 理解 Kettle 软件的基本功能。
2. 能使用 Kettle 完成基本的数据处理工作。
3. 了解 Kettle 软件的一些高级功能
4. 对有Java 开发经验的同学,对 Kettle 代码结构有一定了解,能开发一些 Java 的基本插件。

讲师个人介绍
    初建军(网名:Jason),2004年毕业于天津大学计算软件与理论专业,研究生。后进入北京人大金仓信息技术股份有限公司工作,从事国产数据库的研发工作。现就职于北京傲飞商智软件有限公司(Pentaho 公司的官方合作伙伴),专门从事 Pentaho/Kettle 的研究和开发工作。
    Jason 也是 Kettle 项目的代码提交者,积极推动 Pentaho/Kettle 等开源 BI 技术在国内的应用和发展,创办了 Pentaho 中国爱好者社区论坛((pentahochina.com)。
    Jason 作为 Pentaho 顾问为多个企业做过 Pentaho/Kettle 的咨询、培训、实施等服务, 服务过的企业或政府部门包括联想集团(北京)、中国联通系统集成公司、中国电信(某省)、国家地震局地球物理研究所、公安部第一研究所、四维图新、上海定展航运、品众互动网络技术营销有限公司。
    
课程试听:


新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取100元固定收费+300元暂存学费,学习圆满则全额奖励返还给学员!

特别说明如下:
本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。
在 报名时每位报名者收取400元,其中100元为固定 收费,另外300是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面和互动作业,则300元全款退回,优秀的学员还可以获得礼品 奖励。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!

课程授课方式:
1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。
2、 学习作业:老师每周布置书面及互动作业,学员需按时按质完成作业。
3、 老师辅导:根据作业批改中发现的问题,针对性给予辅导,帮助大家掌握知识。
4、 结业测验:通过测验,完成学业。


全国统一咨询热线 4008-010-006

课程现开始接受报名,报名方式
网上报名 请点击:深入BI之Kettle篇(第三期)
咨询Email :edu01@dataguru.cnedu02@dataguru.cn
课程入门讨论咨询群: 
485625800(群内有培训公开课视频供大家免费观看
咨询QQ: 2222010006 (上班时间在线)


 

最新技术热点、 最新行业资讯,最新培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注!
打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,欢迎您的体验!!!

快速报名:深入BI之Kettle篇(第八期)

38

鲜花
1

握手
1

雷人
1

路过
2

鸡蛋

刚表态过的朋友 (43 人)

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2017-5-30 06:54 , Processed in 0.148716 second(s), 27 queries .