首页 > 选课中心 > 数据分析 > 【快班】R语言数据分析、展现与实例
【快班】R语言数据分析、展现与实例
此课程所属 【数据分析师专业方向】, 【人工智能职业方向】, 【数据分析师专业方向】专业,报名专业套餐,可享受0元学习特惠!点击了解详情
2016年12月19日 15点 共15课 ★☆☆
开课时间 课程周期 难易度
招生中

立即报名
模型 数据分析 案例 R语言 数据展现
课程介绍
【注意】这是炼数成金R语言课程的第三版,是《数据分析、展现与R语言》课程的升级,就原先较为散乱的体系作了重新整理,并大幅度补充实际案例,使本课程更加亲切,更加接近技术前沿。

近年来,由于存储设备的单位成本以惊人的速度下降(1G硬盘空间的成本现在只需要几美分,这在过去难以想象),我们可以轻而易举地积累起大量的数据。电信 运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一 次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在产生海量的视频数 据。在生命科学领域,对人体的DNA分析,一个个体就能产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数据,信息量将会是怎样一个 规模,如此等等,不胜枚举。我们毫无疑问,正处于一个信息爆炸的时代。

很不幸的是,我们得到了大量的数据,而这些数据中的绝大部分,在它的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备 查”。尽管“啤酒与尿布”的故事,已经写入教科书有10多年了,几乎每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的 处理依然停留在按预定指标进行统计这种很低的水平上。造成这种情况的原因有很多。一方面,由于业务人员和IT人员的工作鸿沟,使到即使能提出数据分析的需 求都成了一个很大的困难。在各公司里保管数据的大多是IT人员,他们对业务的了解可能并非很深入,而业务人员也鲜有对数据有深入认识者,他们通常都缺乏必 要的数学素质和知识基础去进行建模和深入的分析工作。另一方面,数据分析专家具有深厚的数学处理能力,善于建模和构筑算法,但是由于无法得到合适的需求, 他们的能力也无从施展。另外数学家、统计学家们很多并不熟悉现代的IT软硬件设备的特性,对于集群、分布式系统、大规模存储、云计算、数据库等认识几乎为零,对于算法的实现可能还停留在对着PC写C语言程序的水平上,对于海量数据,无法利用现代化设备的能力,使到算法是否能真正实现变成生产力存有很大的疑问。

现在这门《数据分析系列网络课程》正是要打破这种鸿沟。用新兴的互联网教育模式,把各应用领域的业务专家、数据分析专家、IT专家推荐给学习者,向有志于学习数据分析知识发挥数据价值的朋友能得到低成本交流的机会。我们的目标是在中国传播“技术成就梦想,数据产生价值”的观念,使学习者能快速提升其个人能力,在新的挑战面前获取更多个人机会,企业能在保存的海量数据中炼出黄金。

R是一套完整的数据处理、计算和制图软件系统。是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R既是功能强大的统计和分析软件,同时也是完美的数据可视化制作工具,丰富的图形函数和外置包,几乎无限的扩展能力,使到我们的想象空间永远都不会达到上限

 

1617040w92vfvbfkapdcv4.png (146.38 KB)

下载附件  保存到相册

2012-11-2 15:07 上传


2011年统计的数据分析软件使用率情况,R语言多项雄踞首位,是最热门的分析利器

《R语言数据分析、展现与实例》课程内容:
1 基础数据分析知识,包括一些概率统计里的概念、术语,和基本统计量的计算方法等。
2 一些常用的数据分析和数据挖掘算法,以及有关的各种领域里的实际应用案例分析
3 世界最流行的开源数据分析软件R及其编程方法
4 数据展现,介绍R及其强大的图表功能
课程大纲
第1课  R语言基础:R简介、数据类型介绍、R的数据可视化、常用R包介绍。R集成开发环境
第2课  数据整理:数据的读入输出、控制流、各种图表,常用统计量计算
第3课 数据展现1:基本制图函数综述、理解关键制图参数
第4课  数据展现2:散点图、线图与时间序列谱图,案例:股价走势可视化展现
第5课  数据展现3:柱形图,点图,饼图,直方图,案例:销售数据可视化展现
第6课  数据展现4:箱线图,热力图,等高线,地图,案例:Facebook好友联系图
第7课  预知未来的回归模型1:线性回归模型,案例:网页流量预测
第8课  预知未来的回归模型2:logistic回归,广义线性回归,非线性回归,案例:婚外情频率预测
第9课  预知未来的回归模型3:回归检验与方差分析,案例:上两周周案例的进一步分析优化
第10课  挖掘关联和推荐技术:MINE方法,apriori购物篮分析,案例:超市购物篮分析
第11课  万事皆选择1:分类算法(线性判别法,贝叶斯分类器,决策树,最近邻算法),案例:汽车销量
走势预测,上涨还是下跌?
第12课  万事皆选择2:聚类算法(层次聚类法,谱系图,k平均值法,k中心法),案例:推荐系统
第13课  大道至简:降维技术,主成分分析和因子分析,案例:业绩综合指标设计
第14课 沿着时间轴前进:时间序列分析,案例:未来股价预测
第15课 R数据挖掘实际场景综合案例分析及前沿技术选讲

本课程糅合了之前所开的《数据分析与R语言》《R语言进阶——数据展现》两门课的精华,去除部分较为艰涩的内容,增加更具有实战价值的知识,是过往有关课程的升级改进版。在进度上,把较难掌握的算法和建模部分与相对较为容易的数据展现部分相间,使到学习者有更多的时间去理解吸收建模知识,这也是通过过往课程得出来的经验,有望可以达到更好的学习效果。
授课讲师
tigerfish,ITPUB创始人,中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。他将带领他的数据分析团队完成整个授课工作。

何翠仪,中山大学统计学专业毕业,炼数成金专职讲师,在过去曾讲授《大数据的统计学基础》《量化投资》《金融时间序列分析》等多门课程
课程环境
windows或其它任何支持R运行的操作系统,PC或笔记本均可,Mac系统也可以
授课对象
这是一门数学+IT的课程,适合已经有一定的IT基础,但对数据分析行业尚不了解的朋友进修学习。
收获预期
算法有一定的了解,有一定的使用R语言解决问题的能力,并且熟练地使用R做出精美的图表
课程试听
课程学费
学费:400元(固定学费:300元 + 逆向学费:100元)
新颖的课程收费形式:“逆向收费”约等于免费学习,课程收取300元固定收费 + 100元逆向学费,学习圆满则全额奖励返还给学员!
特别说明如下
本门课程本来打算完全免费,某位大神曾经说过“成功就是正确的方向再加上适度的压力”。考虑到讲师本身要付出巨大的劳动,为了防止一些朋友在学习途中半途而废,浪费了讲师的付出,为此我们计划模仿某些健身课程,使用“逆向收费”的方法。 在 报名时每位报名者收取400元,其中300元为固定 收费,另外100元是暂存学费,即如果学员能完成全部课程要求,包括完成全部的书面作业,则100元全款退回。如果学员未能坚持到完全所有的学习计划任务,则会被扣款。期望这种方式可以转化为大家强烈的学习愿望和驱动力!
课程授课方式

1、 学习方式:老师发布教学资料、教材,幻灯片和视频,学员通过网络下载学习。同时通过论坛互动中老师对学员进行指导及学员之间相互交流。

2、 学习作业:每课均有布置课后作业,学员完成书面作业后则可进入下一课学习。

3、 老师辅导:通过论坛站内信及邮件等多种方式与老师进行一对一互动。

4、 完成课程:最后一课作业交纳后,老师完成作业批改,即可完成课程并取回相应剩余的逆向学费。

联系我们
咨询Email :edu01@dataguru.cnedu02@dataguru.cn
课程入门讨论咨询QQ群:485625800(群内有培训公开课视频供大家免费观看)
咨询QQ: 点击这里给我发消息 点击这里给我发消息
您是否对此课程还有疑问,那么请 点击进入FAQ,您的问题将基本得到解答
全国统一咨询热线: 4008-010-006
最新技术热点、 最新行业资讯,最新培训课程信息,尽在炼数成金官方微信,低成本传递高端知识!技术成就梦想!欢迎关注!
打开微信,使用扫一扫功能,即刻关注炼数成金官方微信账户,不容错过的精彩,期待您的体验!!!

授课老师

黄志洪黄志洪
tigerfish,ITPUB创始人,炼数成金创始人。中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。曾经讲授炼数成金上《机器学习》、《数据分析、展现与R语言》、《数据分析与SAS》、《Hadoop数据分析平台》等多门受欢迎课程。他将带领他的数据分析团队完成整个授课工作。

热招课程

◆ 实战Java高并发程序设计(第十期)
◆ R语言数据分析、展现与实例(第26期)
◆ 深入理解Storm与大数据实战(第二期)
◆ JAVA极客特训(第一期)
◆ 数据库设计(第21期)
◆ 人工智能前沿系列之生成式对抗网络(第二期)
◆ 大数据的统计学基础(第17期)
◆ Redis技术实战 (第六期)
◆ 机器读心术之文本挖掘与自然语言处理(第六期)
◆ python魔鬼训练营(第六期)
◆ Python机器学习(第二期)
◆ Oracle 12c特性解读-容器数据库和灾备(第一期)
◆ Streams流计算引航公开课(第八期)
◆ 推荐系统(第11期)
◆ 自己动手实践神经网络(第五期)
◆ Hadoop数据分析平台(第42期)
◆ 高可用架构设计与实践(第六期)
◆ 深入浅出Spring(第二期)
◆ Watson Analytics数据分析应用实战公开课(第二期)
◆ R七种武器之金融数据分析quantmod(第28期)
◆ web高并发服务架构(第二期)
◆ 老板说服术之玩转数据展示(第九期)
◆ 大数据的Linux基础(第16期)
◆ 机器学习及其matlab实现—从基础到实践(第八期)
◆ Python突击—从入门到精通到项目实战(第五期)
◆ 基于R的Kaggle实战案例详解(第一期)
◆ LATEX公式排版系统引航(第五期)
◆ 金融市场基础(第二期)
◆ Scala从基础到开发实战(第七期)
◆ Python自然语言分析(第四期)
◆ Zookeeper分布式系统开发实战(第六期)
◆ python web框架企业实战详解(第13期)
◆ 深度学习框架Tensorflow学习与应用(第二期)
◆ 数据陷阱解读(第20期)
◆ Hadoop应用开发实战案例(第15期)
◆ Spark大数据分析平台(第六期)
◆ Mycat从入门到精通(第九期)
◆ 深度玩转Excel(第14期)
◆ MySQL DBA从小白到大神实战(第三期)
◆ Qt编程快速入门(第二期)
◆ 人工智能前言系列之基于Tensorflow的案例实践(第一期)
◆ 验模神器AMOS(第二期)
◆ 运维之Tomcat调优实战(第二期)
◆ Oracle 12C RAC集群原理与管理实战(第九期)
◆ 机器学习(第18期)

GMT+8, 2017-4-24 13:30 , Processed in 0.095240 second(s), 38 queries .