炼数成金 门户 图书 查看内容

数据分析:R语言实战

2014-9-2 22:23| 发布者: 炼数成金_小数| 查看: 68248| 评论: 7|原作者: 李诗羽 张飞 王正林|来自: 电子工业出版社

摘要: 内容简介: 大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。R是一款非常优秀的统计分析软件,本书侧重于使用R进行数据的处理、整理和分析,重点讲述了R的数据分析流程、算法包的使 ...

内容简介:

大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。R是一款非常优秀的统计分析软件,本书侧重于使用R进行数据的处理、整理和分析,重点讲述了R的数据分析流程、算法包的使用以及相关工具的应用,同时结合大量精选的数据分析问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解R的精髓和灵活、高效的使用技巧。

通过本书,读者不仅能掌握使用R及相关的算法包来快速解决实际问题,而且能学会从实际问题分析入手,到利用R进行求解,以及对结果进行分析。

 

目录:

上篇:数据预处理

0章 致敬,R       1

致敬,肩膀!         1

致敬,时代!         3

致敬,人才!         3

致敬,R瑟! 5

1章 数据分析导引          8

1.1  数据分析概述        8

1.1.1  数据分析的原则         8

1.1.2  数据分析的步骤         9

1.1.3  数据分析的过程         10

1.1.4  数据分析的对象         11

1.2  大数据分析   11

1.2.1  大数据分析的流程    11

1.2.2  大数据分析的基本方面    12

1.2.3  大数据分析的应用    13

1.3  数据分析常用工具        13

1.4  R在数据分析中的优势         14


2章 数据的读取与保存          16

2.1  数据读取        16

2.1.1  读取内置数据集         16

2.1.2  读取文本文件    17

2.1.3  读取固定宽度格式的文件         20

2.1.4  读取Excel数据  21

2.1.5  读取数据库文件         22

2.1.6  读取网页数据    26

2.1.7  读入R格式的文件    28

2.1.8  从其他统计软件读入数据         28

2.2  数据保存        31

2.2.1  使用函数cat()    31

2.2.2  保存为文本文件         32

2.2.3  保存R格式文件         33

2.2.4  保存为其他类型文件         33


3章 数据预处理     34

3.1  基本函数        34

3.2  数据修改        38

3.2.1  修改数据标签    38

3.2.2  行列删除    38

3.3  缺失值处理   38

3.3.1  判断缺失数据    39

3.3.2  判断缺失模式    39

3.3.3  处理缺失数据    41

3.4  数据整理        44

3.4.1  数据合并    44

3.4.2  选取数据的子集         46

3.4.3  数据排序    47

3.5  长宽格式的转换   48

3.5.1  揉数据函数         48

3.5.2  揉数据的最佳伴侣    49

 

中篇:基本分析及应用


4章 数据的图形描述     54

4.1  R绘图概述    54

4.2  绘图区域分割        55

4.2.1  函数par()    55

4.2.2  函数layout()        56

4.2.3  函数split.screen()       57

4.3  二维图形        58

4.3.1  高级绘图函数    58

4.3.2  多元数据绘图    61

4.3.3  低级绘图函数    63

4.3.4  图形美化    64

4.3.5  交互式绘图命令         65

4.4  三维图形        67

4.5  LATTICE程序包      69

4.6  ggplot2程序包   73

4.6.1  快速绘图    74

4.6.2  分图层绘图         76

4.7  图形保存        84

4.8  综合实例:数据地图   84


5章 数据的描述性分析          88

5.1  R内置的分布         88

5.2  集中趋势的分析   90

5.2.1  集中趋势的测度         90

5.2.2  R语言实现 91

5.3  离散趋势的分析   93

5.3.1  离散趋势的测度         93

5.3.2  R语言实现 94


前言:

大数据时代,数据成为决策最为重要的参考之一,数据分析随着大数据概念的普及而日益得到重视,数据分析行业迈入了一个全新的阶段。


数据分析的软件如雨后春笋般地涌现,其中R软件的发展备受瞩目。R是一个免费开源软件,它提供了首屈一指的统计计算和绘图功能,尤其是大量的统计分析、数据挖掘方面的算法包,使得它成为一款优秀的、不可多得的数据分析工具软件。


本书的主要目的是向读者介绍如何用R进行数据分析,通过大量的精选实例,循序渐进、全面系统地讲述R在数据分析领域的应用。


全书分为15章,从数据预处理、基本分析及应用和综合实例这三篇展开。


1)上篇:数据预处理

由第1~3章组成,首先简要介绍数据分析的原则、步骤和过程、常用工具及R在数据分析中的优势,然后介绍R中数据整理等数据预处理的基本函数及方法。这些内容是使用R进行数据分析的最基础内容。


2)中篇:基本分析及应用

由第4~13章组成,主要讲述数据分析的基本算法及应用,包括数据的图形描述、描述性分析、参数估计、假设检验,以及方差分析、回归分析、主成分分析、典型相关分析、判别分析、聚类分析和时间序列分析等,这些分析方法也是数据分析使用最多最普遍的算法。R中提供了丰富的、功能强大的算法包和实现函数,数据分析的初级和中级用户务必掌握。


3)下篇:综合实例

由第14~15章组成,主要结合两个大例子,综合讲述数据分析在金融数据分析和数据预测中的应用,以及使用R中的方法和工具进行应用。对于中高级的用户,可以深入学习一下。


R的特点是入门非常容易,使用也非常简单,因此本书也不需要读者具备R和数据挖掘的基础知识,不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容,从而快速入门和提高。读者既可以把本书作为学习如何应用R的一本优秀的教材,也可以作为数据分析的工具书。


全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容,脉络清晰,并且各章自成体系。读者可以从头至尾逐章学习,也可以根据自己的需要进行学习,找到自己实际问题的解决方案。


本书所编的源程序,都通过了反复的调试,读者可在www.broadview.com.cn网站下载,方便读者使用。


26

鲜花
1

握手

雷人

路过

鸡蛋

刚表态过的朋友 (27 人)

发表评论

最新评论

引用 小誌 2015-1-14 11:11
感觉和薛毅的书 区别不大么
引用 Data-jiaoshigun 2014-12-19 21:11
怎么名字与老外那本重复了?
引用 Uriel 2014-11-11 15:23
看了分析这本书,对于初学者有点吃力,里面数学的东西真是醉了
引用 amdosa 2014-10-8 11:17
acheng: 这个和R in action的区别是什么?
是一样的吧。。。。
引用 acheng 2014-9-29 09:23
这个和R in action的区别是什么?
引用 jky03062112 2014-9-16 14:44
能不能给pdf的下载?
引用 步行者 2014-9-4 17:01
这是什么?
新书吗?

查看全部评论(7)

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

热门文章

     

    GMT+8, 2017-3-24 02:38 , Processed in 0.669604 second(s), 27 queries .