Ⅰ 有哪些关于 R 语言的书值得推荐
数据挖掘与R语言
本书首先简要介绍了R软件的基础知识(安装、R数据结构、R编程、R的输入和输出等)。然后通过四个数据挖掘的实际案例 (藻类频率的预测、证券趋势预测和交易系统仿真、交易欺诈预测、微阵列数据分类)介绍数据挖掘技术。这四个案例基本覆盖了常见的数据挖掘技术,从无监督的 数据挖掘技术、有监督的数据挖掘技术到半监督的数据挖掘技术。全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容,脉络清晰,并且各章自成体 系。读者可以从头至尾逐章学习,也可以根据自己的需要进行学习,找到自己实际问题的解决方案。
本书不需要读者具备R和数据挖掘的基础知识。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。读者既可以把本书作为学习如何应用R的一本优秀教材,也可以作为数据挖掘的工具书。
机器学习:实用案例解析
机器学习是计算机科学和人工智能中非常重要的一个研究领域,近年来,机器学习不但在计算机科学的众多领域中大显身手,而且成为一些交叉学科的重要支撑技 术。本书比较全面系统地介绍了机器学习的方法和技术,不仅详细阐述了许多经典的学习方法,还讨论了一些有生命力的新理论、新方法。
全书案例既有分类问题,也有回归问题;既包 含监督学习,也涵盖无监督学习。本书讨论的案例从分类讲到回归,然后讨论了聚类、降维、最优化问题等。这些案例包括分类:垃圾邮件识别,排序:智能收件 箱,回归模型:预测网页访问量,正则化:文本回归,最优化:密码破解,无监督学习:构建股票市早闭郑场指数,空间相似度:用投票记录对美国参议员聚类,推荐系 统:给用户推荐R语言包,社交网络分析:在Twitter上感兴趣的人,模型比较:给你的问题找到最佳算法。各章对原理的叙述力求概陆颂念清晰、表达准确,突 出理论联系实际,富有启发性,易于理解。在探索这些案例的过程中用到的基本工具就是R统计编程语言。R语言非常适合用于机器学习的案例研究,因为它是一种 用于数据分析的高水平、功能性脚本语言。
R语言经典实例
本书涵盖200多个R语言实用方法,可以帮助读者快速而有效地使用R进行数据分析。R语言给我们提供了统计分析酣一切工具,但是R本身的结 构可能有些难于掌握。本书提供的这些面向任务、简明的R语言方法包含了从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你 马上应用R高效地工作。
每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,《R语言经典实例》将帮助 你步入R的殿堂;对于R的资深用户,本书将加深你对R的理解并拓展你的视野。通过本书,你可以使你的分析工作顺利完成并学习更多R语言知识。本书由蒂特 着。
R语言编程艺术
R语言是世界上最流行的用于数据态吵处理和统 计分析的脚本语言。考古学家用它来跟踪古代文明的传播,医药公司用它来探索哪种药物更安全、更有效,精算师用它评估金融风险以保证市场的平稳运行。总之, 在大数据时代,统计数据、分析数据都离不开计算机软件的支持,在这方面R语言尤其出色。
本书将带领你踏上R语言软件开发之旅,从最 基本的数据类型和数据结构开始,到闭包、递归和匿名函数等高级主题,由浅入深,讲解细腻,读者完全不需要统计学的知识,甚至不需要编程基础。而书中提到的 很多高级编程技巧,都是作者多年编程经验的总结,对有经验的开发者也大有裨益。本书精选了44个扩展案例,这些案例都源自于作者亲身参与过的咨询项目,都 是与数据分析相关的,生动展示了R语言在统计学中的高效应用。
金融数据分析导论:基于R语言
本书由统计学领域着名专家Ruey S. Tsay(蔡瑞胸)所着,从基本的金融数据出发,讨论了这些数据的汇总统计和相关的可视化方法,之后分别介绍了商业、金融和经济领域中的基本时间序列分析和计量经济模型。
时间序列分析及应用:R语言(原书第2版)
本书以易于理解的方式讲述了时间序列模型及其应用,主要内容包括:趋势、平稳时间序列模型、非平稳时间序列模 型、模型识别、参数估计、模型诊断、预测、季节模型、时间序列回归模型、异方差时间序列模型、谱分析入门、谱估计、门限模型.对所有的思想和方法,都用真 实数据集和模拟数据集进行了说明。
本书可作为高等院校统计、经济、商科、工程及定量社会科学等专业学生的教材或教学参考书,同时也可供相关技术人员使用。
Ⅱ R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
在R语言中,时间序列分析是金融数据探索的核心技术,特别是ARIMA和ARCH / GARCH模型,它们用于预测股票价格动态。本文将逐步讲解如何在R环境中运用这些模型进行分析。
首先,理解非平稳序列的处理至关重要。通过差分法,如苹果股票价格例子所示,可以将指数增长的序列转换为线性或均值回复的平稳序列。对数转换有助于平滑数据,而差分则是稳定方差的关键步骤。
ARIMA模型的识别依赖于ACF和PACF图。例如,Log Apple股票数据可能需要ARIMA(1,0,0)模型,而差分序列的ACF和PACF提示可能为白噪声模型ARIMA(0,1,0)。
ARIMA模型参数的估计需要使用AICc,如ARIMA(2,1,2)在Apple股票数据中的应用。在R中,通过ACF和PACF图检查残差的独立性和自相关性,确保模型的适用性。
如果ARIMA模型的残差显示波动性,可能需要引入ARCH / GARCH模型。通过分析残差的ACF和PACF以及Ljung-Box检验,确定波动性模型的阶数,如ARCH 8。
ARIMA-ARCH / GARCH模型的结合,如ARIMA(2,1,2)-ARCH(8),可以更准确地反映近期变化和波动,从而提供更短的预测区间。预测结果应结合实际市场事件,如Apple的收益报告,来评估模型的有效性。
时间序列分析在金融领域至关重要,ARIMA和ARCH / GARCH模型提供了有效预测工具。但要注意,ARIMA模型的局限性在于它不考虑新信息,而GARCH模型则通过条件方差适应动态波动。理解这些模型的适用场景和局限性,对于有效预测股票价格具有重要意义。