r语言保存股票数据结构_如何用R语言的quantmod包获取一系列股票的历史日线数据

㈠用R语言，生成1000个服从标准正态分布的随机数，画出散点图，频率直方图（附加密度曲线）及箱线图

作为一种语言进行统计分析，R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布，生成该分布下的随机数。其中有许多常用的个分布可以直接调用。

在R中各种概率函数都有统一的形式，即一套统一的前缀+分布函数名：

d 表示密度函数（density）。

p 表示分布函数（生成相应分布的累积概率密度函数）。

q 表示分位数函数，能够返回特定分布的分位数（quantile）。

r 表示随机函数，生成特定分布的随机数（random）。

(1)r语言保存股票数据结构扩展阅读：

注意事项：

1、使用了错误大小写：help()是正确的，其他都是错误的。

2、不要忘记使用必要的引号：install.packages(“gclus”)。

3、在函数调用时，不要忘记使用括号：help()。

4、在Windous上，路径名中使用的是。

5、R拥有许多用于存储数据的对象类型，包括标量、向量、矩阵、数组、数据框和列表。数据框是用来存储数据集的主要数据结构。

㈡如何用R语言提取股票行情数据

你好，关于股票价格有关的开盘价格，当日最高价格，当日最低价格，收盘价格，股票交易量；和调整后的价格；

DIA.Open 当日开盘价格

DIA.High 当日最高价格

DIA.Low 当日最低价格

DIA.Close 当日收盘价格

DIA.Volume 当日股票交易量

DIA.Adjusted 当日调整后的价格

㈢ R语言怎么把股票日收盘价转换成对数收益率

知道一系列收盘价向量X,length=1000,求对数收益率的R语言代码
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly

acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')

Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")

运行结错误办

> int <- read.table("d-intc7208.txt", head=T)
错误于file(file, "rt") : 打链结
外: 警告信息：
In file(file, "rt") :
打文件'd-intc7208.txt': No such file or directory

+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
错误: 意外符号 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
错误: 意外符号 in "log return"

㈣ R语言基础教程 | 数据结构—因子

变量可归结为名义型、有序型或连续型变量。名义型变量是没有顺序之分的类别变量。类别（名义型）变量和有序类别（有序型）变量在R中称为因子（factor）。因子在R中非常重要，因为它决定了数据的分析方式以及如何进行视觉呈现。因子（factor)是R语言中比较特殊的一个数据类型，它是一个用于存储的类型，举个例子，从性别上，可以把人分为：男人和女人，从年龄上划分，又可以把人分为：未成年人（<18岁），成年人（>=18）。

R把表示分类的数据称为因子，因子的行为有时像字符串，有时像整数。因子是一个向量，通常情况下，每个元素都是字符类型，也有其他数据类型的元素。因子具有因子水平（Levels），用于限制因子的元素的取值范围，R强制：因子水平是字符类型，因子的元素只能从因子水平中取值，这意味着，因子的每个元素要么是因子水平中的字符（或转换为其他数据类型），要么是缺失值，这是因子的约束，是语法上的规则。

通常情况下，在创建数据框变量时，R隐式把数据类型为字符的列创建为因子，这是因为R会把文本类型默认为类别数据，并自动转换为因子。前面我们在讲数据框时，就有提到。

通过class()函数检查gender列的类，结果是因子类型，而不是字符向量。

可以通过factor()函数创建因子，factor()函数的第一个参数必须是字符向量，通过levels参数显式设置因子水平。

参数注释：

例如，因子sex的值是向量c('f','m','f','f','m')，因子水平是c('f','m')

因子水平规定了 因子取值的范围 ，每一个因子，都包含因子水平的信息，例如，打印gender列，可以看到因子的元素和水平：

该因子中的每个值都是一个字符串，它们被限制为“f”、“m”和缺失值（NA）。如果把其他字符串添加到gender列中，R会抛出警告消息，并把错误赋值的元素设置为NA，例如：

因子水平，可以通过函数levels(factor)来查看：

水平的级数，相当于level的长度，可以由nlevels函数查询到：

使用factor函数创建因子，可以使用labels参数为每个因子水平添加标签，labels参数的字符顺序，要和levels参数的字符顺序保持一致，例如：

通常情况下，因子一般是无序的，这可以通过is.ordered()函数来验证：

因子的顺序，实际上是指因子水平的顺序，有序因子的因子水平是有序的。在特殊情况下，有些因子的水平在语义上大于或小于其他水平，R支持按顺序排列的因子，使用ordered函数，或通过给factor函数传入order=TRUE参数，把无序因子转换为有序的因子。

ordered()函数不能指定特定因子水平的顺序，通常情况下，因子中先出现的水平小于后出现的水平。例如，通过ordered函数把sex因子转换为有序的因子：

通过factor函数创建有序因子，通过levels指定因子的顺序。

因子的顺序，其实是因子水平的顺序，我们可以通过levels，使现有的因子按照指定的因子水平来排序。

例如，把heights数据框的gender，按照指定的levels，转换成有序因子：

在数据清理时，可能需要去掉与因子水平对应的数据，通常情况下，需要删除未使用的因子水平，可以使用droplevels函数，它接受因子或是数据框作为参数。

如果x是数据框，那么把数据框中未使用的因子删除。

在数据清理中，有时需要把因子转换为字符，通常情况下，使用as.character()函数，把因子转换为字符串：

使用as.numeric()或as.integer()函数可以把因子转换成对应的整数.

函数 cut() 能够把数值变量切成不同的块，然后返回一个因子.

参数注释：

例如，把身高数据，按照指定的切割点向量分割：

当需要把因子转换为有序因子时，要注意因子水平的顺序.

㈤ R语言中的几种数据结构

R语言中的几种数据结构
一 R中对象的5种基本类型
字符（character）
整数（integer）
复数（complex）
逻辑（logical：True/False）
数值（numeric：real numbers）
查看对象类型的命令：class(x)
二 R语言中有如下几种数据结构：
向量 vector() 组内元素必须类型一致，否则将会被强制转换。
(1) 创建向量的三种方式：
<span style="font-size:18px;">x <- vector("numeric", length = 10)

x <- 1:4

x <- c("a",12,TRUE)</span>
(2) 强制转换的几个函数：
as.numeric(x) / as.character(x) / as.logical(x)
矩阵 matrix() 一列一列的填充元素
按行合并：rbind() 按列合并：cbind()
数组 array() 可以有多个维度
列表 list() 可以包含不同类型的元素
因子 factor()
(1) 分类数据/有序 vs. 无序
(2) 整数向量+标签（label）（优于整数向量）
Male/Female vs. 1/2
常用于lm(),glm()
(3) levels设置基线水平
table() 查看因子信息 unclass() 去除因子属性日期
x <- Sys.Date() 得到系统当前日期
julian(x) x距离1970-01-01的天数
时间 POSIXct / POSIXlt
POSIXct：整数，常用于存入数据框 as.POSIXct()
POSIXlt：列表，还包含星期、年月日等信息。as.POSIXlt()
strptime(x, format = "...") 将一般格式转化为时间格式

㈥ R语言数据结构-向量

R语言数据结构主要有以下四种：

向量：一串相同类型的数据，不限于数字，字符，逻辑都可以，单独拿出来的一列。什么是看做一个整体，一个向量里有若干个数据，它们组成一个整体之后，可以拥有一个共同的名字。

以下主要讲向量：

向量就是一串数据，串联在一起，组成一个整体，向量由元素组成。

很长的向量要么从数据框提取一列，或是有规律地生成，如连续的数据：

paste0函数连接两个向量，逗号 , 前后各有一个向量，如字符型和数值型向量。

paste0和paste的区别是：

paste0函数 把两个向量的元素一一对应进行无缝连接，而 paste函数 把两个向量的元素一一对应进行空格连接。paste函数有默认值为空格，在空格处把空格去掉sep=""引号里把默认的空格去掉，即什么没有，就变成无缝连接，也可以用其它的符号连接sep="/"，sep="_"等。

数值型、字符型、逻辑型：只要有字符型在，用c()生成向量为字符型。只有逻辑型和数值型，用c()生成向量为数值型。

c()函数生成向量时，要求为生成同一种数据类型

注意的地方：

变量名 ：c()为生成向量函数，一般除字母c外，取单个字母或是单词及缩写，组成变量名的字母之间不要有空格，不能以数字为变量名或是以数字开头，变量名不能是中文名，特殊符号等。

<- 与c()函数之间没有空格。

<- 的快捷键输入：

mac电脑： option 和 - ；

windows电脑： Alt 和 -

= 在任何情况下可替代 <- ，但是 = 除了赋值，还有其它用法，比如函数里参数用法。 <- 不能在任意情况下代替 = 。

强大的计算是体现在批量计算上，先把一些数据组成一个整体，

还是以向量x为单位进行

其中五个重要函数，一定要掌握。

能用函数代替的东西，坚决不用手和眼睛去数，比如length()统计向量元素个数。

结论：unique(x)与x[!plicated(x)]函数相同

用identical()可以判断两个函数是否相同（数据结构与数据类型是否完全相同）

重点和难点：

x==y ：x和对应位置的y相等吗？（x和y里的元素，按顺序一一对应比较，讲究位置对应，两者里第一个元素相同就返TRUE，比较完两个向量的第一位置上的元素，接着比较两个向量第二个位置元素...到两个向量最后）。

x和y不一样长：理解“循环补齐”

结论： 如果x与y的向量元素长度不相等，以长度向量说了算，不是由在==前的向量决定。

x%in%y ：x的每个元素在y中存在吗？（x的元素挨个到y里和所有元素比较，在y里有的相同的返回TRUE，不讲究位置，有就是TRUE，没有为FALSE）。比如y向量加了一个元素2，返回还是9个逻辑值，返回的逻辑值是与x一一对应，和y没有关系。

加减乘除，两个向量直接可以进行，等位运算。前提是两个向量必须等长，即元素个数一样。

用paste0或是paste连接两个向量，两个向量的长度（元素个数）不一致，循环补齐。

intersect(x,y)，union(x,y)，setdiff(x,y)，setdiff(y,x)，x与y顺序颠倒（setdiff()与%in%有点儿相似）。

[] ：取子集符号，将TRUE对应的值挑选出来，FALSE丢弃.

例：在13个数中，取出大于7的数，首先把13个数值组成一个向量x，x>7返回是逻辑值。

取值子集的对象放在中括号的外面，取子集的逻辑值向量放在中括号里面。

单独运行中括号里的向量，中括号里各种条件的返回结果有共同的规律，是一个与x等长的逻辑值向量。

下标：代表在哪个位置上。

符号： []

按照逻辑值： 中括号里是与x等长的逻辑值向量

按照位置： 中括号里是由x的下标组成的向量（支持反选）

思考：从13个彩色（绿，蓝，黄）球中，选出属于蓝色和绿色的：

使用x %in% y还是x ==y，用x %in% y，不是等位循环补齐运算，%in%比较灵活，可以在很多场景中使用，如3选2，50选2，50选20等。

13个球的颜色赋值给向量x，蓝色和绿色赋值给y。

x %in% y

x[x %in% y]

修改向量的元素，修改x里的第四个元素

注意：R于语言里所有的修改，都要赋值，没有赋值就是没有发生过

把随机函数生成的数永远为一组数据：用随机函数生成向量，后运行set.seed(10086)

x[match(y,x)] 和 x[order(x)]

排序，如何调整元素顺序

结论：sort(x)等于x[order(x)]，背诵下来

两个向量没有做关联的操作，可以用order函数排序对应信息

向量匹配排序-match，match函数是连线用的

x[match(y,x)] 的以后用法：以y作为模版，给x调顺序。

match：谁在中括号外面，谁就在后面， x[match(y,x)] ，以y作为模板，用x作为原料去取子集，按照一个顺序取子集，取出来的子集和y一样。

需要背诵的两个用法： x[match(y,x)] 和 x[order(x)]

练习题：在以下x和y表格里如何将y的列名一对一替换为ID

切换Rproj的时候出现弹窗：是否将工作空间保存到 .Rdata ？

答案是：不保存，之前单独保存好脚本和图片，这里出现的提示是否临时保存，不需要保存。

.Rdata ？是什么：

以 . 开头的文件，通常用作配置，系统默认隐藏这类文件

.Rdata 是保存工作空间的默认文件

.History 是保存历史命令的默认文件

如果打开Rstudio特别慢，可能是因为 .Rdata 保存了很大的变量，可以找到 .Rdata 文件将其删除。

在Rproj右下角打开脚本时，编辑器脚本的中文注释出现乱码，解决如下：

以上内容是听生信技能树小洁老师的 R语言线上课，根据自己的理解记录下来，小洁老师授课非常细心，对不同水平的同学都照顾到，并且补充很多技巧以及注意事项。

之前学习过R语言，那时对向量认识不够深，也没有重视，数据框的列单独拿出来就是一个向量。认真听小洁老师的讲解以及最近跑几个GEO数据集发现学会对向量的熟练操作以及熟练一些重要的函数，在实战过程中会顺利些。

㈦ R语言数据结构-数据框&矩阵&列表

R语言数据结构主要有以下四种：

四种数据结构，重点掌握向量和 数据框

判断数据结构的函数： class()

向量的详细讲解在上一篇文章，以下主要讲数据框，矩阵，列表：

以下大部分操作使用的数据框为df

几个重要的函数：查看数据框的行数和列数，行名和列名；以及单独查行的数量，列的数量

数据框取子集有几种方法 ： $ 符号，坐标，名字，逻辑值

在 [,] 里，行在前面（左边），列在后面（右边），行与列用逗号 , 隔开： [行,列]

中括号里的逗号，表示维度的分割

数据框按照逻辑值取子集，TRUE对应的行/列留下，FALSE对应的行/列去掉。

修改第二列的列名，就是修改列名这个向量的第二个元素

https://blog.csdn.net/weixin_39718006/article/details/110516670

后续的笔记会有详细介绍

矩阵不能用 $ 符号取子集

t()：转置函数，行与列的互换

as.data.frame()：转换，把矩阵变为数据框 ，用as.matrix()函数也能把数据框变为矩阵

聚类，相似的行，相似的列会聚在一起。热图自动聚类，行和列的相对位置发生了变化，只是列与列，行与行之间的变化规律。

![热图自动聚类]]( https://upload-images.jianshu.io/upload_images/17511166-f6e2432a04cffbbe.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240 )

热图默认聚类，修改参数，不让聚类，热图与表达矩阵对应。

默认的设置不符合自己的预期，可以子啊作者允许的范围内定义。

查看函数帮助文档，参考修改，达到自己的要求。

列表没有列名和行名，只有元素的名字。列表可以由数据框，矩阵，向量，单独的一个数字都可以组成。

列表没有行和列的概念，只有元素，取子集的两种方式： [[]] ， $ ，

$ 有两个作用：数据框取子集和列表取子集。在矩阵和向量里不能用 $ 。

用 class() 函数更能具体说明问题，判断数据结构和数据类型

认识R语言的四种数据结构，小洁老师强调重点掌握向量和数据框，在实战中遇到很多数据结构都是数据框，表达矩阵可以转化为数据框，数据框的一列可以看做是一个向量。小洁老师把实战中会需要的操作融入到练习题，在实战中能联想起小洁老师讲过的知识点。

㈧正在学习用R语言编写股票自动交易软件，但是对股票以及R语言都知之甚少。求高手指点。

我和你一样，也在学，大智慧新一代，通达信，和飞狐这几个你任选一个先学，以后慢慢的都会了。飞狐相对要复杂一些，要想编出功能更强大的公式，飞狐里还会用到VBS和JS脚本，还会用到C语言，别的公式不会用到这些。

㈨ R语言里的一个语句不明白啥意思

在quantmod包里面；
getSymbols(Symbols = NULL,
env = parent.frame(),
reload.Symbols = FALSE,
verbose = FALSE,
warnings = TRUE,
src = "yahoo",
symbol.lookup = TRUE,
auto.assign = getOption('getSymbols.auto.assign',TRUE),
...)

auto.assign=F表示不自动赋值；需要手动指定变量去存储数据。否则就是自动赋值给Symbols变量。

㈩如何用R语言的quantmod包获取一系列股票的历史日线数据

我举个例子供你参考：
> install.packages('quantmod') # 安装安装quantmod包
> require(quantmod)#引用quantmod包
> getSymbols("GOOG",src="yahoo",from="2013-01-01", to='2013-04-24') #从雅虎财经获取google的股票数据
> chartSeries(GOOG,up.col='red',dn.col='green') #显示K线图

导航:首页 > 数据行情 > r语言保存股票数据结构

r语言保存股票数据结构

与r语言保存股票数据结构相关的资料