❶ 如何用爬虫抓取股市数据并生成分析报表
1. 关于数据采集
股票数据是一种标准化的结构数据,是可以通过API接口访问的(不过一般要通过渠道,开放的API有一定的局限性)。也可以通过爬虫软件进行采集,但是爬虫软件采集数据不能保证实时性,根据数据量和采集周期,可能要延迟几十秒到几分钟不等。我们总结了一套专业的爬虫技术解决方案(Ruby + Sidekiq)。能够很快实现这个采集,也可以后台可视化调度任务。
2. 关于展现
网络股票数据的展现,网页端直接通过HTML5技术就已经足够,如果对界面要求高一点,可以采用集成前端框架,如Bootstrap;如果针对移动端开发, 可以使用Ionic框架。
3. 关于触发事件
如果是采用Ruby on Rails的开发框架的话,倒是很方便了,有如sidekiq, whenever这样子的Gem直接实现任务管理和事件触发。
❷ matlab怎样抓取Yahoo/Sina的股票数据
给你一个例程,用于抓取新浪股票2017年1月份的股票数据。程序如下:
clc;
clear;
year=2017;
season = 1 ;
fprintf('抓取%d年%d季度的数据中...\n', year, season)
[sourcefile, status] = urlread(sprintf('http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/000001/type/S.phtml?year=%d&season=%d', year));
expr2 = '<div align="center">(\d*\.?\d*)</div>';
[datafile, data_tokens] = regexp(sourcefile, expr2, 'match', 'tokens'); %从源文件中获取目标数据
data = zeros(size(data_tokens));%产生和数据相同长度的0
for idx = 1:length(data_tokens)
data(idx) = str2double(data_tokens{idx}{1}); %转变数据类型后存入data中
end
%%占坑打个广告,代写matlab程序(毕业设计,课程任务等)
%%信号处理,小波变换,PCA降维,ICA分析,分类器,滤波器等。QQ:1577232787
❸ 如何利用r语言进行读取数据文件,并绘制散点图
首先,下载并安装好R软件。打开R软件,可以看到R软件主窗口。
2
为了方便编辑代码,一般不在主窗口直接输入程序。我们可以点击“文件——新建程序脚本”,出现R编辑器。我们将在此输入需要运行的命令。
3
使用因子格式输入数据。这里输入两组数据,以便后面说明详细使用方法。
4
输入命令plot(x),表示绘制序列x的散点图。选中程序,右键,点击“运行当前行或选中代码”,运行程序。按F5键或者Ctrl+R键也可以实现。在图标显示框出现散点图了。
5
输入命令plot(x,y),其中x表示自变量,y是因变量,生成y关于x的散点图。运行命令,即出现散点图。
6
再增加一组数据,用coplot函数绘制多变量的散点图。coplot(x~m|y)表示在不同的y值下,x关于m的散点图。
❹ 如何用r语言抓取数据库中的数据库
一、 安装RODBC库
1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择“程序包/安装程序包
2、在弹出的窗口里往下拉,选择RODBC如图,点击确定
3、在ODBC数据源管理器里将需要的数据库添加进去,这里笔者使用的是SQL Server2008,驱动程序选择Native Client10.0
3、在R语言窗口输入连接语句
> library(RODBC)
**这里是载入RODBC库
> channel<-odbcConnect("MyTest",uid="ripley",case="tolower")
**连接刚才添加进数据源的“MyTest”数据库
**ch <- odbcConnect("some dsn ", uid = "user ", pwd = "**** ")
**表示用户名为user,密码是****,如果没有设置,可以直接忽略
> data(USArrests)
**将“USArrests”表写进数据库里(这个表是R自带的)
> sqlSave(channel,USArrests,rownames = "state",addPK = TRUE)
**将数据流保存,这时候打开SQL Server就可以看到新建的USArrests表了
> rm(USArrests)
> sqlTables(channel)
**给出数据库中的表
> sqlFetch(channel,"USArrests",rownames = "state")
**输出USArrests表中的内容
> sqlQuery(channel,"select * from USArrests")
**调用SELECT查询语句并返回结果(如图)
> sqlDrop(channel,"USArrests")
**删除表
> odbcClose(channel)
**最后要记得关闭连接
当然,通过这个办法也可以读取Excel、Access表中的内容,具体方法类似,这里不再重复
❺ 如何在R语言中读入数据和导出存储数据
1.R数据的保存与加载
可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中。
[ruby]view plain
>a<-1:10
>save(a,file='d://data//mData.Rdata')
>rm(a)#将对象a从R中删除
>load('d://data//mData.Rdata')
>print(a)
[1]12345678910
下面创建df1的数据框,通过函数write.csv()保存为一个.csv文件,然后通过read.csv()将df1加载到数据框df2中。
[ruby]view plain
>var1<-1:5
>var2<-(1:5)/10
>var3<-c("Rand","DataMining","Examples","Case","Studies")
>df1<-data.frame(var1,var2,var3)
>names(df1)<-c("VariableInt","VariableReal","VariableChar")
>write.csv(df1,"d://data//mmmyData.csv",row.names=FALSE)
>df2<-read.csv("d://data//mmmyData.csv")
>print(df2)
110.1Rand
220.2DataMining
330.3Examples
440.4Case
550.5Studies
RODBC提供了ODBC数据库的连接。
3.1从数据库中读取数据
odbcConnect()建立一个数据库连接,sqlQuery()向数据库发送一个SQL查询,odbcClose()关闭数据库连接。
[ruby]view plain
library(RODBC)
connection<-odbcConnect(dsn="servername",uid="userid",pwd="******")
query<-"SELECT*FROMlib.tableWHERE..."
#orreadqueryfromfile
#query<-readChar("data/myQuery.sql",nchars=99999)
myData<-sqlQuery(connection,query,errors=TRUE)
odbcClose(connection)
3.2从Excel文件中导入与导出数据
[ruby]view plain
library("RODBC")
conn<-odbcConnectExcel("D:/data/Amtrak.xls")
Amtrak<-sqlFetch(conn,"Data")
close(conn)
❻ 用R语言对vcf文件进行数据挖掘.3 从vcf文件里提取有用信息
目录
一般的VCF文件都很大,用手动提取里面的信息肯定不大现实。用 vcfR 就可以轻松实现。
vcfR 自带测试文件 vcfR_test 。就用这个文件来操作一下吧。
在分区 Genotype 里,通过观察 FORMAT 列可以看到一共有四种类型的数据 GT:GQ:DP:HQ ,至于这四种类型的数据个各自代表什么意思大家可以查阅知乎网络谷歌。我们可以提取出我们想要的数据类型。比方说最重要的 GT (genotype)。
同样,我们也可以提取例如 DP (测序深度Read Depth)的数字矩阵。
值的注意的是这里用到了参数 as.numeric = TRUE 使得数据自动转换成了数字。但是并不是对所有类型的数据都有效,比方说我们重复一下提取 gt 。
在没有任何报错的情况下 gt 变成了一堆毫无意义的数字,很明显不合理,不要用这些经过错误转换的数据进行下一步分析,比方说喜闻乐见的主成分分析。
在一些类型的数据里可能会出现一个以上的结果,比方说上面的 HQ 数据。
一般情况下我们只需旦尘猜要每一列的第一个数字
不需要samtools之类的软件我们也可模型以实现vcf数据读取自由,关键是可以直接兄和写入内存进行下一步的统计分析和数据可视化,个人感觉是很有效的提高了生产力。值得花时间学习一下这个工具。
❼ R语言如何从外部读取数据到R中
R语言如何从外部读取数据到R中
R语言可以从键盘,文本,excel,access,数据库,专业处理软件sas
一、使用键盘的输入
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
二、读入带有分隔符文本格式的数据
data<-read.table(文件,header=true/false,sep="delimeter",row.names=列名)
其中文件可以有很多选项的
file()gzfile(),bzfile(),等一些压缩文件以及url(http://,ftp://,smtp://)
例子:
默认的时候,字符串会自动使用factor转化为数值型
data<-read.table("student.csv",header=TRUE,sep=",",row.names="studentid",stringsAsFactors=FALSE)
三、将xls文件导入到R中
(1)将xls变成csv的格式导入
(2)在Windows系统中,你也可以使用RODBC包来访问Excel文件。
library(RODBC)
channel <- odbcConnectExcel("student.xls")
mydataframe<-sqlFetch(channel,"Sheet1")
odbcClose(channel)
四、抓取网页并且提取信息
五、导入spss数据
library(Hmisc)
mydata<-spss.get("mydata.sav",use.value.labels=TRUE)
六、导入SAS数据
将sas格式的数据转换为csv格式的数据 然后用read.table()形式导入
七、导入关系型数据库的数据
R中有多种面向关系型数据库管理系统(DBMS)的接口,包括Microsoft SQL Server、Microsoft Access、MySQL、Oracle、PostgreSQL、DB2、Sybase、Teradata以及SQLite。其中一些包通过原生的数据库驱动来提供访问功能,另一些则是通过ODBC或JDBC来实现访问的。
(1)使用ODBC的方式导入数据
❽ 怎样用r语言 分时间段 取数据
方法
1
不管是读取数据还是写入,R都是在工作路径中完成的。所以首先我们要知道我们的R所在的工作路径是在哪里。使用getwd()函数来获取我们的工作路径。
2
下面查看工作路径里面有哪些文件,使用dir()函数
3
如果你所想导入的数据并不在你当前的工作路径中,有两种方法可以解决。第一种就是把数据文件放到工作路径中,第二种方法就是更改工作路径。更改