❶ 如何用爬蟲抓取股市數據並生成分析報表
1. 關於數據採集
股票數據是一種標准化的結構數據,是可以通過API介面訪問的(不過一般要通過渠道,開放的API有一定的局限性)。也可以通過爬蟲軟體進行採集,但是爬蟲軟體採集數據不能保證實時性,根據數據量和採集周期,可能要延遲幾十秒到幾分鍾不等。我們總結了一套專業的爬蟲技術解決方案(Ruby + Sidekiq)。能夠很快實現這個採集,也可以後台可視化調度任務。
2. 關於展現
網路股票數據的展現,網頁端直接通過HTML5技術就已經足夠,如果對界面要求高一點,可以採用集成前端框架,如Bootstrap;如果針對移動端開發, 可以使用Ionic框架。
3. 關於觸發事件
如果是採用Ruby on Rails的開發框架的話,倒是很方便了,有如sidekiq, whenever這樣子的Gem直接實現任務管理和事件觸發。
❷ matlab怎樣抓取Yahoo/Sina的股票數據
給你一個常式,用於抓取新浪股票2017年1月份的股票數據。程序如下:
clc;
clear;
year=2017;
season = 1 ;
fprintf('抓取%d年%d季度的數據中...\n', year, season)
[sourcefile, status] = urlread(sprintf('http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/000001/type/S.phtml?year=%d&season=%d', year));
expr2 = '<div align="center">(\d*\.?\d*)</div>';
[datafile, data_tokens] = regexp(sourcefile, expr2, 'match', 'tokens'); %從源文件中獲取目標數據
data = zeros(size(data_tokens));%產生和數據相同長度的0
for idx = 1:length(data_tokens)
data(idx) = str2double(data_tokens{idx}{1}); %轉變數據類型後存入data中
end
%%占坑打個廣告,代寫matlab程序(畢業設計,課程任務等)
%%信號處理,小波變換,PCA降維,ICA分析,分類器,濾波器等。QQ:1577232787
❸ 如何利用r語言進行讀取數據文件,並繪制散點圖
首先,下載並安裝好R軟體。打開R軟體,可以看到R軟體主窗口。
2
為了方便編輯代碼,一般不在主窗口直接輸入程序。我們可以點擊「文件——新建程序腳本」,出現R編輯器。我們將在此輸入需要運行的命令。
3
使用因子格式輸入數據。這里輸入兩組數據,以便後面說明詳細使用方法。
4
輸入命令plot(x),表示繪制序列x的散點圖。選中程序,右鍵,點擊「運行當前行或選中代碼」,運行程序。按F5鍵或者Ctrl+R鍵也可以實現。在圖標顯示框出現散點圖了。
5
輸入命令plot(x,y),其中x表示自變數,y是因變數,生成y關於x的散點圖。運行命令,即出現散點圖。
6
再增加一組數據,用coplot函數繪制多變數的散點圖。coplot(x~m|y)表示在不同的y值下,x關於m的散點圖。
❹ 如何用r語言抓取資料庫中的資料庫
一、 安裝RODBC庫
1、進入R語言的GUI界面(RGUI.EXE),在菜單欄選擇「程序包/安裝程序包
2、在彈出的窗口裡往下拉,選擇RODBC如圖,點擊確定
3、在ODBC數據源管理器里將需要的資料庫添加進去,這里筆者使用的是SQL Server2008,驅動程序選擇Native Client10.0
3、在R語言窗口輸入連接語句
> library(RODBC)
**這里是載入RODBC庫
> channel<-odbcConnect("MyTest",uid="ripley",case="tolower")
**連接剛才添加進數據源的「MyTest」資料庫
**ch <- odbcConnect("some dsn ", uid = "user ", pwd = "**** ")
**表示用戶名為user,密碼是****,如果沒有設置,可以直接忽略
> data(USArrests)
**將「USArrests」表寫進資料庫里(這個表是R自帶的)
> sqlSave(channel,USArrests,rownames = "state",addPK = TRUE)
**將數據流保存,這時候打開SQL Server就可以看到新建的USArrests表了
> rm(USArrests)
> sqlTables(channel)
**給出資料庫中的表
> sqlFetch(channel,"USArrests",rownames = "state")
**輸出USArrests表中的內容
> sqlQuery(channel,"select * from USArrests")
**調用SELECT查詢語句並返回結果(如圖)
> sqlDrop(channel,"USArrests")
**刪除表
> odbcClose(channel)
**最後要記得關閉連接
當然,通過這個辦法也可以讀取Excel、Access表中的內容,具體方法類似,這里不再重復
❺ 如何在R語言中讀入數據和導出存儲數據
1.R數據的保存與載入
可通過save()函數保存為.Rdata文件,通過load()函數將數據載入到R中。
[ruby]view plain
>a<-1:10
>save(a,file='d://data//mData.Rdata')
>rm(a)#將對象a從R中刪除
>load('d://data//mData.Rdata')
>print(a)
[1]12345678910
下面創建df1的數據框,通過函數write.csv()保存為一個.csv文件,然後通過read.csv()將df1載入到數據框df2中。
[ruby]view plain
>var1<-1:5
>var2<-(1:5)/10
>var3<-c("Rand","DataMining","Examples","Case","Studies")
>df1<-data.frame(var1,var2,var3)
>names(df1)<-c("VariableInt","VariableReal","VariableChar")
>write.csv(df1,"d://data//mmmyData.csv",row.names=FALSE)
>df2<-read.csv("d://data//mmmyData.csv")
>print(df2)
110.1Rand
220.2DataMining
330.3Examples
440.4Case
550.5Studies
RODBC提供了ODBC資料庫的連接。
3.1從資料庫中讀取數據
odbcConnect()建立一個資料庫連接,sqlQuery()向資料庫發送一個SQL查詢,odbcClose()關閉資料庫連接。
[ruby]view plain
library(RODBC)
connection<-odbcConnect(dsn="servername",uid="userid",pwd="******")
query<-"SELECT*FROMlib.tableWHERE..."
#orreadqueryfromfile
#query<-readChar("data/myQuery.sql",nchars=99999)
myData<-sqlQuery(connection,query,errors=TRUE)
odbcClose(connection)
3.2從Excel文件中導入與導出數據
[ruby]view plain
library("RODBC")
conn<-odbcConnectExcel("D:/data/Amtrak.xls")
Amtrak<-sqlFetch(conn,"Data")
close(conn)
❻ 用R語言對vcf文件進行數據挖掘.3 從vcf文件里提取有用信息
目錄
一般的VCF文件都很大,用手動提取裡面的信息肯定不大現實。用 vcfR 就可以輕松實現。
vcfR 自帶測試文件 vcfR_test 。就用這個文件來操作一下吧。
在分區 Genotype 里,通過觀察 FORMAT 列可以看到一共有四種類型的數據 GT:GQ:DP:HQ ,至於這四種類型的數據個各自代表什麼意思大家可以查閱知乎網路谷歌。我們可以提取出我們想要的數據類型。比方說最重要的 GT (genotype)。
同樣,我們也可以提取例如 DP (測序深度Read Depth)的數字矩陣。
值的注意的是這里用到了參數 as.numeric = TRUE 使得數據自動轉換成了數字。但是並不是對所有類型的數據都有效,比方說我們重復一下提取 gt 。
在沒有任何報錯的情況下 gt 變成了一堆毫無意義的數字,很明顯不合理,不要用這些經過錯誤轉換的數據進行下一步分析,比方說喜聞樂見的主成分分析。
在一些類型的數據里可能會出現一個以上的結果,比方說上面的 HQ 數據。
一般情況下我們只需旦塵猜要每一列的第一個數字
不需要samtools之類的軟體我們也可模型以實現vcf數據讀取自由,關鍵是可以直接兄和寫入內存進行下一步的統計分析和數據可視化,個人感覺是很有效的提高了生產力。值得花時間學習一下這個工具。
❼ R語言如何從外部讀取數據到R中
R語言如何從外部讀取數據到R中
R語言可以從鍵盤,文本,excel,access,資料庫,專業處理軟體sas
一、使用鍵盤的輸入
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
二、讀入帶有分隔符文本格式的數據
data<-read.table(文件,header=true/false,sep="delimeter",row.names=列名)
其中文件可以有很多選項的
file()gzfile(),bzfile(),等一些壓縮文件以及url(http://,ftp://,smtp://)
例子:
默認的時候,字元串會自動使用factor轉化為數值型
data<-read.table("student.csv",header=TRUE,sep=",",row.names="studentid",stringsAsFactors=FALSE)
三、將xls文件導入到R中
(1)將xls變成csv的格式導入
(2)在Windows系統中,你也可以使用RODBC包來訪問Excel文件。
library(RODBC)
channel <- odbcConnectExcel("student.xls")
mydataframe<-sqlFetch(channel,"Sheet1")
odbcClose(channel)
四、抓取網頁並且提取信息
五、導入spss數據
library(Hmisc)
mydata<-spss.get("mydata.sav",use.value.labels=TRUE)
六、導入SAS數據
將sas格式的數據轉換為csv格式的數據 然後用read.table()形式導入
七、導入關系型資料庫的數據
R中有多種面向關系型資料庫管理系統(DBMS)的介面,包括Microsoft SQL Server、Microsoft Access、MySQL、Oracle、PostgreSQL、DB2、Sybase、Teradata以及SQLite。其中一些包通過原生的資料庫驅動來提供訪問功能,另一些則是通過ODBC或JDBC來實現訪問的。
(1)使用ODBC的方式導入數據
❽ 怎樣用r語言 分時間段 取數據
方法
1
不管是讀取數據還是寫入,R都是在工作路徑中完成的。所以首先我們要知道我們的R所在的工作路徑是在哪裡。使用getwd()函數來獲取我們的工作路徑。
2
下面查看工作路徑裡面有哪些文件,使用dir()函數
3
如果你所想導入的數據並不在你當前的工作路徑中,有兩種方法可以解決。第一種就是把數據文件放到工作路徑中,第二種方法就是更改工作路徑。更改