❶ R語言如何資料庫讀取數據
R 對於基於 SQL 語言的關系型資料庫有良好 的支持,這些資料庫既有商業資料庫 Oracle、Microsoft SQL Server、IBM DB2 等,也包含在 GNU General Public License (GPL) 下發布的 MySQL 等開源資料庫。 RMySQL 包中提供了到 MySQL 資料庫的介面;RODBC 包提供了更為廣泛資料庫介面的解 決方案 支持所有標准 ODBC 介面的資料庫。通過這種方式,相同的 R 代碼可以方便地應用於 不同類型的資料庫。 library (RODBC) ch <- odbcConnect("stocksDSN",uid = "myuser",pwd = "mypassword") stocks <- sqlQuery(ch ,"select * from quotes") odbcClose(ch) 經測試,Windows 平台上的 Microsoft SQL Server、Access、Oracle、MySQL、PostgreSQL,和
❷ 如何在R語言中讀入數據和導出存儲數據
1.R數據的保存與載入
可通過save()函數保存為.Rdata文件,通過load()函數將數據載入到R中。
[ruby]view plain
>a<-1:10
>save(a,file='d://data//mData.Rdata')
>rm(a)#將對象a從R中刪除
>load('d://data//mData.Rdata')
>print(a)
[1]12345678910
下面創建df1的數據框,通過函數write.csv()保存為一個.csv文件,然後通過read.csv()將df1載入到數據框df2中。
[ruby]view plain
>var1<-1:5
>var2<-(1:5)/10
>var3<-c("Rand","DataMining","Examples","Case","Studies")
>df1<-data.frame(var1,var2,var3)
>names(df1)<-c("VariableInt","VariableReal","VariableChar")
>write.csv(df1,"d://data//mmmyData.csv",row.names=FALSE)
>df2<-read.csv("d://data//mmmyData.csv")
>print(df2)
110.1Rand
220.2DataMining
330.3Examples
440.4Case
550.5Studies
RODBC提供了ODBC資料庫的連接。
3.1從資料庫中讀取數據
odbcConnect()建立一個資料庫連接,sqlQuery()向資料庫發送一個SQL查詢,odbcClose()關閉資料庫連接。
[ruby]view plain
library(RODBC)
connection<-odbcConnect(dsn="servername",uid="userid",pwd="******")
query<-"SELECT*FROMlib.tableWHERE..."
#orreadqueryfromfile
#query<-readChar("data/myQuery.sql",nchars=99999)
myData<-sqlQuery(connection,query,errors=TRUE)
odbcClose(connection)
3.2從Excel文件中導入與導出數據
[ruby]view plain
library("RODBC")
conn<-odbcConnectExcel("D:/data/Amtrak.xls")
Amtrak<-sqlFetch(conn,"Data")
close(conn)
❸ 如何利用r語言進行讀取數據文件,並繪制散點圖
首先,下載並安裝好R軟體。打開R軟體,可以看到R軟體主窗口。
2
為了方便編輯代碼,一般不在主窗口直接輸入程序。我們可以點擊「文件——新建程序腳本」,出現R編輯器。我們將在此輸入需要運行的命令。
3
使用因子格式輸入數據。這里輸入兩組數據,以便後面說明詳細使用方法。
4
輸入命令plot(x),表示繪制序列x的散點圖。選中程序,右鍵,點擊「運行當前行或選中代碼」,運行程序。按F5鍵或者Ctrl+R鍵也可以實現。在圖標顯示框出現散點圖了。
5
輸入命令plot(x,y),其中x表示自變數,y是因變數,生成y關於x的散點圖。運行命令,即出現散點圖。
6
再增加一組數據,用coplot函數繪制多變數的散點圖。coplot(x~m|y)表示在不同的y值下,x關於m的散點圖。
❹ 如何在r語言中抓取股票數據並分析論文
用quantomd包
然後getsymbols函數
分析論文 要看你研究方向
如果是看影響因素 一般回歸就行
如果看股票波動和預測 可能需要時間序列
❺ 用R語言對vcf文件進行數據挖掘.3 從vcf文件里提取有用信息
目錄
一般的VCF文件都很大,用手動提取裡面的信息肯定不大現實。用 vcfR 就可以輕松實現。
vcfR 自帶測試文件 vcfR_test 。就用這個文件來操作一下吧。
在分區 Genotype 里,通過觀察 FORMAT 列可以看到一共有四種類型的數據 GT:GQ:DP:HQ ,至於這四種類型的數據個各自代表什麼意思大家可以查閱知乎網路谷歌。我們可以提取出我們想要的數據類型。比方說最重要的 GT (genotype)。
同樣,我們也可以提取例如 DP (測序深度Read Depth)的數字矩陣。
值的注意的是這里用到了參數 as.numeric = TRUE 使得數據自動轉換成了數字。但是並不是對所有類型的數據都有效,比方說我們重復一下提取 gt 。
在沒有任何報錯的情況下 gt 變成了一堆毫無意義的數字,很明顯不合理,不要用這些經過錯誤轉換的數據進行下一步分析,比方說喜聞樂見的主成分分析。
在一些類型的數據里可能會出現一個以上的結果,比方說上面的 HQ 數據。
一般情況下我們只需旦塵猜要每一列的第一個數字
不需要samtools之類的軟體我們也可模型以實現vcf數據讀取自由,關鍵是可以直接兄和寫入內存進行下一步的統計分析和數據可視化,個人感覺是很有效的提高了生產力。值得花時間學習一下這個工具。
❻ 如何用R語言在數據中提取指定列數據,並且形成一個新的數據表
最簡單的方法,數據框的名稱,加上你要提取的列數,示例如下:
需要注意的是,如果只提取單列的話,得到的數據就變成了一個vector,而不再是dataframe的格式了。
❼ 在r語言中用什麼命令讀取全部數據
使用R語言的時候,如果是少量數據,不妨使用c()或其他函數進行創建;但是對於大量數據,最好還是先通過其他更方便的軟體創建數據文件,然後使用R讀入這個文件。
.csv是非常好的數據文件格式,跨平台支持非常好。我在Excel或者SPSS中創建的數據,只要存為csv格式,就可以使用幾乎任何數據處理軟體對這些數據進行處理了。使用通用格式在多人合作、不同版本兼容等常見行為中,優勢十分明顯。另外,之所以使用不同的數據處理軟體,第一,可以取長補短。比如有些工作SPSS很復雜的,可以用R語言幾行命令搞定。第二,可以進行軟體間處理結果對照,發現問題。
R語言中讀取外部文件的最基本函數是read.table(),還有用來讀csv的read.csv(), .csv是非常好的數據文件格式,跨平台支持非常好。。
輸入help(read.table)命令,就看到了關於數據輸入函數的說明。
❽ 求助如何用R或者Python抓取同花順網
非要用同花順的話,比較可行的辦法是:做外掛程序,模擬鍵盤滑鼠輸入或者操控窗體控制項
另外就是模擬登陸你券商的web交易版本,這個有一個開源的項目GitHub - shidenggui/easytrader: 提供券商華泰/傭金寶/銀河/廣發/雪球的基金、股票自動程序化交易,量化交易組件
目前支持華泰/傭金寶/銀河/廣發/雪球
❾ 如何用R語言在數據中提取指定列數據,並且形成一個新的數據表
1、分析數據表:通過瀏覽「入庫明細」表,我們可能看到入庫明細表中,作為提取記錄的條件零件號在A列。
需要提取的記錄,入庫日期在H列、入庫單號在O列、最後生產批號在L列、入庫前庫存數在Q列。為DC000496ZL的記錄有5條(截圖中的4條是指上面有4條)。
2、列出提取條件及項目:在sheet1中,將A列放置提取條件(即零件號)。在B、C、D、E列分別寫上提取項目名稱:入庫日期、入庫單號、最後生產批號、入庫前庫存數。
3、寫公式:在最後入庫日期項目下B2中輸入公式:=MAX((入庫明細!$A$2:$A$26=$A2)*(入庫明細!$H$2:$H$26)),這是一個數組公式,請用三鍵確認(ctrl+shift+enter)。
搜索
免費自學excel教程全套
excel另一列數據提取
自動抓取數據excel表
表格技巧大全
excel100個常用技巧
新手怎麼做財務報表