『壹』 怎麼提高R語言讀取資料庫的速度
會有影響的,機器性能對數據的導出速度有很大的影響。
exp和expdp這兩個都是資料庫冷備份的方法,備份的目的是防止資料庫異常導致數據丟失,但是冷備份只能講數據還原到指定時間點的數據。
一周一次備份,頻率還是太低了。就一般生產庫而已,基本上都是一天一備份的。exp對資料庫沒啥影響,只要是在業務相對少的情況下進行就好。
建議使用expdp數據泵方式備份,可以添加parallel參數,很快的。
『貳』 請問如何用R語言做大量次數的幾何布朗運動的模擬(參數μ,σ已知)
這上網搜應該搜的到吧,比如這篇文章"
股票價格行為關於幾何布朗運動的模擬--基於中國上證綜指的實證研究
",照著幾何布朗運動的公式直接寫代碼應該就行了吧,代碼邏輯都很清晰。
下面是照著這片文章模擬一次的代碼,模擬多次的話,外面再套個循環應該就行了。然後再根據均方誤差(一般用這個做准則的多)來挑最好的。
話說你的數據最好別是分鍾或者3s切片數據,不然R這速度和內存夠嗆。
N <- 2000 #模擬的樣本數
S0 <- 2000 #初始值
mu <- 0.051686/100
sigma <- 1.2077/100
St <- rep(0,N)
epsion <- rnorm(N,0,1) #正態分布隨機數
for(i in 1:N) {
if(i == 1) {
delta_St <- mu * S0 + sigma * S0 * epsion[i]
St[i] <- S0 + delta_St
}else {
delta_St <- mu * St[i-1] + sigma * St[i-1] * epsion[i]
St[i] <- St[i-1] + delta_St
}
}
Final_St <- c(S0,St) #最終結果
plot(Final_St,type = "l")
『叄』 R語言如何從外部讀取數據到R中
R語言如何從外部讀取數據到R中
R語言可以從鍵盤,文本,excel,access,資料庫,專業處理軟體sas
一、使用鍵盤的輸入
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
二、讀入帶有分隔符文本格式的數據
data<-read.table(文件,header=true/false,sep="delimeter",row.names=列名)
其中文件可以有很多選項的
file()gzfile(),bzfile(),等一些壓縮文件以及url(http://,ftp://,smtp://)
例子:
默認的時候,字元串會自動使用factor轉化為數值型
data<-read.table("student.csv",header=TRUE,sep=",",row.names="studentid",stringsAsFactors=FALSE)
三、將xls文件導入到R中
(1)將xls變成csv的格式導入
(2)在Windows系統中,你也可以使用RODBC包來訪問Excel文件。
library(RODBC)
channel <- odbcConnectExcel("student.xls")
mydataframe<-sqlFetch(channel,"Sheet1")
odbcClose(channel)
四、抓取網頁並且提取信息
五、導入spss數據
library(Hmisc)
mydata<-spss.get("mydata.sav",use.value.labels=TRUE)
六、導入SAS數據
將sas格式的數據轉換為csv格式的數據 然後用read.table()形式導入
七、導入關系型資料庫的數據
R中有多種面向關系型資料庫管理系統(DBMS)的介面,包括Microsoft SQL Server、Microsoft Access、MySQL、Oracle、PostgreSQL、DB2、Sybase、Teradata以及SQLite。其中一些包通過原生的資料庫驅動來提供訪問功能,另一些則是通過ODBC或JDBC來實現訪問的。
(1)使用ODBC的方式導入數據
『肆』 R語言怎麼把股票日收盤價轉換成對數收益率
知道一系列收盤價向量X,length=1000,求對數收益率的R語言代碼
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')
Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")
運行結錯誤辦
> int <- read.table("d-intc7208.txt", head=T)
錯誤於file(file, "rt") : 打鏈結
外: 警告信息:
In file(file, "rt") :
打文件'd-intc7208.txt': No such file or directory
+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
錯誤: 意外符號 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
錯誤: 意外符號 in "log return"
『伍』 有哪些關於 R 語言的書值得推薦
數據挖掘與R語言
本書首先簡要介紹了R軟體的基礎知識(安裝、R數據結構、R編程、R的輸入和輸出等)。然後通過四個數據挖掘的實際案例 (藻類頻率的預測、證券趨勢預測和交易系統模擬、交易欺詐預測、微陣列數據分類)介紹數據挖掘技術。這四個案例基本覆蓋了常見的數據挖掘技術,從無監督的 數據挖掘技術、有監督的數據挖掘技術到半監督的數據挖掘技術。全書以實際問題、解決方案和對解決方案的討論為主線來組織內容,脈絡清晰,並且各章自成體 系。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,找到自己實際問題的解決方案。
本書不需要讀者具備R和數據挖掘的基礎知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容。讀者既可以把本書作為學習如何應用R的一本優秀教材,也可以作為數據挖掘的工具書。
機器學習:實用案例解析
機器學習是計算機科學和人工智慧中非常重要的一個研究領域,近年來,機器學習不但在計算機科學的眾多領域中大顯身手,而且成為一些交叉學科的重要支撐技 術。本書比較全面系統地介紹了機器學習的方法和技術,不僅詳細闡述了許多經典的學習方法,還討論了一些有生命力的新理論、新方法。
全書案例既有分類問題,也有回歸問題;既包 含監督學習,也涵蓋無監督學習。本書討論的案例從分類講到回歸,然後討論了聚類、降維、最優化問題等。這些案例包括分類:垃圾郵件識別,排序:智能收件 箱,回歸模型:預測網頁訪問量,正則化:文本回歸,最優化:密碼破解,無監督學習:構建股票市早閉鄭場指數,空間相似度:用投票記錄對美國參議員聚類,推薦系 統:給用戶推薦R語言包,社交網路分析:在Twitter上感興趣的人,模型比較:給你的問題找到最佳演算法。各章對原理的敘述力求概陸頌念清晰、表達准確,突 出理論聯系實際,富有啟發性,易於理解。在探索這些案例的過程中用到的基本工具就是R統計編程語言。R語言非常適合用於機器學習的案例研究,因為它是一種 用於數據分析的高水平、功能性腳本語言。
R語言經典實例
本書涵蓋200多個R語言實用方法,可以幫助讀者快速而有效地使用R進行數據分析。R語言給我們提供了統計分析酣一切工具,但是R本身的結 構可能有些難於掌握。本書提供的這些面向任務、簡明的R語言方法包含了從基本的分析任務到輸入和輸出、常用統計分析、繪圖、線性回歸等內容,它們可以讓你 馬上應用R高效地工作。
每一個R語言方法都專注於一個特定的問題,隨後的討論則對問題的解決方案給出解釋,並闡釋該方法的工作機理。對於R的初級用戶,《R語言經典實例》將幫助 你步入R的殿堂;對於R的資深用戶,本書將加深你對R的理解並拓展你的視野。通過本書,你可以使你的分析工作順利完成並學習更多R語言知識。本書由蒂特 著。
R語言編程藝術
R語言是世界上最流行的用於數據態吵處理和統 計分析的腳本語言。考古學家用它來跟蹤古代文明的傳播,醫葯公司用它來探索哪種葯物更安全、更有效,精算師用它評估金融風險以保證市場的平穩運行。總之, 在大數據時代,統計數據、分析數據都離不開計算機軟體的支持,在這方面R語言尤其出色。
本書將帶領你踏上R語言軟體開發之旅,從最 基本的數據類型和數據結構開始,到閉包、遞歸和匿名函數等高級主題,由淺入深,講解細膩,讀者完全不需要統計學的知識,甚至不需要編程基礎。而書中提到的 很多高級編程技巧,都是作者多年編程經驗的總結,對有經驗的開發者也大有裨益。本書精選了44個擴展案例,這些案例都源自於作者親身參與過的咨詢項目,都 是與數據分析相關的,生動展示了R語言在統計學中的高效應用。
金融數據分析導論:基於R語言
本書由統計學領域著名專家Ruey S. Tsay(蔡瑞胸)所著,從基本的金融數據出發,討論了這些數據的匯總統計和相關的可視化方法,之後分別介紹了商業、金融和經濟領域中的基本時間序列分析和計量經濟模型。
時間序列分析及應用:R語言(原書第2版)
本書以易於理解的方式講述了時間序列模型及其應用,主要內容包括:趨勢、平穩時間序列模型、非平穩時間序列模 型、模型識別、參數估計、模型診斷、預測、季節模型、時間序列回歸模型、異方差時間序列模型、譜分析入門、譜估計、門限模型.對所有的思想和方法,都用真 實數據集和模擬數據集進行了說明。
本書可作為高等院校統計、經濟、商科、工程及定量社會科學等專業學生的教材或教學參考書,同時也可供相關技術人員使用。
『陸』 急!!!R語言讀取萬德資料庫遇到問題 :CWSDService: quota exceeded.
是的,每個賬戶查詢數據量有個限額,任意一個連續的7天之內都不能超過這個額度。你可以等到明天再跑一跑,或者聯系客戶經理要求提升許可權。
『柒』 有哪些值得推薦的數據可視化工具
奧 威 推 出的跨平台大數據可視化工具(OurwayBI)
OurwayBI採用Node.js。Node.js是一個Javascript運行環境(runtime),它實際上是對Google V8引擎進行了封裝。V8引擎執行Javascript的速度非常快,利用基於時間序列的內存計算技術,減少與資料庫的交互,可大大提升效率。操作指引更易上手:OurwayBI為了讓用戶不進行任何培訓即可掌握常用操作,設置了操作指引,智能引導用戶逐步掌握基本操作及各項技巧。整個產品的UI進行了大量細節優化,以增加使用者的美觀要求與使用體驗等。
『捌』 Python中怎麼用爬蟲爬
Python爬蟲可以爬取的東西有很多,Python爬蟲怎麼學?簡單的分析下:
如果你仔細觀察,就不難發現,懂爬蟲、學習爬蟲的人越來越多,一方面,互聯網可以獲取的數據越來越多,另一方面,像 Python這樣的編程語言提供越來越多的優秀工具,讓爬蟲變得簡單、容易上手。
利用爬蟲我們可以獲取大量的價值數據,從而獲得感性認識中不能得到的信息,比如:
知乎:爬取優質答案,為你篩選出各話題下最優質的內容。
淘寶、京東:抓取商品、評論及銷量數據,對各種商品及用戶的消費場景進行分析。
安居客、鏈家:抓取房產買賣及租售信息,分析房價變化趨勢、做不同區域的房價分析。
拉勾網、智聯:爬取各類職位信息,分析各行業人才需求情況及薪資水平。
雪球網:抓取雪球高回報用戶的行為,對股票市場進行分析和預測。
爬蟲是入門Python最好的方式,沒有之一。Python有很多應用的方向,比如後台開發、web開發、科學計算等等,但爬蟲對於初學者而言更友好,原理簡單,幾行代碼就能實現基本的爬蟲,學習的過程更加平滑,你能體會更大的成就感。
掌握基本的爬蟲後,你再去學習Python數據分析、web開發甚至機器學習,都會更得心應手。因為這個過程中,Python基本語法、庫的使用,以及如何查找文檔你都非常熟悉了。
對於小白來說,爬蟲可能是一件非常復雜、技術門檻很高的事情。比如有人認為學爬蟲必須精通 Python,然後哼哧哼哧系統學習 Python 的每個知識點,很久之後發現仍然爬不了數據;有的人則認為先要掌握網頁的知識,遂開始 HTMLCSS,結果入了前端的坑,瘁……
但掌握正確的方法,在短時間內做到能夠爬取主流網站的數據,其實非常容易實現,但建議你從一開始就要有一個具體的目標。
在目標的驅動下,你的學習才會更加精準和高效。那些所有你認為必須的前置知識,都是可以在完成目標的過程中學到的。這里給你一條平滑的、零基礎快速入門的學習路徑。
1.學習 Python 包並實現基本的爬蟲過程
2.了解非結構化數據的存儲
3.學習scrapy,搭建工程化爬蟲
4.學習資料庫知識,應對大規模數據存儲與提取
5.掌握各種技巧,應對特殊網站的反爬措施
6.分布式爬蟲,實現大規模並發採集,提升效率