Ⅰ 有哪些關於 R 語言的書值得推薦
數據挖掘與R語言
本書首先簡要介紹了R軟體的基礎知識(安裝、R數據結構、R編程、R的輸入和輸出等)。然後通過四個數據挖掘的實際案例 (藻類頻率的預測、證券趨勢預測和交易系統模擬、交易欺詐預測、微陣列數據分類)介紹數據挖掘技術。這四個案例基本覆蓋了常見的數據挖掘技術,從無監督的 數據挖掘技術、有監督的數據挖掘技術到半監督的數據挖掘技術。全書以實際問題、解決方案和對解決方案的討論為主線來組織內容,脈絡清晰,並且各章自成體 系。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,找到自己實際問題的解決方案。
本書不需要讀者具備R和數據挖掘的基礎知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容。讀者既可以把本書作為學習如何應用R的一本優秀教材,也可以作為數據挖掘的工具書。
機器學習:實用案例解析
機器學習是計算機科學和人工智慧中非常重要的一個研究領域,近年來,機器學習不但在計算機科學的眾多領域中大顯身手,而且成為一些交叉學科的重要支撐技 術。本書比較全面系統地介紹了機器學習的方法和技術,不僅詳細闡述了許多經典的學習方法,還討論了一些有生命力的新理論、新方法。
全書案例既有分類問題,也有回歸問題;既包 含監督學習,也涵蓋無監督學習。本書討論的案例從分類講到回歸,然後討論了聚類、降維、最優化問題等。這些案例包括分類:垃圾郵件識別,排序:智能收件 箱,回歸模型:預測網頁訪問量,正則化:文本回歸,最優化:密碼破解,無監督學習:構建股票市早閉鄭場指數,空間相似度:用投票記錄對美國參議員聚類,推薦系 統:給用戶推薦R語言包,社交網路分析:在Twitter上感興趣的人,模型比較:給你的問題找到最佳演算法。各章對原理的敘述力求概陸頌念清晰、表達准確,突 出理論聯系實際,富有啟發性,易於理解。在探索這些案例的過程中用到的基本工具就是R統計編程語言。R語言非常適合用於機器學習的案例研究,因為它是一種 用於數據分析的高水平、功能性腳本語言。
R語言經典實例
本書涵蓋200多個R語言實用方法,可以幫助讀者快速而有效地使用R進行數據分析。R語言給我們提供了統計分析酣一切工具,但是R本身的結 構可能有些難於掌握。本書提供的這些面向任務、簡明的R語言方法包含了從基本的分析任務到輸入和輸出、常用統計分析、繪圖、線性回歸等內容,它們可以讓你 馬上應用R高效地工作。
每一個R語言方法都專注於一個特定的問題,隨後的討論則對問題的解決方案給出解釋,並闡釋該方法的工作機理。對於R的初級用戶,《R語言經典實例》將幫助 你步入R的殿堂;對於R的資深用戶,本書將加深你對R的理解並拓展你的視野。通過本書,你可以使你的分析工作順利完成並學習更多R語言知識。本書由蒂特 著。
R語言編程藝術
R語言是世界上最流行的用於數據態吵處理和統 計分析的腳本語言。考古學家用它來跟蹤古代文明的傳播,醫葯公司用它來探索哪種葯物更安全、更有效,精算師用它評估金融風險以保證市場的平穩運行。總之, 在大數據時代,統計數據、分析數據都離不開計算機軟體的支持,在這方面R語言尤其出色。
本書將帶領你踏上R語言軟體開發之旅,從最 基本的數據類型和數據結構開始,到閉包、遞歸和匿名函數等高級主題,由淺入深,講解細膩,讀者完全不需要統計學的知識,甚至不需要編程基礎。而書中提到的 很多高級編程技巧,都是作者多年編程經驗的總結,對有經驗的開發者也大有裨益。本書精選了44個擴展案例,這些案例都源自於作者親身參與過的咨詢項目,都 是與數據分析相關的,生動展示了R語言在統計學中的高效應用。
金融數據分析導論:基於R語言
本書由統計學領域著名專家Ruey S. Tsay(蔡瑞胸)所著,從基本的金融數據出發,討論了這些數據的匯總統計和相關的可視化方法,之後分別介紹了商業、金融和經濟領域中的基本時間序列分析和計量經濟模型。
時間序列分析及應用:R語言(原書第2版)
本書以易於理解的方式講述了時間序列模型及其應用,主要內容包括:趨勢、平穩時間序列模型、非平穩時間序列模 型、模型識別、參數估計、模型診斷、預測、季節模型、時間序列回歸模型、異方差時間序列模型、譜分析入門、譜估計、門限模型.對所有的思想和方法,都用真 實數據集和模擬數據集進行了說明。
本書可作為高等院校統計、經濟、商科、工程及定量社會科學等專業學生的教材或教學參考書,同時也可供相關技術人員使用。
Ⅱ R語言中的時間序列分析模型:ARIMA-ARCH / GARCH模型分析股票價格
在R語言中,時間序列分析是金融數據探索的核心技術,特別是ARIMA和ARCH / GARCH模型,它們用於預測股票價格動態。本文將逐步講解如何在R環境中運用這些模型進行分析。
首先,理解非平穩序列的處理至關重要。通過差分法,如蘋果股票價格例子所示,可以將指數增長的序列轉換為線性或均值回復的平穩序列。對數轉換有助於平滑數據,而差分則是穩定方差的關鍵步驟。
ARIMA模型的識別依賴於ACF和PACF圖。例如,Log Apple股票數據可能需要ARIMA(1,0,0)模型,而差分序列的ACF和PACF提示可能為白雜訊模型ARIMA(0,1,0)。
ARIMA模型參數的估計需要使用AICc,如ARIMA(2,1,2)在Apple股票數據中的應用。在R中,通過ACF和PACF圖檢查殘差的獨立性和自相關性,確保模型的適用性。
如果ARIMA模型的殘差顯示波動性,可能需要引入ARCH / GARCH模型。通過分析殘差的ACF和PACF以及Ljung-Box檢驗,確定波動性模型的階數,如ARCH 8。
ARIMA-ARCH / GARCH模型的結合,如ARIMA(2,1,2)-ARCH(8),可以更准確地反映近期變化和波動,從而提供更短的預測區間。預測結果應結合實際市場事件,如Apple的收益報告,來評估模型的有效性。
時間序列分析在金融領域至關重要,ARIMA和ARCH / GARCH模型提供了有效預測工具。但要注意,ARIMA模型的局限性在於它不考慮新信息,而GARCH模型則通過條件方差適應動態波動。理解這些模型的適用場景和局限性,對於有效預測股票價格具有重要意義。