導航:首頁 > 數據行情 > pandas保存股票資料庫

pandas保存股票資料庫

發布時間:2025-02-13 08:20:46

⑴ 通過Tushare平台,獲取指數信息存入資料庫中

通過Tushare平台,獲取並存入資料庫指數信息,具體步驟如下:

首先,獲取股票指數信息。利用Python的tushare庫,通過賬號訪問數據源,獲取上證綜指、深證成指、上證50、滬深300與中證500等指數的數據。以2011年1月1日至2020年12月31日的數據為例,使用Pandas庫進行數據處理,最後將數據連接至資料庫。

其次,建立資料庫連接並創建表格。在MySQL資料庫中,創建一個名為tushare.index_daily的表格,表格包括指數代碼、交易日期、開盤價、最高價、最低價、收盤價、昨收價與成交量。

再次,將獲取的指數數據插入資料庫中。使用for循環遍歷各指數,執行SQL語句插入數據至指定表格。確保數據完整性和准確性。

接著,計算每個日期對應的星期。使用SQL的WEEKDAY函數,返回交易日期對應的星期編號(0為星期一,6為星期日)。

隨後,計算每日漲跌幅。通過計算收盤價與昨收價的百分比變化,得出每日漲跌幅。

最後,統計分組得到每個指數不同天的平均漲跌幅。使用SQL語句,按指數代碼與星期編號分組,並計算平均漲跌幅。結果按照指數代碼與星期排序,便於分析。

將處理後的數據輸出,使用Python連接資料庫執行SQL查詢,並將查詢結果轉化為列表輸出。完成數據的獲取、處理與展示。

⑵ 鍥介檯鑲$エ鎸囨暟 涓嬭澆 python 鍖

Python涓鍙浠ヤ嬌鐢ㄥ氱嶅寘鏉ヤ笅杞藉浗闄呰偂紲ㄦ寚鏁版暟鎹錛屽俻andas_datareader銆亂finance絳夈

鍏充簬鑲$エ鎸囨暟鏁版嵁涓嬭澆

鍦ㄥ浗闄呰偂紲ㄦ暟鎹涓嬭澆鏂歸潰錛孭ython鎻愪緵浜嗗氱嶅簱鏉ュ府鍔╁紑鍙戣呰幏鍙栭噾鋙嶆暟鎹銆傚叾涓錛屽浗闄呰偂紲ㄦ寚鏁版暟鎹鐨勮幏鍙栨槸榪欎簺搴撶殑涓涓閲嶈佸姛鑳姐傝繖浜涙暟鎹鍙浠ョ敤浜庡垎鏋愯偂紲ㄥ競鍦鴻秼鍔褲佸緩絝嬫姇璧勭瓥鐣ョ瓑銆

甯哥敤鐨凱ython鍖

1. pandas_datareader錛氳繖鏄涓涓鐢ㄤ簬璇誨彇鍚勭嶉噾鋙嶆暟鎹鐨凱ython搴撱傞氳繃榪欎釜搴擄紝鍙浠ヨ交鏉懼湴浠庡悇縐嶆潵婧愪笅杞借偂紲ㄦ寚鏁版暟鎹錛屽俌ahoo Finance絳夈傚畠鎻愪緵浜嗕竴涓緇熶竴鐨勬帴鍙f潵璁塊棶澶氱嶆暟鎹婧愶紝浣垮緱鏁版嵁鑾峰彇鍙樺緱鐩稿圭畝鍗曘

2. yfinance錛氳繖鏄涓涓涓撲負Yahoo Finance璁捐$殑Python搴撱傚畠鍙浠ョ敤鏉ヤ笅杞借偂紲ㄣ佹湡璐с佸栨眹鍜屽姞瀵嗚揣甯佺瓑閲戣瀺浜у搧鐨勬暟鎹錛屽寘鎷鍥介檯鑲$エ鎸囨暟銆傜敱浜庡畠鏄涓撻棬閽堝簹ahoo Finance璁捐$殑錛屽洜姝ゅ湪鏌愪簺鎯呭喌涓嬪彲鑳芥洿閫傜敤浜庣壒瀹氱殑鑲$エ鍜屽競鍦恆

浣跨敤鏂瑰紡

榪欎簺搴撶殑浣跨敤閫氬父娑夊強鍒板畨瑁呯浉搴旂殑Python鍖咃紝鐒跺悗閫氳繃綆鍗曠殑鍑芥暟璋冪敤灝卞彲浠ヤ笅杞藉埌鑲$エ鎸囨暟鏁版嵁銆傚叿浣撶殑浣跨敤鏂瑰紡闇瑕佹牴鎹搴撶殑鏂囨。鍜屾寚鍗楄繘琛岋紝閫氬父闇瑕佹彁渚涜偂紲ㄧ殑浠g爜鎴栬呭競鍦虹殑鏍囪瘑絎︿綔涓哄弬鏁般傚悓鏃訛紝榪橀渶瑕佹敞鎰忔暟鎹鐨勬椂鏁堟у拰鎺堟潈闂棰樸

鎬葷粨鏉ヨ達紝濡傛灉闇瑕佷笅杞藉浗闄呰偂紲ㄦ寚鏁版暟鎹錛孭ython鎻愪緵浜嗗氱嶅簱鏉ュ府鍔╁疄鐜拌繖涓鐩鏍囷紝寮鍙戣呭彲浠ユ牴鎹鍏蜂綋闇奼傚拰鍋忓ソ閫夋嫨鍚堥傜殑搴撱

⑶ 利用Tushare獲取股票數據(全面詳細,照著敲就可以)

利用Tushare獲取股票數據的全面指南


Tushare是一個專為金融分析人員設計的免費Python財經數據介麵包,它簡化了從數據採集到存儲的過程,以pandas DataFrame格式提供高效的數據。通過Python的pandas、NumPy和Matplotlib,分析人員可以方便地進行數據處理和可視化,同時支持Excel和關系型資料庫的分析。Tushare覆蓋了股票、基金、期貨、數字貨幣等廣泛的數據內容,以及基本面數據,如公司財務和基金經理信息,且支持多語言的SDK和RESTful介面,適應不同用戶的需求。數據存儲選項包括Oracle、MySQL、MongoDB、HDF5和CSV,確保了數據獲取的性能和便利性。


安裝Tushare依賴環境只需執行pip install tushare,查看版本信息時,導入並列印tushare的__version__屬性即可。以下是使用Tushare獲取股票數據的步驟:



  1. 導入所需庫,如pandas、matplotlib和tushare。

  2. 設置數據格式和日期,使用qfq前復權方式獲取股票數據。例如,通過定義get_data函數獲取指定股票在特定日期范圍內的數據。

  3. 使用acquire_code函數下載股票數據,並保存為CSV文件。用戶需要輸入股票代碼、開始和結束日期。

  4. 運行acquire_code函數,輸入股票代碼,如600893.SH。

  5. 數據下載完成後,文件將保存在指定文件夾中,通過查看文件夾來獲取爬取的數據。

⑷ 使用 Python 獲取股票歷史資金流向數據(大單、超大單、主力流入等)

市場主導力量在股市中尤為重要,理解主力交易數據與股價變動之間的關系對於投資者至關重要。為了深入研究這一領域,本文將展示如何利用Python技術,通過爬蟲手段獲取A股市場的歷史資金流向數據(包括大單、小單、超大單、主力流入等信息)。這些數據將被保存為表格文件,為後續的分析提供便利。

在開始之前,請確保您的計算機已安裝Python 3環境。若尚未安裝,可參考相應教程進行安裝。此外,您需要安裝兩個庫:pandas和requests。通過命令行(或終端工具)執行如下代碼以安裝:

輸入命令並按Enter鍵執行,直至出現「successfully」提示。

以下代碼展示了獲取單只股票(股票代碼:600519)的歷史大單交易數據,並將其保存為CSV文件(文件名與股票代碼相同):

執行示例代碼後,輸出相關文字信息,生成的文件名在代碼執行目錄中,並展示文件截圖。

接下來的示例代碼演示了如何同時獲取兩只股票(代碼分別為600519和300750)的歷史大單交易數據,同樣以各自股票代碼命名CSV文件,並在代碼運行目錄生成文件。

總結,本文闡述了使用Python獲取單只及多隻股票的歷史資金流向數據,並保存為CSV文件的方法。感謝您閱讀本文,如果您對更多金融數據獲取感興趣,請關注我的金融數據獲取專欄,以獲取更多相關技巧。

⑸ python兩大免費獲取股票介面Baostock&Tushare

在探索數據獲取途徑時,Tushare和Baostock成為了兩款備受推崇的免費股票介面。Tushare不僅提供了全面的股票數據,還涵蓋了其他領域的數據,而Baostock則以其穩定性和高效性著稱。


接下來,我們將通過案例分析,直觀了解這兩款介面的使用方法和特點。


Baostock案例一:上證指數日交易量、振幅、換手率

首先,導入Baostock庫並登錄。配置介面,添加日線指標參數(包含停牌證券),列印結果為pandas的Dataframe,最後輸出並存入CSV文件。


Tushare案例二:南方傳媒和浙江傳媒股票對比

導入Tushare等相關庫,配置介面。獲取南方傳媒和浙江傳媒股票的收盤價,並形成新的Dataframe。對數據進行排序,然後進行可視化分析,以直觀呈現股價集中度和擬合情況。


總結

在選擇介面時,應根據自身需求和偏好來決定。Tushare與Baostock各有優勢,適合不同應用場景。數據猿雖為門外漢,但希望此分析能為您提供參考。若有疑問或交流需求,歡迎在公眾號後台回復「0」,加入數據猿的交流群。


⑹ 如何搭建自己的股票高頻資料庫(Python)

二話不說,先上結果。本文闡述了以下幾個方面:

下圖是編寫好的數據介面提取數據的示例。該數據介面支持多標的、多品種(股票、指數一起提取)、多欄位、多時間提取。並且支持不復權、後復權、等比前復權提取(前復權不太實用就沒有做)。而且速度巨快,沒有數據量的限制。如果你也覺得很香,請接著往下看,本文將手把手教你搭建這樣的資料庫。

資料庫搭建需要用到一些第三方庫,在各位動手之前請安裝:

本文的方法不涉及到常用的資料庫(不涉及MySQL、MongoDB),思路非常簡單,請各位放心食用。主要是使用pyarrow來加強代碼性能。雖然不涉及到常用資料庫,但這是我目前能想到的最有效的方法。

正所謂「巧婦難為無米之炊」,想搭建高頻資料庫,就需要一個數據源獲取高頻數據。在此,我推薦聚寬作為我們的數據源。 聚寬賬號的申請請點這里。新人用戶有每日100萬條數據,DataFrame的一行算一條,請各位務必珍惜自己的數據量。(不過我是正式用戶了,每天兩個億,就不太在意這一點哈哈。)

非會員的100萬條數據量能幹啥?我們來簡單計算以下:每個交易日有240條數據(4個小時,240條分鍾k線),假設一年有250個交易日,每隻股票每年需要佔用60000條數據。也即一日的數據量能夠提取一隻股票16年(100/6=16.66667)左右的股票分鍾數據。相當於資料庫的搭建過程還是相當艱難的,每天耗盡數據量只能下載好一隻股票的數據。(白嫖是這樣的啦,如果有條件可以聯系聚寬客服,購買正式賬號)

我們這里假設我們的資料庫記錄2015年至今的股票分鍾數據。(當然我自己的資料庫記錄的是2005年1月1日的全A股分鍾數據)這里,我們以貴州茅台(股票代碼 600519.XSHG)為例,演示數據的提取與保存。先看看數據如何從介面提取出來(這里需要用到各位申請的聚寬賬號):

來看看代碼運行的結果。

數據提取後,自然需要把數據保存起來。pandas.DataFrame有很多方便的方法可以將數據保存下來。為做對比,這里將數據保存為csv格式和ftr格式。

相對應的,我們可以用這樣的代碼將保存好的數據讀取進來。雖然pandas有read_feather函數,可以直接將ftr文件讀取進來,但這個速度比直接調用pyarrow的更慢一些。考慮到代碼性能,這里直接從pyarrow調用read_feather函數。

雖然兩種格式都能將數據完整地保存下來,但讀取速度上,ftr文件占據著絕對的優勢。因此,我們考慮到資料庫的性能以及資料庫所佔空間,我們選擇使用ftr格式儲存數據。feather正如他的名稱,像羽毛一樣輕,它所佔的空間會比csv更小。這是一種不佔空間,讀取速度又快的文件格式,太香了!

在前文中我提到了行情數據的提取、保存方法,並強調了一定要提取不復權的數據。這是為了與復權因子結合,還原各種形式的復權數據。至於復權的詳細定義,請參看 網路。

隨便打開一個股票看盤軟體,大致會有3種復權方式,即前復權、不復權、後復權。按照我自己的想法,可以這么理解:

在這樣的情況下,如果記錄價格數據,記錄前復權的數據是最沒有意義的,因為隔一段時間,歷史的價格就全變了。如果只做收益率相關研究的話,記錄後復權數據是可以的。然而,我們這里要搭建資料庫,所以採取「記錄不復權數據」加上「復權因子」還原的方法。

我們著手提取復權因子。在提取之前,不妨再理順一下思路:

思路理順了,我們來看看後復權因子的提取方法:

有了復權因子,如何計算復權價格?請接著看第3節——數據介面編寫。

提取了行情數據和復權因子數據,應當找個地方把它們存放起來。我分了兩個文件夾來保存我的數據。

在你搜集了足夠多隻股票的分鍾數據後,就能夠來到這一步,編寫一個數據介面方便調用數據。

數據介面的編寫重難點在於股票價格復權的計算。這里同樣以貴州茅台(股票代碼 600519.XSHG)為例來演示如何進行復權的計算。復權的核心在於下面這個公式:

[公式]

先來看看我們如何提取貴州茅台在一段時間(這里為2015-01-01至2021-09-08)內的後復權分鍾數據。(這里千萬不能將交易量和交易額一起拿去復權了。只有價格數據需要復權。(我不太確定交易量要不要,要的話我就改一改嘿嘿))

看看代碼運行的效果。

那麼,等比前復權該如何實現呢?其實很簡單,只需要在框定了復權因子的時間後,讓復權因子全序列除以最後一個復權因子,即得到前復權因子。將這個前復權因子乘上不復權的價格,即可得到等比前復權的價格數據。

以下是數據介面的全部代碼,裡面有挺多細節(但挺簡單的),我就不再贅述了。

要更新資料庫的數據,則是將資料庫中的所有數據文件逐個讀取進來,取最後一天作為start_date,然後取今天作為end_date。將新數據合並到原有的DataFrame中並保存就完成了數據的更新。數據更新比較耗時,也需要一定的數據量。不過,不論如何,我們來看看數據更新的代碼。

在編寫完這些代碼後,我把這些代碼整合成了一個python文件【high_freq_db.py】放在了site-package中,方便以後數據的調用和更新。

親愛的讀者,感謝你讀到這里。本文講述了我搭建我的股票高頻資料庫的方法。畢竟我的專業是金融而非計算機,難免會有不足的地方,懇請大家在評論區指出。(華工封校了,我也快瘋了,所以一天寫了兩篇東西。。。。)

另外,這個資料庫完全搭建起來之後會非常大(行情數據佔80GB左右,包含指數和個股ftr文件),維護起來也比較費時費力,就不對外公布了(我也不知道怎麼公布【手動捂臉】)。如確有需要,可以和我私信。

再次感謝大家的閱讀!

——————————————————

2022年5月27日更新:

有不少小夥伴想要這個數據,目前我已經整理好上傳至網路網盤啦。數據和完整代碼私聊獲取。

獲取數據請只用於學習,勿直接用於投資決策!

閱讀全文

與pandas保存股票資料庫相關的資料

熱點內容
python導入股票數據excel 瀏覽:307
證券投資買股票的理由 瀏覽:515
深圳霧芯科技股票行情 瀏覽:990
香港股票appE開頭 瀏覽:499
中國股票有過千股漲停 瀏覽:773
在哪個app買股票 瀏覽:827
有收購齊商銀行股票嗎 瀏覽:69
三十年年股票投資心得 瀏覽:361
將葯明生物調出港股通股票名單最新 瀏覽:36
銀行卡被開通了股票賬戶 瀏覽:146
數據股票小說 瀏覽:631
影響A股票的因素有哪些 瀏覽:888
是不是一個股票漲停就沒法買入了吧 瀏覽:441
股票有什麼投資類型 瀏覽:42
中國最早股票哪個公司發行的 瀏覽:448
蘋果app股票軟體下載 瀏覽:367
普門科技股票歷史交易數據 瀏覽:839
中電控股的股票市值最新排名 瀏覽:847
湯姆森路透股票數據根據什麼統計的 瀏覽:449
股票現金分紅稅除權後購買 瀏覽:888