1. 03_Python 使用Matplotlib繪圖
不知不覺,已經進入第12周了,Python數據分析的學習現今也已經進入了中後期,在繼上周進行了Numpy的康威生命游戲的編寫之後;緊接或飢著進行的學習就是利用Python的Matplotlib模塊來練習繪圖。 這次由於涉及到圖像,所以衫嫌返引者陵用了一些丁燁老師的pdf的截圖。主要是進行用Matplotlib模塊來進行MATLAB能做的數據分析繪圖工作,並結合Numpy和Matplotlib來做一個掃雷小游戲。
matplotlib官網
2. python matplotlib數據作圖
一、使用numpy生成長度為100的等差序列作為自變數陵或跡,命名為x,並使用三角函數SiNx和cosx**2生成兩個因變數,命名為y和Z。
3. matplotlib繪圖入門詳解
matplotlib是受MATLAB的啟發構建的。MATLAB是數據繪圖領域廣泛使用的語言和工具。MATLAB語言是面向過程的。利用函數的調用,MATLAB中可以輕松的利用一行命令來繪制直線,然後再用一系列的函數調整結果。
matplotlib有一套完全仿照MATLAB的函數形式的繪圖介面,在matplotlib.pyplot模塊中。這套函數介面方便MATLAB用戶過度到matplotlib包
官網: http://matplotlib.org/
學習方式:從官網examples入門學習
Figure:面板(圖),matplotlib中的所有圖像都是位於figure對象中,一個圖像只能有一個figure對象。
Subplot:子圖,figure對象下創建一個或多個subplot對象(即axes)用於繪制圖像。
axex: 設置坐標軸邊界和表面的顏色、坐標刻度值大小和網格的顯示
figure: 控制dpi、邊界顏色、圖形大小、和子區( subplot)設置
font: 字體集(font family)、字體大小和樣式設置
grid: 設置網格顏色和線性
legend: 設置圖例和其中的文本的顯示
line: 設置線條(顏色、線型、寬度等)和標記
patch: 是填充2D空間的圖形對象,如多邊形和圓。控制線寬、顏色和抗鋸齒設置等。
savefig: 可以對保存的圖形進行單獨設置。例如,設置渲染的文件的背景為白色。
verbose: 設置matplotlib在執行期間信息輸出,如silent、helpful、debug和debug-annoying。
xticks和yticks: 為x,y軸的主刻度和次刻度設置顏色、大小、方向,以及標簽大小。
如果這兩種顏色不夠用,還可以通過正禪兩種其他方式來定義顏色值:
1、使用HTML十六進制字元串 color=』#123456』 使用合法的HTML顏色名字(』red』,』chartreuse』等)。
2、也可以傳入一個歸一化到[0,1]的RGB元祖。 color=(0.3,0.3,0.4)
通過向如matplotlib.pyplot.axes()或者matplotlib.pyplot.subplot()這樣的方法提供一個axisbg參數,可以指定坐標這的背景色。
subplot(111,axisbg=(0.1843,0.3098,0.3098))
以下示例需要引入的庫包括
plot時可以設置的激清散屬性包括如下:
一個窗口多個圖
屬性設置同點圖、線圖中。明氏
屬性設置同點圖、線圖中。
原文:
https://blog.csdn.net/luanpeng825485697/article/details/78508819
最後,給大家分享我收藏的幾個不錯的 github 項目,內容都還是不錯的,如果覺得有幫助,可以順便給個 star。
4. Python實操:手把手教你用Matplotlib把數據畫出來
作者:邁克爾·貝耶勒(Michael Beyeler)
如需轉載請聯系華章 科技
如果已安裝Anaconda Python版本,就已經安裝好了可以使用的 Matplotlib。否則,可能要訪問官網並從中獲取安裝說明:
http://matplotlib.org
正如使用np作為 NumPy 的縮寫,我們將使用一些標準的縮寫來表示 Matplotlib 的引入:
在本書中,plt介面會被頻繁使用。
讓我們創建第一個繪圖。
假設想要畫出正弦函數sin(x)的線性圖。得到函數在x坐標軸上0≤x<10內所有點的值。我們將使用 NumPy 中的 linspace 函數來在x坐標軸上創建一個從0到10的線性空間,以及100個采樣點:
可以使用 NumPy 中的sin函數得到所有x點的值,並通過調用plt中的plot函數把結果畫出來:
你親自嘗試了嗎?發生了什麼嗎?有沒有什麼東西出現?
實際情況是,取決於你在哪裡運行腳本,可能無法看到任何東西。有下面幾種可能性:
1. 從.py腳本中繪圖
如果從一個腳本中運行 Matplotlib,需要加上下面的這行調用:
在腳本末尾調用這個函數,你的繪圖就會出現!
2. 從 IPython shell 中繪圖
這實際上是互動式地執行Matplotlib最方便的方式。為了讓繪圖出現,需要在啟動 IPython 後使用所謂的%matplotlib魔法命令。
接下來,無須每次調用plt.show()函數,所有的繪圖將會自動出現。
3. 從 Jupyter Notebook 中繪圖
如果你是從基於瀏覽器的 Jupyter Notebook 中看這段代碼,需要使用同樣的%matplotlib魔法命令。然而,也可以直接在notebook中嵌入圖形,這會有兩種輸出選項:
在本書中,將會使用inline選項:
現在再次嘗試一下:
上面的命令會得到下面的繪圖輸出結果:
如果想要把繪圖保存下來留作以後使用,可以直接在 IPython 或者 Jupyter Notebook 使用下面的命令保存:
僅需要確保你使用了支持的文件後綴,比如.jpg、.png、.tif、.svg、.eps或者.pdf。
作為本章最後一個測試,讓我們對外部數據集進行可視化,比如scikit-learn中的數字數據集。
為此,需要三個可視化工具:
那麼開始引入這些包吧:
第一步是載入實際數據:
如果沒記錯的話,digits應該有兩個不同的數據域:data域包含了真正的圖像數據,target域包含了圖像的標簽。相對於相信我們的記此坦憶,我們還是應該對digits稍加 探索 。輸入它的名字,添加一個點號,然後按Tab鍵:digits.<TAB>,這個操作將向我們展示digits也包含了一些其他的域,比如一個名為images的域。images和data這兩個域,似乎簡單從形狀上就可以區分。
兩種情況中,第一維對應的都是數據集中的圖像數量。然而,data中所有像素都在一個大的向量中排列,而images保留了各個圖像8×8的空間排列。
因此,如果想要繪制出一副單獨的圖像,使用images將更加合適。首先,使用NumPy的數組切片從數據集中獲取一幅圖像:
這里是從1797個元素的數組中獲取了它的第一行數據,這行數據對應的是8×8=64個像素。下面就可以使用plt中的imshow函數來繪制這幅圖手模像:
上面的命令得到下面的輸出:
此外,這里也使用cmap參數指定了一個顏色映射。默認情況下,Matplotlib 使用MATLAB默認的顏色映射jet。然而,在灰度圖像的情況下,gray顏色映射更有效。
最後,可以使用plt的subplot函數繪制全部數字的樣例。subplot函數與MATLAB中的函數一樣,需要指定行數、列數以及當前的子繪圖索引(從1開始計算)。我們將使畢扒緩用for 循環在數據集中迭代出前十張圖像,每張圖像都分配到一個單獨的子繪圖中。
這會得到下面的輸出結果:
關於作者:Michael Beyeler,華盛頓大學神經工程和數據科學專業的博士後,主攻仿生視覺計算模型,用以為盲人植入人工視網膜(仿生眼睛),改善盲人的視覺體驗。 他的工作屬於神經科學、計算機工程、計算機視覺和機器學習的交叉領域。同時他也是多個開源項目的積極貢獻者。
本文摘編自《機器學習:使用OpenCV和Python進行智能圖像處理》,經出版方授權發布。
5. Python量化教程:不得不學的K線圖「代碼復制可用」
不管是對量化分析師還是普通的投資者來說,K線圖(蠟燭圖)都是一種很經典、很重要的工具。在K線圖中,它會繪制每天的最高價、最低價、開盤價和收盤價,這對於我們理解股票的趨勢以及每天的多空對比很有幫助。
一般來說,我們會從各大券商平台獲取K線圖,但是這種情況下獲得的K線圖往往不能靈活調整,也不能適應復雜多變的生產需求。因此我們有必要學習一下如何使用Python繪制K線圖。
需要說明的是,這里mpl_finance是原來的matplotlib.finance,但是現在獨立出來了(而且好像沒什麼人維護更新了),我們將會使用它提供的方法來繪制K線圖;tushare是用來在線獲取股票數據的庫;matplotlib.ticker中有個FuncFormatter()方法可以幫助我們調整坐標軸;matplotlib.pylab.date2num可以幫助我們將日期數據進行必要的轉化。
我們以上證綜指18年9月份以來的行情為例。
我們先使用mpl_finance繪制一下,看看是否一切正常。
可以看到,所有的節假日包括周末,在這里都會顯示為空白,這對於我們圖形的連續性非常不友好,因此我們要解決掉他們。
可以看到,空白問題完美解決,這里我們解釋一下。由於matplotlib會將日期數據理解為 連續數據 ,而連續數據之間的間距是有意義的,所以非交易日即使沒有數據,在坐標軸上還是會體現出來。連續多少個非交易日,在坐標軸上就對應了多少個小格子,但這些小格子上方並沒有相應的蠟燭圖。
明白了它的原理,我們就可以對症下葯了。我們可以給橫坐標(日期)傳入連續的、固定間距的數據,先保證K線圖的繪制是連續的;然後生成一個保存有正確日期數據的列表,接下來,我們根據坐標軸上的數據去取對應的正確的日期,並替換為坐標軸上的標簽即可。
上邊format_date函數就是這個作用。由於前邊我們給dates列生成了從0開始的序列連續數據,因此我們可以直接把它當作索引,從真正的日期列表裡去取對應的數據。在這里我們要使用matplotlib.ticker.FuncFormattter()方法,它允許我們指定一個格式化坐標軸標簽的函數,在這個函數里,我們需要接受坐標軸的值以及位置,並返回自定義的標簽。
你學會了嗎?
當然,一個完整的K線圖到這里並沒有結束,後邊我們會考慮加入均線、成交量等元素,感興趣的同學歡迎關注哦!
6. Matplotlib 繪制直方圖、散點圖
直方圖可以幫助我們直觀地發現數據在不同區間的分布和集中情況。高團轎下或運面,我們就先來學習一下 Matplotlib 直方圖的繪制~
首先,導入工具包並執行魔法指令:
繪制直方圖,除了需要傳遞數據之外,還需要我們設置一個 bins ,即區間的劃分:
繪制結果:
此外,我們還可以在一張圖中繪制兩組數據的直方圖,可以進行對比分析:
這里除了使用 plt.legend(loc='best') 添加了圖注之外,在 plt.hist 繪制直方圖時,我們設置了透明度 alpha=0.6 ,這樣重疊的區間也可區分出兩組數據了~
使用 plt.scatter 即可繪制散點圖:
其中數據集 x1 x2 x3 都是二維的矩陣,在繪制散點圖時我們將第一個維度的值作為橫坐標,第二個維度的值作為戚肆縱坐標。
繪制結果:
上述,無論是散點圖還是直方圖,在一個坐標系繪制多組數據時, Matplotlib 都會自動為我們指定顏色,還是很方便的。我們只需要添加圖注即可~
下面,我們來給散點圖標注點的坐標~首先,繪制一個簡單的散點圖:
繪制結果:
使用 annotate 在坐標系中添加註釋:
7. 標普100案例分析 —— 帶著Python玩金融(5)
本文將帶著你使用Python對標普100數據進行簡單的分析,你會學到:
標准普爾100指數 用來衡量大公司的股票表現,它由多個行業的100家主要公司構成。2017年標普100在各行業的比例如下圖所示。
本文將要分析的數據如下表所示,它由四列數據構成,分別是公司名(Name),行業(Sector),股價(Price)和每股盈餘(EPS)。
我們將這四列數據分別存儲在四個Python列表中。
先來用切片的方法觀察下數據。比如查看前四家公司的名稱。
或者輸出最後一家公司的所有信息。
市盈率 (衫好余Price to Earnings ratio),也或滾稱股價收益比率,由股價除以每年度每股盈餘(EPS)得到,它是用來衡量股價水平是否合理的指標之一。
為了方便計算市盈率,我們首先將數據從Python列表類型轉換為NumPy數組。
NumPy數組的優勢是它可以直接對數組進行運算,襪嘩而這一點Python列表是做不到的。比如計算市盈率 pe ,我們可以直接將數組 prices 除以數組 earnings 。
接下來我們就具體行業來進行分析,比如對於IT行業,我們首先需要篩選出哪些公司屬於這一行業。
用同樣的方法,篩選出必需消費品行業的公司和市盈率。
篩選出IT和必需消費品行業的數據後,我們來計算這兩個行業市盈率的均值和標准差。
首先用散點圖來觀察這兩個行業中每一家公司的市盈率。這里使用Python中常用的繪圖工具包 matplotlib 。
我們注意到,上圖的右上角有一IT公司的市盈率特別高。若某股票的市盈率高於同類股票,往往意味著該股有較高的增長預期。所以讓我們進一步來觀察IT行業的市盈率分布,在這里直方圖可以用來查看數據的分布情況。
現在可以更直觀的看到在直方圖的右側有一離群值,它具有很高的市盈率。我們可以使用布爾索引找到這家市盈率很高的公司。
註:本文是 DataCamp 課程 Intro to Python for Finance 的學習筆記。