1. 怎麼學python爬取財經信息
本程序使用Python 2.7.6編寫,擴展了Python自帶的HTMLParser,自動根據預設的股票代碼列表,從Yahoo Finance抓取列表中的數據日期、股票名稱、實時報價、當日變化率、當日最低價、當日最高價。
由於Yahoo Finance的股票頁面中的數值都有相應id。
例如納斯達克100指數ETF(QQQ)
其中實時報價的HTML標記為
[html]view plain
<spanid="yfs_l84_qqq">87.49</span>
而標普500指數ETF(SPY)
其中實時報價的HTML標記為
[html]view plain
<spanid="yfs_l84_spy">187.25</span>
因此本數據抓取程序根據相應的id字元串來查找數據。具體來說就是先繼承HTMLParser,然後在自定義的子類中重載handle_data(self, data)方法,查找包含相應id字元串(例如實時報價的id字元串為"yfs_l84_"+股票代碼)的HTML標記,並輸出這個HTML標記中的數據(例如qqq的<span id="yfs_l84_qqq">87.49</span>,其中的數據87.49就是實時報價。)
樣本輸出:
數據依次是
數據日期 股票代碼 股票名稱 實時報價 日變化率 日最低價 日最高價
[python]view plain
05/05/(IBB)233.281.85%225.34233.28
05/05/(SOCL)17.480.17%17.1217.53
05/05/(PNQI)62.610.35%61.4662.74
05/05/2014xsdSPDRS&PSemiconctorETF(XSD)67.150.12%66.2067.41
05/05/2014itaiSharesUSAerospace&Defense(ITA)110.341.15%108.62110.56
05/05/2014iaiiSharesUSBroker-Dealers(IAI)37.42-0.21%36.8637.42
05/05/(VBK)119.97-0.03%118.37120.09
05/05/2014qqqPowerSharesQQQ(QQQ)87.950.53%86.7687.97
05/05/2014ewiiSharesMSCIItalyCapped(EWI)17.86-0.56%17.6517.89
05/05/(DFE)62.33-0.11%61.9462.39
05/05/(PBD)13.030.00%12.9713.05
05/05/(EIRL)38.52-0.16%38.3938.60
2. 怎麼通過股票代碼查詢公司
投看看告訴你怎麼通過股票代碼查詢公司:
1、根據股票代碼查詢公司信息的方法:打開股票交易軟體,輸入個股代碼,然後按快捷鍵F10,即可查詢上市公司的行情信息了。
2、股票代碼用數字表示股票的不同含義。股票代碼除了區分各種股票,也有其潛在的意義,比如600***是上交所上市的股票代碼,6006**是最早上市的股票,一個公司的股票代碼跟車牌號差不多,能夠顯示出這個公司的實力以及知名度。
3. 如何用python 爬蟲抓取金融數據
獲取數據是數據分析中必不可少的一部分,而網路爬蟲是是獲取數據的一個重要渠道之一。鑒於此,我拾起了Python這把利器,開啟了網路爬蟲之路。
本篇使用的版本為python3.5,意在抓取證券之星上當天所有A股數據。程序主要分為三個部分:網頁源碼的獲取、所需內容的提取、所得結果的整理。
一、網頁源碼的獲取
很多人喜歡用python爬蟲的原因之一就是它容易上手。只需以下幾行代碼既可抓取大部分網頁的源碼。
為了減少干擾,我先用正則表達式從整個頁面源碼中匹配出以上的主體部分,然後從主體部分中匹配出每隻股票的信息。代碼如下。
pattern=re.compile('<tbody[sS]*</tbody>')
body=re.findall(pattern,str(content)) #匹配<tbody和</tbody>之間的所有代碼pattern=re.compile('>(.*?)<')
stock_page=re.findall(pattern,body[0]) #匹配>和<之間的所有信息
其中compile方法為編譯匹配模式,findall方法用此匹配模式去匹配出所需信息,並以列表的方式返回。正則表達式的語法還挺多的,下面我只羅列所用到符號的含義。
語法 說明
. 匹配任意除換行符「 」外的字元
* 匹配前一個字元0次或無限次
? 匹配前一個字元0次或一次
s 空白字元:[<空格> fv]
S 非空白字元:[^s]
[...] 字元集,對應的位置可以是字元集中任意字元
(...) 被括起來的表達式將作為分組,裡面一般為我們所需提取的內容
正則表達式的語法挺多的,也許有大牛隻要一句正則表達式就可提取我想提取的內容。在提取股票主體部分代碼時發現有人用xpath表達式提取顯得更簡潔一些,看來頁面解析也有很長的一段路要走。
三、所得結果的整理
通過非貪婪模式(.*?)匹配>和<之間的所有數據,會匹配出一些空白字元出來,所以我們採用如下代碼把空白字元移除。
stock_last=stock_total[:] #stock_total:匹配出的股票數據for data in stock_total: #stock_last:整理後的股票數據
if data=='':
stock_last.remove('')
最後,我們可以列印幾列數據看下效果,代碼如下
print('代碼',' ','簡稱',' ',' ','最新價',' ','漲跌幅',' ','漲跌額',' ','5分鍾漲幅')for i in range(0,len(stock_last),13): #網頁總共有13列數據
print(stock_last[i],' ',stock_last[i+1],' ',' ',stock_last[i+2],' ',' ',stock_last[i+3],' ',' ',stock_last[i+4],' ',' ',stock_last[i+5])
4. 炒股怎麼看上市公司詳細的財務報表,去哪裡看
查看詳細財務報表,有以下幾種方式:
在線量化研究平台,BigQuant - 你的人工智慧量化平台,可以獲取常用的關鍵財務數據,並且能夠返回標准化的整理好了的多隻股票多年時間的財務數據,可以直接拿來段衡槐開發策攔昌略。
直接去上市公司網站獲取財務報表,一般為pdf格式。
在新浪財經、東方財富、同花順財經網站上獲取上市公司財務報表,一般都有財務報告全文。
在數據商那裡獲取財務報表,比如Wind資訊--中國領先的金融數據和分析工具服務商。
一些開源的數據包獲取財務信息,如TuShare -財經數據介麵包,只不過不是詳細的財務報表,而是關鍵的財務數握友據。
通過關鍵指標快速把握公司財務的方法:
一、先看業務,具體看「營業收入增長率」、銷售毛利率、凈利潤增長率這3個指標。
通過營業收入增長率可以看出公司的營收是在增長還是下滑,判斷業務擴張性;通過銷售毛利率可以反映公司主營業務是否健康;通過凈利潤增長率可以分析公司整體經營盈利能力強弱。
二、其次看資產和現金流,具體看資產負債率、經營活動產生的現金流凈額這2個指標。
通過資產負債率可以判斷公司資產健康情況,這涉及到舉債是否過度,或者依舊穩健;通過經營活動產生的現金流凈額,可以判斷公司經營現金流充裕情況,現金流不斷裂是一家公司存活的關鍵保證。
三、最後,分析凈資產收益率ROE指標。
凈資產收益率是一個很有效的判斷公司價值的指標,也被很多投資大佬推崇,比如巴菲特就曾特意強調過。
具體的使用方法比如:從全部上市公司中篩選出連續10(或者5)年以上,每年凈資產收益率都保持在15%以上的股票,那篩選出來的這些,就是公司經營一貫穩定、業績持續增長的優質標的。
這樣,也就通過6個指標,就可以掌握了上市公司財報的基本情況,對公司財務做出基本的判斷了。
5. 爬取股票信息是網路爬蟲的應用場景嗎
網路爬蟲可以用來爬取股票信息,因為股票信息可以在互聯網上搜索並獲取,網路爬蟲可以自動收集這些信息。網路爬蟲是一種自動地抓取互聯網信息的程序,能夠按照指定的規則自動地抓取網站上的信息,是一種常見的數據抓取技術。
6. 如何爬取新浪財經的多級數據
爬取新浪財經的多級數據可以按照以下步驟。
1、導入依賴的模塊,需要導入的程序介面有request、pyquery和Pandas。
2、選擇爬取數據,選取的數據為新浪財經的網頁,進入微博-新浪財經的網頁,點擊滑鼠右鍵,出現如圖所示的對話框,點擊檢查。
3、點擊Toggledevive鍵,將網頁由PC顯示,轉換成手機顯示模式以便於爬取網頁內容,多數網站在PC端都建立了防爬措施。
4、進入網頁的手機端後,點擊Network。
5、從選擇的網頁中選取需要的內容進行爬取並輸出。
7. 什麼是稅務稽查中的"網路爬蟲
1."網路爬蟲"的解讀
"網路爬蟲"也稱"網頁蜘蛛",是一個自動提取網頁的程序,運用"網路爬蟲"技術設定程序,可以根據既定的目標更加精準選擇抓取相關的網頁信息,有助於在互聯網海量信息中快捷獲取有唯洞用的涉稅信息.
2."網路爬蟲"的運用
"網路爬蟲"技術主導下的涉稅信息監控平台具有三個突出的特點:分類抓取、實時監控和智能比對.
平台主要從證券財經網站,重點抓取上市公司公告、上市公司十大股東股票減持、限售股解禁等信息;風控中心的專用電腦全天候實時抓取、儲存和分類整理相關信息;平台將從互聯網獲昌宏取的信息與稅收征管系統以及其他第三方信息進行自動比對,從中篩選出存在稅收風險的管征戶信息.
3."網路爬蟲"的流程(具體可以咨詢財慧網)
進入系統後,先連接互聯網的風控中心電腦,通過"網路爬蟲"程序定向抓取各網站上發布的上市公司公告信息,並且將這些信息轉化成可識別的文本.在當天股市收盤後,掃描程序開始啟動,掃描"網路爬蟲"抓取的公告內容.
如果掃描中出現了國稅局管理的企業名稱或者是其他有效信息,監控平台會自動將公告與國稅局管理企業建立起關聯,並且以不同顏色的字體和高亮方式顯示在電腦屏幕上.風控中指迅枯心人員可以實時看到關聯信息.
8. 投資者如何從「披露易」網站查閱港股通股票以往發布的信息披露文件
聯交所上市公司信息披露的文件包括以下幾類:公告及通告,通函,財務報表/環境、社會及管治資料,月報表等。通常,聯交所上市公司在發布年報前,會預先披露全年業績公告(屬於公告及通告的一類)。其中,投資者較為關注的公司主要經營狀況、財務數據均會在全年業績公告中有所體現。
具體而言,投資者查詢上市公司公告的方式有以下幾種:
一是從「披露易」網站內「上市公司公告」一欄內選擇「進階搜尋」查詢上市公司的公告。具體操作時,投資者可在「現有上市證券」欄內輸入股份代號或股份名稱(繁體字或英文),在「標題類別」中選擇「公告及通告」及「財務資料」,以查看該公司的董事會會議召開日期、業績公告內容、股息分派詳情等。
二是在「披露易」網站上,從「發行人相關資料」欄目下的「董事會會議通知」及「證券持有人享有的權益(股息及其他)」查閱近期公司發布的有關資料。
三是登錄聯交所網站,在「中國證券市場網頁」欄目下的「上市公司」中搜尋上市公司曾發布的公告和派息紀錄等。
9. 購買股票後想要獲知持倉公司的經營狀況,要如何查詢
購買股票後想要獲得這持倉的公司的情況,我們可以通過多方面的渠道去查詢得到相應信息。但是我們能夠查詢到的都是沒有什麼內部消息的,就是官方讓你知道的想讓你知道的而已,只不過這些東西仍然具備一定的參考價值。
平常也要關注一些這個公司所在行業的情況就是你要投資這個公司,你起碼得知道他公司主要的業務是什麼,他現在做的主要產品是什麼?這些產品主要面臨的難關是什麼?是說現在沒有關鍵技術的突破呢?還是說現在需要時間去鋪設產品的渠道,那不一樣的,也要及時關注公司有關的新聞,出現重大的利好消息和利空消息,都會對公司的股價造成直接的影響。