导航:首页 > 板块资金 > python自动抓取股票资金流向

python自动抓取股票资金流向

发布时间：2023-08-04 15:35:51

㈠怎样用python处理股票

用Python处理股票需要获取股票数据，以国内股票数据为例，可以安装Python的第三方库：tushare；一个国内股票数据获取包。可以在网络中搜索“Python tushare”来查询相关资料，或者在tushare的官网上查询说明文档。

㈡怎么学python爬取财经信息

本程序使用Python 2.7.6编写，扩展了Python自带的HTMLParser，自动根据预设的股票代码列表，从Yahoo Finance抓取列表中的数据日期、股票名称、实时报价、当日变化率、当日最低价、当日最高价。

由于Yahoo Finance的股票页面中的数值都有相应id。

例如纳斯达克100指数ETF（QQQ）
其中实时报价的HTML标记为

[html]view plain

<spanid="yfs_l84_qqq">87.49</span>

而标普500指数ETF（SPY）

其中实时报价的HTML标记为

[html]view plain

<spanid="yfs_l84_spy">187.25</span>

因此本数据抓取程序根据相应的id字符串来查找数据。具体来说就是先继承HTMLParser，然后在自定义的子类中重载handle_data(self, data)方法，查找包含相应id字符串（例如实时报价的id字符串为"yfs_l84_"+股票代码）的HTML标记，并输出这个HTML标记中的数据（例如qqq的<span id="yfs_l84_qqq">87.49</span>，其中的数据87.49就是实时报价。）

样本输出：

数据依次是

数据日期股票代码股票名称实时报价日变化率日最低价日最高价

[python]view plain

05/05/(IBB)233.281.85%225.34233.28
05/05/(SOCL)17.480.17%17.1217.53
05/05/(PNQI)62.610.35%61.4662.74
05/05/2014xsdSPDRS&PSemiconctorETF(XSD)67.150.12%66.2067.41
05/05/2014itaiSharesUSAerospace&Defense(ITA)110.341.15%108.62110.56
05/05/2014iaiiSharesUSBroker-Dealers(IAI)37.42-0.21%36.8637.42
05/05/(VBK)119.97-0.03%118.37120.09
05/05/2014qqqPowerSharesQQQ(QQQ)87.950.53%86.7687.97
05/05/2014ewiiSharesMSCIItalyCapped(EWI)17.86-0.56%17.6517.89
05/05/(DFE)62.33-0.11%61.9462.39
05/05/(PBD)13.030.00%12.9713.05
05/05/(EIRL)38.52-0.16%38.3938.60

㈢如何用python在掘金量化抓取数据

TuShare财经数据接口 – 可以直接抓取新浪财经、凤凰财经的网站数据，包括行情、基本面、经济数据等等。
完全免费，简洁易用，API设计得非常友好，提取的数据格式是Pandas的DataFrame。同时可以获取非高频实时数据（取决于网站更新速度，同事经验大约是15秒），一个极好的非高频股票策略数据解决方案。

㈣怎样用 Python 写一个股票自动交易的程序

股票自动交易助手提供了一个 Python 自动下单接口，参考代码

#股票自动交易助手Python自动下单使用例子
#把此脚本和StockOrderApi.pyOrder.dll放到你自己编写的脚本同一目录

fromStockOrderApiimport*

#买入测试
#Buy(u"600000",100,0,1,0)

#卖出测试,是持仓股才会有动作
#Sell(u"000100",100,0,1,0)

#账户信息
print("股票自动交易接口测试")
print("账户信息")
print("--------------------------------")

arrAccountInfo=["总资产","可用资金","持仓总市值","总盈利金额","持仓数量"];
foriinrange(0,len(arrAccountInfo)):
value=GetAccountInfo(u"",i,0)
print("%s%f"%(arrAccountInfo[i],value))

print("--------------------------------")
print("")

print("股票持仓")
print("--------------------------------")
#取出所有的持仓股票代码,结果以','隔开的
allStockCode=GetAllPositionCode(0)
allStockCodeArray=allStockCode.split(',')
foriinrange(0,len(allStockCodeArray)):
vol=GetPosInfo(allStockCodeArray[i],0,0)
changeP=GetPosInfo(allStockCodeArray[i],4,0)
print("%s%d%.2f%%"%(allStockCodeArray[i],vol,changeP))

print("--------------------------------")

㈤怎样用 Python 写一个股票自动交易的程序

1，http://www.python.org/download/ 下载windows安装包，
2，python环境变量配置
（1）设置环境变量:我的电脑-右键-属性-高级-环境变量在Path中加入
;c:\python26 （注意前面的分号和路径）
（2）此时，还是只能通过"python *.py"运行python脚本，若希望直接运行*.py，只需再修改另一个环境变量PATHEXT:
;.PY;.PYM

3，测试是否安装成功
cmd进入命令行输入python –v 若是输出版本信息，则表示安装完毕
4，建一个hello.py
print ("hello world")

5,cmd 进入命令行找到文件路径 hello.py
会输出"hello world"
6,接受用户输入
x= input("x:")
y= input("y:")
print (x * y)
print("我开始学习python了，要加油啊！")

㈥ python如何获得股票实时交易数据

使用easyquotation这个库。(不用重复造轮子了)
github地址是：
https://github.com/shidenggui/easyquotation

㈦怎样用Python写一个股票自动交易的程序

方法一前期的数据抓取和分析可能python都写好了庆察，所以差这交易指令接口最后一步。

对于股票的散户，正规的法子是华宝，国信，兴业这样愿意给接口的券商，但貌似开户费很高才给这权利，而且只有lts，ctp这样的c++接口，没python版就需要你自己封装。方法二是wind这样的软件也有直镇拦接的接口，支持部分券商，但也贵，几万一年是要的。方法三鼠标键盘模拟法，很复杂的，就是模拟键盘鼠标去操作一些软件，比如券商版交易软件和大智慧之类的。方法四就是找到这些软件的关于交易指令的底层代码并更改，不过T+1的规则下，预誉旅茄测准确率的重要性高于交易的及时性，花功夫做数据分析就好，交易就人工完成吧

㈧如何使用python 抓取雪球网页

现在关注一个组合，就会有持仓变动的提示了。不过我觉得这事情挺有意思的。比如可以把很多持仓的数据都抓下来，做一些综合的分析，看看现在网站上被持有最多的股票是哪一支，某一天被调入最多的又是哪一支之类。
于是我决定来抓抓看，顺便借此说说我通常用程序做自动抓取的过程。
Step.1 分析页面
要抓一个网页，首先自然是要“研究”这个网页。通常我会用两种方式：
一个是 Chrome 的 Developer Tools。通过它里面的 Network 功能可以看到页面发出的所有网络请求，而大多数数据请求都会在 XHR 标签下。点击某一个请求，可以看到其具体信息，以及服务器的返回结果。很多网站在对于某些数据会有专门的请求接口，返回一组 json 或者 XML 格式的数据，供前台处理后显示。

另一个就是直接查看网页源代码。通常浏览器的右键菜单里都有这个功能。从页面的 HTML 源码里直接寻找你要的数据，分析它格式，为抓取做准备。
对于雪球上的一个组合页面粗略地看了一下它发出的请求，并没有如预想那样直接找到某个数据接口。看源代码，发现有这样一段：
SNB.cubeInfo = {"id":10289,"name":"誓把老刀挑下位","symbol":"ZH010389" ...此处略过三千字... "created_date":"2014.11.25"}
SNB.cubePieData = [{"name":"汽车","weight":100,"color":"#537299"}];

cubeInfo 是一个 json 格式的数据，看上去就是我们需要的内容。一般我会找个格式化 json 的网站把数据复制进去方便查看。

这应该就是组合的持仓数据。那么接下来，一切似乎都简单了。只要直接发送网页请求，然后把其中 cubeInfo 这段文字取出，按 json 读出数据，就完成了抓取。甚至不用动用什么 BeautifulSoup、正则表达式。
Step.2 获取页面
分析完毕，开抓。
直接 urllib.urlopen 向目标网页发送请求，读出网页。结果，失败了……
看了下返回结果：
403 Forbidden
You don't have permission to access the URL on this server. Sorry for the inconvenience.

被拒了，所以这种赤裸裸地请求是不行的。没关系，那就稍微包装一下：
send_headers = {
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.81 Safari/537.36',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Connection':'keep-alive',
'Host':'xueqiu.com',
'Cookie':r'xxxxxx',
}
req = urllib2.Request(url, headers=send_headers)
resp = urllib2.urlopen(req)
html = resp.read()

header 数据都可以从 Developer Tools 里拿到。这次顺利抓到页面内容。
一般网站或多或少都会对请求来源做一些阻拦，通过加 header 可以搞定大部分情况。
Step.3 提取数据
因为这个数据比较明显，直接用通过一些字符串查找和截取操作就可以取出来。
pos_start = html.find('SNB.cubeInfo = ') + len('SNB.cubeInfo = ')
pos_end = html.find('SNB.cubePieData')
data = html[pos_start:pos_end]
dic = json.loads(data)

dic 就是一个包含数据的字典对象。之后想干什么就随便你了。
对于复杂一点的情况，可以通过 BeautifulSoup 来定位 html 标签。再不好办的，就用正则表达式，基本都可以解决掉。
Step.4 处理数据
因为我想对数据进行持久化存储，并且做展示和分析，所以我用了 django 里的 ORM 来处理抓下来的数据。
# add Portfolio
portfolio, c = models.Portfolio.objects.get_or_create(code=dic['symbol'])
portfolio.name = dic['name']
portfolio.earnings = dic['total_gain']
portfolio.save()
# add Stock
stocks = dic['view_rebalancing']['holdings']
for s in stocks:
stock, c = models.Stock.objects.get_or_create(code=s['stock_symbol'])
stock.name = s['stock_name']
stock.count += 1
stock.weight += s['weight']
stock.save()

Portfolio 记录下组合及其收益，Stock则记录每支股票的被收录数和总收录份额。
对于抓取到的，一般也可以存在文件中，或者直接通过 SQL 存入数据库，视不同情况和个人喜好而定。
Step.5 批量抓取
前面的一套做下来，就完整地抓取了一组数据。要达到目的，还要设计一下批量抓取的程序。
一个要解决的问题就是如何获得组合列表。这个可以再通过另一个抓取程序来实现。然后根据这些列表来循环抓取就可以了。
若要细究，还要考虑列表如何保存和使用，如何处理抓取失败和重复抓取，如何控制抓取频率防止被封，可否并行抓取等等。
Step.6 数据分析
数据有了，你要怎么用它，这是个很大的问题。可以简单的统计现象，也可以想办法深入分析背后隐藏的逻辑。不多说，我也还只是在摸索之中。

㈨如何用python 爬虫抓取金融数据

获取数据是数据分析中必不可少的一部分，而网络爬虫是是获取数据的一个重要渠道之一。鉴于此，我拾起了Python这把利器，开启了网络爬虫之路。

本篇使用的版本为python3.5，意在抓取证券之星上当天所有A股数据。程序主要分为三个部分：网页源码的获取、所需内容的提取、所得结果的整理。

一、网页源码的获取

很多人喜欢用python爬虫的原因之一就是它容易上手。只需以下几行代码既可抓取大部分网页的源码。

为了减少干扰，我先用正则表达式从整个页面源码中匹配出以上的主体部分，然后从主体部分中匹配出每只股票的信息。代码如下。

pattern=re.compile('<tbody[sS]*</tbody>')
body=re.findall(pattern,str(content)) #匹配<tbody和</tbody>之间的所有代码pattern=re.compile('>(.*?)<')
stock_page=re.findall(pattern,body[0]) #匹配>和<之间的所有信息

其中compile方法为编译匹配模式，findall方法用此匹配模式去匹配出所需信息，并以列表的方式返回。正则表达式的语法还挺多的，下面我只罗列所用到符号的含义。

语法说明

. 匹配任意除换行符“ ”外的字符

* 匹配前一个字符0次或无限次

？匹配前一个字符0次或一次

s 空白字符：[<空格> fv]

S 非空白字符：[^s]

[...] 字符集，对应的位置可以是字符集中任意字符

(...) 被括起来的表达式将作为分组，里面一般为我们所需提取的内容

正则表达式的语法挺多的，也许有大牛只要一句正则表达式就可提取我想提取的内容。在提取股票主体部分代码时发现有人用xpath表达式提取显得更简洁一些，看来页面解析也有很长的一段路要走。

三、所得结果的整理

通过非贪婪模式(.*?)匹配>和<之间的所有数据，会匹配出一些空白字符出来，所以我们采用如下代码把空白字符移除。

stock_last=stock_total[:] #stock_total：匹配出的股票数据for data in stock_total: #stock_last：整理后的股票数据
if data=='':
stock_last.remove('')

最后，我们可以打印几列数据看下效果，代码如下

print('代码',' ','简称',' ',' ','最新价',' ','涨跌幅',' ','涨跌额',' ','5分钟涨幅')for i in range(0,len(stock_last),13): #网页总共有13列数据
print(stock_last[i],' ',stock_last[i+1],' ',' ',stock_last[i+2],' ',' ',stock_last[i+3],' ',' ',stock_last[i+4],' ',' ',stock_last[i+5])

阅读全文

与python自动抓取股票资金流向相关的资料

热点内容

股票是长期还是发布：2025-01-17 07:46:08 浏览：750

中国织材控股股票走势分析发布：2025-01-17 07:44:38 浏览：839

中国蓝田股票发布：2025-01-17 07:31:09 浏览：439

主力尾盘拉升股票目的发布：2025-01-17 07:23:54 浏览：51

委内瑞拉股票涨幅发布：2025-01-17 07:19:36 浏览：442

股票主力对敲分时发布：2025-01-17 07:19:30 浏览：330

股票长期会亏钱吗发布：2025-01-17 07:19:30 浏览：282

深市股票申购新股条件发布：2025-01-17 07:18:50 浏览：143

新疆青龙管业股票走势发布：2025-01-17 07:18:14 浏览：274

股票今日走势图高清发布：2025-01-17 07:03:05 浏览：980

股票推荐排名app 发布：2025-01-17 07:02:57 浏览：218

股票放量涨停是什么发布：2025-01-17 07:00:19 浏览：502

有关中国卫星的龙头股票有哪些发布：2025-01-17 07:00:16 浏览：318

股票对中国经济的影响发布：2025-01-17 06:57:33 浏览：130

股票的资金量怎么看发布：2025-01-17 06:53:13 浏览：461

股票中签账户资金不足发布：2025-01-17 06:44:02 浏览：781

股票发行的时间安排发布：2025-01-17 06:43:53 浏览：548

华升股份股票历史交易数据发布：2025-01-17 06:34:42 浏览：94

spark股票大数据发布：2025-01-17 06:30:41 浏览：543

不会K线可以买股票吗发布：2025-01-17 06:30:03 浏览：808