一、股票数据分析
题目:
1、使用tushare包获取某股票的历史行情数据。
2、输出该股票所有收盘比开盘上涨3%以上的日期。
3、输出该股票所有开盘比前日收盘跌幅超过2%的日期。
4、假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?
答案:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tushare as ts
1、使用tushare包获取某股票的历史行情数据
df = ts.get_k_data("600519",start="1988-01-01")
df.to_csv("E:\\Test\\600519.csv")
df = pd.read_csv("E:\\Test\\600519.csv", index_col=\'date\', parse_dates=[\'date\'])[[\'open\',\'close\',\'high\',\'low\']]
df
2、输出该股票所有收盘比开盘上涨3%以上的日期
df[(df[\'close\']-df[\'open\'])/df[\'open\']>=0.03].index
3、输出该股票所有开盘比前日收盘跌幅超过2%的日期
df[(df[\'open\'] - df[\'close\'].shift(1)) / df[\'close\'].shift(1) <= -0.02].index
4、假如我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?
price_last = df[\'open\'][-1] # 当天开盘价
df = df[\'2010-01\':] #剔除首尾无用的数据
df_monthly = df.resample("M").first() # 每个月第一天的数据
df_yearly = df.resample("A").last()[:-1] # 每年最后一天的数据
cost_money = 0
hold = 0
for year in range(2010, 2020):
cost_money -= df_monthly[str(year)][\'open\'].sum()*100 # 每月第一天买入一手
hold += len(df_monthly[str(year)][\'open\']) * 100 # 当前持有股票数量
if year != 2019:
cost_money += df_yearly[str(year)][\'open\'][0] * hold # 每年最一天卖出所有股票(卖出价格以当天开盘价为准)
hold = 0 # 持有股票归零
cost_money += hold * price_last # 当前收益和当前持有股票价值之和
print(cost_money)
二、查看历史金叉死叉日期
题目
1、使用tushare包获取某股票的历史行情数据
2、使用pandas包计算该股票历史数据的5日均线和60日均线
3、使用matplotlib包可视化历史数据的收盘价和两条均线
4、分析输出所有金叉日期和死叉日期
5、如果我从假如我从2010年1月1日开始,初始资金为100000元,金叉尽量买入,死叉全部卖出,则到今天为止,我的炒股收益率如何?
答案
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import tushare as ts
1、使用tushare包获取某股票的历史行情数据
df = ts.get_k_data("600623",start="1988-01-01")
df.to_csv("E:\\Test\\600623.csv")
df = pd.read_csv("E:\\Test\\600623.csv",index_col=\'date\', parse_dates=[\'date\'])[[\'open\',\'close\',\'low\',\'high\']]
2、使用pandas包计算该股票历史数据的5日均线和60日均线
求取均线有三种方式:
# 创建五日均线和30均线列为缺失值
df[\'ma5\'] = np.nan
df[\'ma30\'] = np.nan
# 第一种方式:
# 五日均值
for i in range(4, len(df)):
df.loc[df.index[i],\'ma5\'] = df[\'close\'][i-4:i+1].mean()
# 30日均值
for i in range(29, len(df)):
df.loc[df.index[i],\'ma30\'] = df[\'close\'][i-29:i+1].mean()
# 第二种方式:
(df[\'close\'].cumsum() - df[\'close\'].cumsum().shift(1).fillna(0).shift(4)) / 5
# 第三种方式:
df[\'ma5\']=df[\'close\'].rolling(5).mean()
df[\'ma30\']=df[\'close\'].rolling(30).mean()
以上三种方式都可以实现,只是一个实现思路的问题。
3、使用matplotlib包可视化历史数据的收盘价和两条均线
df[[\'ma5\',\'ma30\']].plot()
plt.show()
4、分析输出所有金叉日期和死叉日期
"""
金叉:短期均线上穿长期均线,买入信号
死叉:短期均线下穿长期均线,卖出信号
"""
golden_cross = []
death_cross = []
# 第一种方式:
for i in range(1,len(df)):
if df[\'ma5\'][i] >= df[\'ma30\'][i] and df[\'ma5\'][i-1] < df[\'ma30\'][i-1]:
golden_cross.append(df.index[i].to_pydatetime())
if df[\'ma5\'][i] <= df[\'ma30\'][i] and df[\'ma5\'][i-1] > df[\'ma30\'][i-1]:
death_cross.append(df.index[i].to_pydatetime())
# 第二种方法:
"""
ma5 < ma30 T -->F 金叉
ma5 >= ma30 T --> F 死叉
FF -> 死叉 TT -> 金叉
"""
sr1 = df[\'ma5\'] < df[\'ma30\']
sr2 = df[\'ma5\'] >= df[\'ma30\']
death_cross = df[sr1 & sr2.shift(1)].index
golden_cross = df[~(sr1 | sr2.shift(1))].index
5、如果我从假如我从2010年1月1日开始,初始资金为100000元,金叉尽量买入,死叉全部卖出,则到今天为止,我的炒股收益率如何?
first_money = 100000
money = first_money
hold = 0 #持有多少股
sr1 = pd.Series(1, index=golden_cross)
sr2 = pd.Series(0, index=death_cross)
# 合并数据,1代表金叉,0代表死叉,排序
sr = sr1.append(sr2).sort_index()
for i in range(0, len(sr)):
p = df[\'open\'][sr.index[i]]
if sr.iloc[i] == 1:
#金叉
buy = (money // (100 * p))
hold += buy*100
money -= buy*100*p
else:
money += hold * p
hold = 0
# 当前开盘价
p = df[\'open\'][-1]
now_money = hold * p + money
# 收益
print(now_money - first_money)
# 收益率
print((now_money - first_money)/first_money)