有没有什么平台是通过机器学习来预测股票结果的呢？

台湾省 | 炒股 | Legion | 室内设计 | 钢笔 | 历史故事 | 手机摄影 | 小店区 | 四大会计师事务所 | 首次公开募股（IPO） | 文言文 | 网络营销 | 哔哩哔哩 | 保险业 | 期货交易 | 屏幕 | 三国 | 前端开发 | 秦时明月之天行九歌 | 红楼梦（小说） | 电子技术研发 | 手绘 | 赛事 | 背景音乐（bgm） | 视频会议 | 香港购物 | 哲学 | 取名 | 城市规划 | 德州扑克 | 在线教育 | 雅马哈 | 加湿器 | 今日头条 | 金融数学 | 创业团队 | 网络推广 | 冷知识 | 互联网创业 | 文化 | 软件开发 | 写字楼 | 戒指 | 读后感 | 姓氏 | 总决赛 | 智利 | 字体设计 | 图像处理 | 文案 | 高二 | 迅雷（软件） | 欧洲历史 | 刘胡兰 | 海军 | 坦克世界（游戏） | 硬笔书法 | 化妆品 | 塞浦路斯 | 英国 | 华为路由器 | 狼牙山五壮士 | pdf | 服饰搭配 | 网站运营 | 美术生 | 重大疾病保险 | Windows 7 | 江苏银行 | 中国中央电视台 | 西瓜视频 | 耽美小说 | 微信群 | 几米 | O2O | 孔子 | 用户界面 | 百度输入法 | NBA | 地理 | 武术 | 阿富汗伊斯兰共和国 | 图书 | 韭菜 | 风水 | 职业规划 | 股权转让 | 报纸 | 新媒体 | Javascript | 斗鱼直播 | 西游记 | 艺考 | 风水堪舆学 | 战役 | 人口 | 信托 | 女生 | 澳门 | 非洲 | 汉服 | 项目管理 | 户型 | 前女友 | 燕窝 | APK | Adobe Illustrator | 创意 | 主机 | 老挝 | 植物辨识 | 花样姐姐 | 澳大利亚 | 开幕式 | 团队管理 | 索尼 | 神话 | 李时珍 | 日本动漫 | 易纲 | 展会 | youtube | 艺术品 | 舞蹈 | 外汇投资 | 品牌营销 | 大学专业 | 字幕 | 发型 | 热血传奇 | 越南 | 希腊 | 南航 | 现货原油 | Python | 哈萨克斯坦 | 饮酒 | 韩非 | 企业邮箱 | 赵一曼 | 罗永浩 | 水晶 | 西藏自治区 | 雾霾 | 直播 | 亚马逊中国 | 优酷视频 | 固态硬盘 | 交互设计 | 配音 | 蜜蜡 | 投资银行 | 优酷土豆 | 月饼 | 国家开发银行 | 生日 | 手工艺 | 油画 | 谷歌浏览器 | 盈利模式 | 游戏原画设计师 | 女性 | 基金定投 | 衣服 | 洛奇英雄传 | 荆州市 | 债券 | 遵义市 | 视频网站 | 宝马（bmw） | 水果 | 世界杯 | 流氓软件 | 后宫·甄嬛传（书籍） | 表情包 | 漫步者 | 红河哈尼族彝族自治州 | 攀枝花市 | 爱奇艺 | android开发 | 长城 | 微观经济学 | 缅甸 | 易经 | 运动锻炼 | 包装设计 | r（编程语言） | 求职 | 唯品会 | 汽车养护 | 皮肤护理 | ISIS（伊斯兰国） | 亚洲 | 国际物流 | 互联网广告 | ansys | 风景园林 | 苏州市 | 股市 | 康佳 |

你的位置：网站首页 >> 频道首页 >>股票 >>有没有什么平台是通过机器学习来预测股票结果的呢？

有没有什么平台是通过机器学习来预测股票结果的呢？

来源：蜘蛛抓取(WebSpider) 时间：2017-11-28 00:24 标签：

您正在使用IE低版浏览器，为了您的雷锋网账号安全和更好的产品体验，强烈建议使用更快更安全的浏览器
发私信给easunlu
导语：那么，机器学习在量化金融方面怎么用？比如说，预测股票这件事儿靠谱么？
同步到新浪微博
当月热门文章
为了您的账户安全，请
您的邮箱还未验证,完成可获20积分哟！
您的账号已经绑定，现在您可以以方便用邮箱登录
请填写申请人资料后使用快捷导航没有帐号？
查看: 43|回复: 0
机器学习模型能否有效预测股票数据？
中级会员, 积分 297, 距离下一级还需 203 积分
论坛徽章:4
本人炒股也有一段时间了，期间也用过量化模型，感觉股票数据特征难以提取，噪音干扰严重，最主要股票本身是零和游戏，决定涨跌的始终是资金的流入流出，而历史数据并不能给予很好的解释
金牌会员, 积分 1358, 距离下一级还需 1642 积分
论坛徽章:15
股票预测的前提是现在发生的事情在将来还会出现。对数据的及时性和参与的变量过于复杂，
短期还只能做参考吧。完全依赖它做投资，还是有不小的风险。
金牌会员, 积分 1551, 距离下一级还需 1449 积分
论坛徽章:11
个人感觉能在一定程度上预测，但无法做到准确预测。从大量数据的基础上能够抽象出股票的一些特征，当这些特征在起作用的时候会有助于得出正确方向的预测。但尤其是在中国，感觉这些特征受影响的因素比较多，有时变化非常大。此时，则这些特征就可能会失效。
注册会员, 积分 86, 距离下一级还需 114 积分
论坛徽章:5
个人感觉，如果是国内市场的股票，比较难预测。因为除了一些规律性的东西外，可能股票的价格还受很多别的因素影响，比如国家政策，或者一些不太懂的资本运作等。也就是您说的噪音干扰严重。
中级会员, 积分 291, 距离下一级还需 209 积分
论坛徽章:6
不能，哈哈哈，要看你预测什么，如果要预测股票的未来走势，是很难的。不过我不认为股票是零和游戏，如果股票是零和游戏，价值投资者就赚不到钱啦。事实上现在的量化交易，很多还在停留在寻找alpha因子上，就算是机器学习，基本都是用线性模型做预测，还是有很大的发展空间~
您需要登录后才可以回帖用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么? | 36大数据
我的图书馆
用AlphaGo来做股票交易会怎样?机器学习预测股票靠谱么? | 36大数据
AlphaGo对阵韩国围棋职业九段选手已经取得了胜利。无疑，这是一个伟大的时刻，也是个伟大的开始，超级智能机器在未来将会在人类生活中扮演更多更重要的角色。
资本市场，越来越多的量化策略与量化交易，越来越多的机器在介入，以前散户面对的是同样赤手空拳的空头，但现在我们面对的是高度智能的机器以及加杠杆的赌徒，以前跌一年，现在一周搞定，信息传播越来越快，人心预期转化也特别迅速，于我们，更需要理性，纪律与底线。
Alpha Go的优势：
无比强大的数据分析能力。对于公司的财务、行业的数据，未来的趋势，依据其建立的模型，肯定会有比人类更强大分析和推理能力。
无比强大的量化交易能力。现在很多交易模型，其实也是量化的，这个无需多说。
无比冷血的纪律。依据模型和计算，该卖就卖，该买就买，不会有任何情绪。估计能100%达到逆人性的要求。因为根本它就不是人。
对于Alpha Go的优势，完全对应的是人类的劣势，可以说不管是在分析、交易、纪律几个方面，人类都是完败的，而且没有任何赢的机会。
人类的优势：
创造力机器对未来的分析是依靠数据，但人类的创造力是无穷尽的。正因为这个，是人类制造出了Alpha Go，而不是Alpha Go制造出了人类。比如次级债，比如借壳重组，这种游戏，这种为了追逐利润，人类在市场中伟大的发明创造，伟大的想象力，就是人类的优势。
对于人性的理解。 Alpha Go不是人，所以无法理解人性。财色君认为，投资中一切都是虚无的，唯有人性是永恒的。Alpha Go也许可以量化出走势，量化出未来，但却无法量化人性。
两者互不，我们才能在交易中不败。下面讲点技术性的，怎么用机器学习预测股票走势，这只是一个入门介绍。我们用的模型远比下面的复杂。
机器学习是什么?
简单说：机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。
用一张图说明它所包含的内容：
我们把目光集中到上图中的有监督学习，它是指数据中包括了我们想预测的属性，有监督学习有以下两类：
分类(Classification)——样本属于两个或多个类别，我们希望通过从已标记类别的数据学习，来预测未标记数据的分类。例如，识别手写数字就是一个分类问题，其目标是将每个输入向量对应到有穷的数字类别。从另一种角度来思考，分类是一种有监督学习的离散(相对于连续)形式，对于n个样本，一方有对应的有限个类别数量，另一方则试图标记样本并分配到正确的类别。
回归(Regression)——如果希望的输出是一个或多个连续的变量，那么这项任务被称作回归，比如用年龄和体重的函数来预测三文鱼的长度。
scikit-learn
scikit-learn是一个基于NumPy、SciPy、Matplotlib的机器学习包，主要涵盖了分类、回归和聚类等机器学习算法。例如knn、SVM、逻辑回归、朴素贝叶斯、随机森林、k-means等等，简言之：是一只强大的轮子。
有个很好耍的例子：安德森鸢尾花品种亚属预测。
我们有一百五十个鸢尾花的一些尺寸观测值：萼片长度、宽度，花瓣长度和宽度。还有它们的亚属：山鸢尾(Iris setosa)、变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)。我们使用这些数据，从中学习并预测一个新的数据。在scikit-learn中，通过创建一个估计器(estimator)从已经存在的数据学习，并且调用它的fit(X,Y)方法。
代码如下：
看不懂代码没关系，这里的输出结果：array([0])。
即学习结果认为，萼片长度、宽度，花瓣长度和宽度观测值分别为5.0, 3.6, 1.3, 0.25的安德森鸢尾花的亚属为山鸢尾(Iris setosa)。
我的目标是亲自实现验证体会机器学习做市场预测这一构建过程，顺带瞧瞧这玩意儿是不是文献或是研报中“传说”的那么神或是然无卵。
那么，机器学习在量化金融方面怎么用?比如说，预测股票这件事儿靠谱么?
首先，我们得熟悉我们的数据。获取过去十年CSI300指数原始数据(代码开发环境 Ipython Notebook)：
df = rd.get_price(‘CSI300.INDX’, ‘′, ‘′).reset_index()[[‘OpeningPx’, ‘ClosingPx’]]
有了开收盘价格后，我们把原始数据这般那般后，有了下面三张图。
图一：过去近2500个交易日，当天是涨是跌天数的统计
图二：每日收益率随时间序列的变化
图三：涨跌天数的频率分布
有兴趣的盆友可以仔细看看图，里面有很有趣的东西。熟悉了数据之后就可以正式开工了，我主要从以下三点来做些尝试：
机器学习估计器的选择，即我们使用何种方法进行我们的预测。
训练集样本数量的选择，即我们每次预测结果之前使用多少条训练集合的样本。
涨跌时间窗口的选择，即我们每个样本中的特征个数，我们训练集每个单元包含连续多少个交易日的涨跌。
下面具体说：
1、根据手头数据的情况及scikit-learn: machine learning in Python中下图所示的引导：
我们选择比较RandomForestClassifier、LinearSVC、KNeighborsClassifier，结果如下：
可以看出，KNeighborsClassifier表现明显逊于RandomForestClassifier、LinearSVC，它的波动较大且胜率与另外两者比也不理想。这结果与JMLR的一篇神奇文章有点类似：《 Do we Need Hundreds of Classifiers to Solve Real World Classification Problems?》，文章测试了179种分类模型在UCI所有的121个数据上的性能，发现Random Forests 和 SVM 性能最好。
2、训练集样本数制约了预测结果的准确性，理想情况下，我希望每次做预测的样本数越多越好，但你知道理想很骨感的，训练集样本数一方面受实际总数据量限制。
另外，计算资源与时间也是制约因素。我们最终要形成某种程度的妥协，即保证相当程度预测效果下选择最小的训练集样本数量。于是我们计算样本数从1~300范围内的胜率，结果如下：
可以看出，控制其它条件不变，随着样本数增多，胜率逐步提高结果更为稳定并且最后维持在0.52~0.53左右波动。为了节约计算资源及考虑到历史数据总量，我们可以选择100个作为训练样本数。
3、涨跌时间窗口选择。实际上反映了交易日历史的涨跌对下一个交易日的影响。
这个动量是否客观存在?我认为从交易心理上说还是有一定依据的，比如作为交易者如果过去一连10个交易日全部飘红，对于后一天的走势我更愿意谨慎看空。当然，这是个极端的臆想，归根结底的表现怎么样，还是要看数据给的答案：
这样的结果让人抓狂，有点看乱码的感觉。后来我改变了每次回测的起点之后发现，基本每次结果都差不多。一个共同点是：每次曲线的开端都会存在倒塌式下滑，而后稳定震荡于0.5扔硬币的概率左右。
也就是说，动量是存在的，只不过很小(结合前面两节的试验结果其期望处于0.53这个位置)，且时间窗口很短，超出这个时间窗口，预测问题就转化为扔硬币问题。
上面只是对机器学习在金融市场的预测应用做的一个小试验，综合三张图的结果来看。其实概率还能勉强说比纯抛硬币好那么一丢丢(低于0.5的情况并不多见，调试程序的时候发现0.53是个神奇的数字)，但这毕竟是快速自己实现的一个小Demo。可以想像，如果有更优秀的算法，更丰富的数据，更合理的特征选择，意想不到的结果也会是情理之中。
via:数据挖掘DW
可能感兴趣的内容
转载请注明来自36大数据（)： ?
TA的最新馆藏
喜欢该文的人也喜欢机器学习动作预测中的compensated是什么意思_百度知道
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。
机器学习动作预测中的compensated是什么意思
我有更好的答案
为您推荐：
其他类似问题
换一换
回答问题，赢新手礼包2720被浏览224504分享邀请回答/resource/29824(这个BBC的视频做了精彩的探讨)但具体是为什么呢? 为什么有反馈的系统会造成了一种完全不可预测的状态变化?&这个有空再继续探讨&45257 条评论分享收藏感谢收起121 条评论分享收藏感谢收起查看更多回答

有没有什么平台是通过机器学习来预测股票结果的呢？

我要回帖

随机推荐