您好,欢迎来到小侦探旅游网。
搜索
您的当前位置:首页新型深度学习算法研究概述

新型深度学习算法研究概述

来源:小侦探旅游网
第31卷第1期(下) 2015年1月 赤峰学院学报(自然科学版) Journal of Chifeng University(Naturla Science Edition) Vo1.3l No.1 Jan.2015 新型深度学习算法研究概述 马 超,徐瑾辉,侯天诚,蓝 斌 (广东外语外贸大学 金融学院,广东 广州 510006) 摘要:作为一个具有巨大应用前景研究方向,深度学习无论是在算法研究,还是在实际应用(如语音识别,自然语言处 理、计算机视觉)中都表现出其强大的潜力和功能.本文主要介绍这种深度学习算法.并介绍其在金融领域的领用. 关键词:深度学习;受限波兹曼机;堆栈自编码神经网络;稀疏编码;特征学习 中图分类号:TP181 文献标识码:A 文章编号:1673—260X(2015)01—0037—03 1深度学习的研究意义 切入点,本项目借鉴时频分析与小波分析中的方法,结合数 学分析领域中的泛函分析技术,与堆栈自编码神经网络相 结合,提出一种新的深度学习算法——深度泛函网络.为了 深度学习是一类新兴的多层神经网络学习算法,因其 缓解了传统训练算法的局部最小性,引起机器学习领域的 广泛关注.深度学习的特点是,通过一系列逻辑回归的堆栈 作为运算单元,对低层数据特征进行无监督的再表示(该过 验证算法的有效性及优越性 ,本项目将把新算法应用于金 融时间序列的领域. 程称为预学习),形成更加抽象的高层表示(属性类别或特 征),以发现数据的分布式特征表示.深度学习的这种特性由 于与脑神经科学理论相一致,因此被广泛应用于语音识别、 在目前国内外对于深度学习的研究中,几乎没有任何 将深度学习技术运用于金融数据的研究.通过提出并运用得 当的深度序列学习方法,我们期望从金融数据中抽取更高 级的、具有经济学意义或预测性意义的高级特征(与人工设 计的“技术指标”相对应),并开发相应的量化交易策略,并 自然语言处理和计算机视觉等领域. 生物学研究表明【l】:在生物神经元突触的输出变化与输 入脉冲的持续时间有关,即依赖于持续一定时间的输入过 程,输出信号既依赖于输入信号的空间效应和阈值作用,也 依赖于时间总和效应. 传统的深度学习方法虽然较好地模拟了生物神经元的 一与其它传统算法进行对比,以说明所提算法的可行性和优 越性. 2国内外研究现状 人类感知系统具有的层次结构,能够提取高级感官特 个重要特性——空间总和效应上的深度,却忽视了生物 征来识别物体(声音),因而大大降低了视觉系统处理的数 据量,并保留了物体有用的结构信息.对于要提取具有潜在 复杂结构规则的自然图像、视频、语音和音乐等结构丰富数 据,人脑独有的结构能够获取其本质特征[31.受大脑结构分层 次启发,神经网络研究人员一直致力于多层神经网络的研 究.训练多层网络的算法以BP算法为代表,其由于局部极 神经元的另一个重要特性——时间总和效应上的宽度[2].因 此,对于连续的时间变量问题(如语音识别),传统深度学习 方法只能将连续的时间函数关系转化为空间关系,即离散 化为时间序列进行处理.这样做有几个弊端: (1)可能造成深度学习算法对时间采样频率的十分敏 感,鲁棒性较差.这使得,不同时间尺度下,需要使用不同的 数据和算法.这无疑是十分不方便的; (2)导致深度网络规模过大,使得计算开销增大、学习 效果变差、泛化性能降低; 值、权重衰减等问题,对于多于2个隐含层的网络的训练就 已较为困难[41,这使得实际应用中多以使用单隐含层神经网 络居多. 该问题由HintontSl所引入的逐层无监督训练方法所解 (3)难以满足实际应用对算法的实时性的要求,更难以 体现连续输入信息的累积效应,大大降低深度学习算法的 实用性. 决.具体地,该法对深度神经网络中的每一层贪婪地分别进 行训练:当前一层被训练完毕后,下一层网络的权值通过对 该层的输入(即前一层的输出)进行编码(Encoding,详见下 因此,对传统的深度学习算法进行改进,使其不但具有 “深度”,亦能具有“宽度”,能够对连续时变数据进行更好的 文)而得到.当所有隐含层都训练完毕后,最后将使用有监督 的方法对整个神经网络的权值再进行精确微调.在Hinton 的原始论文中,逐层贪婪训练是通过受限波兹曼机 特征提取、提高算法效率和实用性,显得势在必行.基于这个 基金项目:本文系“国家级大学生创新诩I练计划资助项目(No.201411846001)” 一37— 然缺乏较好解决时间过程(序列)问题的方案. 4金融时序数据中的应用 coders【C]//Proceedings of the 25th intenartional confer- ence on Machine learning.ACM,2008:1096—1 103. 传统金融理论认为,金融市场中的证券价格满足伊藤 过程,投资者无法通过对历史数据的分析获得超额利润.然 [7]Lee H,Grosse R,Ranganath R,et a1.Convolutional deep belief networks for scalable unsupervised learning 而,大量实证研究却表明,中国股票价格波动具有长期记忆 性,拒绝随机性假设,在各种时间尺度上都存在的可以预测 的空间.因此,如何建立预测模型,对于揭示金融市场的内在 规律,这无论是对于理论研究,还是对于国家的经济发展和 广大投资者,都具有重要的意义. 股票市场是一个高度复杂的非线性系统,其变化既有 内在的规律性,同时也受到市场,宏观经济环境,以及非经 of hierarchical representations【C]//Proceedings of the 26th Annual International Conference on Machine Learning.ACM,2009:609—616. [8]Vincent P,LarocheHe H,Lajoie I,et a1.Stacked de— noising autoencode ̄:Learning useful representations in a deep network with a local denoising cirteiron卟The journal of Machine Learning Research,2010,9999: 济原因等诸多因素的影响.目前国内外对证券价格进行预测 的模型大致分为两类:一是以时间序列为代表的统计预测 模型;该类方法具有坚实的统计学基础,但由于金融价格数 据存在高噪声、波动大、高度非线性等特征,使得该类传统 方法元法提供有效的工具.另一类是以神经网络、支持向量 机等模型为代表的数据挖掘模型.该类模型能够处理高度非 线性的数据,基本上从拟合的角度建模.虽然拟合精度较高, 但拟合精度的微小误差往往和市场波动互相抵消,导致无 法捕捉获利空间甚至导致损失,外推预测效果无法令人满 意.因此,建立即能够处理非线性价格数据,又有良好泛化能 力的预测模型势在必行. 参考文献: [1]Zhang L I,Tao H W,Holt C E,et a1.A critical win— dow for cooperation and competition among developing retinotectal synapsesUJ.Nature,1998,395(6697). [2]37-44.欧阳楷,邹睿.基于生物的神经网络的理论框 架——神经元模型U】.北京生物医学工程,1997,16(2):93— 101. [3]Rossi A F,Desimone R,Ungerleider L G.Contextual modulation in primary visual codex of macaques卟the Journal of Neuroscience,2001,21(5):1698—1709. [4]Bengio Y.Learning deep architectures f0r AI U1.Foun— dations and trends?in Machine Learning,2009,2(1):1— 127. [5]Hinton G E,Osindero S,Teh Y W.A fast learning al— gorithm for deep belief netsⅡ1.Neurla computation, 2006,18(7):1527—1554. [6]Vincent P,LarocheUe H,Bengio Y,et a1.Extracting and composing robust features with denoising autoen— 3371-3408. [9]Olshausen B A,Field D J.Sparse coding with an over- complete basis set:A strategy employed by VI?卟Vi— sion research,1997,37(23):331 1—3325. [10]Lee H,Batlte A,Raina R,et a1.Efifcient spa ̄e cod— ing algorithms D1.Advances in neurla informaiton pro— cessing systems,2007,1 9:801. [1 1]Lee H,Ekanadham C,Ng A Y.Spa ̄e deep belief net model for visual area V2[C]//NIPS.2007,7: 873-880. [12)Raina R,Battle A,Lee H,et a1.Self-taught learning: transfer learning from unlabeled data[C]//Proceedings of the 24th international conference on Machine learning. ACM.2007:759—766. [13]Lee H,Grosse R,R.anganath R,et a1.Convolutional deep belief networks for scalable unsupervised learning of hierarchical representaitons【C]//Proceedings of the 26th Annual International Conference on Machine Learning.ACM,2009:609—616. [14]Taylor G W,Hinton G E,Roweis S T.Modeling human motion using binary latent vairables[J].Advances in neural information processing systems,2007,19: 1345. [15]Sutskever I,Hinton G E,Taylor G W.The Recur— rent Temporal Restricted Boltzmann Machine【C]// NIPS.2008,21:2008. [16]Locke ̄A J,Miikkulainen R.Temporal convolution machines for sequence leanringⅡ】.To Appear,2009: 】一8. 一39— 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- xiaozhentang.com 版权所有 湘ICP备2023022495号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务