大学计算机基础-文献订阅-重庆大学图书馆

徐君阳张红梅张坤

武汉大学电气与自动化学院武汉430072长江水利委员会水文局长江口水文水资源勘测局上海200136

摘要： 针对定步长LMS算法在收敛速度和稳态误差之间难以取得平衡的问题以及传统变步长算法对初始参数选择依赖程度高、工作量大且存在主观性的缺陷,提出了一种基于深度强化学习的变步长LMS算法。该算法对初始参数的依赖性小,规避了繁琐的调参流程。首先,构建了一个融合深度强化学习和自适应滤波的算法模型,该模型利用深度强化学习智能体控制步长因子的变化,代替了传统变步长算法中用于步长调整的非线性函数,从而规避了繁琐的实验调参流程,降低了算法使用的复杂性。其次,提出了基于误差的状态奖励和基于步长的动作奖励函数,引入动态奖励与负奖励机制,有效提升算法的收敛速度。此外,设计了基于欠完备编码器的网络结构,提高了强化学习策略的推理能力。通过实验验证,相较于其他较新的变步长算法,所提出的算法具有更快的收敛速度和更小的稳态误差,在不同初始参数下均能快速调整至合理的步长值,减少了实验调参的工作量。将训练完成的网络应用到系统辨识、信号去噪以及截流区龙口水域水位信号的滤波等实际领域中,均取得了良好的性能表现,证明了算法具有一定的泛化能力,并进一步证实了其有效性。

基于改进哈里斯鹰优化算法的微电网多目标优化调度

王鑫李升

南京工程学院电力工程学院(沈国荣学院) 江苏省南京市211167

来源详细信息

高校大学生算法素养形成机理与培育策略研究

史玄谭璐星

湖南工商大学图书馆长沙410205

来源国家哲学社会科学学术...

详细信息

SM4算法基于不同逻辑门集的量子优化实现

郭运雨向泽军林达曾祥勇张莎莎

湖北大学网络空间安全学院武汉430062密码技术全国重点实验室北京100878国防科技大学理学院长沙410073湖北大学数学与统计学学院应用数学湖北省重点实验室武汉430062

来源详细信息

基于A2C算法的股票交易模型

肖豪柯宗武

湖北师范大学计算机与信息工程学院湖北黄石

来源汉斯期刊

详细信息

关键词： 量化交易强化学习 A2C算法 Gym-Anytrading Stable-Baselines

摘要： 2024年9月中国A股市场大涨,再次点燃了全民的“炒股热”。然而,牵动股民心弦的股价涨跌——却跟许多因素息息相关。对于散户来说,除了筛选信息进行股票的买进卖出以外,通过算法模型预测也能够起到事半功倍的效果。上世纪六十年代初便有了通过计算机技术进行量化交易的雏形,随着技术的迭代,通过统计学和模型构建成为量化交易的主流选择。而本论文构建了一个使用A2C (优势行动–评论家)强化学习算法的股票交易模型。利用“gym-anytrading”库创建一个股票交易环境,并使用Stable-Baselines库训练一个策略网络来学习如何在该环境中进行交易以最大化收益。该模型的数据来源于Yahoo-Finance的阿里巴巴股票信息(2022年12月至2024年9月),通过pandas-datareader库的接口获取。In September 2024, a significant surge in China’s A-share market reignited the public’s “stock trading frenzy”. However, the fluctuating stock prices that excited stock investors were closely related to many factors. For individual investors, in addition to screening information for buying and selling stocks, using an algorithm model to predict can also have a twice-as-effective effect. In the early 1960s, the embryo of quantitative trading using computer technology had appeared, and with the advancement of technology, quantitative trading based on statistics and model building became the mainstream choice. This paper constructs a stock trading model using the A2C (Advantage Actor-Critic) reinforcement learning algorithm. By using the “gym-anytrading” library to create a stock trading environment and training a policy network using the Stable-Baselines library to learn how to trade in this environment to maximize profits. The data source for the model comes from the stock information of Alibaba (2022 December to 2024 September) obtained through the interface of the pandas-datareader library.

基于多维混沌映射的复合型部分随机测量矩阵构造算法

陈兴兰鲁进张亚楠

云南大学信息学院昆明650500云南省高校物联网技术及应用重点实验室昆明650500

来源详细信息