当前位置：
方案库>
方案详情

DeepSeek大模型原创核心技术解读

自GPT采用Transformer架构取得成功以来，经典Transformer架构一直是很多大模型的标配。但这不意味着Transformer是完美无缺的。DeepSeek在Transformer架构的基础上也做了很多创新，主要为：多头潜在注意力即MLA 。

 2025-02-21
收藏0
阅读767

分享至:

方案详情

评价

暂无评论！

相关方案

【中服云】集团版工业物联网平台-白皮书

集团版专为集团型企业打造，包括集团管控系统、工厂系统、开发发布系统、运维管理系统、网关系统5大子系统，旨在实现集团内部多工厂、多部门之间的协同管理和数据共享。它通过构建一体化的工业物联网平台，整合各工厂的生产、设备数据和资源，打造集团统一的工业操作系统底座，为集团提供统一的管理视角和决策依据，提升集团整体运营效率和协同效应。

阅读1060
下载4

163页化工动设备讲义（PPT）

163页化工动设备讲义（PPT）,163页化工动设备讲义（PPT）,163页化工动设备讲义（PPT）

阅读1402

ChatGPT发展历程、原理、技术架构详解和产业未来

本文将介绍ChatGPT的特点、功能、技术架构、局限、产业应用、投资机会和未来。

阅读4461
下载15

最新上线

天津职业技术师范大学陈庆斌等｜基于相似日选取和数据重构的短期光伏功率组合预测方法

针对光伏功率随机性较强等问题，提出了一种基于相似日选取和数据重构的短期光伏功率组合预测方法。首先，利用核模糊C均值算法对光伏功率进行聚类分析，通过最大信息系数提取主要影响特征；其次，结合合作博弈思想计算预测日和历史日的综合相关系数，挑选相关性较强的历史日构建训练集；然后，利用变分模态分解将光伏功率分解为若干子序列，计算排列熵值并重构为趋势项、低频项和高频项；最后，对趋势项和低频项采用长短期记忆神经网络进行预测，对高频项采用卷积神经网络-双向长短期记忆神经网络-注意力机制模型进行预测，将结果叠加得到最终预测结果。经实例验证，在不同天气条件下，所提模型整体预测误差最小，可有效提高预测精度。

阅读34
下载0

三峡大学鲁玲等｜计及？效率和多重不确定性的区域综合能源系统双层优化

本文在现有研究区域综合能源系统配置与调度双层优化的基础上，引入？效率作为综合能效的评估指标，同时考虑风光不确定性、负荷和能源价格波动对系统的影响，建立了计及？效率和多重不确定性的RIES双层优化模型，

阅读35
下载0

上海电力大学李江等｜计及水泥厂直接碳排放碳责任的源-荷低碳优化运行方法

未来随着双碳政策的推进，本文提出的双向碳排放分摊和低碳经济运行方法，将为高能耗企业更深层次参与低碳需求响应提供理论和技术支撑。

阅读35
下载0

2025年AI Agent行业报告（二）

Agent（代理）一概念起源于哲学，描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域，"Agent"（智能体）是一个具有自主性、感知能力和决策能力的实体。智能体能够通过传感器感知其所处的环境，并根据其内部状态和预设的目标，通过执行器对环境进行影响。智能体的目标通常是在给定的环境中实现特定的任务或目标。大型语言模型（LLMs）的出现为智能代理的进一步发展带来了希望