科研知识互享,齐心协力共进 | 计算机与人工智能系科学研究学术讲座
日期:2024-10-31  作者:wangxinyu_jsj   来源:  浏览量:1

为增强计算机与软件学院科研教学团队的综合实力,促进教师间的科研创新能力,10月22日,计算机与软件学院计算机与人工智能系在软件园校区A3-206教室举办第二十九期科研学术讲座。计算机与软件学院的两位教师王广富、蒋韬主讲,围绕“基于多模态的关键信息提取算法介绍”与“人工智能的最新进展以及行业大模型的痛点对策”两大议题展开。

 

 

首先,王广富老师介绍他的研究内容,题为《基于多模态的关键信息提取算法介绍》。“介绍了多模态算法的未来趋势及其基本概念,并阐述研究多模态问题对于推动人工智能更好地理解和认知我们周围世界的重要性。

接下来,着重介绍多模态算法的核心网络架构及其在未来人工智能领域的关键作用。然而,多模态算法的实现面临诸多挑战,尤其是多模态融合方面。传统的融合技术在复杂数据集下性能受限。对此提出了采用基于空间感知的注意力机制,克服传统技术的局限性。

最后详细讲解基于多模态的关键信息提取算法的设计原理,并通过实验有效证明了多模态算法在关键信息提取领域的强大实力。同时,复现了最新的大模型与多模态相结合的MiniCMP算法,这个算法在端侧具备非常强的能力,通过演示证明了该模型的强大之处,更凸显了多模态算法在人工智能领域的巨大潜力和广阔应用前景。

 

 

接下来,蒋韬老师深入讲解了《人工智能的最新发展趋势以及行业大模型的痛点与对策》。他首先讲述大模型最新的研究动态以及在中国市场各大模型厂商的活动状态。

 

 

之后,蒋老师话锋一转,提出大模型在高歌猛进的同时,在行业应用方面却面临巨大挑战。首先从大模型的原理和本质入手解释了大模型Seq2Seq的特征能够大力出奇迹(数据、算力和算法),“涌现”的不确定性以及大模型产生“幻觉”的内在因素。接着分析了行业大模型在专业性、确定性、可靠性、稳定性、灵活性、一致性、可解释性和低时延等方面的要求。

 

 

最后,就可能的解决方案进行了探讨:除了不断加大网络参数规模(百亿,千亿,万亿),不断重新训练(改进梯度  寻优,改进网络结构,改进训练方法),不断增加数据量,不断改进数据质量,不断重新训练和微调、优化模型之外,还需要从行业本身的特点出发,在知识工程、交互工程、质量工程、事务工程方面发力,系统性地推进大模型在行业应用中发挥更大的作用。

在随后的互动环节,与参会者热烈讨论。有的老师针对多模态技术的应用提出创新构想;也有的老师就行业大模型如何在学校提出“教医养康旅”战略中发挥更大的作用提出了建设性的意见。此次科研交流活气氛热烈,思想活跃,同时也为后续的学术交流奠定了的基础。

 

收藏本页