国家级大创项目 | 基于深度学习的助盲场景下图像描述算法研究
日期:2020-04-04  作者:[db:发布人]   来源:软件学院  浏览量:3211

项目名称:基于深度学习的助盲场景下图像描述算法研究

执行时间:2018年4月至2019年4月

项目成员:李振宇、王浩南、李晗曦

指导教师:张明会(教授) 软件工程系

项目简介(200字以内):

盲人群体的生存状况一直是我国政府和社会长期关注的问题,技术层面已有许多硬件上助盲策略,如将电极贴在头上,以人工电信号模拟视觉信号在大脑中的传导等。本项目尝试以计算机视觉代替部分视觉障碍群体的视觉能力,借助感知、摄像设备识别周围场景,利用机器学习理论与自然语言处理算法进行图像场景识别,结合语音技术将结果转换,用听觉代替视觉方式,从软件和算法层面解决助盲问题,帮助盲人群体更加便利的生活。

创新点(100字以内):

1.深度学习与计算机视觉融合,将先进的理论研究成果应用到助盲场景中。

2.租用Google云平台完成复杂的大规模计算任务,解决个人计算资源不足弊端。

3.采用微软COCO数据集和斯坦福的ImageNet数据集,为训练算法和验证算法提供后台保障。

取得成果:

1.可视化算法验证程序

2.发表学术论文1篇

心得体会(50字以内):

完成这个项目最大的体会就是感受到了团队合作与课下自学的重要性,大家在一起学习、研究,更有学习的动力,彼此监督影响,收获颇丰。

相关图片:

收藏本页