肉眼识别图像中的深度对我们来说轻而易举,但对于计算机而言,这是一项需要长时间学习和研究才能掌握的技能。西门菲莎大学SFU计算摄影实验室的研究人员正在让计算机逐步拥有“人类的视觉”——识别照片中的深度。
近期,该实验室的研究人员在单目深度估计技术上取得了重要突破。这项技术的目标是教授计算机通过学习客观深度信息和经验知识,来识别图像中的深度。通过模拟人类的视觉神经网络,计算机能够分析图像中物体的大小、位置和相互关系,从而判断物体的远近,这是人类识别场景中物体并理解其真实大小的天然能力,也是神经网络领域的一个重要研究课题。
为了提高计算机视觉估计的分辨率,研究团队进一步开发了一个引人入胜的应用。这个应用能够利用单目深度估计技术,生成令人惊艳的3D图像,这些图像在视觉上非常逼真。这一技术的广泛应用前景无比广阔,不仅在智能手机、个人电脑和工业检测领域有着广泛的应用,而且在智能安防、机器人、自动驾驶、智慧医疗、无人机和增强现实(AR)等领域也展现出了巨大的潜力。
AR领域的三维重建技术就是其中的一例,它能够通过重现目标,将用户带入一个梦寐以求的奇妙3D世界。全球许多视觉艺术家已经开始利用这项技术,创造令人惊叹的视觉效果。例如,Akira Saito利用该技术制作视频,将观众带入一个令人叹为观止的3D艺术世界。
SFU计算机科学学院在计算机科学和工程领域一直处于世界领先地位。该学院在计算机图形与成像领域拥有全球第14名的高排名。学院不仅拥有各种最前沿的人工智能研究项目,还有一台名为Cear的超级计算机。这台超级计算机被设立在SFU的Burnaby校区,是加拿大目前用于学术研究的最强大计算机。它是SFU与Compute Canada和WestGrid紧密合作的结果,展示了该学院与行业顶尖企业的深度合作。