自我介绍范文网

当前位置:自我介绍范文网 > 记忆力 > 记忆法应用 > >

地平线机器人杨铭:深度神经网络在图像识别应用中的演化

来源::网络整理 | 作者:管理员 | 本文已影响

4 月 15 日,杨铭博士在机器之心线下活动 Interface 上做了一次题为「深度神经网络图像识别应用中的演化」的演讲。这篇文章对杨铭博士分享的内容进行了整理,同时还附有添加了字幕的视频,希望能为大家学习图像识别提供帮助。

地平线机器人杨铭:深度神经网络在图像识别应用中的演化

地平线机器人技术 ( Horizon Robotics ) 联合创始人&软件副总裁杨铭博士毕业于清华大学电子工程系并获得工学学士和硕士学位,于美国西北大学电气工程与计算机科学系获得博士学位。杨铭博士是 Facebook 人工智能研究院创始成员之一,曾任 NEC 美国研究院高级研究员,专注于计算机视觉和机器学习领域研究,包括物体跟踪、人脸识别、海量图片检索、及多媒体内容分析。在顶级国际会议 CVPR/ICCV 发表论文 20 余篇。在 Facebook 工作期间负责的深度学习研发项目 DeepFace。多次担任 CVPR/ICCV/NIPS/ACMMM 等顶级国际会议程序委员会成员,T-PAMI/IJCV/T-IP 等顶级国际期刊审稿人,申请获得美国专利 14 项。2015 年,杨铭博士回国加入地平线机器人技术。

下面是添加了字幕的视频,以及演讲内容整理:

大家下午好!我是地平线机器人的杨铭,非常高兴有这样一个机会跟大家交流和分享。首先感谢机器之心的邀请,更加感谢大家在这样一个风和日丽、周六的下午来到这里,听我的分享。

深度神经网络这几年非常火热,取得了很多技术突破。其中最关键的是深度网络的网络结构,网络模型本身具有很强的建模能力,能够完成很多任务,每项任务也都有很好的结果。网络模型本身也经历了一些发展,从 80 年代一直到现在。我想把发展的过程和一些设计的考虑跟大家分享一下。

今天这个分享不只是我一个人的总结,也包括我的同事黄畅博士。黄畅博士也是地平线机器人联合创始人,负责算法方面。之前在清华大学计算机系读博,之后去南加州大学做博士后。我们在硅谷、在 NEC Lab 当过一段时间的同事。后来他去了百度深度学习研究院担任主任架构师,现在负责地平线的算法研发工作。

还有一位合作者是罗恒博士,在蒙特利尔大学做过博士后,后来去了百度深度学习研究院工作,目前在地平线负责图像算法的研发。

简单说一下我的背景。我在清华电子系读的本科和硕士,当时做的是视频编码。2000 年左右的时候,视频编码以及 4G 通信是比较火的项目。我读完硕士之后就去了美国西北大学读博士,那个时候转向了计算机视觉、机器学习。毕业后就去了硅谷,跟黄畅做了同事。后来他们回国,先去了百度,创立了百度深度学习研究院,我去了 Facebook,Facebook 那几年决定加大投入做 AI 相关的研发。

2013 年的 8、9 月份,我们成立了 Facebook AI research,开始叫做 Facebook AI Lab。当年 12 月份的 NIPS 上,Yann LeCun 被 Mark 说服后就加入了我们。之后改名为 Facebook AI Research。在 Facebook,我主要负责的人脸识别后端系统跟算法。2015 年,我回国和余凯、黄畅一块创立了地平线机器人。这一波 AI 浪潮来势凶猛,我们想在这个浪潮之中,顺应历史发展潮流,做一些事情。

这可能是我之前做的比较重要的工作,就是人脸识别。我的感觉是说,深度学习开始在 ImageNet 做的非常好,在人脸识别也表现的非常好。我们之前做的人脸识别工作,DeepFace 是第一次把深度学习在互联网上应用、落地的产品。我们在 2013 年底差不多做完的,2014 年上线。

地平线机器人杨铭:深度神经网络在图像识别应用中的演化

当时 DeepFace 每天处理 Facebook 上大约 4 亿张人脸识别,现在应该更多了。基本上每一张上传到 Facebook 的人脸会先经过一个人脸检测,再进行后端的比对识别,向用户推荐一下说这是不是人脸。如果我们识别出来了之后,就会打一个名字,如果没有识别准的话,我们可能会列 4、5 个选项。如果说我们比较有把握,Facebook 就会把照片向用户的朋友推荐或者发一些消息,提高用户的活跃度。

这个工作我们只敢说接近人眼的性能,后来很多人它说超过了人的能力,但我觉得还没到完全超过人的能力那个程度,还是有一定的差别。因为计算机非常适合在大规模的情况下做人脸识别,这其中还有一些限制,需要人脸偏正面、偏清晰。但是对于人说,如果是熟悉的亲戚、朋友,甚至你看到一个背影,看到一点点,看到一撇,就可以看出这个人是谁。

整体来讲,在一定规模下的人脸识别,机器肯定超过人的水平,但是遇上非常难和极端的条件,机器可能还是不能达到人的水准。这个工作是深度学习之后,人脸识别领域中应用最多的工作,也被 Science 等很多媒体报道过。

再稍微简单介绍一下地平线机器人。地平线机器人成立于 2015 年 6 月,目前的总部在北京。我们在南京有研发中心,另外在深圳、上海都有办公室。在深圳,我们主要是做人工智能跟硬件相结合,在深圳是非常适合做硬件相关的生产的。我们上个月在上海刚刚成立了一个聚焦于汽车自动驾驶方面研发的分公司,位于上海汽车城,产业很聚集,进行相应测试也非常方便。

主要的员工和同事来自于百度、Facebook。我们硬件团队主要来自于 NOKIA,也有很多同事来自于微软、TI 和英伟达。目前我们还是偏研发的公司,超过 80% 的同事都是在做算法、软件硬件研发的工作。很多人有海外求学的经历,14-15% 是有博士学位的。

目前我们所做的事情主要是希望把深度学习的方法跟硬件相结合,跟嵌入式系统相结合,能够成功落地,影响大家生活。目前的主要目标是希望通过十年、二十年的努力,能够让世界上上千种设备都具有智能的功能,让大家生活更加安全、更加便捷、更加有序,具体来讲我们现在聚焦一下几个业务方向:

第一个,自动驾驶或者智能汽车。这个方向大家也有所了解,这几年非常火热,不断有大新闻曝出来。我们相信这个领域不仅仅可以国家整个社会的运行、整个社会的生活,而且也是人工智能能够发挥很大作用的场景。

第二个,智能家居或者智能生活。2015 年之前,大家听到的智能家居,归结于一个词就是 WIFI,家里的设备能够进行联网控制,我们认为其实这是不够的,还是非常不方便的。大家在外出工作的时候,经常会用手机沟通、打车。但是回家之后如果再掏出手机,点开 APP,再找到几个按纽,对家里的东西进行操控,这是挺不方便,挺不自然的。在家里,人们希望手机可以放在一边,能够更自然地跟家里各种电器、各种设备交互,这是我们的第二个方向,能够在智能家居的场景下,将人工智能镶嵌到设备里面去,给大家提供更便捷的交互方式。

第三个,智能安防或者智能安全。这是跟摄像头相关的,也是一个很好的场景,能够让图像识别技术真正地帮助大家,让这个社会更安全,让这个城市更安全。


本文标题:地平线机器人杨铭:深度神经网络在图像识别应用中的演化
分享到: 更多

更多关于“记忆法应用”的文章

随机阅读TODAY'S FOCUS