搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作
首页> 人工智能>正文

「AI视觉」的创新源头,从仿脑到追光逐电 | 专访北京大学教授黄铁军

秦明 ·2022-09-05 09:54
从图像视频到脉冲流,真正离开胶片思维,完成数码相机未完成的数字化革命。
南通新源
未融资江苏省2002-08
非石棉纤维为原料生产商
36氪报道 先进制造 专精特新 专精特新小巨人 高新技术企业
我要联系

文 | 秦明;编辑 | 石亚琼

开始前,黄铁军教授先分享了自己十多年前的一个小故事。

2011年,他在斯坦福大学电机工程系图像系统工程中心Bernd Girod教授团队做访问教授。第一天,Girod教授和他一起午饭后在校园边散步边探讨问题。在聊到斯坦福网络中心创办思科公司时,正好走到山坡上的一栋小楼,可以看到屋里有不少音乐设备。

这时,Girod突然停下来问他:你知道斯坦福大学科技成果转化最成功的案例是什么吗?黄铁军告诉36氪,他当时脑海中闪现的是Google等为代表的一大批硅谷顶尖企业。

Girod教授告诉他,其实最成功的例子是这个小楼内音乐装备使用的音频合成技术,这是斯坦福大学教授的发明。随后它被应用于电子琴各种音频的底层技术中,比如雅马哈等企业的产品都是用这种技术来模拟多种逼真的声音。

这表明每架电子琴的制作都要有该技术专利许可,同时也意味着源源不断的收益会流向创新者。

黄铁军谈到,科技企业如果缺乏核心技术,就难有长远发展;若没有原创发明,也很难成为伟大的企业。因此,一直以来,追求原始创新、追寻最本质的东西,是他科学研究中的第一导向。

黄铁军在1988年进入大学,10年间先后攻读了计算机应用专业学士、工业自动化专业硕士和模式识别与智能控制专业博士学位。从硕士期间参加863项目手写印刷体汉字识别开始,如今他已在视觉信息处理方向上探索了30年。

期间,他陆续在视频编码标准、视觉特征分析、高速成像原理等三方面实现了创新突破,终结了国外向我国视频行业索取高额专利费的历史,创立了以特征分析与压缩为中心的视觉大数据处理技术体系,以及超高速脉冲视觉技术新体系。

近期,在第一届专精特新技术创新大会暨科学家创新创业论坛前夕,36氪数字时氪专访了北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军,聊了聊当下人工智能的发展,包括他对AI视觉研究的思考、以及对科技成果转化的理解。

北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军

01 做减法,追寻第一性原始创新

早在1985年,黄铁军刚刚上高中,就赶上来“电脑要从娃娃抓起”的东风,跟随班主任霍振祥老师学习Basic语言。他回忆到,在学校微机课程中第一次接触到苹果电脑,很是兴奋,因为进步很快,霍老师把自己大学期间的计算机教材都给他自学,他对油印教材中的流程图至今记忆犹新。

黄铁军告诉36氪,真正开始研究是在大学毕业那一年,他后来的硕士导师研究手写体汉字识别。当时导师申请到863计划课题,需要新生力量,鉴于他当时成绩优秀,就被免试进入课题组读硕士。之后,博士期间研究虚拟现实,主要是基于双目立体视觉的场景建模,算是计算机视觉比较早期的一拨人。

黄铁军回忆到,2002年我国DVD产业遭遇高额专利费,自己博士后刚出站,便协助高文教授组织成立数字音视频编解码技术标准工作组,开展了至今20年的视频编码标准突围和超越之路。

2013年欧洲人类大脑计划启动,全球掀起脑科学与类脑研究热潮,北京市布局“脑科学与类脑计算”重大专项专家组,黄铁军担任了召集人,专注灵长类视网膜神经编码机理研究,提出了脉冲视觉编码新原理,研制了比人类视觉和电影电视速度快千倍的超高速相机和视觉系统。

每个脚印恰好都踩在了时代进步的节点上。

黄铁军谈到,2011年在斯坦福大学访问期间,他听了吴恩达、余凯的学术分享,那时候深度学习才刚刚热起来。转折点在2012年,Hinton团队把Imagenet视觉检测识别任务的性能提升了10%+,随后几年,计算机视觉研究发生了翻天覆地的变化,传统方法被推翻,迎来了基于深度学习的AI视觉研究。

一方面人们都沿着这条重大变革之路继续往前走,另一方面黄铁军仍然保留自己的独立思考——是不是有了深度学习,视觉就真的成功了吗?

世俗所认为的成功与学者们认为这件事是否彻底解决了,依然是两回事。黄铁军表示,那时候大多数人的创新基本上都选择做加法,比如增加神经网络参数数量,刷数据集,不断尝试新网络结构等等,结果是越来越复杂。

他更倾向于做减法,追寻第一性原理,回到最本质的源头创新上。

黄铁军告诉36氪,科研的成功不是一味进行算法性能优劣的比较,相比于“论文等身”,他更在乎独创性的原始成果,同时期望可以找到足够大的市场需求,推动产业社会变革。时机到了,技术驱动很容易引起社会性变化,搜索引擎便是典型的一个例子。

现如今,人工智能不断与产业场景结合。关于未来新一代人工智能的技术路线走向,他谈到有三条,第一是基于大数据和深度学习算法实现的人工智能技术路线;第二是通过强化学习,在虚拟环境不断训练得出的具身智能路线;第三是通过模拟生物神经系统和生物智能,最终实现智能生命技术路线。

其中,生物脑科学的精细模拟,是启发新一代人工智能的重要路线。

近期,他们团队对线虫302个神经元精细建模,训练出由高精度神经系统控制的、与环境实时交互的智能机器线虫,能够像真实线虫一样嗅探并控制身体蠕动到感兴趣的目标,从源头创新开始迈向了智能生命。

02 AI视觉的创新源头,从仿脑到追光逐电

AI视觉当下的创新源头是什么?黄铁军告诉36氪,抓手有两个。

一个是生物源头。强大的视觉处理系统是生物的天然能力,计算机视觉的研究源头还是在生物。基于此,清楚认识生物视觉的基本原理是第一个要探寻的问题

另一个是物理源头。人们能看到物体,是因为照射到物体上的光反射进观察者的眼睛中,之后通过神经元传递,让大脑感知到了物体本身。从物理设备角度看,视觉是对光信号的捕获、加工与处理。因此,回答物理世界、光信号、以及相机采集的图像视频三者之间关系是目前要追寻的另一个重要问题

黄铁军谈到,将上述两个视觉原理研究清楚,那么其他问题可能也就迎刃而解了。

在生物视觉层面,要理解整个视觉系统的机制,首先要建立起对每个细胞单元的理解。黄铁军谈到,人的眼睛里面大约有六七十种神经细胞,每种细胞及彼此间的连接都要研究清楚。

比如光信号进入视锥、视杆细胞后,细胞是如何把光信号转为电信号的?神经网络结构是如何连接的、每个连接上的信号是如何向下传递?最后需要将整个系统通过计算机重演出来。从2014年起,他们团队便开始研究了,目前已经做到了部分视觉细胞的精细建模。

黄铁军继续补充到,视皮层约占大脑皮层五分之一,若能清楚演绎出从光信号进入眼睛开始一直到最后完成识别的信号加工过程,便可以说将生物视觉搞明白了。他的团队希望再用五年左右的时间把灵长类视网膜搞清楚,他相信,在全球科研人员的努力下,预计可以在2035年左右解决这些问题。

与此同时,黄铁军也自信的谈到,他的团队已经解决了物理源头层面的研究难点。

谈物理源头要从光谈起。光学虽然不是黄铁军教授团队的学科范围,但是要探讨相机是如何采集与表达光信号的。如果研究计算机视觉只是从图像视频数据集开始,便没有追寻到第一性原理

光具有波动特性,又有粒子特性,即所谓的波粒二象性。光的波动性表现在每个光子本身,它们振动频率不同、能量不同,最后反映在光谱上的分布也就不同。

相机是通过捕获高速冲击过来的光子流,把它转成一幅图像或视频。黄铁军表示,光子在运行撞击相机传感器的物理过程中,本质是把高速运转的物理世界变成每秒几十赫兹的慢速过程。可以想象,当光子打到螺旋桨的扇叶上,然后反弹撞上镜头背后的感光元件,形成一张图片。

这里面会带来一些问题,一方面螺旋桨扇叶高速旋转是清清楚楚地发生着,另一方面传统相机以几十赫兹的速度是完全无法记录下整个过程。

黄铁军告诉36氪,虽然高速相机目前可以做到,但是成本高、体积大的特点仍然无法普及利用。其中的技术问题在于,即使相机能够每秒输出3万幅图像,背后的算法、存储能力、计算系统也难以实时处理,当前硬件设备成本高昂,这是第一个要解决的问题

视觉信息表达一直以来都采用图像与视频,少有人思考还有什么更好的办法。背后的原因,可以追溯到发明相机的年代,本质是一种化学方法逻辑。黄铁军谈到,目前人们表达信息的方式还停留在胶片时代,包括数码相机也是一样,比如打开快门,曝光数毫秒形成一幅图像。

其中的误区在于光从来都不是“整整齐齐排着队”,它是一个自然发生的随机过程,相机通过曝光获取图像的方式,最大的损失就是把丰富的动态过程变成单一的静态图像,科研人员再用算法通过比较不同图像的差别来估计运动过程,纯属浪费,但这就是目前计算机视觉的主流方式,黄铁军解释到。

如何能够低成本实时记录动态过程引发了他的深入思考。

当下,黄铁军教授团队研究的课题之一就是把光的整个运动过程记录下来。极端情况是把一个光子转成一个比特,常规器件做不到,就收集一组光子(例如1000个)转为1个比特,这样光强的时候比特流会密集,光弱的时候会相对稀疏,要想了解某时刻光强如何,可以用两个比特或两个脉冲之间的时间来计算,这就很好地刻画了光的物理过程。

也就是说,不同于传统相机,基于“视觉+雷达”模型的脉冲相机的每个像素独立,不需在特定时刻一起成像,自行记录光线变化,将光信号转换成0和1组成的数字比特流,所有像素的比特流按照空间排布组成的流阵列,准确刻画了传感器视窗采集到的一段时间内光线变化的物理过程

他的团队采用成熟的CMOS光电器件和芯片,实现了超高速连续成像,有机会逐渐淘汰贵且大的高速相机乃至所有摄像头,重塑包括表示、编码、检测、跟踪、识别在内的整个视觉信息处理体系。

放弃传统图像视频表达,回到表达光物理过程的本源,这就是叫做减法。基于此,在脉冲视觉的世界中没有图像,光变成脉冲流,图像视频等只是产物之一,脉冲流还可以直接输入脉冲神经网络,实现超高速机器视觉。

03 成果转化,没有糊里糊涂的成功

视觉表达过程不用图像,而用脉冲流,这个原理的提出使人们真正离开胶片时代,完成数码相机没有完成的数字化革命。

有了技术原理模型,黄铁军在2016 年1月申请发明专利,2019年中国专利授权,随后美国、日本、韩国、欧洲等国际专利也均授权;2017年团队设计了第一块芯片,能够拍摄出高速的过程,性能显著;2021年进入科技成果转化,成立了公司——脉冲视觉。

根据官网介绍,这是一种全新的脉冲视觉智能技术,颠覆了视频概念;通过脉冲相机,将光信号转换成0和1组成的数字比特流,所有像素的比特流按照空间排布组成的流阵列,准确刻画了传感器视窗采集到的一段时间内光线变化的物理过程,能够“追光逐电,见所未见”。

脉冲相机拍摄高速扇叶(来自脉冲视觉官网)

实验室芯片到工业级芯片,从零到一的工作已经完成,接下来就是产业化了。

他谈到,该技术可广泛应用于高铁、电力、风电和工业检测等行业高速检测需求,也可以用于车路协同、自动驾驶等实时响应场景,同时也用于高速手机摄像头,提升主摄成像质量,记录高速运动过程。

从原创技术的诞生到市场化的产品,可能直接转化后企业就欣然接受,也可能需要经过很长时间才能找到它的应用爆发点。

脉冲视觉已经完成了“从零到一”的原始创新,能否将独特优势技术发展成硬科技企业,需要经过市场经营与验证,这就需要强有力的团队支撑。在这个转化过程中,科学家关注技术创新和技术升级,特别需要职业经理加入,组建从技术、产品到经营的专业团队。

过去成功的企业中,大多是平台性企业,本质上是商业模式加上互联网。黄铁军谈到,当下中国的原始性创新不断涌现,越来越多的“专精特新”企业逐渐登上舞台,未来也将从原创技术成长为某个方向的小巨人乃至全球领先企业

(完)

人工智能
+1
43

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
蔚来李斌:乐道要做合资SUV油车的挑战者
京西集团中国区CEO刘喜合:国产底盘替代趋势利好,成本和服务能力才是关键|36氪专访
一款15年历史的大厂产品,如何在AI时代“杀”到榜一|涌现36人
联想智能设备总裁Luca Rossi:发布了超过60款AI硬件后,我们看到了什么样的未来? | 36氪专访
名士表全球CEO Michale Guenoun:我们想成为年轻中产的“第一块腕表”|专访
小马智行楼天城:自动驾驶已经没有技术阻碍|36氪专访
「清程极智」翟季冬:中国AI算力行业,不能只“照抄”英伟达丨涌现36人
欣旺达董事长王威:和龙头拼价格没出路,要做出差异化 | 36氪专访
靠种草“卖药”,在小红书也能玩转医药市场?|36氪专访

最新文章推荐

公话亭变身最小公路酒吧 不夜城上海有了新城市符号 耐克换帅不意外,为何职业经理人在运动品牌难有好结局?|BrandBeat 苹果、讯飞、腾讯同日宣布重磅消息,这一市场终于要爆了 OpenAI o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开 大手笔套现,巴菲特2个月减持570亿元!目前最好的投资是囤现金?伯克希尔囤积现金近2万亿元,此前已甩卖数千亿元苹果股票 最强卷王3个月进化9次!可灵AI上新1.5模型,国外网友:太疯狂 淘天出海,为什么服饰先行? 当米哈游站在十字路口 生长激素激战:产品制胜vs渠道为王 回购60亿,注销!1.6万亿茅台,稳了
秦明
新锐作者

关注建筑科技与数字化转型,微信say-Amazing

最近内容

广联达董事长袁正刚:职业生涯很想把建筑行业的数字化做好 | 数字经济36人
转让Space X、菜鸟网络、约200万美元额度的Open AI老股份额|资情留言板第100期
转让Space X、Open AI、某500亿美元估值的Shein老股份额|资情留言板第99期

报道的项目

提及的项目

查看项目库

脉冲视觉

生物源

良食良品

中国专利

展开更多

下一篇

智能手机马拉松:后半程是耐力赛

越来越萎缩的市场背后,是国内手机厂商的日子越来越不好过了。

2022-09-05

热门标签

雷雷 伽玛 职位分析 基尼系数 瘾君子 王野 瘦身 猛犸象 北京花店 运动医学 林宁 十年之约 京东家电专卖店 女性电影 陆风 江铃 云渲染 网络小说作家 曲线锯 鬼冢 鬼冢虎 鲍尔曼 2016西安草莓音乐节 场地出租 二元对立 生态学 消费贷款 天下秀 魅族真旗舰 赢商网
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

玻璃钢生产厂家清远玻璃钢童趣雕塑玻璃钢仿真车雕塑宿州玻璃钢雕塑定做欧式玻璃钢人物雕塑产品介绍河北定制玻璃钢雕塑供应商上海主题商场美陈生产厂家亳州玻璃钢雕塑制造厂咸阳火烈鸟玻璃钢雕塑公司广东季节性商场美陈市场价大兴玻璃钢雕塑工厂德州水景校园玻璃钢雕塑厂家青岛城市玻璃钢雕塑宁夏崇艺玻璃钢雕塑花朵玻璃钢人物雕塑银川人物玻璃钢雕塑价格玻璃钢雕塑作品名称大连玻璃钢雕塑摆件定制玻璃钢人物雕塑哪里买蚌埠创意玻璃钢雕塑价位玻璃钢动物不锈钢雕塑生产福建艺术商场美陈生产厂家黄冈玻璃钢雕塑制作玻璃钢花盆尺寸结构设计贵阳户内玻璃钢雕塑市场专业的树脂玻璃钢花盆么商场中庭美陈找什么公司做日照小区玻璃钢雕塑厂家玻璃钢雕塑款式齐全质量好的玻璃钢鹿雕塑玻璃钢花盆改造衣服香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化