• OA系统
  • 图书馆
  • English
  • 中国科学院
  • 首页
  • 所况简介
    所况简介
    1964年,为落实国家声学规划,满足国家迫切需要,形成全国声学学科研究中心,经国务院副总理聂荣臻元帅批准,成立中国科学院声学研究所(以下简称声学所),将原中科院电子所的水声、超声、建筑声3个实验室,1958年成立的南海研究站、1960年成立的东海研究站、1961年成立的北海研究站整体纳入声学所。声学所是从事声学和信息处理技术研究的综...
    了解更多+
    现任领导
    李风华
    所长
    倪 宏
    党委书记、副所长
    李明庚
    副所长(正局级)
    李浩然
    党委副书记、纪委书记
    杨 军
    副所长
  • 机构设置
    领导机构
    所务会 党委会
    咨询机构
    学术委员会 学位评定委员会
    职能部门
    综合办公室 党委办公室 人力资源部 科技发展部 重大任务部 财务管理部 资产条件保障部 质量管理部 保密办公室 监督审计(纪委)办公室
    研究站
    南海研究站 东海研究站 北海研究站
    挂靠机构
    中国声学学会 全国声学标准化委员会 中科院声学计量站(CMA)
    研究单元
    声场声信息实验室
    水下环境信息感知实验室
    水下信息技术实验室
    海洋声学技术实验室
    水下航行器实验室
    超声学实验室
    噪声与音频声学实验室
    智能网络与信息处理技术实验室
    语音与智能信息处理实验室
  • 科研成果
    研究领域
    经过五十多年的发展,声学所形成了独具特色的六大研究领域:水声物理与水声探测技术、环境声学与噪声控制技术、超声学与声学微机电技术、通信声学和语言语音信息处理技术、声学与数字系统集成技术、高性能网络与网络新媒体技术。 【详情】
    成果概况
    获奖
    论文
    专利
    专著
    科研进展
    研究人员利用驻波场中悬浮小球的振动实现物性参数的反演
    2023-02-07
    研究人员利用蜂窝结构的空间周期性提出一种脱粘缺陷检测新方法
    2023-01-16
    研究人员用一种鲁棒的并行虚拟传感方法实现反馈有源噪声控制
    2022-11-08
    研究人员计算出边界附近粘弹柱壳的声辐射力矩
    2022-09-14
    一种宽频广角有效的水下隐身毯
    2022-08-30
    骨传导如何传声?研究人员新发现:中西方人群颅骨力阻抗存在差异
    2022-07-21
    产品展示
  • 人才队伍
    院士专家
    汪德昭
    马大猷
    应崇福
    张仁和
    侯朝焕
    李启虎
    汪承灏
    人才招聘
    更多+
    中科院声学所监督审计(纪委)办公室管理岗位招聘启事
    2023-03-22
    中科院声学所资产条件保障部安全保卫管理岗招聘启事
    2023-03-16
    中科院声学所综合办公室主任岗位招聘启事
    2023-03-13
    中科院声学所声场声信息实验室科技类岗位招聘启事
    2023-02-14
    中科院声学所南海研究站声学实验室主任岗位招聘启事
    2023-02-14
    正高级专业技术岗位
    副高级专业技术岗位
    中科院青年创新促进会会员
    特别研究助理及博士后管理
  • 研究生教育
  • 党建与文化
    活动报道
    更多+
    百岁寿辰 学习楷模——东海研究站贺离休老干部杨馥丽百岁寿诞
    2023-03-22
    声学所妇委会开展“艺润科创情,煦暖巾帼心”郊游踏青活动
    2023-03-21
    声学所召开党建工作推进会
    2023-03-17
    南海研究站召开2022年度党建述职考评会
    2023-03-10
    声学所深入学习贯彻中国科学院2023年度工作会议精神 谋划部署“攻关2023”重点工作
    2023-03-09
    展巾帼英姿 绽芳华风采——东海研究站开展Talk秀主题活动
    2023-03-09
    文化副刊
    诗歌
    书画
    摄影
    散文
  • 交流合作
    学术交流
    更多+
    声学所举办科研基金撰写专题培训
    2023-02-28
    声学所举行2023年第1期学术交流会
    2023-02-10
    声场声信息国家重点实验室学术委员会暨声学与海洋信息重点实验室学术委员会2022年度工作会议在北京召开
    2022-12-26
    声学所举行第十一届研究生学术交流会
    2022-11-18
    中科院声学研究所举行2022年第6期学术交流会暨2022年度青促会学术交流会
    2022-09-30
    科技合作
    更多+
    亚秒级超快响应的声表面波氢探测技术参加智汇行动-概念验证创新大赛路演
    2023-01-18
    东海研究站参加第五届长三角科技成果交易博览会
    2022-11-18
    王文研究员获第十二届中国发明协会发明创业奖·人物奖
    2022-09-01
    合肥市新站高新区管委会调研声学所超声学实验室
    2022-08-25
    国际合作与港澳台地区合作项目情况
    2022-07-06
    国际会议
    更多+
  • 科学传播
    工作动态
    更多+
    青岛海信学校学生走进北海研究站开展科学实践活动
    2023-02-10
    声学所参加“嗨,科学!”中科院第四届科学节主场活动
    2022-10-31
    “爱科学,向未来”——声学所举办第十八届公众科学日线上活动
    2022-06-20
    声学所举办“红领巾寻访红色印记”科普活动
    2022-04-18
    关爱听力健康,聆听精彩未来——声学所与中关村一小联合开展2022年“全国爱耳日”科普活动
    2022-03-04
    科技期刊
    科普文章
    更多+
    科普文章丨耳机里的声音为什么会有方向感?
    科普文章丨嘿,siri!嘈杂的酒吧里,AI为什么听不懂指令?
    科普文章丨神奇的主动降噪技术
    科普视频
    更多+
    科普视频丨杨波:揭秘“深海勇士号”载人潜水器
    科普视频丨声音的奥秘
    科普视频丨真空无法传声科普实验
    科普视频丨借声波一臂之力探神秘海底世界
  • 信息公开
    信息公开规定
    信息公开指南
    信息公开目录
    信息公开申请
    信息公开年度报告
    信息公开联系方式
  • 首页
  • 所况简介
    • 机构简介
    • 所长致辞
    • 现任领导
    • 历任主要领导
      • 历任所长
      • 历任党委书记
    • 院所风貌
  • 机构设置
    • 党的委员会
    • 学术委员会
    • 学位委员会
    • 组织机构
      • 领导机构
      • 咨询机构
      • 研究平台
        • 研究单元
        • 重点实验室(工程中心)
      • 职能部门
      • 研究站
      • 挂靠机构
  • 科研成果
    • 研究领域
    • 科研进展
    • 科研产出
      • 获奖
      • 论文
      • 专著
      • 专利
  • 人才队伍
    • 院士专家
    • 正高级专业技术岗位
    • 副高级专业技术岗位
    • 中科院青年创新促进会会员
      • 2011
      • 2012
      • 2013
      • 2014
      • 2015
      • 2016
      • 2017
      • 2018
      • 2019
      • 2020
      • 2021
    • 特别研究助理及博士后管理
      • 博士后公告
      • 博士后规章
    • 人才招聘
  • 交流合作
    • 学术交流
    • 国际会议
    • 科技合作
      • 合作动态
      • 专利转让信息
      • 合作项目
  • 研究生教育
  • 党建与文化
    • 党群园地
    • 组织文化
    • 形象标识
    • 活动报道
    • 文化副刊
      • 诗歌
      • 书画
      • 摄影
      • 散文
  • 科学传播
    • 时间轴
    • 工作动态
    • 科普作品
      • 科普文章
      • 科普视频
      • 其他
    • 科技期刊
  • 信息公开
    • 信息公开规定
    • 信息公开指南
    • 信息公开目录
    • 信息公开申请
    • 信息公开年度报告
    • 信息公开联系方式
  • 重要新闻
  • 党建动态
  • 综合新闻
  • 媒体报道
  • 学术报告
  • 通知公告
  • 最美科学家
  • 专题
  • 专题
    • 学习两会精神
    • 学习宣传贯彻党的二十大精神
    • 中国科学院2022年度工作会
    • 2021年终科技盘点
    • 中国科学院“基础研究十条”
    • 十九届六中全会
    • 党史学习教育
    • 不忘初心牢记使命
    • 十九届五中全会
    • 率先行动
    • 两学一做
    • 防灾减灾
    • 十八届四中全会
    • 喜迎十八大
  • 快捷通道
    • OA系统
    • 继续教育网
    • ARP
    • 违法违纪举报
    • 信访渠道
    • 图书馆
    • 正版软件
    • 网站地图
  • 友情链接
    • 新闻媒体
    • 政府机构和组织
    • 国内院校
    • 国内科研机构
    • 国际科研机构
  • 网站纠错
科普作品
科普文章
科普视频
其他
科普文章
您当前的位置:
首页 科学传播 科普作品 科普文章

科普文章丨嘿,siri!嘈杂的酒吧里,AI为什么听不懂指令?

发布时间:2020-12-22 作者:中科院噪声与振动重点实验室 孙雪聪
【  小 中 大  】

  不知道你是否有这样的经历,月底穷困潦倒的你中午走进人潮喧哗的食堂,正在心里疯狂比较哪个菜更便宜时,忽然听到五米开外某人的一声“咱们发工资了”,于是你理直气壮地对食堂大妈喊道:“加个鸡腿!”

  

  (图片来源:修改自《家有儿女》)

  还有,不管在哪里,周围有多吵,一旦有人叫自己的名字,总是能听到。人能够在如此嘈杂的环境下精确捕捉到想听到的声音,甚至还能知道声音的方位,相比之下,现在的很多智能设备却做不到这一点,这究竟是为什么呢?

  Part. 1

  人的听觉为什么具有选择性

  说起人的听觉,有一个著名的效应——鸡尾酒会效应,它是指在喧闹的鸡尾酒会上,参会者大脑中的听觉系统可以将他的注意力集中约束在他感兴趣的谈话内容上,而自动忽略其他“无关”的噪声,即使周围环境非常嘈杂。

  然而,这种我们人类用两只耳朵就能搞定的小问题,对于智能音箱等语音交互设备来说,却并不是那么容易的。当它们身处嘈杂的环境时,很容易就受到各种来路不明的声音的连环暴击,最终陷入我是谁我在哪我在干嘛的死循环中无法自拔(感兴趣的同学可以打开你身边的语音交互设备尝试一下)…

  于是,攻(工)城(程)狮(师)们本着大力出奇迹的原则,不惜斥巨资为它们装上很多个金光闪闪的麦克风用来接收声音,又去全世界各地搜罗各种各样的声音数据,没日没夜地投喂它们。但是,机器们学习的效果不是十分理想,鸡尾酒会问题至今仍然困扰着世界各地的语音攻城狮们。

  

  这时有的同学可能就要坐不住了:“就这?还用学?看来我的学霸属性就要藏不住了!”这位同学你先冷静一下,事情可并不是你想的那么简单哟。

  其实,你能具有这种听觉选择能力首先要感谢你的妈妈给了你两只忽闪忽闪的大耳朵,这使得你的耳膜并不是像麦克风一样是直接裸露在空气中的。你的耳廓、头部、肩膀、躯干等身体部位对于声音来说像是一个“迷宫”,来自不同方位的声音需要从不同的入口进入,经历上述部位的一系列反射后最终到达“迷宫”的中心——耳膜,然后你的大脑就能感知到这个声音啦。

  由于声波所走过的路径不同,它们的频谱也会发生不同程度的修改。在这个“迷宫”的不同位置,仿佛潜伏着一群造型师(没错,就是让你又爱又恨的Tony老师),声波路过时总是难免被“改造”一番。由于这些造型师们风格迥异、水平参差不齐,在大脑看来,这些声波就变得各有特色,所以很容易区分,怎么说呢…有点像…

  

  所以当你还是个小baby的时候,你还没能累积足够多的听音经验,你的大脑对这些改造过的声音可能一时无法辨认,因此导致你对声音的辨别能力可能比较弱。随着你慢慢长大,听到的声音越来越多,你的大脑就会慢慢摸清套路,建立一套自己的算法(数据库),这样即使是好几个声音同时出现在你面前,你也能很轻松地区分他们。

  Part. 2

  机器怎么获取辨音能力

  那么问题来了!能不能让机器像我们人一样,拥有能够分辨不同声音的能力呢?答案是肯定哒!前不久,中科院声学所的杨军研究员团队就提出了一种基于声学超材料的单通道多声源定位与分离系统,只使用一个带有超材料外壳的单通道传声器,即可实现三维空间中多个同时发声声源的实时定位与分离。研究成果发表在了综合类期刊Advanced Science上。

  

  别...别激动…说人话就是——给麦克风做了一个忽闪忽闪的“大耳朵”,不过这个耳朵跟我们的耳朵差别有点大,它长这样…

  

  左图:超材料结构模型图 右图:超材料结构实物图

  (图片来源:作者绘制与拍摄)

  我们暂且叫他“蜂窝耳”吧。这个“蜂窝耳”由外中内三层半球壳嵌套而成,每一层球壳上都随机设置大小不一的圆孔,球壳之间随机插入了若干块横向和纵向的挡板来制造大小不一的腔体,在球心位置则放着一个单通道的麦克风。这些大小随机的圆孔和隔板使“蜂窝耳”具有高度的空间不对称性,因此会对来自不同方向的声波起到不同的调制效果。

  这个“蜂窝耳”中的声学结构就像是一个个风格迥异的Tony老师,声波经过时总是难逃老师们的“改造”,这位老师画个眉毛,那位老师涂个口红,所以等它到麦克风的面前时,早就不是它原本的样子啦。

  你可能已经猜到,“蜂窝耳”的学名就是——声学滤波器。刚才所说的声波的“改造”过程其实就是滤波过程,滤波后的声信号频谱会发生相应的改变,因此被麦克风接收到的信号就会产生与来波方向有关的差异性了。

  那么问题又来了——你以为声波们长得不一样,机器就能很快辨别出来吗?想得美!

  我们还需要训练一个算法,让机器提取这些声波身上的独家特征,最终定位和识别来自不同方向的声音。拥有这个算法就好像拥有了一本Tony老师们的《造型百科全书》,里面记录了各位Tony老师的改造技能和偏爱风格。从某种意义上说,这个算法也可以帮助广大男同胞完美应对女朋友每日的灵魂拷问:“你觉得我今天有什么不一样吗?”是不是很想来一套!

  

  Part. 3

  机器戴耳记

  一切准备就绪,我们的“蜂窝耳”就可以正式上岗啦!

  来自不同方向的声波从外表面不同的位置进入“蜂窝耳”,经过不同的传播路径时被不同的造型师改造,被球心的麦克风接收;熟读《造型百科全书》的算法对接收信号进行处理,最终重建出它们的来波方向和声音的内容。这种超材料结构+智能算法的组合,只用一个麦克风就能实现多声源的实时定位和分离。攻城狮们再也不用担心麦克风数量不够用啦!

  

  “蜂窝耳”的工作流程

  (图片来源:作者绘制)

  你是不是也很好奇“蜂窝耳”的效果如何呢?来看看研究人员针对多个生活场景进行的听音测试。

  

  实验场景(图片来源:作者拍摄)

  “蜂窝耳”(图片红框里)放在中间,周围均匀放置16个音响用于播放测试所用的声音。测试所用到的声音包括马路上的鸣笛声、动物的叫声、各种乐器声、人说话的声音等等,好奇心爆棚的笔者曾一度跑到“蜂窝耳”的位置,试图挑战一下这个听音测试,当时的场景大概是这个样子的…

  

  不过,这对训练有素的“蜂窝耳”来说就是小菜一碟啦。当空间中同时发声的声源不超过三个,定位与分离的准确率可以达到90%以上,耗时也不超过1s,是不是棒棒哒!

  当然,现在的“蜂窝耳”还只能算一个小baby,它的声学结构设计和后端算法仍有待进一步的磨合和提升,研究人员也正在马不停蹄地研发“蜂窝耳”2.0版本。随着语音技术的发展,我们身边越来越多的电子设备都搭载了语音交互系统,希望这个“蜂窝耳”能让这些设备更加智能,使人与机器之间的交互更加流畅和便捷。

  参考文献:

  SUN Xuecong, JIA Han, ZHANG Zhe, YANG Yuzhen, SUN Zhaoyong, YANG Jun. Sound Localization and Separation in 3D Space Using a Single Microphone with a Metamaterial Enclosure. Advanced Science n/a, 1902271.

  论文链接:https://doi.org/10.1002/advs.201902271

  出品:科普中国

  制作:孙雪聪(中科院声学所 中科院噪声与振动重点实验室)

  监制:中国科学院计算机网络信息中心

  (本文中标明来源的图片已获得授权)

  文章仅代表作者观点,不代表中国科普博览立场

  本文来源于“中国科普博览”公众号(kepubolan),转载请注明公众号出处

  


附件下载:

上一篇:

科普文章丨耳机里的声音为什么会有方向感?

下一篇:

科普文章丨高铁噪声大?用特殊声波怼回去,世界一片清净

旧版回顾 | 网站地图 | 联系我们
© 1996 - 2021 中国科学院声学研究所 版权所有备案序号:京ICP备16057196号-1
京公网安备110402500001号地址:北京市海淀区北四环西路21号中国科学院声学研究所
邮编:100190
官方微信