伦敦大学学院宋文辉教授团队:革命性突破!仿生压电纳米纤维智能听觉系统,超越人类听觉的精准声源定位

  • 发布时间:2025.07.23
  • 作者:wemaxnano

研究背景:听觉障碍与现有技术的局限

引言:听觉是人类感知世界的重要途径,不仅关乎语言交流,还影响空间定位和环境感知。全球约有4.3亿人患有不同程度的听力损失,传统助听器和人工耳蜗虽能部分恢复听力,但在声源定位(尤其是垂直方向)和复杂环境下的语音识别上表现不佳。

现有技术的核心问题

  • 空间线索不足:人类依赖双耳时间差(ITD)和强度差(ILD)进行水平定位,但垂直定位需依赖头部相关传输函数(HRTF)等复杂频谱线索,现有设备难以模拟。
  • 通道限制:人工耳蜗仅提供24个频率通道,远少于人类耳蜗的3500个通道,导致音乐、语调感知能力低下。
  • 非线性信号丢失:传统压电器件仅捕获一阶共振信号,忽略高阶共振中的频谱信息,影响定位精度。
  • 自然听觉的启示:人类耳蜗通过基底膜的螺旋结构和毛细胞的机械电转换实现频率分离,而大脑通过整合时空线索构建声学地图。这一过程激发了研究者开发仿生压电听觉系统的灵感。

伦敦大学学院宋文辉教授团队在《Science Advances》发布了“基于压电纳米纤维的智能听觉系统”(ST-PiezoAD)的最新成果。该团队通过构建螺旋式梯度纳米纤维阵列并融合神经网络,成功实现超人类精度的三维声源定位。这一成果为下一代人工耳蜗与可穿戴听觉设备提供了仿生新范式。

创新亮点:仿生设计与人工智能的完美结合

本研究提出了一种螺旋蹦床式压电纳米纤维声学器件(ST-PiezoAD),结合深度学习模型,实现了超越人类听觉的声源定位能力。其创新点包括:

1仿生螺旋结构

  • 通过径向排列的PVDF-TrFE/BTO压电纳米纤维,模拟耳蜗基底膜的渐变刚度和频率选择性。
  • 纤维长度和方向呈螺旋变化,形成多共振通道,覆盖更广频谱(图1)。

2多共振信号捕获

  • 传统器件仅利用一阶共振,而ST-PiezoAD通过不对称几何设计和纤维耦合振动,同时捕获高阶共振信号,保留完整的声学线索(图3)。

3人工智能增强

  • 采用注意力机制Transformer模型,从压电信号中提取时空特征,实现水平与垂直方向的精准定位(图5)。
  • 回归预测模型可识别未标注角度的声源(如22°、45°),R²值达0.93。

4超高灵敏度与稳定性

最大灵敏度达1532.9 mV/Pa,信噪比>60 dB,经过4800次测试循环后性能无衰减。

核心实验:从材料到系统的突破

1. 压电纳米纤维的制备与表征

  • 材料优化PVDF-TrFE(75/25 mol%)与6 wt% BTO纳米颗粒复合,电纺成径向排列纤维(图2B)。
  • 力学与压电性能:添加BTO后,纤维模量从103.6 MPa提升至140.6 MPa,但断裂应变降低(图2D-E)。PFM测试显示明显的蝴蝶环和180°相位翻转,证实铁电性(图2F-G) 

2. 器件设计与多共振行为

  • 螺旋电极结构:四通道电极(直径15-30 mm)实现频率分离,通道1(655 Hz)至通道4(190 Hz)覆盖宽频带(图4A-C)。
  • 振动模式:激光测振仪显示振动峰沿径向传播,有限元模拟与实验高度吻合(图4E-F)。

 3. AI模型训练与性能验证

  • 数据集:采集4800组声源方向数据,通过STFT转换为256×256频谱图像输入模型。
  • 方向识别:水平面(xy平面)平均准确率97±3.2%,垂直面(yz平面)92.1±8.1%(图5B-C)。四通道配置下,1°步长识别精度显著优于单通道(图5D)。

4. 扩展应用:语音与音乐识别

设备成功录制并重建音乐(见补充视频Movie S4),并识别莎士比亚戏剧片段,展现多场景适用性。

 

图文导读

图片1(7

1:展示了仿生压电纳米纤维智能听觉系统的整体设计示意图。图中清晰呈现了螺旋蹦床式结构的压电纳米纤维(PVDF-TrFE/BTO复合材料)排列方式,纤维长度和方向呈梯度变化,模拟人类耳蜗的基底膜功能。纤维通过电纺技术径向排列在同心圆电极上,能够将声波振动转换为多通道电信号。背景中加入了人工智能模块的抽象表示,突出了"信号转换-特征提取-方向识别"的全流程整合设计。

 

图片2

2:详细表征了PVDF-TrFE/BTO纳米纤维的材料特性。包含SEM显微照片显示纤维的均匀分布(B图),直径分布直方图显示平均直径约600nm(C图),以及应力-应变曲线揭示添加6wt%BTO后模量提升35%(D-E图)。特别值得注意的是PFM测试结果(F-G图),显示明显的压电响应和180°相位翻转,证实了材料的铁电特性。H-I图则通过示意图揭示了纳米颗粒-聚合物界面的压电增强机制。

 

图片3(7

3:系统研究了圆形压电器件(CT-PiezoAD)的共振行为调控。A图通过短时傅里叶变换展示30mm器件的振动频谱,B图比较不同直径器件的共振频率偏移(从394Hz到210Hz)。C图显示60mm器件在114dB声压级下产生19.41V峰值电压,D-E图则量化了器件在210Hz共振频率下的灵敏度(10.4dBV)。F图总结出器件灵敏度随直径增大而提升,60mm器件最高达1532.9mV/Pa。

 

图片4

4:揭示了螺旋结构器件(ST-PiezoAD)的多通道频率分离特性。A-C图显示四个通道分别对应655Hz、310Hz、210Hz和190Hz的特征频率,呈现类似耳蜗的tonotopic分布。D图的tonotopic剖面显示器件能同时捕获六个共振峰。E-F图的振动模式实验与模拟高度吻合,特别是高频振动(660Hz)在通道1的径向局域化特征,验证了仿生设计的有效性。

 

图片4

5:展示了AI模型在声源定位中的卓越性能。A图描绘了数据采集和模型训练的完整流程。B-C图显示水平面定位准确率达97±3.2%,垂直面92.1±8.1%。D图证明四通道配置在1°精度下仍保持高准确率,显著优于单通道。E图的回归预测展示了模型对未训练角度(如22°)的泛化能力,R²=0.93。插图展示了实时定位演示场景,突显了技术的实用性。

结论与展望:下一代人工听觉的未来

学意义

  • 首次将仿生压电纤维与深度学习结合,实现全向声源定位,填补了人工听觉在垂直定位上的技术空白。

  • 多共振设计突破了传统器件的频率限制,为高保真听觉恢复提供了新范式。

应用前景:

  • 临床医疗:可集成至助听器或植入式设备,改善听力障碍者的空间感知。

  • 人机交互:用于智能耳机、AR/VR设备的实时声场重建。

  • 机器人传感:为服务机器人提供类人听觉,提升环境交互能力。

挑战与改进方向:

  • 微型化:当前器件为毫米级,需缩小至耳蜗尺寸(微米级)。

  • 生物兼容性:长期植入需优化材料的稳定性和生物安全性。

编者按:这项研究不仅是材料科学与人工智能的跨界典范,更为数百万听力障碍者带来了重返自然听觉的希望。未来,随着纳米加工技术的进步,ST-PiezoAD或将成为“电子耳蜗2.0”的核心技术。

 

文献来源:https://doi.org/10.1126/sciadv.adl2741

相关文章

联系我们

  • 电话/微信:18520902353
  • 客服QQ:3597831168
  • 邮箱:info@wemaxnano.com
  • 地址:广东省佛山市南海区狮山镇塘头名创钢材仓储园B区二楼

联系客服二维码

纳米纤维及其应用