声学与电子工程 ​通过仔细规划来成功实现实时声学处理

小编 2024-10-19 电子头条 23 0

​通过仔细规划来成功实现实时声学处理

低延时时、实时声学处理是许多嵌入式处理应用的关键因素,其中包括语音预处理、语音识别和主动降噪(ANC)。随着这些应用领域对实时性能的要求稳步提高,开发人员需要以战略思维来妥善应对这些要求。由于许多大型系统都由芯片提供可观的性能,因此我们往往会将出现的任何额外任务都加载到这些设备上,但我们需要知道,延时时和其确定性是非常关键的因素,如果未仔细考虑,很容易引发重大的实时系统问题。本文将探讨设计人员在选择SoC和专用音频DSP时应考虑的问题,以避免实时声学系统出现令人不快的意外。

低延时声学系统的应用非常广泛。例如,单单是在汽车领域,低延时对于个人音频区域、路噪降噪和车内通讯系统等都至关重要。

随着汽车电气化趋势涌现,路噪降噪变得更加重要,因为没有内燃机产生明显噪音。所以,与汽车道路接触相关的噪音会变得更明显、更扰人。减少这种噪音不仅能带来更舒适的驾驶体验,还能减少驾驶员疲劳感。与在专用音频DSP上部署低延时时声学系统相比,在SoC上部署会面临诸多挑战。这些问题包括延时时、可扩展性、可升级性、算法考量、硬件加速和客户支持。我们来逐一进行介绍。

延时

在实时声学处理系统中,延时问题非常重要。如果处理器跟不上系统的实时数据搬运和计算需求,会导致不可接受的音频断续。

一般来说,SoC会配备小型片内SRAM,因此,大部分本地存储器访问必须依赖缓存。这导致代码和数据的使用具有不确定性,还会增大处理延时。对于ANC这样的实时应用来说,单是这一点就无法接受。但是,事实上,SoC也会运行管理繁重的多任务非实时操作系统。这会放大系统的不确定性操作特性,使其很难在多任务环境中支持相对复杂的声学处理。

图1显示了一个运行实时音频处理负载的SoC的具体示例,在处理更高优先级的SoC任务时,CPU负载出现峰值。例如,在执行以SoC为中心的任务时,包括在系统上进行媒体渲染、浏览或执行应用,可能会出现这些峰值。当峰值超过100% CPU负载时,SoC将不再实时运行,这会导致音频丢失。

图1.除了运行其他任务外,运行高音频负载处理的典型SoC的瞬时CPU负载。1

另一方面,音频DSP的架构是为了在整个信号处理路径(从采样音频输入到处理(例如,音效+噪声抑制)到扬声器输出)中实现低延时。L1指令和数据SRAM是最接近处理器内核的单周期存储器,足以支持多个处理算法,无需将中间数据转存到片外存储器。此外,片内L2存储器(离内核较远,但访问速度仍然比片外DRAM快得多)可以在L1 SRAM的存储容量不够时,提供中间数据操作缓存。最后,音频DSP通常运行实时操作系统(RTOS),确保可以在新输入数据到达之前完成输入数据处理并将其搬移到目标位置,从而确保数据缓冲区在实时操作期间不会上溢。

系统启动时的实际延时时(通常通过启动发声来表征)也是重要指标,尤其是对于汽车系统,它要求在启动后的某个窗口内播报提示音。在SoC领域,通常采用很长的启动时序,其中包括启动整个设备的操作系统,所以很难或无法满足这个启动要求。另一方面,可以对运行自己的RTOS、不受其他无关的系统优先级影响的独立式音频DSP实施优化,以加快其启动速度,从而满足启动发声要求。

可扩展性

虽然在诸如噪声控制等应用中,对于SoC来说,延时是个问题,但对于想要执行声学处理的SoC来说,可扩展性是另一个缺点。换句话说,控制具有许多不同子系统的大型系统(例如汽车多媒体主机和仪表盘)的SoC无法轻易从低端扩展到满足高端音频需求,这是因为每个子系统组件的可扩展性需求之间始终存在冲突,需要在整体SoC利用率方面进行权衡。例如,如果前端SoC连接到远端收音模组,并且适配多种车型,那么该收音模组需要从几个通道扩展到多个通道,而每个通道都会加剧之前提到的实时问题。这是因为SoC控制下的每个附加特性都会改变SoC的实时行为,以及多个功能所使用的关键架构组件的资源可用性。这些资源包括存储器带宽、处理器内核周期和系统总线结构仲裁槽等方面。

除了有关连接到多任务SoC的其他子系统的问题外,声学系统本身也存在扩展性问题。其中涉及低端到高端的扩展(例如,增加ANC应用中麦克风和扬声器通道的数量),也涉及音频体验扩展,从基本的音频解码和立体声播放一直到3D虚拟化和其他高级功能。虽然这些要求不具有ANC系统的实时限制,但它们与系统音频处理器的选择直接相关。

使用一个单独的音频DSP作为SoC的协处理器是解决音频可扩展性问题的极佳解决方案,可以实现模块化的系统设计和成本优化的解决方案。SoC可以减少对大型系统实时声学处理需求的关注,将这种处理需求转移到低延时音频DSP上进行。此外,音频DSP提供代码兼容和引脚兼容选项,涵盖几种不同的价格/性能/存储容量等级,让系统设计人员能够最大限度地灵活选择适合给定产品层级的音频性能产品。

图2. ADSP-2156x DSP,高度可扩展的音频处理器

可升级性

随着如今的汽车越来越普遍地采用OTA,通过发布关键补丁或提供新功能进行升级变得越来越重要。由于其各个子系统之间的依赖性增加,这可能会导致SoC的关键问题。 首先,多个处理和数据移动线程会在SoC上争夺资源。在添加新功能时,尤其是在处于活动高峰期间时,这会加剧处理器MIPS和存储空间的竞争。从音频的角度来看,其他SoC控制域中的新增特性可能会对实时声学性能产生无法预测的影响。这种情况带来的一个负面影响是:新功能必须在所有操作平面上进行交叉测试,导致彼此竞争的子系统的各种操作模式之间出现无数排列组合。所以,每个升级包的软件验证次数都会成倍增加。

从另一个角度来看,可以说除了受SoC控制的其他子系统的功能图谱外,SoC音频性能的改善还取决于可用的SoC MIPS。

算法开发与性能

显然,在开发实时声学算法时,音频DSP旨在达成任务目标。与SoC的显著区别在于,独立音频DSP可以提供图形化开发环境,让缺乏DSP编码经验的工程师能够在其设计中集成高质量的声学处理。这种类型的工具可以在不牺牲质量和性能的情况下通过缩短开发时间来降低开发成本。

例如,ADI的SigmaStudio®图形音频开发环境提供多种集成至直观的图形用户界面(GUI)的信号处理算法,从而能够创建复杂的音频信号流。它还支持采用图形A2B配置进行音频传输,非常有助于加快实时声学系统开发。

音频辅助硬件特性

除了专为高效并行浮点计算和数据访问而设计的处理器内核架构外,音频DSP通常还采用专用的多通道加速器来运行通用算法,例如快速傅立叶变换(FFT)、有限和无限脉冲响应(FIR和IIR)滤波,以及异步采样速率转换(ASRC)。这样允许在内核CPU之外进行实时音频滤波、采样和频域转换,从而提高内核的有效性能。此外,由于它们采用优化的架构,提供数据流管理功能,所以有助于构建灵活且方便用户使用的编程模型。

由于音频通道数量、滤波器流、采样速率等增加,我们需要使用配置程度最高的引脚接口,以支持在线采样速率转换、精密时钟和同步高速串行端口来高效的路由数据,避免导致延时或外部接口逻辑增加。ADI公司的SHARC®系列处理器的数字音频互连口(DAI)就展现了这种能力,如图4所示。

图3. ADI公司的SigmaStudio图形开发环境

图4. 数字音频互连(DAI)框图

客户支持

在使用嵌入式处理器进行开发时,我们常常会忽略一点,即客户对设备的支持。

尽管SoC供应商提倡在他们的内置DSP产品上运行声学算法,但在实际使用时这会带来一些负担。一方面,供应商的支持通常更复杂,因为SoC应用开发领域一般不涉及声学专业知识。因此,往往很难为想要基于SoC的片内DSP技术开发自己的声学算法的客户提供支持。而是由供应商提供标准算法,并收取可观的NRE费用,然后将声学算法移植到SoC的一个或多个内核中。即使如此,也无法保证一定能成功,在供应商无法提供成熟、低延时的框架软件时更是如此。最后,适合基于SoC的声学处理的第三方生态系统往往相当脆弱,因为这个领域不是SoC关注的重点。

显然,专用音频DSP 可为开发复杂的声学系统提供更强大的生态系统,从优化的算法库和设备驱动程序到实时操作系统和易于使用的开发工具。此外,有助于加快产品上市的以音频为主的参考平台(例如ADI的SHARC音频模块平台,如图5所示)对于SoC来说比较少见,但在独立音频DSP领域却很常见。

图5. SHARC音频模块(SAM)开发平台

总之,很明显,设计实时声学系统需要细致、战略性的规划系统资源,不能单单通过在多任务SoC上分配处理裕量来进行管理。相反,针对低延时处理而优化独立的音频DSP有望提高其耐用性,缩短开发时间,实现出色的可扩展性,以适应未来的系统需求和性能等级。

行业发展历程概述智研——电声产业百科【753】

摘要: 20世纪80年代后,全球电声产品跟随着视听娱乐产业和消费电子产业的发展浪潮,也迅速进入到了千家万户中。近年来全球移动通信和计算机产业规模已大大超过传统的设备产业规模,电子信息产品的成长和普及,也带动了电声音响产业的发展。据统计,2022年中国无线耳机产品产值为994亿元,音箱产品产值为662亿元;2023年中国无线耳机产品产值约为1030亿元,音箱产品产值约为680亿元。

一、定义及分类

“电声”一词是电子音响(Electroacoustics)的简称,是指研究声音的产生、传播、处理和应用过程中涉及到的电气和机械系统,是声学与电子工程的交叉学科领域。电声产品是指利用电磁感应、静电感应或压电效应等来完成电信号和声音信号转换的产品,其主要类别包括耳机、音箱等。

电声按照应用领域可以分为消费电声、专业电声;按照技术功能可以分为声音采集、声音处理、声音放音;按照设备类型可以分为麦克风、扬声器、声学传感器;按照技术原理可以分为传统电声技术、先进电声技术;按照信号处理方式可以分为模拟电声、数字电声。

二、行业政策

1、主管部门及监管体制

根据《国民经济行业分类(GB/T4754-2017)》,电声行业属于“C39计算机、通信和其他电子设备制造业”中的“C3984电声器件及零件制造”。电声行业的主管部门是国家工业和信息化部。国家工业和信息化部负责提出新型工业化发展战略和政策,协调解决新型工业化进程中的重大问题,拟订并组织实施工业、通信业、信息化的发展规划,制定并组织实施行业规划、计划和产业政策。行业的自律组织为中国电子音响行业协会,协会的主要责任是对行业进行调研,与政府部门沟通交流,反映行业发展情况及企业的愿望和要求,提出相关建议等。

2、相关政策

(1)国家层面

电声行业属于国家鼓励发展的产业,享受多项政策支持。近年来,国家相继发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》《基础电子元器件产业发展行动计划(2021-2023年)》《2022年国务院政府工作报告》等政策文件,促进了中国消费电子产业链的发展,为中国消费电子产业国际竞争力的提高打下坚实的基础。这些行业政策对电声行业产生的重要影响,政策促使产业结构优化和工业转型升级,推动生产方式向智能化和精细化转变,用自动化技术改造和提升制造业,优先发展电子元器件、语音识别等重点领域。

(2)地方层面

中国电声行业近年来发展迅速,国家层面政策环境对于行业的发展起着重要的推动和引导作用。与此同时,各省市发布了一系列政策进一步推动电声行业及相关电子元器件产品突破和推广应用。部分地方层面电声行业相关政策如下:

三、发展历程

电声音响是人们用声音的方式传递信息和传播文化艺术必不可少的组件。它具有对声音的接受、转换、传输、重放和测量等功能。对人类生活的各个方面都有巨大的作用。中国电声音响行业大体经历的几个发展阶段如下:

四、行业进入壁垒

电声行业是一个涉及声音处理、音频设备制造、音频软件开发等多个领域的行业,因此,电声行业进入壁垒可能是由于多种因素导致的。首先,高端音频处理技术、声音识别技术、语音合成技术等方面的专利和专业知识可能构成技术壁垒,使得新进入者难以与已有的企业竞争。其次,电声行业制造商需要具备大规模的生产能力,因此,行业需要大量的资金进行研发、生产和市场推广,资金充足的大型企业可能会通过不断投入资金来巩固自己在行业中的地位,对新进入者形成一定的资金壁垒。最后,市场上已有的品牌知名度、客户基础、渠道资源等都构成了市场壁垒,新企业想要进入可能需要花费大量的时间和资金来建立自己的品牌和渠道,因此,电声行业对新进入者具有较强的客户资源壁垒。

五、产业链

1、行业产业链分析

电声制造企业的上游为电子元器件、精密组件、塑胶五金件、电池、线材等生产类企业以及工业设计、软件算法和芯片设计等服务类企业。由于声学产品的更新迭代速度较快,行业内企业若想把握市场潮流、快速响应客户,则需要对自身的原材料采购、供应链管理提出较高要求。其中:电子元器件产业的发展主导着产品的性能表现和关键竞争力,其供应材料的效率、质量和价格,一定程度上影响了电声行业企业的交货周期、产品质量和价格竞争力。

电声制造企业位于行业中游,电声制造企业主要以ODM、OEM模式开展业务。OEM模式下,电声企业根据客户提供的产品方案和技术要求进行原材料的采购和产品的生产制造,客户负责产品的设计、研发、销售和服务环节。电声制造企业根据客户具体要求进行生产后,将成品直接销售给客户。国际品牌厂商有苹果、哈曼、三星、索尼,国内的大中型电声企业有歌尔股份、通力股份、国光电器等。

电声行业下游应用于智能手机、互联网企业、电脑、汽车、电视、智能家居、可穿戴设备等领域,主要客户为为声学领域品牌厂商,主要包括国际知名消费电子企业和互联网头部企业等。电声行业产业链具体如下:

注: 本文转自智研产业百科 平台,如需获取更多行业信息和定制服务,可进入智研咨询 搜索查看。

智研产业百科 是智研咨询推出的产研工具平台,致力于为您提供全方位的百科式产业信息查询服务。智研咨询 践行用信息驱动产业发展的企业使命,完善和丰富企业方法论,依托产业百科平台提升信息价值,持续为行业发展及企业投资决策赋能。电声 产业百科作为电声 产业一站式系统化研究工具,全面归纳了电声 产业知识信息,内容涵盖电声 产业的定义、分类、政策、产业链、竞争格局、发展趋势等,并依靠信息技术建立智能互链的行业知识图谱,为行研从业者及相关投资者提供深入的洞察力和全面的信息。

智研咨询 以“用信息驱动产业发展,为企业投资决策赋能”为品牌理念。为企业提供专业的产业咨询服务,主要服务包含精品行研报告、专项定制、月度专题、可研报告、商业计划书、产业规划 等。并提供周报/月报/季报/年报 等定期报告和定制数据,内容涵盖政策监测、企业动态、行业数据、产品价格变化、投融资概览、市场机遇及风险分析等。

相关问答

声学 属工科吗?

声学专业设有电声工程和超声技术两个培养方向。电声工程是以电子技术、应用声学和声电换能原理为技术支撑的一门交叉性、应用型学科。超声技术是20世纪发展起...

声学 是什么? 申请方

[回答]声学,是物理学的一个分支。其实,声学的定义很简单,就是研究声波的产生、传播、接收和效应的科学。通俗一点,就是关于声音的学问,就叫声学。声音从产...

电子 信息 工程 大类下都还细分那些专业啊?哪位前辈能系统的说...

基本应该是包括电子信息工程、电子科学与技术、通信工程、微电子科学与工程、光电信息科学与工程、信息工程这么几个细专业吧,这几个学科都可以归到...

声学 所换能器方向属于理科还是工科?

声学所换能器方向既涉及到理科的物理、数学等基础理论学科,又涉及到工科的机械设计、电子工程等实际应用学科。从理论角度来看,声学所换能器方向属于物理学的...

戴姆森耳机是德国的吗?

是德国的勒姆森是德国的一个耳机品牌,其创始人AndressHenschke出生于德国著名音乐世家,在声学和电子工程上有很深的研究。他带领的团队在欧洲设有专门的设计...

什么是 声学 ?

声学是指研究声波的产生、传播、接收和效应的科学。声学是物理学中最早深入研究的分支学科之一,随着19世纪无线电技术的发明和应用,声波的产生、传输、接收和...

豪恩集团和深圳市豪恩 声学 股份有限公司是什么关系?

从属关系。深圳市豪恩声学股份有限公司是于2008年6月经股份制改制成立的国家高新技术企业,公司的前身是1996年成立的深圳市豪恩声学股份科技有限公司。作为豪...

电子 信息 工程 专业考研可以报考哪些研究所?

从事电子信息方向研究的研究所很多,电子所(雷达),微电子所,声学所(电声学,网络以及嵌入式开发等),半导体所和微系统所,还有自动化所这几个都不错,这就...声学...

水声 电子 信息是属于水声 工程 吗?

属于,水生电子信息类专业肯定属于水声工程类专业。水生电子信息类专业基本修业年限为四年,授予工学学士学位。该专业旨在培养具有坚实的数学、物理、水声学原...

声学 定律

声学是指研究声波的产生、传播、接收和效应的科学。声学是物理学中最早深入研究的分支学科之一,随着19世纪无线电技术的发明和应用,声波的产生、传输、接收和...