从实验室到生产线:科大讯飞用AI“听诊”技术破解工业检测难题
2025年即将收官,盘点这一年国内人工智能产业的重要突破,智能音频技术在工业领域的深度应用成为不可忽视的亮点。今年7月,科大讯飞联合团队在国际声学场景和事件检测及分类挑战赛(DCASE 2025)中获三项冠军,包揽所有参赛任务及赛道第一。这一成绩的背后,是人工智能国家队从技术攻关到产业落地的完整闭环。
“让机器学会听,听懂另一台机器的声音”——这个看似科幻的命题,正在成为现实。在DCASE赛事的机器声纹无监督异常检测任务中,参赛团队需要仅凭机器运行的声音,判断设备是否处于正常状态。今年该任务吸引了35支队伍参赛,创历年之最。科大讯飞研究院联合中科大语音及语言信息处理国家工程研究中心、国家智能语音创新中心等单位组成的联合团队,凭借全国产自研技术方案脱颖而出。
技术突破的关键在于自主创新。联合团队构建了基于9万小时海量数据训练的声纹预训练模型底座,创新设计师生双分支自蒸馏网络和时频域均衡特征提取方案。这套全栈自主可控的技术体系,从底层算法到模型架构均实现国产化自主研发,为打破国外技术垄断提供了有力支撑。
作为承建认知智能全国重点实验室的大模型国家队核心成员,科大讯飞在智能语音领域深耕二十余年。依托语音及语言信息处理国家工程研究中心的科研积累,以及国家新一代人工智能开放创新平台的资源优势,科大讯飞持续推动前沿技术向产业应用转化。
国际赛场的冠军技术如何服务实体经济?答案写在一线生产现场。目前,科大讯飞已将相关技术转化为AI工业听诊器、AI声学成像仪等系列产品,覆盖电力能源、矿山开采、钢铁冶金等多个工业领域。
在电力行业,AI工业听诊器已进驻芜湖特高压、淮南特高压等国家级重点工程,实现对变电站设备的全天候声纹监测,可精准识别局部放电、设备异响等早期故障隐患。在南水北调洪泽站,该技术同样守护着国家水利命脉的安全运行。截至目前,产品已部署至安徽、浙江、内蒙古、广东等近20个省份的数百个场站。
效率提升更为直观。在首钢集团的应用案例中,AI声学成像仪将管道泄漏检测时间从传统的5小时压缩至30分钟,效率提升10倍,并成功定位22处泄漏点。国家智能语音创新中心推出的电机声纹智能质检方案,实现无需停机停产的在线检测,准确率高达98.5%。
“声音是设备健康状态最直接的反映,但过去只能依赖老师傅的经验。”一位电力行业从业者表示,AI听诊技术的普及,让设备巡检从“经验驱动”迈向“数据驱动”,大幅降低了人工成本和漏检风险。
行业分析人士指出,在工业智能化转型的浪潮中,智能音频检测技术正从“锦上添花”变为“刚性需求”。科大讯飞凭借国际顶尖赛事验证的核心算法,叠加深厚的产业化经验,有望在这一细分赛道持续领跑。
大模型时代,AI的能力边界不断拓展。从“听懂”人类语言到“听懂”机器声音,科大讯飞正以人工智能国家队的担当,探索技术赋能实体经济的更多可能。
-
北京耀中成功举办DSE课程说明会 -
银轮股份:站上液冷风口,“千亿事业”有望加速实现 -
ETC最新重要报告全面介绍全球建筑业排放状况和脱碳路径 -
Assembly任命Karen Ho为大中华区董事总经理,引领该地区增长 -
Quantinuum宣布具巨大商业潜力的生成式量子人工智能突破 -
AI 与基因组学进步为亚洲肺癌负担带来新希望 -
E Ink元太科技发布75吋E Ink Kaleido™ 3户外大型彩色电子纸广告牌 -
布鲁可携多IP系列产品亮相德国纽伦堡玩具展,持续推进全球化战略布局 -
森林城市再迎重磅利好,数字地位赋能区域发展 -
IBM 发布 2024 年第四季度业绩报告:软件业务双位数增长,自由现金流超全年预期














