岂北

7.对话柯登峰|识别率93.6%!我如何教会AI说潮汕话


Listen Later

本期简介

嘉宾:柯登峰,澄海人,北京语言大学信息科学学院副教授,中国计算机学会语音专委会执行委员,全国汉语方言学会授课专家

主播:子昂,澄海人,现在京从事文化行业

教会AI讲潮汕话,到底有多难?

曾经我们觉得,潮汕话是“加密语言”,是算法无法攻克的堡垒。但随着这两年AI不断“攻城略地”,我们似乎又会觉得,没有什么是AI拿不下的,潮汕话被它攻下,仿佛只是一件可以“静待花开”的事情。

但是,跟登峰兄聊完之后,我才发现,事实远比想象中复杂。

打个可能不太恰当的比喻:潮汕话就像一匹难以“驯服”的野马。它有规则之外的变调,不统一的书写,以及十里不同音的倔强,很多时候,连语言学家都会为此感到头疼。

但正是面对这样一个难题,登峰兄带着他的团队一次次发起挑战。经过两年时间,如今他们的潮汕话识别准确率已经达到93.6%,这应该是目前市面上还从未见过的高水平。

在语音识别领域,登峰兄资历很深。读书期间,他就参与了多项应用于实践的智能语音系统研发;后来,又参与研发了中国第一套口语语音自动评分系统和汉语作文自动评分系统;他曾作为京师讯飞首席科学家,带领科大讯飞团队完善音乐评测技术;他也曾为天猫精灵(阿里巴巴旗下人工智能品牌)提供第一套语音识别系统。可以说,他一路都在参与和见证语音技术的关键发展。

再后来,在朋友的“怂恿”下,他转身对我们自己的母语发起了“挑战”。

和他聊天,我既能感受到他对家乡文化的深厚感情,也从他那种技术与人文融合的视野中,获得不少新的启发。

目前,登峰兄仍将主要精力放在研发上,但我很期待这项技术能被更多人看到,早日进入应用层面。

如果你也期待,不妨来听听这期节目,同时也欢迎你告诉我(我会转告他哈哈),你希望这项技术被用在什么地方。

时间轴
  • 1:11 从一只会唱潮汕歌谣的“狮头鹅”说起
  • 4:24 一个计算机系本科生为何“闯入”语音世界?
  • 8:25 “深度学习”带来的巨大颠覆,语音识别领域瓶颈的突破
  • 18:36 “驯服”我们最熟悉的母语,到底有多难?
  • 27:37 “技术+人文”的学习路径:如何在研究中补强文科知识?
  • 31:26 同学的“怂恿”:为什么不做潮汕方言的语音识别?
  • 35:13 从专家“取样”到全民“扫描”,技术如何让方言保护更有效?
  • 40:24 文读、白读、“普读”:AI如何应对三种读音并存的现实?
  • 50:00 语言学家也头疼,因为潮汕话总是“不按套路出牌”
  • 56:03 倘若方言“标本化”:课堂传承是拯救还是另一种消失?
  • 1:01:23 落地的期待,如何为潮汕话AI找到合适的应用场景?
  • 1:08:44 花絮:30s潮汕话听力挑战
附录柯登峰老师教学生分析和修改语音的频谱图柯登峰老师教学生分析和修改语音的频谱图柯登峰老师在指导方言基地的学生标注语音数据第17届闽方言学术研讨会现场(在会上,柯登峰老师受邀作《汕头话语音识别系统面临的问题与挑战》主题报告)在汕头市澄海城北小学举办的“潮音汇”潮语传承比赛,让方言保护走进大众生活(柯登峰团队参与主办)

本播客小红书账号:岂北

柯登峰老师相关报道:

专访柯登峰:用技术守护方言,让潮语在数字时代“活”起来

新闻 | 柯登峰团队获广电AI大赛二等奖,祝贺北语信科

新闻|科技赋能语言和文化——我校信息科学学院教师柯登峰及其研究团队发布创新研究成果

播客开头提到的会唱潮汕歌谣的“狮头鹅”澄澄:

全球首款潮汕话AI智能玩具“澄澄”重磅发布

 

「岂北」节目由「声湃 WavPub」提供内容托管和数据服务支持。

...more
View all episodesView all episodes
Download on the App Store

岂北By 陈陈陈陈陈逍遥