到了 2020 年,AI 人工智慧其实早已深入你我身旁 — 无论是以智慧喇叭的形式,或是在手机内的语音助理。有意思的是就目前的使用体验,原本理应要被人工智慧服务的服服贴贴的人类,却时常变成得要适应 AI,改变自己的讲法等。而这样的「不自然」体验,其实才是 AI 科技目前仍面临的开发挑战。如何与 AI 正常对话,也就是现阶段十分值得努力突破之处。
科技部与国家实验研究院科技政策研究与资讯中心,希望透过 2020「科技大擂台 与 AI 对话 」竞赛的丰厚奖金,悬赏吸引高手挑战带来更进步的 AI 技术的成果。我们电脑王阿达团队有荣幸参加这场竞赛的颁奖典礼,在冠军队伍出炉的紧张气氛之余,更深入了解了台湾在 AI 技术发展的强大表现。
AI 终极竞技场2020「科技大擂台 与 AI 对话 」决赛结果公布
「与智慧音箱沟通却常变成它听不懂我,而必须要迁就它的说法,这样的话人类丰富且优美的语言就不见了。年轻人变成在学习设备的语言。」科技部陈良基部长在今天的访谈中提到这个,AI 与人类对话现阶段面临的问题点 –「这个困难点应该要被解决,而不是人去迁就它。」也因此,政府必须要推动鼓励创新者更深度挖掘 AI 的潜力,透过技术与创意来解决这项挑战。所以才有这个已经举办第二届的「与 AI 对话」竞赛的持续推进。
活动的开始,陈良基部长先是恭喜从 400 人共 99 组团队之中脱颖而出的初赛前 10 名队伍,有机会晋级决赛挑战最高新台币 2,000 万的首奖奖项 — 没错,是单一奖项,不是总金额(看到这是不是觉得应该要锁定「科技大擂台」大赛的最新动向准备一展身手!)。部长观察到这次参赛的队伍有将近 1/3 是来自产业界,代表这项竞赛真的有吸引到高手加入。
台湾可以掌握 AI「话语权」
「三年前当我在推 AI 的时候,我一直强调它对各行各业的重要性… 现在没有 AI 将来可能都活不下去了。」部长指出,要推动 AI 与人类协作的关键点是「AI 也必须听得懂我们讲话才行。」毕竟中文对於 AI 开发来讲是相当困难的语系,但也因为如此,多元语言系统的型态反而会是台湾的优势之所在,更有机会主导这方面的发展。部长认为如果没有抓紧机会、掌握话语权的话,就可能变成反而得以不太习惯的方式来与 AI 对话,更可能因此导致这些语言被 AI 所淘汰而消失。
「如何尽快教 AI 我们台湾优良的语言体系,我觉得是非常重要的。」然而真的要着手发展却比想像中要困难 — 重点是不仅要听得懂,也要能从各种环境中分辨出人的声音。部长提到「早晚 AI 一定可以听得懂人类的直接对话,这技术如果不存在我们就来挑战它!」所以就定出了这个科技大擂台的挑战。目标不仅是分出高下,更希望可以藉此训练 AI 达到与人类直接对话的目标。
▲图:公布最终结果之前,打入决赛的 10 支团队也获得颁发竞赛证书。
难度升级,参赛者依然缴出漂亮成绩!
▲图:让人对 AI 提问的多轮对话挑战,因为混合了许多问题与条件所以其实非常困难。
部长透露首届科技大擂台是拿华语文竞赛的基本门槛 72%,只要达到这个境界就算是达到阶段目标。但去年却还是差了那麽临门的一脚,所以特别期待今年十个队伍是否有机会跨过门槛或是将技术更往前进逼。这次的比赛主要注重的是语意与对话的推演,相较上届以选择题为主、简答题为辅,这届参考了「华语文能力测验」流利精通难度,进一步让参赛者挑战阅读与申论题,以及多轮对话的考验。
▲图:这次活动主办单位也让现场观众体验了 AI 遇到的「难题」。
这次的考题是希望更深化让 AI 可以先「理解」语意,再进一步「思考」以完整的字句对话。有意思的是,我们电脑王阿达团队曾经介绍过的「雅婷逐字稿」,也因为主办单位有与台湾人工智慧实验室(Taiwan AI Labs)合作,被做为产生题目的语言辨识系统。评审委员会则是由中央研究院资讯科学研究所特聘研究员许闻廉担任主席,还邀请了中央大学资工系蔡宗翰教授、辅仁大学中文系刘雅芬教授、暨南大学中文系主任曾守仁教授与淡江大学中文系林伟淑教授共同筹组。
▲图:模拟 AI 对答竞赛的互动相当热烈。
在现场体验 9 题考验的活动之後,最终也正式公布了 2020「科技大擂台 与 AI 对话 」竞赛的决赛结果。虽然很可惜的这次没有团队超过人类测试的标准。但其实透过两届的竞赛,也逐步地朝着 AI 能够模拟人类思考完成与人流畅对话的目标迈进。
▲图:评审主席许闻廉研究员。
评审主席许闻廉研究员认为今年的参赛成绩其实已经相当不错,指出因为目前 AI Model 的推定能力还不是很好,所以很多队在竞赛中都卯足了劲加了不同的 Model 进来,最终结果也还不错。许闻廉老师也提到这次的比赛是比较偏向考验 AI 针对自然语言的推理能力,期待有团队可以创造出新的模式把推理以及 AI 本来就很擅长的统计能力兼顾,未来 AI 将可更接近人类一步。
科技大擂台三强揭晓
虽说很可惜没有团队能超越人类答题的门槛水平,而不能看到 2,000 万奖金发出。不过其实前三名团队的奖项还是非常的丰厚。这次的前三名团队分别可获得 200 万元、50 万元与 30 万元的奖金。团队成绩排名如上,第一名是由「Taipei 101」夺下;「大叔与 AI 对话」则是第二;「A Team」团队得到第三。
获得第三名介绍自己团队成员是来自四面八方效法天龙特攻队的「A Team」表示,能突破重围获奖真的感到蛮讶异的,主要是因为团队成员基本上只有周末才会聚在一起四个小时左右准备这个比赛。被问到对於哪些题目感到苦手,他们则是认为阅读理解的部分应该是最困难的类型。
成员只有一位的「大叔与 AI 对话」的得奖感言,是认为自己虽不是这方面的专家,本身专长是偏影像辨识技术,但其实也是与 AI 有关。第一届就有参加的他,认为科技部办的比赛很有意义,可以鼓励年轻人有个目标可以大家一起努力。
本次的冠军「Taipei 101」很感谢科技部与中研院创造了这样的机会,让他们可以与各界好手聚在一起参加 2020「科技大擂台 与 AI 对话 」的比赛。回答主持人认为的「最大收获是什麽?」则是很直白的说到「当然就是有两百万啦!」
会後「Taipei 101」也在我们电脑王阿达的访谈中透露,在此领域已经耕耘数年的他们,虽说他们原本就有一些相关作品,但因应这次的比赛其实是特别开发了新的聊天机器人,结合自己的 Training Data 参赛才可以对应不同的情境。他们提到,这个系统其实有点像是 One for all 的感觉,让所有情境都可以透过系统很快对应,未来也可以应用在企业做为快速验证市场机制的方式,证明这样的规划是可以实际应用在生活之中。
▲图:这次的竞赛中「中研问答」团队在多轮对话项目中超越多数队伍的 4~8 分,取得了 14 分的优良成绩(人类测试可取得 18 分),优异表现也获得了评审委员会一致推荐获颁 10 万元鼓励奖金。
结论
虽然今年没有达到跨越华语文能力测验精通级的难度,不过举办 2020「科技大擂台 与 AI 对话」竞赛的目的之一,是透过逐步建立语音标注资料集,用越来越多的资料给 AI 进行深度学习,让 AI 越来越强,经过每次的比赛则使 AI 更为提升精进。现阶段科技部已经提供 1,000 小时的国语语音资料库,可以协助业界发展 AI 相关技术,今年更可再增加 2,600 小时国语语音资料及 100 小时的台语语料(加入台语是因为在台湾,很多人也是会国台语混合使用)。
虽说目前科技部已预告今年 5 月将会释出约 2,600 小时的国语语料,以及 100 小时的台湾闽南语罗马字拼音标注的台语语料。陈良基部长搜集专家意见,则是认为未来语料库目标要可以尽快达到 3,000 ~ 5,000 小时左右,并且涵盖包括中文、台语甚至是客家语与新住民语系,期望可以将这个成果分享给台湾的各行各业使用。也邀请企业、学研机构齐力投入推动台湾 AI 技术,打造在地化的 AI 语音对话应用。