在 2024 世界政府峰会上,英伟达 CEO 黄仁勋表示「每个国家都需要拥有自己的人工智能基础设施,以便在保护自己文化的同时利用经济潜力……它(AI)记录了你的国家文化、社会智慧、常识、历史——你拥有你自己的数据」。从某种意义上讲,经过大规模训练的 AI 模型,本身就是一种文化缩影。
但对中国用户来说,选择一个可以「代表自己」的 AI 大模型,事情就有些复杂:中国在普通话的基础上,还保留着璀璨的方言文化。时至今日,国内依然有不少长辈只能用方言交流。以国内最多用户使用的方言——粤语为例,在经济、文化、社群效应的影响下,粤语早就不仅仅是一门「南方方言」那么简单:
根据 Ethnologue 的数据,粤语的母语使用者大约有 8600 万人,在南方、东南亚甚至全球各地的华人社区中也广泛使用。这使得粤语在全球范围内有着重要的影响力,并成为全球第 19 大最广泛使用的语言。
尽管粤语用户不少,但由于粤语有自己独特的文字、读音和书写习惯,这种书面语-口语分离(Diglossia)的情况为粤语 AI 大模型的研发带来了相当大的挑战。即使是前段时间发布的、代表 AI 行业「顶尖水平」的 ChatGPT 4.0,在粤语领域的表现也一塌糊涂:
不仅不理解广东话语境下的常用口语,连语音合成的效果都支离破碎——除了口音听起来像讲不同粤语的外国人,在遇到无法合成的读音时,甚至会自顾自讲普通话。以至于在很长一段时间里,被戏称为「人工智障」的 Siri,反而是粤语体系中效果最好的 AI 助手。
图片来源:雷科技
但很快,广大粤语用户将迎来更好用的粤语 AI 大模型:2024 年 5 月 29 日,在香港扎根多年的本土 AI 企业商汤科技,在商汤科技十周年这个时间节点,正式发布了基于 SenseNova 5.0(日日新 5.0)的「粤语分支」——SenseChat 粤语版。此外,商汤科技也宣布了未来在国内 AI 领域的最新动向。
真正懂粤语的大模型产品
根据商汤科技的介绍,SenseChat 粤语版是基于 SenseNova 5.0 的一个分支。尽管粤语的语言习惯非常复杂,但得益于 SenseNova 5.0 的通用性,和商汤科技长期扎根香港换来的对粤语的理解,商汤只用了三四个月就交出了 SenseChat 粤语版这份答卷。
首先在粤语内容的训练上,商汤科技为 SenseChat 粤语版准备了大量的训练内容,不仅让 SenseChat 粤语版可以听懂复杂的粤语发音,还可以理解粤语地区的口语、俚语,比如「白车(救护车)」「磅水(给钱)」,甚至连「红 Van」「填 From」这种香港本地独有的「粤英混合」语句都能应对自如。
图片来源:雷科技
商汤科技也强调,由于商汤科技是本地企业,和海外竞品相比,SenseChat 粤语版无论是知识库的时效性,还是语音合成的准确度上,表现都更加优秀。发布会上,商汤科技更是直接用 SenseChat 粤语版和最新的 ChatGPT 4.0 做对比,表现可以说全面领先。
因 SenseNova 5.0 是一个多模态模型,所以 SenseChat 粤语版同样沿袭了 SenseChat 通用版的多模态能力:除了最基本的语言交互外,SenseChat 粤语版同样支持图片、文档等形式的内容交互。更重要的是,因针对粤语的习惯进行了专门的学习,SenseChat 粤语版可以真正理解照片、文档中的内容。
图片来源:雷科技
在发布会上,商汤科技就演示了用 SenseChat 粤语版看菜单,根据用户的具体需求推荐对应餐品的场景,对广大「点菜选择困难症患者」来说相当实用。
至于我们什么时候才能用上 SenseChat 粤语版,商汤科技也给出了明确的答案:「商量粤语版」 AI 大模型会提供 Web、App 两种不同形式的服务,将在很快正式向粤语区用户开放。功能上 Web 版和 App 版基本一致,但当前的测试版中,语音交互功能仅在手机 App 中提供。考虑到这一服务对全球粤语用户的重要性,商量粤语版Web 版和 App 版也将永久免费,粤语区用户在注册后也能免费使用。
图片来源:雷科技
用通用性为行业赋能
面向一般公众的商量粤语版宣布永久免费,而 API 方面,商量 5.0 粤语输入、输出的定价均为 30 港币每百万 Tokens。如果和国内高度内卷的 AI 服务定价相比,商量 5.0 粤语版的定价看似竞争力有限。但对于这个定价,商汤科技也有自己的看法:
图片来源:雷科技
目前商量 5.0 粤语版是首个支持粤语俚语理解的大模型,也是一个多模态的通用模型。从简单的粤语电话客服,到对时效性、准确度有极高要求的金融科技(FinTech)、法律、医疗领域,我们都有可能看到商量 5.0 粤语版的身影。而这种高时效性、高精准度的 AI 运算,对背后的算力资源有极高的要求,而在算力资源总量不变的情况下,更高的算力需求也意味着更高的定价。
商汤科技也在想办法为自己的算力扩容。目前商汤科技在上海临港产业区已经有了自己的算力中心,目前算力已达到 8400 PFLOPS,强大算力可支撑超过 20 个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。前段时间,前海深港人工智能算力中心也正式启动,一期算力已经达到 500 PFLOPS。商汤科技也会与深港两地合作,在深港自贸区部署更多的算力资源。
未来,商汤科技也将实现港深沪闽自贸区算力协同,在保证数据合规的前提下实现算力融合,让更多用户可以享受到更高效的服务。
算力是 AI 发展的基石
其实从商汤科技对算力的持续投入上,我们不难得出一个结论:在未来,算力的提升将是 AI 行业的首要任务。
随着模型不断迭代,AI 模型的规模和复杂度正在迅速增长,例如 OpenAI 的 GPT 系列参数量从最初的数百万增加到现在的数千亿,训练时间和计算资源的需求也随之大幅提升。不仅仅是语言模型,计算机视觉、语音识别和自动驾驶等领域的 AI 应用也在不断提高对算力的要求。更高的分辨率、更复杂的场景和更实时的反应都需要更强大的计算能力来支撑,因此,提升算力成为 AI 发展的核心任务。
但算力的发展背后意味着高昂的投入,为了应对日益增长的算力需求,高效利用现有算力资源也将至关重要,而边缘计算的结合成为解决这一问题的重要途径。边缘计算将计算能力下沉到设备端,减少数据传输的延迟,提升实时处理能力。分布式计算技术的发展也为算力资源的高效利用提供了新的可能,通过分布式训练和推理,AI 模型可以在多个计算节点上并行处理,大幅提升计算效率。
图片来源:雷科技
在提升算力的同时,算法改进在应对算力资源紧缺方面同样起到了至关重要的作用。传统的深度学习模型训练往往需要大量的计算资源,而通过改进优化算法,如引入更高效的梯度下降方法、减少冗余计算、改进参数初始化等,可以显著降低计算复杂度,减少模型训练所需的时间和算力。
其次,稀疏化技术的应用也为算力节约提供了新的路径。稀疏化技术通过将模型中不重要的参数置零,减少了计算量和存储需求。剪枝、量化等稀疏化方法能够在不显著降低模型性能的情况下,显著减少模型的计算需求,从而降低对算力资源的依赖。
而当人人都能用上门槛更低、功能更丰富的 AI 模型时,我们才算是真正踏入 AI 时代。
来源:雷科技
原文标题 : 全球首个粤语大模型来了,商汤SenseChat用AI打破语言障碍