大模型兴起,AI商用门槛再降低
沟通是社会存在与进步的基础。从智能音箱到机器人、数字人,这些使用AI技术和人进行沟通的基础都是NLP(自然语言处理技术)。商业场景中人机AI沟通已经非常普遍,例如你要维修电器,企业的售后服务电话首先由机器人接听,人机对话会围绕着你需要维修电器的种类、型号、出现什么故障、你的联系方式和地址等信息展开。
这样的AI机器人几乎每个大企业都在用。“按照2021年招行年报,招行在AI模拟人、辅助人、替代人方面成效显著,在智能客服、语音质检和智能审核、流程智能化这些方面实现超过6000人的人力替代。”招商银行人工智能实验室负责人李金龙表示,“人工智能的工具箱越来越丰富,而大数据、大模型和大算力驱动了人工智能的新一轮发展,大幅提升了AI的适用环境,催生出更多实际应用。”
目前国内已经出现多个AI大模型,腾讯混元大模型、百度文心大模型、鹏城实验室推出的盘古大模型、中国科学院自动化研究所研发的紫东.太初大模型、阿里AI预训练模型M6等。
“超大规模预训练模型的出现,很可能改变信息产业格局。继基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于模型的AI 时代。”清华大学计算机科学与技术系教授唐杰说。
零样本建模
去年4月份,由循环智能和华为联合开发,鹏城实验室提供算力支持的盘古NLP大模型正式在业界亮相,它是业界首个千亿参数的中文大模型。今年6月中旬,在时隔一年之后,盘古NLP大模型的零样本平台推出,支持零样本或少样本训练AI建模,进一步增强了适应的场景、降低了企业使用AI的门槛。
AI建模是AI应用的关键一环,要推动AI规模化、普适化应用,缩短建模时间、降低建模成本、提高模型效率是AI产业化过程中主要的推进目标。对模型做预训练是近两三年兴起的技术,如BERT预训练技术在产业中取得了巨大的进步,之后的GPT3技术也受到业界追捧。
但在实现更大规模的建模、匹配更多类商用场景的过程中,这些技术面临一个巨大的挑战:需要大量的手工调优和标注数据,在处理新场景、新任务时识别准确率低,使得这些技术的建模周期长、普适化应用能力差,无法为业务提供精准支撑。
预训练模型技术在盘古大模型上出现明显提升,基于盘古NLP大模型的零样本建模平台开始商用。
去年推出的盘古NLP大模型拥有 1100 亿密集参数,为了训练这个模型,华为云人工智能首席科技家田奇与循环智能联合创始人杨植麟联合带领研究团队花了近半年的时间,给模型喂了40TB的行业文本数据和超过400万小时的行业语音数据。一年之后的盘古NLP零样本平台,已进化为仅需15亿参数就能实现性能更强、在真实场景得到广泛验证并具备强大工程化支持的大模型平台。
“在NLP这条赛道上,只有实现NLP技术的规模化生产,才能有规模化的商业模式,因此,我们需要一场技术变革。”杨植麟表示。
“零样本意味着无需标注样本,只需提供指令即可完成一个新语义建模,和原来标注几百条样本的效果相当,建模时间从3天降至3分钟;准确率比当前的主流模型提升15%。” 杨植麟称,“该平台现在已经完成超过200个场景的落地验证,通过极致的算法和工程优化,在平台上利用一个普通的2080TiGPU抽取1万小时录音数据,仅需要16分钟。”
盘古零样本平台不仅支持零样本学习,也能支持模型的持续调优和进化。据杨植麟分析,零样本技术目前大概能覆盖70%的客户经营场景,对剩下30%的场景,可以用少样本微调技术进行优化,准确率相比第一代和第二代预训练系统可以有15%的提升,目前在客户画像、客户异议、销售执行、情绪识别、阅读理解等任务的执行中,这种提升幅度都得到了验证。
银行业落地
随着智慧金融、智慧政务、虚拟数字人、数字文旅、在线教育等行业的不断孵化,各行业对NLP技术所带来的智能决策和自主交互能力的需求日益增长。
2021年,招商银行的零售AUM(管理客户总资产)已经达到了约10万亿,在招行的“十四五”规划中,目标是做到20万亿。招行提出,要让人工智能和数字化技术向一线人员赋能,其中提升大量财富管理人员的营销能力、服务能力,就是核心的业务目标之一。
“招行AI实验室和循环智能在语音识别、自然语义理解的研究方向上进行了比较长期的探索和共创,有非常有应用价值的场景上线,例如智能坐席助手,这个项目是用AI的能力帮助坐席人员判断客户的意图,屏幕上能够提示他怎么更好地回复客户的问题,还可以推荐话术。”李金龙说,“这只是项目之一,以后会在人机结合、客户服务、提升效率等其他场景中进行更多的探索和合作。”
循环智能联合创始人、CEO陈麒聪表示:“在推出盘古零样本NLP平台的同时,我们还提出了整体产品方案,可以贴近企业上百种业务场景、支持零样本或少样本训练AI建模及线上线下全渠道采集和分析;不仅为企业对外沟通提供更好用的工具,还可独家提供内容和增长服务,满足不同团队的个性化分析管理需求。”
“在一线赋能方面,循环智能可为金融企业提供所需的AI实时辅助助手和智能工具。”循环智能联合创始人、COO揭发说,“在业务中台能力提升方面,我们专注于提升客户意图洞察力,有效挖掘客户交互信息中的商机,打通各渠道非结构化数据孤岛,并助力企业实现全渠道合规和质检智能化能力升级;在底层AI能力优化方面,我们建议企业构建统一智能化NLP分析平台,以降低人力投入及运营风险,提升运营效率。”
打开沟通 “黑盒”
“我们要对沟通数据进行深度挖掘、精准分析,打开沟通数据的黑盒,让销售和客户经营不再是一门属于顶尖销售顾问的艺术,而是一门可以被量化管理,可以规模化复制的科学。”杨植麟说。
循环智能的整体方案为这些痛点和问题给出了系统性的科学解法。包括“会话分析洞察 Insight”“智能销售助手 Expert”“会话挖掘引擎 Discovery”;包括合规型提升产品 “智能合规质检 Compliance”和“智慧双录助手 Compliance Now”;包括AI能力平台产品“企业级NLP平台”和“企业级ASR自训练平台”。
循环智能的AI产品矩阵在企业的部署实践中体现出“有迹可循”的降本增效价值,可使人均产能提升22%,业务策略执行率提升100%,合规成本降低40%。
随着标注数据需求大幅降低,AI 生产效率将会明显提升,摆脱原来依靠大量样本的落后生产方式,进入规模化量产时代。盘古NLP大模型零样本平台的推出,是AI 预训练技术的一次突破,可以解锁很多新应用、新场景。而找到合适的商用场景,创造预训练模型的商业价值,则是使大模型平台正向滚动发展的推手。