这是一次要靠加快语速、提高分贝才能“抢”到提问的采访。
7月7日下午,2023世界人工智能大会·腾讯论坛举行前,一个狭小嘈杂的会议室里,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声接受了媒体群访。近20天前,腾讯对外正式公布MaaS全景图,以行业大模型切入火热的“大模型赛道”,记者们迫切地想知道,同为头部互联网企业,腾讯为何避开通用大模型,选择了一条看起来更“现实”的道路。
“企业需要的,是在实际场景中真正解决某个问题,而不是在100个场景中解决70%-80%的问题。”吴运声表示,站在公司策略角度,腾讯更专注于解决落地实际的问题,而通用大模型不能彻底解决用户的所有问题。
拥有中国最多个人用户的腾讯,在新一轮人工智能浪潮来临时,将产业互联网AI化放在了改变的第一步。
腾讯云MaaS再升级
6月19日,腾讯云首次公布腾讯云行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,并已为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。
本次世界人工智能大会上,腾讯云再次公布了多项升级。
其中,最新升级的腾讯云自研星脉高性能计算网络,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升。基于腾讯云新一代算力集群HCC,可支持10万卡的超大计算规模。腾讯云AI原生向量数据库,最高支持10亿级向量检索规模,延迟控制在毫秒级,相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。
在应用创新方面,腾讯云行业大模型能力应用到金融风控、交互翻译、数智人客服等场景中,极大提升了智能应用效率。
行业大模型加持的金融风控解决方案,相比之前有了10倍效率提升,通过腾讯积累超过20年的黑灰产对抗经验和上千个真实业务场景,整体反欺诈效果比传统模式有20%左右的提升。在数智人领域,今年腾讯云推出了小样本数字人工厂,仅需少量数据、24小时内即可复刻2D数字分身,让企业应用数智人服务成本大大降低。
“事实上,过去半年多的时间里,我们一直在思考和探索,大模型和各行业结合背后最本质的逻辑是什么?其实只有两点:一是技术的根本出发点是解决实际问题,二是如果不能深入行业探索,便不能真正解决行业面临的问题。”真实场景对大模型带来的“考验”,让吴运声感慨颇多。
智能客服被公认是LLM(大规模语言模型)最适用的行业。此次大会,腾讯为一家线上旅游OTA公司打造了一个行业大模型,精调后的客户专属模型,无需配置对话流程,即可实现端到端解决业务问题。提升任务完成率,降低对话构建成本。但事实上,让大模型真正理解客户的问题,并非想象中那么简单。
“在沟通过程中,客户的思维是跳跃的、变化的。比如他刚提出要定10号的酒店,但在机器还没回答之前,突然又说,再帮我看看11号的酒店和航班,当AI还在对第二个需求进行反馈时,他又可能说,给我看看双床房。”吴运声指出,大模型要实现多意图识别,目前还是有相当难度,通用大模型并不能简单解决,而是需要结合场景,特别是与客户的系统交互要重构一些非常复杂的模型。
“群模共舞”时代到来
经过初期的喧嚣之后,AI大模型如何落地商业化,企业客户如何享受这轮AI红利,解决“AI焦虑”,成为这届世界人工智能大会上热议的话题。
红杉资本中国合伙人郑庆生从PC互联网中期开始进入投资领域,在他看来,每个时代的胜出者,都源自那个时代的技术原生,比如PC互联网时代,人们看重电子商务,结果社交软件成了最大赢家;移动互联网时代开始,人们看中社交软件、长视频,但短视频占据了最多的时长,“现在我们并不知道,哪些AI本身产生的原发性场景,将改变我们的基础行为。”
尽管AI原生的“杀手锏”何时出现,还不得而知,但“入局”一定是第一步。此次WAIC集中亮相的30多个大模型中,除了百度文心一言、阿里通义、讯飞星火、商汤日日新等第一轮通用大模型之外,后来者基本都聚焦于行业大模型。
“对客户而言,参数少、投入低,见效快的企业专属大模型,更容易被接受,买单意愿也比较明确。”一位创业公司展商告诉《IT时报》记者,一些已经在用大模型改造客服系统的银行客户,通常会选择软硬一体的私域部署方式,用自己已有的知识图谱和数据训练和实现推理,既确保了数据安全,投入算力成本也不会太高,“如果只需要对一个场景进行推理输出,算力板卡甚至在个位数便可以搞定。”
“产业场景已经成为最佳练兵场,”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,在本次WAIC全体会议-产业发展论坛上曾表示,选择具有一站式行业大模型服务能力的云厂商合作,基于行业大模型,构建自己的专属模型,或许是企业探索大模型应用实践的可行路径。
这意味着,未来将是一个“万模共存”的时代,每个企业都将拥有自己的大模型,而腾讯决定做新时代的赋能者。
上个月腾讯云公布的MaaS服务全景图中提出,基于腾讯云TI平台打造行业大模型精选商店,腾讯云可提供金融、文旅、政务、医疗、传媒、教育等10大行业,50多个解决方案。同时腾讯云推出行业大模型精调解决方案,帮助模型开发者与算法工程师,一站式解决模型调用、数据与标签管理、模型精调、评估测试与部署等任务,减轻创建大模型的压力。
在这些模型和工具平台基础上,企业只用加入自己的场景数据,就可以快速生成自己的“专属模型”。
“现在还是大模型发展的早期阶段,我个人更希望百花齐放,大家在不同的领域尝试不同的可能性。”吴运声认为,人工智能的发展是一项庞大的数据工程,既要有共性的知识,也需要有专业的精深的权威知识组织,需要各方合力,才能真正使技术服务行业。
AI for Science捕获宇宙“闪烁”
当然,除了在产业数字化转型发挥效应,腾讯云行业大模型也加速推动大模型等AI技术在科学计算领域的应用。
2021年开始,腾讯、国家天文台、复旦大学计算机科学技术学院联合启动“探星计划”,用云+AI帮助中国天眼FAST处理每天接收到的庞大数据量,通过视觉AI分析找到快速射电暴、脉冲星线索,截至目前已发现30颗脉冲星。
今年WAIC上,腾讯宣布探星计划再度取得进展,首次通过AI技术发现2颗快速射电暴。
快速射电暴是一种神秘的天文现象,每1毫秒,就会放射出太阳一整年释放的能量,“闪烁”宇宙。但它“闪烁”频次极低、时间极短,海量数据中极易忽视、捕捉极难,直到2007年,人类才发现第一颗,比脉冲星的发现晚了40年。
与脉冲星探索相比,要在海量数据中发现更低频出现的快速射电暴,要求AI模型具备更高的精度、以及更快的计算速度。为了提高计算速度,腾讯针对快速射电暴探索,特别设计了一套全新的,端到端的AI算法。在同等算力下,这套全新的天文数据处理范式,推动信号处理效率相对常规处理流程提速1800倍。
此前,AI识图前,需要先对信号图完成繁杂的天体物理预处理,比如傅立叶变换、消色散......这些工作专业而复杂。现在腾讯优图开创了一种天文数据处理的“端到端AI算法”,可以跳过预处理步骤,直接进入AI识别,效率大提升。
FAST每天产生数百TB 数据,每周产生几千万张信号图。面对海量数据,通过“多示例学习方法+注意力机制”,腾讯云可以快速定位和识别数据中有用信息,并提供强大的底层算力支撑。
如今,腾讯云和FAST正在继续探测250万光年外M31仙女座的射电信号,预计不久的将来,将有更多“宇宙闪烁”被捕获。