自美国OpenAI公司的ChatGPT引燃全球竞赛热潮后,人工智能大模型经历了一年半“技术狂飙”。如今,大模型价格战又带来了商用竞争的提速。OpenAI公司近几个月多次降价,字节、阿里、百度、腾讯等国内多家大模型厂商近一个月来也竞相降价。
促进应用
5月21日,阿里云旗下9款大模型全面降价,其中,Qwen—LongAPI输入价格从0.02元/千tokens降至0.0005元/千tokens,直降超97%。据估算,降价后1元钱约可买到300万字符,相当于5本《新华字典》的文字量。
“阿里云大模型降价,是希望让更多的使用者和中小企业用上大模型,加速AI应用市场的提前爆发。我们有底气降价,主要得益于公共云技术红利和规模效应带来的成本和性能优势。”阿里云资深专家朱迅垚告诉经济日报记者。
目前,百度智能云千帆大模型平台共计有7款模型免费开放。百度智能云AI与大模型平台总经理忻舟表示:“大模型仍处于市场培育阶段。企业只有在认识到大模型带来的巨大价值后,才能将其应用于更大规模、更复杂的业务场景中。生态繁荣是大模型行业发展的前提。”
忻舟表示,百度有充分的资源和技术积累,在降价政策发布前内部已制定专项保障策略,以确保大量客户涌入时的使用体验。
从实际数据看,降价确实可以提高大模型获客量。
百度的两款主力大模型ERNIESpeed和ERNIELite于5月21日宣布免费开放后,两周时间其日调用量就涨了10倍。阿里云宣布降价后,百炼平台上通义千问调用大幅提升,表明很多企业应用大模型的意愿增强。
大浪淘沙
2023年国产大模型就已开启“百模大战”,如今国产大模型数量超过200个,其中10亿参数规模以上的大模型超100个。业内专家普遍认为,本轮降价潮会加速大模型洗牌。
“国内通用大模型产品高度同质化,无法通过差异化功能来吸引更多消费者,最终造成了本次大范围降价。”哈尔滨工业大学商学院院长马涛教授认为,在大模型技术底层上,国内知名的几个大模型产品均参考了经典的Transformer等架构,技术路线上存在部分重合;在大模型数据层面上,因为用于大模型训练或推理的中文语料库来源单一、动态更新频率不高,导致各通用大模型的训练数据高度相似。
经过2023年的“百模大战”之后,全国在网信办登记备案的生成式人工智能服务数量已连续多月保持在117家不变。马涛估计,未来我国通用类大模型产品还将经历一轮大浪淘沙,常见常用的知名大模型数量将最终稳定在10个左右。
谁能成为胜出者?储备充足的中国互联网巨头们颇具信心。
迎难而上
当前,全球大模型技术竞争异常激烈,各国都在快速迭代技术。从全球已发布的大模型地域分布看,中国和美国大幅领先,超过全球总数的80%,中国已形成了紧跟世界前沿的大模型技术群。
与引领这轮潮流的美国相比,中国在大模型产品和服务上还有哪些不足?
马涛表示,算力供给上的差距值得关注。近期,英伟达宣布搭载最新架构Blackwell的GPU芯片正式投产,这标志着目前在全球范围内性能仍表现非常突出的H100计算芯片已经成为“上一代”,并与我国内地存量较多的英伟达A100芯片和华为昇腾910B拉开距离,形成了代际差距。
面对客户的芯片焦虑,百度采取了“兼容”策略。忻舟表示,百度百舸·AI异构计算平台可以实现一云多芯,对国内外主流AI芯片兼容,无需为每个芯片平台重新设计和优化模型,帮助用户摆脱单一芯片依赖,节省大量时间和资源。
“中国有超大市场规模和全产业链优势,有巨大的训练专业知识数据开发潜力,以及海量的大模型专业应用场景和垂直领域落地需求,这是其他国家很难具备的条件,为我国大模型加快技术迭代和实际应用提供了宝贵的发展机遇。”马涛说。
朱迅垚表示,对大模型未来应用的增长非常有信心,同时也相信中国在人工智能领域,尤其是AI原生应用上,一定会走在世界前列。