【TechWeb】5月21日消息,在今天上午阿里云宣布旗下通义千问GPT-4级主力模型降价***%后,刚刚,百度发文宣布,旗下两款大模型ERNIE Speed、ERNIE Lite免费。
ERNIE Speed和ERNIE Lite是今年3月百度正式推出的“轻量级”大模型。“轻量级”大模型即用小尺寸的专家模型也能够达到通用大模型的效果,而小尺寸专家模型的推理成本会更低,更便宜。
ERNIE Speed推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,生成更加连贯和准确的预测或回答。
ERNIE Lite参数量相比ERNIE Speed更小,更加适合搭载在低算力的AI加速卡上处理推理任务,在兼顾模型效果与推理性能的同时,大幅降低客户落地应用成本。
今年以来,国内AI大模型行业价格竞争越来越激烈。
上周,字节跳动旗下豆包主力模型在企业市场的定价低至0.0008元/千tokens,DeepSeek-V2价格做到了每百万tokens1元。此前,智谱AI也把glm3-turbo价格调整到每百万tokens 1元。
今天上午,阿里云宣布通义千问GPT-4级主力模型Qwen-Turbo、Qwen-Plus、Qwen-Long等9款主力AI大模型宣布全面降价,其中Qwen-Long API输入价格从0.02元/千tokens降至0.0005元/千tokens,最高直降***%。(宜月)
标签: #模型