webjb

散仙谷 http://www.webjb.org/webjb/sanxian/

送交者: SR 于 2025-05-01 04:36:12

据悉，DeepSeek R2的参数量将比R1模型翻倍，达到约1.2万亿个参数。更令人关注的是，其企业端使用成本预计比ChatGPT-4便宜97.3%，输入端费用约为每百万tokens 0.07美元，输出端为每百万tokens 0.27美元。

如果消息属实，DeepSeek R2将成为市面上性价比最高的大语言模型，有望在价格战中大幅压制GPT-4 Turbo、Gemini 2.0等国外竞争对手。

此次传闻中的另一大亮点是，DeepSeek R2模型几乎完全依赖华为Ascend 910B芯片进行训练。据称，该模型在Ascend 910B集群上的利用率达到了82%，并且基本上完全在华为芯片上完成训练。

阅读次数：341

所有跟贴:

我看到的传闻是Deep seek 早就用上了升腾910C， testtesttest (212字节) 05/01 11 45:37 (10368644)

加跟贴