1、昨晚幻方大模型热度比较高
魔搭ModelScope社区宣布,DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。
据悉,幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE,以236B 总参数、21B 激活,实际部署在8卡 H800机器上,输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。
性能方面,在目前大模型主流榜单中,DeepSeek-V2均表现出色:
中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队
英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B
知识、数学、推理、编程等榜单结果也位居前列
支持128K上下文窗口
和DeepSeek67B相比,DeepSeek-V2节约了42.5%训练成本,推理的KV Cache节约了93.3%,最大吞吐是之前的576%。
DeepSeek-V2的推理代码和模型下载链接已经在魔搭 ModelScope 社区开源,用户可以通过该平台直接下载模型。
券商评论:
Kimi后看到的AI又一重大突破: 幻方AI正式发布新一代开源模型,模型成本骤降下重申看好AI应用商业闭环【天风计算机 缪欣君团队】
资料显示:幻方量化二老板——徐进与每日互动关系匪浅,是每日互动的创始人之一
总结: 每日互动:幻方大模型A股唯一映射标的
幻方二股东,技术负责人是每日互动的联合创始人,存在合作基础。
幻方大模型对每日互动的用户行为语料采购合作,每日互动牵头的浙江大数据计算中心为幻方大模型的算力合作,还有每日互动为幻方大模型营销客户推广合作。
之前kimi也炒了一段时间,ai方面沉寂一段时间了,下周一OPEN AI发布 AI搜索,应该会刺激AI应用方面
马上就是周末了,也是极有可能发酵的,推荐给大家,仅为逻辑分享,买卖大家随意,谢谢!
苹果手机内置大模型接近落地,国外ChatGPT,国内百度文心一言(openai入种花家被禁)。 每日互动:百度(鼎鹿中原)为其第三大股东,国内手机端ai大模型数据供应方,ai手机高辨识度标的