首页 / 科技
零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型
3月7日消息,近日,“零一万物 01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。
据悉,Yi-9B模型的实际参数达到了8.8B,默认上下文长度更是高达4K tokens。这款模型在Yi-6B的基础上进行了进一步的训练和优化,使用了0.8T tokens的数据进行精细调整,训练数据截至2023年6月。
在综合能力方面,Yi-9B模型表现出色,超越了众多同尺寸的开源模型,如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等。在代码能力上,Yi-9B仅次于DeepSeek-Coder-7B,但超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B等众多竞争对手。同时,在数学能力方面,Yi-9B也展现出强大的实力,仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型。
Yi-9B在常识和推理能力方面也表现出不俗的水平,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下。此外,官方还特别强调,无论是Yi-9B(BF 16)还是其量化版Yi-9B(Int8),都能够在消费级显卡上实现轻松部署,大大降低了使用成本,对开发者来说非常友好。
据ITBEAR科技资讯了解,零一万物公司由李开复创新工场董事长兼CEO带队创办,此前已经成功推出了Yi-34B和Yi-6B两个开源大模型。该公司表示,他们对学术研究完全开放,并同步开放免费商用申请,以推动人工智能技术的广泛应用和发展。
标签: 零一万物内容头条
相关内容
-
华为Mate 70系列最新消息:正测试两款国产传感器
-
星环科技入选IDC《大模型背景下的政府行业知识图谱市场分析
-
小度召开首届全屋智能服务商大会,围绕大模型实现软硬件全面进
-
Anthropic发布Claude 3系列:大型语言模型的新标杆
-
华为云盘古大模型荣获金融大模型验证“优秀级”,领航AI产业新
-
iPad Pro 2024最新消息:厚度减至5.0mm 变化明显
-
OpenAI发布Sora文生视频大模型,清华大学亦有新专利公布
-
苹果A18芯片爆料最新消息汇总:iPhone16首发
-
美国银行:很难从1月份波动的数据得出结论 美联储料仍从6月开
-
多位美联储票委表态:开启降息必须谨慎 应根据数据采取行动
-
假期要闻汇总:金融数据开门红 1月新增信贷、社融均创历史同期
-
Switch 2发布时间最新消息:延至明年发布
-
OpenAI发布Sora模型:文本秒变视频,AI创作再升级
-
OpenAI发布Sora模型:文本秒变视频,AI创作再升级
-
谷歌开源新工具Magika:基于AI高效识别文件格式和内容