手机版 欢迎访问人人都是自媒体网站

当前位置:主页 > 科学 >

李开复下场发布大模型,公司估值10亿美元

时间:2023-11-08 05:07|来源:网络整理|编辑:|点击:

 
 
李开复下场发布大模型,公司估值10亿美元  
 

·Yi-34B在关键指标上胜过市场上已有的领先开源模型,包括备受推崇的Meta的Llama 2,其分别在Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单爬升到第一位,成为全球开源大模型“双料冠军”。

·零一万物已经储备了未来所需的芯片,于今年早些时向风险投资机构创新工场借款,进行了大规模的半导体储备。

创新工场董事长兼CEO李开复。

11月6日,由创新工场董事长兼CEO李开复创办的人工智能公司“零一万物”(01.AI)发布首款开源中英双语大模型“Yi”。与此同时,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值超过10亿美元,在成立不到8个月的时间即跻身独角兽行列。

Yi-34B在关键指标上胜过市场上已有的领先开源模型,分别在Hugging Face英文开源社区平台(Hugging Face负责运行最佳性能大语言模型排行榜)和C-Eval中文评测的最新榜单爬升到第一位。

截至11月5日,Yi-34B在关键指标上胜过市场上已有的领先开源模型,包括备受推崇的Meta开发的大语言模型LLaMA 2。其分别在Hugging Face英文开源社区平台(Hugging Face负责运行最佳性能大语言模型排行榜)和C-Eval中文评测的最新榜单爬升到第一位,成为全球开源大模型“双料冠军”,这是迄今为止唯一成功登顶Hugging Face全球开源模型排行榜的国产模型。

“34B是开源大模型稀缺的‘黄金比例’尺寸”

中英双语开源大模型“Yi”系列,包括Yi-6B(参数规模为60亿基础模型)和Yi-34B(参数规模为340亿的基础模型)两个版本。

中英双语开源大模型“Yi”系列,包括Yi-6B(参数规模为60亿基础模型)和Yi-34B(参数规模为340亿的基础模型)两个版本。

李开复认为,340亿参数量属于开源大模型稀缺的“黄金比例”尺寸,达到“涌现”门槛、满足精度要求的同时,对厂商而言能够采用高效率单卡推理,训练成本友好。在参数量和性能方面,Yi-34B相当于只用了不及LLaMA 2-70B一半的参数量,取得了在各项测试任务中超越全球领跑者的成绩。

据介绍,Yi目前拥有全球大模型中最长的200K上下文窗口,可处理约40万字的文本。这意味着Yi-34B可以理解超过1000页的PDF文档,同时可以让很多依赖向量数据库构建外部知识库的场景,用上下文窗口来完成替代。

在大语言模型中,上下文窗口是大模型综合运算能力的重要指标之一,其对于理解和生成与特定上下文相关的文本至关重要,拥有更长窗口的语言模型意味着可以处理更丰富的知识库信息,从而在如法律、财务、传媒等场景中生成更连贯、准确的文本。OpenAI的GPT-4上下文窗口为32K,文字处理量约2.5万字。今年3月,硅谷知名AI创业公司Anthropic的大模型Claude2-100K将上下文窗口扩展到了100K规模。

“团队对标 OpenAI、谷歌等一线大厂,已储备未来所需芯片”

今年3月下旬,李开复宣布将以Project AI 2.0入局大模型。7月,李开复上线了“AI 2.0”公司零一万物。

李开复表示,“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World's No.1’(世界第一)的初衷和决心。我们组成了一支有潜力对标OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,以稳定的节奏和全球齐平的研究工程能力,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。”

据零一万物透露,该公司员工规模已超过100人,其中一半以上是来自大型跨国公司和中国科技公司的大语言模型专家。技术副总裁是谷歌聊天机器人Bard团队的早期成员,主导或参与了从Bert、LaMDA等大模型在多轮对话、个人助理等多个方向的研究和工程落地;首席架构师是TensorFlow的核心创始成员之一,并与谷歌大脑的著名研究人员杰夫·迪恩(Jeff Dean)和萨米·本吉奥(Samy Bengio)等合作。

上一篇:专家学者共探喜马拉雅地区生物圈保护 下一篇:没有了

Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP