首页 热点 业界 科技快讯 数码 电子消费 通信 前沿动态 电商

李开复的新 AI 公司登陆大模型战场,百亿级模型已内测|今日要闻

2023-07-05 01:03:18 来源 : 36氪

文 | 周鑫雨

编辑 | 邓咏仪

距李开复发出 AI 英雄帖,过去了整整 106 天。


【资料图】

2023 年 3 月 19 日,创新工场董事长兼 CEO 李开复在朋友圈宣布 " 亲自筹组 Project AI 2.0,一个致力打造 AI 2.0 全新平台和 AI-first 生产力应用的全球化公司 "。

3 个月后,7 月 3 日,Project AI 2.0 终于揭开了业务和团队画像的一角。创新工厂官宣 Project AI 2.0 新公司 " 零一万物 ",并上线官网(01.AI)。

创新工场表示,零一万物是其 " 塔尖孵化 " 的第 7 家公司。

所谓的 " 塔尖孵化 ",是创新工场投资具有短板的初期公司的战略,特点是在创业者和学术圈之间建立紧密的人才、技术等方面的联系,涵盖甄别技术趋势、设定技术主题、挖掘技术人才、跟踪行业最新动态等环节。3 月,宣布完成亿元人民币 Pre-A 轮融资的澜舟科技,就是创新工场采取塔尖孵化模式的公司。

自研大模型,是零一万物切入 AI 赛道的方向。为此,零一万物搭建了专供大模型训练、调优和推理的实验平台,资源储备包括数千卡 GPU 集群。

面对 " 重复造轮子 " 的质疑,零一万物用目前国内大模型赛道存在的两个问题做出了回应:一,许多声称效果类似 ChatGPT 的开源模型,都只局限于简单对话,无法适应稍微泛化或复杂的任务;二,依赖开源生态不利于对大模型技术原理的研究,自身能力天花板容易被他人定义。

为了提高模型能力,零一万物采取了拆解技术路线、分步攻克的策略,包括 7 大模块:

1、定义模型能力天花板的预训练框架(Pre-train)技术;

2、精进模型实现能力的 Post-train(训练后)技术;

3、支撑模型高效训练的 AI Infra 技术;

4、更多元化多介质的多模态模型技;

5、平台中间件及工具链技术;

6、推理部署技术;

7、服务部署技术。

据官方介绍,遵循模块化的技术路线后,零一万物在 3 个月内已经实现百亿参数规模的模型内测,且参数正往 300-700 亿的规模扩大。与此同时,零一万物也表示,未来不排除大模型开源的可能。

创新工场表示,目前 " 零一万物 " 已经有数十名核心成员,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发能领域。

从创新工场披露的团队成员背景来看," 顶尖大厂 "" 一把手 " 是最显著的标签。官方表示,已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴 / 百度首席算法负责人、前谷歌中国高管、前微软 /SAP/Cisco/ 副总裁,包括 36 氪此前独家报道的前百度副总裁马杰。与此同时,零一万物算法和产品团队背景均来自国内外大厂。

将模型训练技术路线拆分为 7 个模块后,零一万物的野心是为每一个模块配备顶尖的技术专家,这也意味着人才焦虑仍在持续。官宣公司成立时,零一万物特意强调,简历投递通道已在官网(01.AI)开启。

作为国内 AI 界的标志性人物,李开复已经撸起袖子亲自入局。不过,创新工场对 36 氪表示:塔尖孵化是投入很重的模式,但开复不是全部 ALL-IN 到新公司去了,后续还会平衡基金和新公司。

欢迎交流!

标签:

相关文章

最近更新
微评 2023-07-05 00:20:08
定远梅鱼-环球关注 2023-07-04 23:48:57
年青的鹰 2023-07-04 23:44:32
分隔线条素材_分隔线 2023-07-04 23:32:14
化妆品改名潮来了! 2023-07-04 22:53:24
工行e钱包_工行e卡 2023-07-04 22:51:29