作者| 苑桢
来源| 创头条
最近,一家原本名不见经传的AI初创公司——月之暗面(Moonshot AI),和它的AI助手Kimi突然火出了圈。
爆火到什么程度?连服务器都崩掉了。
昨天(3月21日)下午,Kimi的App和小程序一度出现无法使用的情况。原因是访问量的激增。
此前,月之暗面已发布情况说明,说观测到Kimi的系统流量持续异常走高……并对“宕机”问题进行了致歉。
资本市场也热闹非凡。 一夜之间,Kimi 成了大A股的“宠儿”,掀起一波Kimi概念股涨停潮。
Kimi背后是一家叫月之暗面的公司。在一众国产大模型中,它被视为是“中国版Chat GPT”最有力的挑战者之一。
月之暗面创始人是AI大模型领域最火90后——杨植麟。他身上的标签有清华学霸、AI天才科学家,还是一位热爱摇滚的青年。
上线四个月,月访问量达300万
爆火的“宕机”的Kimi,到底啥来头?
泼天的流量,“砸”晕了刚出道的Kimi。
3月21日傍晚,因流量突然剧增,Kimi助手的App和小程序一度出现了无法使用的情况。小编测试了一下,当前页面已恢复了正常。
在一个Kimi团队与用户沟通的群里,Kimi方面人员表示,“Kimi从昨天开始用户量增速很快,工程师已经紧急扩容了几次,还在实施更多应急措施。”
此前,月之暗面也发布情况说明,观测到Kimi的系统流量持续异常走高……并对“宕机”问题进行了致歉。
Kimi凭啥一夜之间变得如此火爆?
3月18日,Kimi智能助手开启200万字无损上下文内测。或许是Kimi引爆流量的原因。
当然, 资本市场上兴起的一股Ki mi概念股纷纷涨停潮,可能也是“神助攻”。
有人说,现在国内做AI应用最好的,非Kimi莫属。
上线四个多月,Kimi 2月访问量达到300万,仅次于百度文心一言和阿里的通义千问。在国内大模型创业公司中居于首位。
当前,国产大模型众 多, Kimi 之所以 能脱颖而出 ,原因有很多。
所谓“术业有专攻”,好的产品往往都是单点引爆。
相比于市面上一些追求“面面俱到”的大模型,Kimi专攻长文本处理能力,刚上线时就支持20万汉字的长文本输入。
Kimi不光是个智能文本助手,还覆盖了各种应用场景,比如快速文献总结、信息搜索、数据处理、编码辅助、模拟对话、多语言翻译……
现阶段的AI大模型,本质上就是为了在信息爆炸的时代,辅助人类处理过载信息而诞生的。Kimi 的长文本处理能力,正好切中“处理海量信息”这一市场需求。
从市场的角度看,Kimi是一款做且只做了to C产品,与其它一众选择去做to B生意,或在医疗、游戏等细分场景中找落地的大模型,形成了差异化竞争。
站在Kimi背后的公司是月之暗面,成立于2023年3月,是国内大模型领域的关键玩家。
虽然员工数量在头部国产大模型公司中最少,仅为80人,也不如大厂财力雄厚,但月之暗面也有着自己“长袖善舞”的一面。
月之暗面创始人和核心团队成员来头都不小。
创始人是当下最火90后、清华学霸——杨植麟。其他几位关键成员,如联合创始人周昕宇和吴育昕,也拥有清华大学背景。
过去一年,月之暗面成为了大模型赛道被VC争抢激烈的项目。
今年2月,该公司刚完成一笔大额融资。去年10月,完成了阿里领投,砺思资本、小红书跟投的B轮融资,投后估值约25亿美元。
月之暗面是中国大模型赛场上现阶段估值最高的一家独角兽。
最火90后、AI天才科学家杨植麟
在中国大模型创始人中,杨植麟年纪最轻,于1992年出生。
杨植麟从小就是一名学霸,在高中时期就展现出对信息学的兴趣和天赋,曾在全国青少年信息学奥林匹克竞赛中取得优异成绩。
高中毕业后,杨植麟被保送至清华大学。大二时转专业进入计算机系。师从清华教授、IEEE Fellow唐杰。
真正的学霸,对于艺术都有着一份偏爱。
杨植麟就特别钟爱摇滚,大学期间,他周昕宇组建了校园摇滚乐队,并创作了一首歌,有关“做了一个创业成功一夜暴富的白日梦”。
据说,月之暗面这个名字就是来自于英国著名摇滚乐队Pink Floyd的专辑——杨植麟最喜欢的神作《The Dark Side of The Moon》。
直到现在月之暗面公司还放着两把电吉他,还有一架钢琴。当然这些都是后话了。
2015年,杨植麟以年级第一的成绩毕业,随后远赴卡内基梅隆大学语言技术研究所,跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。读博期间,杨植麟成为学术圈和AI领域的风云人物。
2023年3月,杨植麟正式创办月之暗面,首款产品Kimi用的也是杨植麟的英文名。
虽然是一位90后,杨植麟在学术界有着深厚的积累。其曾与多位图灵奖得主合作发表过论文。
业界评价杨植麟是,坚定的AGI信徒和有技术号召力的创始人。他的学习与工作履历很多与通用AI相关,论文引用超22000次。
周昕宇是月之暗面的算法团队负责人,清华大学2011级本科生,和杨植麟韬同为计算机系的学生。
周昕宇在毕业后选择加入旷视,工作内容是算法量产。就职期间,他和旷视研究院基础科研负责人、ResNet作者之一张祥雨合作研究移动端模型,以共同一作的身份撰写ShuffleNet论文,被CVPR接受。
这项工作后来影响了包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术。
另一位联合创始人吴育昕和杨植麟一样,先后毕业于清华和CMU,研究方向为计算机视觉中的检测和识别问题。毕业后他先是在Meta的FAIR工作,曾和AI大神何恺明共同提出组归一化(GN)的方法。期间,他还创建了detectron2,这是Meta最受欢迎的AI项目之一。在Google Scholarship上,吴育昕的被引次数超过了19000次。
对于当前国产大模型的竞争格局,杨植麟直言“大模型空间非常大,很难有任何一家公司可以把所有的事情都做了。有ToB也有ToC,技术路线也不一样,我觉得这是一个巨大的空白空间。”
长文本无损压缩是月之暗面瞄准的一个方向。杨植麟认为,大模型“马拉松刚开始,接下来会有更多差异化”。
自ChatGPT引爆这股AI浪潮以来,谁是中国版ChatGPT的讨论从未消失,而在一众“大哥”面前,月之暗面被视为最有力的挑战者之一。