租2000个芯片做大模型:创业公司“蛮战”的生死抉择来了,创业者在反击
日期:2023-07-12 12:10:14 / 人气:290

编辑|李伟
头图来源|视觉中国
当一项新技术兴起时,创业公司是等着大公司来做,还是投入真金白银?
一家名为中科申智的虚拟人创业公司选择了后者。最近,中科申智发布了一个大模型,包括20亿和200亿两个版本的参数。为此,他们租用了2000块英伟达A100显卡,十几个人的团队夜以继日工作了两个月,花费了数百万元现金。
中科申智创始人兼CEO程伟忠表示,目前访问API的响应速度太慢,无法满足虚拟人的实时性要求。而且大厂的大模型不会公布核心算法,导致创业公司无法迭代基础算法,被大公司牵着鼻子走。
中科申智成立于2016年。最近一次融资是在2021年11月。第二轮融资由陈山资本领投1000万美元,老股东马航MYEG Capital继续跟进。虽然成立7年,但中科申智目前只有100多人,主要是R&D人员,公司年营收数千万元。
当技术的浪潮来临时,巨头公司有更多的资源来应对,也有更多的试错成本。但是创业公司就完全不同了。他们势单力薄,放不下机会,又不能盲目跟风,这让他们如履薄冰。
不做就会死。
大模型火热,但程维忠等人发现,开源的大模型没有一个能用。
中科申智CTO宋健表示,一个可用的开源模型有三个定义:一是训练数据开源,比如数据如何处理,用什么数据进行训练,如何复制;第二,训练过程是开源的,比如算法;第三,训练模型是开源的,比如参数。
“这三点基本决定了目前市面上很少有大型开源模型。没有一个大的中国模型,大约有两三个大的英国模型,但他们的许可证有许多限制,例如不能商用。”宋健说。他预测,2024年将会有更多性能良好的大型开源模型问世,可以快速切换。
大模型最流行的商业模式是调用API接口,具体到中科申智的虚拟人商业场景。因为计算能力的限制和巨大的需求,ChatGPT4.0每五六秒回答一次,延迟对虚拟人场景是致命的,消费者不会多等一秒。
即使连接了API接口,创业公司的算法也无法迭代。程伟忠表示,中科申智的产品是基于NLP(自然语言处理)来输出语言的,使用的是CLAP算法。如果用大模型来改进算法,那么就需要大模型的源代码,尤其是多模态训练,必须要有源代码。
“大公司目前不可能开源,以后也不好说。此外,我们的客户也非常担心数据安全。”程伟忠说。
中科申智创始人兼首席执行官程伟忠。来源:受访者:大公司如何看待创业公司在大模式创业大潮中的机遇?
“随着云计算的发展,通过开放一系列模型,尝试一些突破,降低学习成本,这一点非常重要。”阿里云CTO周说。谁能更加敏捷,快速探索出一条业务发展创新之路,谁就占据了有利地位。今天,每个人都在和时间赛跑。
目前中科申智还没有盈利,但程伟忠已经没有退路:“如果你自己不做大模型,半年后,公司业务的轨迹就和你自己无关了。”
据IT桔子统计,2022年,虚拟人领域融资案例51起,融资总额40.96亿元。截至2023年5月,该领域已有数十笔融资。比如成立于2019年的万向科技,4月份宣布完成数千万的A2轮融资。
大公司也在这个领域竞争。7月,阿里云依桐模型家族迎来新成员。AI绘画创作模型开启定向邀请测试,可以辅助人类创作图片,未来可应用于艺术设计、电子商务、游戏、文化创作等应用场景。
4月,商汤发布大型模型系统,商汤日日新大型模型。发布会上,商汤展示了2D数字人体视频生成平台“如影感头像”,只需5分钟的直播视频素材,即可生成一个语音自然、口型准确、多语言熟练的数字人体头像。
大模型的“推理”能力突破了NLP的局限性,让人机对话更流畅、更智能。技术的变革带来了企业家和投资者的涌入。虚拟人赛道已经成为大型模型可以应用于地面的最大场景之一。
做一个租电的大模型
中科申智通过自有渠道,以按小时付费的方式租用计算能力开发大型模型,一小时十几元,单价比往年提高了3倍。计算能力主要用于数据训练和微调。经过计算,他们估计用了2000块英伟达A100显卡。
中科申智推出的20亿和200亿参数模型主要针对垂直场景,比如电商卖货,没有考虑普适性。以虚拟主播为例,几年积累的场景数据会用于训练,最重要的是反应速度。
“从三五秒到0.5秒,这就够了,不用在意作文或者摘要怎么写。”程伟忠说。
20亿、200亿参数的大模型,在ChatGPT、文新的千亿参数面前,就是个“小兄弟”。但是小有一个小优势,就是胜在速度。大公司致力于建立一个拥有数千亿参数的通用人工智能模型。他们是“既要又要”,但对于创业公司来说,他们是“只要”。
程伟忠反映,部分电商客户接入通用大模型后,发现不仅API响应速度慢,而且部分回答不专业,影响了C端用户的留存和转化。客户反过来寻求中科申智的SDK(软件开发工具包),使用中科申智的大模型。
中科申智开发了一项名为“虚拟辅助广播”的技术,允许真人与虚拟人互动。以前传统的NLP技术无法满足产品的需求。现在,在虚拟人背后连接一个大模型,就可以支持虚拟人,真人可以让虚拟人独立唱歌、跳舞、答题、卖货。
来源:受访者大模式似乎正在成为大公司的“坏生意”,创业公司的“好生意”。
“坏”就在于其目标设定高,建立了通用的人工智能技术基础和无底洞,成为了长期投资;而创业公司只需要迭代算法和技术,就可以在本地建立优势,注重实用性,边用边学。
无论是腾讯云的行业模式,还是百度的文心词,都在从一般的人工智能转向场景落地,而这恰好是行业公司的硬核优势。行业头部企业最后成为行业典范更容易推广和落地。从这个角度来说,垂直模式确实更有优势。
但是一些技术问题仍然模糊不清。
与《文生图》《文文生》等场景不同,虚拟人直接将大规模模型能力推向多模态领域,但没有人告诉创业公司这条路是否行得通。以前是动作捕捉生成技术,现在是否切换到大模型的定义,在生成端还有很多技术上的不确定性。
高风险时代,创业公司如何扩张?
大公司拓展新业务,推出新产品。百度和阿里巴巴都推出了基于大模型功能的新产品,比如阿里巴巴的懂懂,它也用大模型改造了钉钉等产品,推出了会议总结、总结等功能。
有人把AI革命的爆发周期定义为10年,但技术革命之初,技术路线和落地路径都不是很清晰,噪音和泡沫满天飞。对于创业公司来说,拓展新业务尤其谨慎。
在技术变革时期,每个创业者似乎都看到了机会。以这个大模型为例,机器人公司会觉得交互革命已经到来,社交软件创业者会觉得做下一个微信的机会已经出现,3D虚拟人创业者会说未来需要1000亿虚拟人。
这种“机会的幻觉”会激发创始人的野心,甚至蒙蔽他们的双眼。但有些创业者也容易被风险吓倒,变得畏首畏尾。
中科申智是一家研发公司,算法是他们的核心竞争力。它在很长一段时间内投入了研发,其绩效受宏观经济的影响。中科申智的投资人,包括他们自己的团队,对大模型没有概念,花了很多钱去培训,所以大家都会有疑虑。
程伟忠说服自己:不要神化大模特,用平常心去看。做生意的时候,你会考虑我该不该做吗?我觉得可以赚钱,对我们公司有长期帮助,所以做了一个大模型。
他预言,未来的10年、20年,其实就是XR加AI,不能简单的说AI。AI大模型将带来AI工具、AI应用和3D服务,这意味着未来虚拟空间需要越来越多的虚拟人。
想好了就去做,但是要紧密结合自己的场景和业务去做。
上一波移动互联网,程维忠错过了一波技术。2008年,他创办了一家互联网营销公司。移动互联网一上来,程维忠就谨慎了。他觉得技术不成熟,终端差,网络不好。他觉得在进入游戏之前需要等待。
“现在回想起来,这是一个非常错误的决定。”程伟忠反映。移动互联网的创业浪潮是在2007年、2008年、2010年圈定的。
像程维忠这样的移动互联网创业者,已经开始在新技术的浪潮中占据主动,但成败还需要时间来检验。"
作者:腾越娱乐
新闻资讯 News
- 租2000个芯片做大模型:创业公司“...07-12
- 二代骁龙7+性能超赞,红米Note1...07-12
- 2013年,工信部正式向三大运营商...07-12
- macOS新恶意软件ShadowVau...07-12