租2000个芯片做大模型:创业公司“蛮战”的生死抉择来了，创业者在反击

日期：2023-07-12 12:10:14 / 人气：454

编辑|李伟
头图来源|视觉中国
当一项新技术兴起时，创业公司是等着大公司来做，还是投入真金白银？
一家名为中科申智的虚拟人创业公司选择了后者。最近，中科申智发布了一个大模型，包括20亿和200亿两个版本的参数。为此，他们租用了2000块英伟达A100显卡，十几个人的团队夜以继日工作了两个月，花费了数百万元现金。
中科申智创始人兼CEO程伟忠表示，目前访问API的响应速度太慢，无法满足虚拟人的实时性要求。而且大厂的大模型不会公布核心算法，导致创业公司无法迭代基础算法，被大公司牵着鼻子走。
中科申智成立于2016年。最近一次融资是在2021年11月。第二轮融资由陈山资本领投1000万美元，老股东马航MYEG Capital继续跟进。虽然成立7年，但中科申智目前只有100多人，主要是R&D人员，公司年营收数千万元。
当技术的浪潮来临时，巨头公司有更多的资源来应对，也有更多的试错成本。但是创业公司就完全不同了。他们势单力薄，放不下机会，又不能盲目跟风，这让他们如履薄冰。
不做就会死。
大模型火热，但程维忠等人发现，开源的大模型没有一个能用。
中科申智CTO宋健表示，一个可用的开源模型有三个定义:一是训练数据开源，比如数据如何处理，用什么数据进行训练，如何复制；第二，训练过程是开源的，比如算法；第三，训练模型是开源的，比如参数。
“这三点基本决定了目前市面上很少有大型开源模型。没有一个大的中国模型，大约有两三个大的英国模型，但他们的许可证有许多限制，例如不能商用。”宋健说。他预测，2024年将会有更多性能良好的大型开源模型问世，可以快速切换。
大模型最流行的商业模式是调用API接口，具体到中科申智的虚拟人商业场景。因为计算能力的限制和巨大的需求，ChatGPT4.0每五六秒回答一次，延迟对虚拟人场景是致命的，消费者不会多等一秒。
即使连接了API接口，创业公司的算法也无法迭代。程伟忠表示，中科申智的产品是基于NLP(自然语言处理)来输出语言的，使用的是CLAP算法。如果用大模型来改进算法，那么就需要大模型的源代码，尤其是多模态训练，必须要有源代码。
“大公司目前不可能开源，以后也不好说。此外，我们的客户也非常担心数据安全。”程伟忠说。
中科申智创始人兼首席执行官程伟忠。来源:受访者:大公司如何看待创业公司在大模式创业大潮中的机遇？
“随着云计算的发展，通过开放一系列模型，尝试一些突破，降低学习成本，这一点非常重要。”阿里云CTO周说。谁能更加敏捷，快速探索出一条业务发展创新之路，谁就占据了有利地位。今天，每个人都在和时间赛跑。
目前中科申智还没有盈利，但程伟忠已经没有退路:“如果你自己不做大模型，半年后，公司业务的轨迹就和你自己无关了。”
据IT桔子统计，2022年，虚拟人领域融资案例51起，融资总额40.96亿元。截至2023年5月，该领域已有数十笔融资。比如成立于2019年的万向科技，4月份宣布完成数千万的A2轮融资。
大公司也在这个领域竞争。7月，阿里云依桐模型家族迎来新成员。AI绘画创作模型开启定向邀请测试，可以辅助人类创作图片，未来可应用于艺术设计、电子商务、游戏、文化创作等应用场景。
4月，商汤发布大型模型系统，商汤日日新大型模型。发布会上，商汤展示了2D数字人体视频生成平台“如影感头像”，只需5分钟的直播视频素材，即可生成一个语音自然、口型准确、多语言熟练的数字人体头像。
大模型的“推理”能力突破了NLP的局限性，让人机对话更流畅、更智能。技术的变革带来了企业家和投资者的涌入。虚拟人赛道已经成为大型模型可以应用于地面的最大场景之一。
做一个租电的大模型
中科申智通过自有渠道，以按小时付费的方式租用计算能力开发大型模型，一小时十几元，单价比往年提高了3倍。计算能力主要用于数据训练和微调。经过计算，他们估计用了2000块英伟达A100显卡。
中科申智推出的20亿和200亿参数模型主要针对垂直场景，比如电商卖货，没有考虑普适性。以虚拟主播为例，几年积累的场景数据会用于训练，最重要的是反应速度。
“从三五秒到0.5秒，这就够了，不用在意作文或者摘要怎么写。”程伟忠说。
20亿、200亿参数的大模型，在ChatGPT、文新的千亿参数面前，就是个“小兄弟”。但是小有一个小优势，就是胜在速度。大公司致力于建立一个拥有数千亿参数的通用人工智能模型。他们是“既要又要”，但对于创业公司来说，他们是“只要”。
程伟忠反映，部分电商客户接入通用大模型后，发现不仅API响应速度慢，而且部分回答不专业，影响了C端用户的留存和转化。客户反过来寻求中科申智的SDK(软件开发工具包)，使用中科申智的大模型。
中科申智开发了一项名为“虚拟辅助广播”的技术，允许真人与虚拟人互动。以前传统的NLP技术无法满足产品的需求。现在，在虚拟人背后连接一个大模型，就可以支持虚拟人，真人可以让虚拟人独立唱歌、跳舞、答题、卖货。
来源:受访者大模式似乎正在成为大公司的“坏生意”，创业公司的“好生意”。
“坏”就在于其目标设定高，建立了通用的人工智能技术基础和无底洞，成为了长期投资；而创业公司只需要迭代算法和技术，就可以在本地建立优势，注重实用性，边用边学。
无论是腾讯云的行业模式，还是百度的文心词，都在从一般的人工智能转向场景落地，而这恰好是行业公司的硬核优势。行业头部企业最后成为行业典范更容易推广和落地。从这个角度来说，垂直模式确实更有优势。
但是一些技术问题仍然模糊不清。
与《文生图》《文文生》等场景不同，虚拟人直接将大规模模型能力推向多模态领域，但没有人告诉创业公司这条路是否行得通。以前是动作捕捉生成技术，现在是否切换到大模型的定义，在生成端还有很多技术上的不确定性。
高风险时代，创业公司如何扩张？
大公司拓展新业务，推出新产品。百度和阿里巴巴都推出了基于大模型功能的新产品，比如阿里巴巴的懂懂，它也用大模型改造了钉钉等产品，推出了会议总结、总结等功能。
有人把AI革命的爆发周期定义为10年，但技术革命之初，技术路线和落地路径都不是很清晰，噪音和泡沫满天飞。对于创业公司来说，拓展新业务尤其谨慎。
在技术变革时期，每个创业者似乎都看到了机会。以这个大模型为例，机器人公司会觉得交互革命已经到来，社交软件创业者会觉得做下一个微信的机会已经出现，3D虚拟人创业者会说未来需要1000亿虚拟人。
这种“机会的幻觉”会激发创始人的野心，甚至蒙蔽他们的双眼。但有些创业者也容易被风险吓倒，变得畏首畏尾。
中科申智是一家研发公司，算法是他们的核心竞争力。它在很长一段时间内投入了研发，其绩效受宏观经济的影响。中科申智的投资人，包括他们自己的团队，对大模型没有概念，花了很多钱去培训，所以大家都会有疑虑。
程伟忠说服自己:不要神化大模特，用平常心去看。做生意的时候，你会考虑我该不该做吗？我觉得可以赚钱，对我们公司有长期帮助，所以做了一个大模型。
他预言，未来的10年、20年，其实就是XR加AI，不能简单的说AI。AI大模型将带来AI工具、AI应用和3D服务，这意味着未来虚拟空间需要越来越多的虚拟人。
想好了就去做，但是要紧密结合自己的场景和业务去做。
上一波移动互联网，程维忠错过了一波技术。2008年，他创办了一家互联网营销公司。移动互联网一上来，程维忠就谨慎了。他觉得技术不成熟，终端差，网络不好。他觉得在进入游戏之前需要等待。
“现在回想起来，这是一个非常错误的决定。”程伟忠反映。移动互联网的创业浪潮是在2007年、2008年、2010年圈定的。
像程维忠这样的移动互联网创业者，已经开始在新技术的浪潮中占据主动，但成败还需要时间来检验。"

作者：腾越娱乐

租2000个芯片做大模型:创业公司“蛮战”的生死抉择来了，创业者在反击

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →