从多位知情人士处获悉,字节跳动正秘密研发多个AI大模型领域的产品,涵盖多模态数字人、AI生图和AI生视频等多个方面。这一消息引起了业界的广泛关注。
据透露,去年下半年,有知情人士亲眼目睹了字节跳动多模态数字人产品的demo,并给予了高度评价。同时,字节跳动旗下的剪映团队已秘密组建封闭团队,专注于AI产品的研发。目前,该团队仍处于保密阶段,尚未公布相关产品。
对于上述消息,媒体向字节跳动方面进行了求证,但截至发稿时,尚未获得回应。不过,一位接近字节跳动的知情人士透露,去年一年,字节跳动创始人张一鸣将主要精力都放在了AI上,这也显示了公司对AI业务的重视程度。
在AI大模型产品的研发上,字节跳动采取了全面布局的策略,从模型层到应用层都进行了深入探索。在基础大模型领域,去年8月,字节跳动推出了首个大语言模型“豆包”和多模态大模型BuboGPT。此外,其抖音云雀大模型也成功通过了首批《生成式人工智能服务管理暂行办法》备案,面向公众开放。
值得一提的是,几天前,字节跳动还发布了文生图开放模型SDXL-Lightning,该模型能够在短时间内生成高质量和高分辨率的图像,将生成速度提高了十倍。这一创新性的技术无疑为AI生图产品的发展提供了强大的支持。
在AI应用层,字节跳动于去年11月成立了新AI部门Flow,并已经推出了三款AI对话类产品,包括豆包、扣子和Cici。在基础大模型层,字节跳动在语言和图像两种模态上都进行了布局,两个团队均向TikTok技术负责人朱文佳汇报。
尽管字节跳动在大模型布局上面临着一定的压力,但多位了解情况的人士表示,现在还不能完全否定其在AI大模型领域的布局。其中,剪映被认为是字节跳动AI大模型落地最有希望的产品之一。
剪映作为一个视频创作工具,处于内容创作的上游,往AI方向走即文生视频。此外,剪映创作的视频内容有抖音承接,创作者后续使用字节系的文生视频、多模态数字人产品创作内容,都有较大的想象空间。今年春节前,原抖音集团CEO张楠辞任CEO一职,称未来将把精力聚焦在剪映的发展上。这一举动也被业内人士解读为字节跳动将通过剪映在文生视频方向上发力。
然而,有知情人士透露,字节跳动在大模型布局上曾面临战略摇摆的问题。最初,公司准备通过投资方式进入大模型领域,一度考虑投资大模型公司MiniMax和阶跃星辰。但在去年6月,字节跳动决定放弃投资外部大模型公司,转向自研。这一决策是否正确,仍有待进一步观察。
总的来说,字节跳动在AI大模型领域的布局已经逐渐浮出水面。未来,随着技术的不断发展和市场的不断变化,我们期待看到更多创新和突破。