复制成功

分享至

主页 > 比特币 >

如果AIGC继续发展,你相信哪个世界?

2022.12.05

作者:周志峰、胡奇,均为启明创投TECH投资团队成员,周志峰是启明创投合伙人,胡奇是启明创投投资经理。

来源:未尽研究

如果AIGC继续发展,你相信哪个世界?

图片来源:由无界版图 AI生成

编者按:

今年以来,由游戏设计师杰森·艾伦使用AI绘图工具Midjourney绘制的作品《太空歌剧院》夺下了美国科罗拉多博览会的年度艺术比赛的首奖,引起艺术家和社交媒体的热议,也让AIGC(人工智能自动生成内容)概念成为AI界年度热词,并掀起了一股AIGC投资热潮。AIGC真如外界所宣传的那般美好吗?其背后的创新创业生态将如何构建?

从2012年AlexNet取得深度学习里程碑式的突破以来,启明创投在过去的十年中都是中国最活跃的人工智能投资机构之一,我们见证了人工智能从算法到应用的一次次突破和发展,对人工智能的前景我们始终保持着热情和理智。启明创投开设硬科技前瞻专栏,希望从创投视角深度解读前瞻技术突破,多维度剖析行业趋势,寻找新锐科技力量。

如果我和你说,未来AIGC可能有两种世界:一种世界是多个大模型基础公司,为上游应用提供API和模型服务,上游应用公司只需要专注于开发产品逻辑和上层算法;而另一种世界则如同今天的AI公司一样,每家公司都根据自身需求研发底层大模型,为自身应用提供技术支持。

你对任何一种世界的相信都将构成你当下投资和创业的选择,当然,这两种世界也可能存在互相交织的过渡形态,但需要你来对过渡形态的持续时间进行判断,你会选择相信哪一种世界?

AIGC的两种世界

如果AIGC继续发展,你相信哪个世界?

先不用着急给出你的答案,再问你两个问题:

1、如果GPT-4,或者3年、5年后最好的模型比GPT-3大100倍甚至1000倍,作为创业公司是否还要自研?

2、在某个领域的底层基础模型尚未成熟的时候,选择在该领域进行创业是很好的timing吗?

如果你对未来的AIGC世界和这两个问题感兴趣,我们将进入今天的文章。我们将简单回顾近期热闹的AIGC,从中探寻AIGC在今年火爆的根本原因,并将结合强化学习奠基人之一Rich Sutton的“AI 70年惨痛的教训”和Jasper.AI、Copy.AI等公司的发展,做出我们对于这个世界的判断。相信看完以后,你也将会得出自己的答案。


引爆用户的AIGC


如果用一个字形容过去几个月的AIGC(AI Generated Content)/Generative AI那么应该是“火”。Midjourney的作品获得美国科罗拉多州博览会的数字艺术比赛一等奖,引发关注和广泛争论,有人戏称AIGC让每个画师都在担心失业。与此同时,今年相对沉寂的VC迎来新风口,连续轰炸的AIGC公司的融资消息和新闻让VC又一次产生FOMO (Fear of Missing Out)的情绪;DreamStudio、Midjourney等AI作画应用符合视觉消费的时代主题,引爆了C端热情。

Midjourney的获奖作品 - 太空歌剧院

如果AIGC继续发展,你相信哪个世界?

Théâtre D’opéra Spatial

其实AIGC并不是一个新颖的概念,AIGC即用AI算法生成文本或者图像等内容,各种NLG(自然语言生成) 模型和GAN(生成对抗网络)及其变种模型都是此前的生成式AI模型。如果你打开谷歌搜索AIGC,会发现排在前面的基本都是中文网站,因此有人说AIGC是一个国产概念,与之对应的海外概念是Gartner在2019年提出的Generative AI,为统一理解,本文将采用AIGC来表达AI生成内容。

我们观察到新一波AIGC浪潮起源于2020年的预训练大模型GPT-3,现在火爆的图像生成、视频生成、3D生成等,本质是大模型从文本生成扩展到多模态,并结合原有模态算法进行实现(当然,以图片生成图片等本模态之间的AI生成,以及图像生成视频、2D生成3D等跨模态生成也是AIGC,例如VAE、StyleGAN、Nerf等与AI生成相关的模型都在GPT-3发布之前或之后提出,但这些方向的工作并非引爆新一波AIGC的主要原因)。因此,我们看到的大量AIGC应用,目前的表现形式大多为输入一句话,生成一句话/一张图/一段视频/一串代码等。

如果AIGC继续发展,你相信哪个世界?

1750亿参数的GPT 3曾一度是AI历史上最大的机器学习模型,相比于15亿参数量的GPT 2,GPT 3参数量提高约117倍,预训练的数据量也从50 GB提高到570 GB。2020年发布GPT 3的时候,OpenAI并没有将工作重点放在模型结构的创新上,反而是进行了大量工程化的工作,充分展示GPT 3通过Zero-Shot、One-Shot和Few-Shots(即不需要额外数据进行微调,直接给出几个样例就可以让模型做出正确的生成)等Prompt方法完成多种NLP任务的通用性和泛化能力。通过释放出API接口供公众调用,GPT-3的商业化也正式提上日程。GPT-3展示出惊人的效果后,一年后顶级实验室和科技大厂陆续发布自己的NLP预训练大模型,模型参数量呈现指数级别的增长。

深度学习模型中参数数量的指数级增长

如果AIGC继续发展,你相信哪个世界?

随后的一年内,OpenAI进行了多次多模态的探索,其中最知名的是Text-to-image系列模型DALLE和DALLE2。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier