AI只有Chat?——AIGC产品进化论
AI技术发展趋势分析,探讨人工智能在各行业的应用前景和商业价值。
发布时间
预计阅读
1 分钟
从2022年年底到现在,接近两年的时间,AIGC产品从无到有,从简单的Chatbot套壳和单次generate,发展到现在,不仅应用到了各种应用场景和领域,而且产品形态也有了很多的发展。
本文从用户需求的发展来聊聊AIGC产品形态的发展。
AI从Chat开始
自从ChatGPT爆火,很多套壳GPT接口的通用chatbot出现了,因为信息差、网络、价格、OpenAI的限制等等各种原因,这些chatbot,靠着SEO快速获取流量并赚到了钱。
而且,时至今日,这些chatbot依然活的很不错,毕竟AIGC时代,对chatbot的需求,仅仅一两个ChatGPT这样的巨头是远远不够的。
Generator大爆发
然而,通用的chatbot是远远无法满足具体场景的需求的。而且,从ChatGPT的爆火开始,各种Generator的需求出现井喷式的增长,包括文字、图片、视频、音乐等等。于是,各种简单的单次生成的Generator开始大爆发,从去年一直到现在,势头只增不减。
两种基于单论对话的Generator
总结下来,这种基于单轮对话的Generator有两种。
第一种,是基于单个大模型的单轮对话生成结果。
比如,比较常见的文字生成、图片生成等。
第二种,是基于多个大模型的单轮对话生成结果。
就是说,基于一次prompt的提交,多个大模型生成不同的结果,最后组合数据,返回给用户。
最典型的就是音乐的生成,像Suno,提交一段prompt,它不仅会生成音乐,也会生成这个音乐的封面图、标题和歌词。而且,这其中是有流程的。先生成标题和歌词,然后再生成音乐。
基于单论对话的Generator大爆发的原因
其实,基于单轮对话的Generator,以及基于单轮对话的AI Search和AI Answer的大爆发有两方面的原因。
一方面,是用户各种用户场景对AI的需求井喷式增长
但这些需求相对比较简单,只要能简单地生成比较满意的结果就可以。因为只要能做到这一点,就能比以前的方式大幅度地提升效率和提升质量。
比如,写一封邮件,以前需要花上一些时间,思考一下,一句句写出来,但有个AI Email Generator,只要提要求,就能得到一个基本满意的结果,然后,自己稍微改一下就可以了。
另一方面,是开发成本的问题
对于做AI产品的站长和开发者来说,这种单轮对话的generator开发简单,没有多大的开发成本,可以快速做出来,上线,然后通过SEO获得大量的流量,并且变现。
AI回归Chat
然而,今年以来,有一个明显的变化。
针对特定场景和需求的、基于Chat,也就是基于多轮对话的Generator开始强势登场。相对于基于单轮对话的Generator,它的优势非常明显。
基于单轮对话的Generator是有问题的。
做过这种基于单轮对话的Generator的朋友们感受应该会比较明显,用户对这种产品的使用方式是用同一个prompt多次Generate,得到多个结果,然后,如果有满意的,那就结束,如果没有满意的,要么修改prompt再次尝试,要么就放弃了。
无论是文字的生成还是图片、音乐、视频等的生成,都是这样。
如果没有做过这种基于单轮对话的Generator,可以去discord上的midjourney服务器,看一下就知道了。
原因其实也简单,用户使用这种基于特定场景和需求的Generator,目标就是能简单地获得自己想要的结果。
然而,基于单轮对话的Generator,每次生成,其实得到的都是不确定的结果,这个结果,用户可能满意,但更多时候是不满意,所以,用户就只能多次尝试,甚至稍微该动prompt,之后多次尝试,以期得到一个满意的结果。也就是说,这种产品无法给用户一个获得确定的满意的结果的方式。
但,基于Chat(多轮对话)的Generator就不一样了,用户第一次生成后,如果不满意(绝大多数情况下是不满意),可以让AI在这个基础上修改,甚至是多次修改,直到得到一个满意的结果。
也就是说,基于Chat的Generator给了用户一种获得确定的满意的结果的方式。
比如,V0这个产品,基于Chat,生成代码,把代码版本管理加入进来,每一次Chat和修改,就会在原有的代码基础上,生成一个新的版本。
再比如,交互式故事生成器,每一次Generate,生成这个故事的一个段落,然后用户再continue或通过prompt控制情节的发展生成下一个段落。
这些都是基于单轮对话所无法达到的,但却是用户能得到自己想要的确定的结果的方式。
AI只有Chat?
需求是递进的
[pms-restrict]
用户的需求总是递进的。
第一种:
当一个新鲜事物出现时,用户对它的需求往往只是尝试一下、体验一下。
第二种:
然后就会有基于特定场景的需求出现,这个时候,需求往往只是简单和粗糙的。这个时候,一个简单粗糙的产品其实才是最容易成功的。
第三种:
只有体验过了这种简单粗糙的产品,用户才会有更高的需求,对产品的要求也会越来越严苛和细分。这个时候,产品会越来越细分,越来越针对特定的用户和场景,只有这样才能接得住用户的需求。
AIGC,目前,可以说三种都有,而且三种情况的需求强度都很高。但随着时间的推移,我认为以下三种会逐渐脱颖而出。
产品的方向
后续,我认为以下三个方向会出现大量的AIGC产品。
适应各种细分场景的基于多轮对话的chatbot
这个不用说了。
基于各种细分场景的工作流式的Generator
目前,比较典型的就是AI PPT了,先生成大纲,再一页一页的生成,而且每一页都会有文字和图片的生成。
而实际上,很多内容的生产都是需要一个工作流的,比如视频,写剧本、分镜、视频生成、声音、字幕等等。
所以,基于各种细分场景的工作流式的Generator会越来越多。
主动式AIGC
写代码的朋友都体验过cursor了吧。
TAB键,从未变得如此重要和高频。这都是cursor的主动式的补全和修改的提示在不断地出现,而且大多时候,还很正确。
这种基于现有内容的主动式的提示,应该会出现在更多的场景和产品中。
[/pms-restrict]
总结
AIGC时代,我们要如何工作和创作?这是所有AIGC产品都将面临的问题。
推荐大家去看《西部世界》这个美剧。
2018年,我做了一个机器人,而那一年,正是《西部世界》第一季火爆的时候,说实话,这部美剧对我做那个机器人启发很大。
https://www.lyustu.com/%e4%bb%80%e4%b9%88%e6%98%af%e5%89%a7%e6%83%85%e6%9c%ba%e5%99%a8%e4%ba%ba/
https://www.lyustu.com/%e5%85%b3%e4%ba%8e%e5%89%a7%e6%83%85%e6%9c%ba%e5%99%a8%e4%ba%ba/
去年(2023),《西部世界》第四季播出,我看了之后,对一个场景印象特别深刻。
女主在公司,创作一个游戏的场景,她对AI描述了一下大致的情况,然后AI直接渲染出了3D的人物和场景。然后,女主又多次告诉AI如何修改,甚至是否定AI的创作。
这不就是AIGC产品的终极交互方式吗?至少也是终极交互方式之一啊。
继续探索
更多前沿科技洞察正等待你发现