为什么你的大模型不能成为生产力?问题很可能出在Prompt上
引言:
你真的会写Prompt吗?
想象一下,对英语没有那么熟练的你正在和一位外国朋友用ChatBot进行翻译交谈。如果你给出的指令是“帮我翻译”,翻译可能会很生硬。但如果你说“请用地道的英语帮我翻译,语气要自然友好”,翻译的质量就会好很多。这里,你对翻译软件的具体要求,就是一个简单的Prompt(提示词)。
Prompt就像是我们与AI沟通的说明书。就如同我们和人类沟通时,说话的方式会影响对方的回应 —— "帮我倒杯水"和"请问能帮我倒杯温水吗?我有点不舒服"就会得到不同的反应。同样,给大模型输入不同的Prompt,也会得到天差地别的结果。
作为人类与生成式人工智能的桥梁,也是使用者唯一可以影响到输出结果的方式,Prompt的重要性一直远远超过大多数人对其的重视程度。怎么写好一个Prompt,也一直都是衡量一个人能否用好AI工具的重要评定标准,而在文生视频成为AI创作者的工具之后更是如此。
譬如你想复刻诗仙李白的经典诗句“举头望明月,疑是地上霜”场景,如果只是把诗句输入其中,那么你只能得到这样的视频:
emmmm,这样的“举头望明月,低头思故乡”确实没有错,但却丝毫没有原先诗句中的情感因素。
而不止是文生视频,在日常使用更多的大语言模型中,Prompt的优秀与否、合理与否,生成的结果可以说是天壤云泥之别。
那么,在大模型已经迈向应用的现在,该怎么写一个符合自己需求的Prompt?又有哪些好玩的Prompt呢?
第一部分:文生图生视频,写好Prompt事半功百倍
最需要写Prompt有能力的,一定是文生图与文生视频了。
因为在日常同各类ChatBot聊天的过程中,哪怕你对Prompt并无任何了解,只是以最直觉的自然语言进行沟通,在多轮对话之后,你总能根据反馈来调节自己的要求。但文生图/视频却不同,受制于生成算力成本与生成时间,一个简单的镜头很难进行十几次甚至几十次的反复微调。
对于更多的普通使用者来说,他们往往会遇到一种情况,那就是明明自己脑中已经有了完美的构想,但只要一面对输入框大脑就一阵空白,想了半天最后只能打出几个字,“一只可爱的小狗”。
生成的结果虽然不错,但我相信,如果你脑海中本来就有了假想图,这些很难让你满意,
此时,学会怎么写一个Prompt,就很重要了。
其中,对于文生图而言,你在Prompt中给出的信息越详细,生成的效果也就会越好。
不过,不同人描述同一张图片有不同的方式,可能有些人会用简单的十几个字描述,也会有人拿出“长篇大论”,用几百甚至几千字“事无巨细”地将所有细节全都纳入其中。
如果你想要把文生图变成生产力工具的话,这都是不可取的。太过简单的Prompt会给大模型过多的想象空间,距离你所希望的模样自然就会有所偏差;而太过细节不仅会浪费大量时间,还会让大模型不明白哪个才是你的主要诉求。
一般情况下,想要生成一张不错的图片,至少需要对“风格、主体、场景、画面、细节”进行限制,只要抓住这些重点,就能保证不会出现严重的漂移,也能大大省下工作量。
就以上面“一只可爱的小狗”为例,若是我想生成一只小金毛在草地上的图片,就可将Prompt进一步丰富,而生成的图片也就完全不同了。
而文生视频也同样如此,其实可以看做是在文生图的基础上让Prompt也“动起来”。
文生图的Prompt可以用“风格、主体、场景、画面、细节”来概括,而文生视频的Prompt核心则是“光影、主体、主体运动、场景、场景变化、氛围”,其实也就是把一幅画的“风格”变成了一段视频的风格——“光影”,“细节”变为了“氛围”,核心思想没有任何更改。
回到开头的“举头望明月,低头思故乡”上来,如果Prompt像下面这么写,就会有不错的效果。
如果不会写Prompt,那就交给大模型吧,几乎所有大模型产品都有帮助用户写Prompt的智能体,只要你给出要求就能得到很好的Prompt了,如果还有什么不满意的地方,也可以多轮对话进行修改。
第二部分:好Prompt,让大模型突破天际,能直接打造出产品
相比于文生图、文生视频所需相对固定的Prompt,其实我们使用最频繁的大语言模型在Prompt上的可塑性更强,只要能配上好的Prompt,大模型给出的上限会被无限拔高。
而其中发生在不久之前且十分有代表性的事件,就是用Prompt将Claude3.5“进化”成为了堪比满血版本的o1。
具体来说,就是在去年11月的时候,一位17岁的少年用一条Prompt,就把o1的思维模式“复刻”进了Claude3.5中,让其本来的思考变得更详细、更拟人。截至目前,已经在Github上拿下了13.9k的星标。
而这个名为“Thinking Claude”的Prompt,把人类“接收到问题之后先详细地分析信息,再思考所有可能解决方式,然后尝试每一种解决方式并进行验证,最后给出详细解答”的过程,逻辑清晰、详尽全面并采用深度思考的方式写成了一条Prompt,只要输入Claude 3.5中,其就能秒变性能强大无数倍的“新模型”。
以“帮我规划一下先去广东后去广西,为期10天的旅行吧”为例,在没有加入Prompt的时候,其并未考虑分配时长和旅行的具体情况,只是粗暴地55分配给两省,接着把10天的旅行时间平均分到了10个市区的不同旅游景点,而且在景点的设计上也更像是把著名景点做出了罗列。
但在加入Thinking Claude后,回答会分为思考部分与正式回答部分,思考部分展现了它有对时间分配、地理位置、季节/天气因素、特色景点和体验进行综合考虑,最后给出了包括行程安排、交通建议和特别提醒的以下回答。
而除了可以全方位增强大模型的能力与回答质量外,还可以用一个Prompt把大模型“捏”成你想要的模样。
其中很有代表且比较好玩的案例,就是Prompt领域顶尖创作者李继刚老师的汉语新解了。
顾名思义,汉语新解就是利用大模型的能力,在Prompt的规范与帮助之下,将一个汉语词组给出更加适合当下环境的解答。
譬如“七上八下”,使用该Prompt后输出的内容就对打工人和股民进行了“阴阳怪气”:
“现代人的日常状态:
早上七点上班,像上紧的发条。
晚上八点下班,像放完的气球。
一天下来,心在天上飘,人在地下跑。
既不是七也不是八,
更像是个无限循环的∞符号。”
“像是股市里的散户:
上涨时心跳七下,
下跌时肝颤八回。
最后发现,
慌得七荤八素的只有自己,
而庄家们正悠闲地喝着下午茶。”
而对于“百度”一词,它也给出了更辛辣的讽刺:
“说是‘有问题就会百度’,
但总是在问题最关键处显示:
‘啊哦,您要找的内容不存在哦~’
倒是广告特别诚实,
永远都在第一条等着你。”
这样品质的汉语新解,已经完全可以当作是一个类似于已经“去世”的小鸡词典的产品了。而这,也是Prompt的强大之处。
而你想要将这样的Prompt也装入你的生活与工作中的话其实也并不难,同上面给文生图与文生视频一样,只要你有想法,大段生成Prompt的工作都可以交给大模型去做,然后再根据输出结果进行微调即可。
不过,虽然有大模型可以作为帮手,但人还是其中的灵魂,想要写一个优秀Prompt既要有足够过硬的工程素质能力,又得有对文本的敏锐表达。而这,也意味着未来优秀的大语言模型使用者一定是“文理兼修”的那个,那么,你有什么想要通过写一个Prompt然后批量处理的工作吗,快来试一下吧!
作者:杨启隆
编辑:丁力
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有