《科创板日报》4月7日讯(编辑 郑远方)当ChatGPT横空出世,当谷歌、微软等接连开放AI搜索或聊天工具,延续了数十年的人机交互历史终被颠覆。普通用户下指令不再需要用Python、SQL等写代码,只要简单打字说话即可。
这场AI风暴由此催生了一个全新的岗位——提示工程师(Prompt Engineer),有人甚至无需编程技能,便有望实现年入百万人民币。
【资料图】
在AI领域,特别是AI作画领域,很多人难以借助AI获得理想作品,而这时人与人的差距,或许就体现在提示(prompt)上。有时候,一行精准、专业且完美的prompt,甚至可以价值千金。
但短短4个月,“提示工程师”这个诞生于AI的岗位,或许也即将被AI扼杀。
去年12月史上首位正式提示工程师Riley Goodside入职,今年2月末提示工程师招聘热潮涌起,而本月AI作画工具Midjourney最新版本 V5上线新功能“/describe”,可以“看图说话”,无需人类插手便可直接从图片反推prompt。
在“/describe”功能中,用户可以上传任何图片,Midjourney会自动分析图片,并生成四个与图片相关的prompt与对应按钮。用户可以直接点击这些按钮,快速创建出更多相似的图片,或以这些prompt为基础,生成新作品。这一新功能也得到了用户的一致好评。
例如,若将乔治•华盛顿图像输入Midjourney,便可生成4种prompt:
对此,Midjourney识别出了图像主体华盛顿,给出的每一条prompt都颇为精细,涉及内容包括:画作颜色、风格、年代、画家、尺寸、应用场景等。
对应生成的图片也各有不同:
(图片来源:Matters)
还有用户根据一张NASA登月任务中的宇航员合照,生成了一张足以以假乱真的新图:
(图源:Medium)
从Midjourney最近的更新来看,这一AI作画“神器”的进步堪称飞速。
英伟达AI科学家Jim Fan猜测,Midjourney一直在通过人类用户反馈,进行大规模强化学习,这甚至可能是有史以来规模最大的文本到图像强化学习。
当用户选择放大一张图片时,也暗示着相较其他图片,他更喜欢这张。这个行为便可以当做一个“奖励信号”,这些数据收集并不昂贵,且完全符合用户群需求。当用户越多,获得的反馈就越好,还有助于反过来进一步提高用户数量。不过Fan也强调,这些仅仅是猜测。
从最新的“/describe”功能可以看到,在冲击了部分原画师岗位之后,AI也开始在绘画领域“代劳”提示工程师的工作。
AI会比人类做得更好吗?这一功能未来会延伸到视频或者其他领域吗?让我们拭目以待。