「这些应用让AI触手可及」
(资料图片仅供参考)
记者 | 何昕晔
编辑 | 王杰夫
Key Points
妙鸭相机成为生成式AI在国内的首款现象级应用;
妙鸭并非来自创业团队,而是由阿里优酷内部孵化;
妙鸭底层技术是搭配了LoRA插件的Stable Diffusion开源模型,你在电脑上也能实现;
妙鸭已经上线苹果应用商店,并时刻准备从9.9元涨价到29.9元。
终于,在ChatGPT引发的生成式AI热潮过去半年后,国内用户总算可以通过「妙鸭相机」(以下简称「妙鸭」)这款照相应用,切切实实地感受下这拨浪潮的温度。
7月17日,这款AI人像生成应用在微信小程序上线。当你上传21张符合标准的个人照片并支付9.9元后,妙鸭便会为你生成一个「数字分身」——其实就是一张你的二维头像;接下来,像在影楼一样,你可以选择各种风格的装扮,正装、校园、古风等等,程序会自动将你的头像与装扮结合起来,生出一张张数字影楼照。
妙鸭相机生成的数字写真
妙鸭相机一经上线便引发了用户极大的试用热情,毕竟谁没有在朋友圈晒过几张装扮夸张、姿势做作的写真呢,更何况你的数字分身还挺养眼。
妙鸭相机从6月30日开始邀请制内测,当时就有上千人参与。正式上线小程序后,高峰期排队人数超过4000人,也在社交媒体平台上引发了新一轮的「晒自拍」热潮。
7月30日,妙鸭相机上线苹果应用商店,小程序版本生成的数字分身可以直接迁移过来,但无法再生成新的数字分身。
妙鸭背后的技术并非独一无二
妙鸭的团队并未对外公开其图像生成模型的底层技术,只是为这个模型挑选了个好名字——「提香」(Tiziano),他是文艺复兴时期的重要画家,尤其擅长色彩鲜艳的肖像画。
但同样是AI创业者的王凯告诉《新皮层》,妙鸭相机实际用到的技术并不复杂,应该是搭配了LoRA插件的Stable Diffusion开源模型。王凯是一位连续创业者,担任过日事清运营负责人,最近创立VentureAI,提供图像生成应用Midjourney API服务。
Stable Diffusion模型是Stability AI公司推出的在行业内使用最广泛的开源图像生成模型,而LoRA是对这种大模型的微调方法。LoRA全称是Low-Rank Adaptation of Large Language Models,最早在2021年由微软的研究人员提出。它只需很少的数据,就可以训练出具有特定风格或特征的模型。
具体实现方式是,利用低秩适配(low-rankadaptation)技术,只训练新加入的数据(比如用户上传的21张照片),之后将由此形成的新参数和已有模型合并。这样的好处在于,服务提供者(比如妙鸭)不必耗费大量算力重新训练模型,只需要用户提交的少量数据(即21张照片)就能够生成特定风格的图像。这就是妙鸭相机只用到了21张照片,就能为不同用户生成个性化数字分身的原因。
其实,在妙鸭相机出圈前,已经有不少用户尝试用LoRA技术生成数字分身。例如在小红书或哔哩哔哩上,搜索「LoRA定制自己的形象方法」就能发现,早在半年前,就己经有AI爱好者推出手把手的视频教程。
B站与小红书上早就有大量LoRA使用教程
而从妙鸭目前实现的效果来看,团队并没有对LoRA技术做进一步优化。理论上,如果用庞大的人脸数据库训练一个基于Diffusion Model的垂直模型,妙鸭能实现更好的数字分身效果。「但这样处理需要高昂的算力成本。」王凯说,「以妙鸭现在的数据看,很难下决心投入做这件事。」
妙鸭出圈其实是产品的胜利
其实,妙鸭并非是一支创业团队。从用动物给产品起名的习惯看,不难猜出它来自阿里巴巴。
公开资料显示,妙鸭相机的主体公司是未序网络科技(上海)有限公司,法定代表人为张龙同时担任优酷视频(西安)传媒科技有限公司的法定代表人、执行董事兼总经理,其监事冯云乐也同时担任了多家阿里系公司的监事职务。所以,妙鸭相机其实是优酷的内部创业项目。
妙鸭的出圈,背后并没有创新性的技术,主要还是基于用户洞察的产品创新。妙鸭相机创始人张月光是互联网圈内一位资深产品经理,曾在今日头条与阿里巴巴工作,负责过今日头条红包雨、字节时光相机、支付宝「集五福」等知名产品策划。通过此次妙鸭的爆红,也能看出他老辣的产品经验。
一是价格便宜。9.9元,一杯奶茶的价格,降低了用户的付费门槛。早在今年5月,美图秀秀推出的同类产品「美颜相机」App就上线了「AI写真」功能,价格也是9.9元,但只能获得一张同风格、同姿势的照片,并没有太多用户付费试用。目前,美颜相机已经调低了价格,从9.9元降到了3.9元。出圈后,妙鸭相机则反过来提升了价格。小程序页面显示,妙鸭目前提供的服务的标准价是29.9元——9.9元是限时特惠价格。王凯称,妙鸭9.9的定价肯定是在亏钱的,国内AIGC类的应用想在C端出圈,低价是决定性的因素。
二是尝试零门槛。妙鸭相机初期搭载在微信小程序之中,不需要下载App即可体验,降低了试用成本。此外,用户只需上传照片并选择想要的风格,将输入Prompts提示词的过程隐藏在了产品背后,降低了用户对于陌生技术的紧张感。
三是产品有传播属性。相比于文字内容,自拍类图像自带社交属性,可以满足自我形象展示的需求,用户有更强的动机在社交媒体上传播这类内容。妙鸭还推出了分享鼓励机制,通过朋友圈分享邀请好友,就可以获得更多钻石,这也加速了用户的自发传播。
四是痛点捕捉准确。「拥有一套高品质的写真需要多少钱?699?1299?3699?除了金钱,拍写真又需要多少步?定档期、化妆、造型、拍摄、选图、修图、交片……不仅如此,很多女生在约拍时,还可能会遇到骗子,钱财甚至安全都得不到保障。」以上是妙鸭官方对于用户痛点的介绍,团队精准地捕捉到了拍写真对于大多数消费者来说,是一项在金钱和时间方面都有很高成本的活动,消费者希望能更便宜、更便捷地得到拍写真的体验。
妙鸭对天真蓝会是「降维打击」么?
无需妆造,仅需上传已有的个人照片,就能收获不同风格的写真。妙鸭相机推出的功能引发了讨论,天真蓝和海马体这类线下照相馆,还有存在的必要吗?
妙鸭相机的确想要做目前海马体们正在做的事。从官方公布的信息来看,团队对妙鸭相机的定位是「每个人的AI摄影师」,希望可以帮助用户「便宜、快捷、安全地追求美」。而社交媒体上的晒图热情也体现了大众对妙鸭生成效果的肯定。「表情自然」「像自己又比自己美一点」是常见的对其的评价。
但是,有很多用户表示,妙鸭相机的生成效果并不稳定,只有几个模版生成的图像是「能看得过去的」,而很多模版生成的照片完全不像本人,「有的很像,有的似像非像,有些瘆得慌」,这是试用者小洁的评价。有些试用者甚至反馈在生成的所有照片中,找不到一张像自己的,「从数字分身环节开始生成的就是另一个人」。此外,双眼皮弧度不太流畅、手部细节粗糙是用户普遍反应存在的问题。
目前妙鸭相机的小程序评分是2.4分(满分5分),在近3000条评价中,可以看到多条「照片失真」的评价。
不过,天真蓝和海马体的写真照就足够「写真」么?
其实去过这两家照相馆拍照的人在拿到他们的照片后,也常有这样的疑惑,好看是好看,但这像我吗?和AI生成的照片一样,在线下拍照,成片失真的情况也非常普遍,还有人拿到的照片在办签证、考试报名等环节根本无法通过。
一位客户在海马体照相馆门店观看产品介绍
其实,线下照相馆也早已用上了AI技术。早在2019年,天真蓝的创始人周扬就表示过,天真蓝的竞争力在于AI人脸识别修图技术,能实现1分钟修图,97% 替代人工,并保证100%通过人脸识别的标准化运作,天真蓝将这套系统称为「AI修图中央厨房」。所以,在这些照相馆获得的照片,也不是个性化的——AI提供了标准化、模版化的流水线作业,这正是照片同质化、失真的原因。
所以,AI生成器有的问题,线下照相馆也少不了。王凯说,妙鸭相机目前的技术水平要代替线下照相馆还有一段距离,但图像生成的技术一直在发展进步,未来是很有可能的。比如,如果AI技术可以帮助用户生成在公安系统可以过审的证件照,那会是一个非常大的进步。
妙鸭还能火多久?
目前,妙鸭主要针对拍写真等场景,但对于大多数消费者,这并不是高频的、需要经常复购的需求。用户愿意为此类产品付费,主要还是因为新鲜,但再次付费的意愿没有保证。
在妙鸭出现之前,去年底国外就有过同类的图像生成应用Lensa,也是基于Stable Diffusion模型,是同类应用中的开创者。Lensa去年11月底推出「魔法头像」功能,用户上传10到20张个人照片,Lensa 就可以生成各类AI自画像或头像。12月,Lensa登顶 App Store「照片和视频」分类下载榜单榜首。
Lensa按次付费的收费标准是,生成50个头像3.99美元、100个头像5.99美元、200个头像7.99美元。此外,Lensa还推出了订阅制的模式。
去年12月,Lensa的下载量突破1700万次,单月收入就达800万美元。但是,这拨热度很快沉寂,到今年1月,其下载量跌至不足200万。
图片来源:Sensor Tower《2023年AI应用市场洞察》
所以,从Lensa的先例来看,这类产品在用户留存方面很难持续。王凯分析,妙鸭相机之所以定价9.9元更多是因为应用处于测试期,如果想保障产品受欢迎就不能定价太高,所以亏钱降低使用门槛,当然能否让用户长期使用是非常大的挑战。
目前,妙鸭采取的留存用户的方式是不断开发出新的模版。最近一周,妙鸭上新了多款国风系列模版。7月29日,趁着电影《芭比》的热度,妙鸭还上线了美式芭比风和Y2K风格的模版。
妙鸭相机新推出的两款造型风格
王凯认为,在AI图像生成的市场中,很多账都已经被算得很清楚了,「比如,能生成在线下场景可用的证件照,能加 10 亿的市场;能生成游戏图,能加1万亿的市场;能生成商业海报,能多几千亿的利润」。所以,妙鸭相机这种并没有技术创新的应用,对市场的影响甚微。
「Lensa作为一个开创性的应用在国外推出的时候,能为市场在图形生成的应用层带来启发,所以能带动一拨商业行为。但妙鸭这样的后来者,其实对当下全社会关注、投资大模型没什么影响,大家都能看到大模型带来的巨大变革。」王凯说。
不过,妙鸭的走红证明了,当下的国内市场,或许并不缺乏先进的技术,要知道最近发布的每款国产开源模型都号称在基准测试中胜过美国竞品;缺少的反而是对用户需求的精准洞察和将生成式AI落地成产品以满足这个需求的能力。
在移动互联网浪潮初期,正是依靠这种能力才诞生了微信、抖音、美团、小红书这些现象级应用;在生成式AI浪潮下,我们期待下一款「妙鸭」。
-END-
本文版权归第一财经所有,
未经许可不得转载或翻译。
2023年金字招牌大调查已经启动啦,
关键词: