在加速全球化过程中,这家中国海外互联平台找到了一个更好的切合点。
12月15日,昆仑万维在北京举行AIGC技术发布会,会上昆仑万维CEO方汉正式发布了昆仑天工AIGC全系列算法与模型,并宣布模型开源。
(资料图片仅供参考)
据了解,昆仑天工旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。
有意思的是,昆仑天工起先源于规模不大、团队成员不足50人、用于海外版全民K歌平台——Star X的AI作曲。出发点也很简单,想让海外用户在K歌的同时,还能圆一下自己音乐创作家的梦想。
正是基于不断满足海外4亿用户的更好体验,曾经这个不到50人的团队已发展到研发团队200余人,除了AI作曲外,昆仑天工形成了多模态内容生成能力,涵盖了AI图像、AI文本、AI编程。并且这几个模型都选择了开源。
“昆仑天工之所以选择开源,因为我们坚信开源是推动AIGC生态发展的土壤和重要力量。昆仑万维致力于在AIGC模型算法方面的技术创新和开拓,致力于推进开源AIGC算法和模型社区的发展壮大,致力于降低AIGC技术在各行各业的使用和学习门槛。”方汉介绍说,把技术开源是一个非常好的把握Web3时代机遇的方法。开源的迭代速度远远超过闭源,能够极大的促进行业生态发展。同时还可以加速全球化,让更多海外公司和用户参与开源社区的建设中,这样就极大推动了中国公司全球化的进程。
据悉,昆仑万维是中国第一个全身心投入面向全球用户的AIGC开源社区的公司。
趟出来的全球化加速度
昆仑万维在2008年成立之初便切入海外市场,“航海”经验丰富。在出海过程中,又通过收购、内部孵化等方式不断丰富业务矩阵。
目前,昆仑万维已经从一个以移动游戏为核心的公司,发展为聚焦互联网主赛道、多元化布局的企业集团,旗下版块主要包括:海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games和休闲娱乐平台闲徕互娱以及投资业务。
昆仑万维已经进入全球100多个国家和地区,全球月活跃用户近4亿。如何更好地服务这一规模庞大的用户群体?这个问题曾一度是方汉考虑最多的。
目前,海外最大的 K 歌软件是美国的 Smule。Star X主打 Smule 没有到达的地区,做长尾市场,也就是那些多样化的——大公司看不上的人群和市场。
方汉说,关注长尾流量,并且给长尾流量提供非常精准的出口,会获得非常好的自增长,而音乐的长尾流量特别明显。
譬如,主流语言有非常多的内容,但小语种的用户群也很庞大,却没有足够的小语种内容(包括语言、音乐、长短视频)来满足他们。Star X 自己做语料库,每个语种要花几百万美元,目前做了九种语言。
ROI 模型调出来后,Star X在东南亚与中东核心国家排到了音乐和音频下载榜前三。接着它拿下了拉美和俄罗斯市场,今年的重点是欧洲。2021 年上半年,Star X 用户日平均在线时长为 49 分钟,仅次于 YouTube(77 分钟)、Tiktok(71 分钟)和 Facebook(55 分钟)。
写歌(创作)、K 歌、听歌三个市场,规模从小到大递增。StarMaker 思路是,先把 K 歌的人吸引进来,再吸引创作者,再想办法切到比 K 歌市场大十倍的听歌市场。
中国企业出海喜欢平移国内的成功产品,但成功率非常低。方汉说,他们在海外的运营思路是从下往上,因为 “企业想干什么,和用户想要什么两回事。”
他们也不太担心有竞争对手,因为 “这块领域巨头根本看不上”。但对于方汉来说,并不是就可以高忱无忧了,持续的技术投入,才是守住这块长尾市场的根本。
当初AI作曲或许就是基于这样的考虑诞生,发展成如今的昆仑天工的一部分。
“StarMaker在音频技术上的积累,让我们进行AI作曲研发的起点比较高。” 方汉介绍说。
但很少有公司给音乐做文字标注,导致样本量很少,训练AI作曲就比较困难。
StarMaker有些不同。作为StarX旗下的主力产品,其出发点是做一个海外最好的K歌品牌,因此在音频技术上持续投入了很大的研发力量。“很多在海外做音视频的公司,都是采购声网的服务,但是我们的音频技术都是自研的。”方汉说。
StarMaker还有美化声音的技术,用户使用再低配的手机唱歌都会悦耳动听,效果非常好。
StarMaker做K歌产品,是要对音乐做标注的,否则没法判断用户唱得好不好,因此积累了包含大量曲目的数据集。有了数据集,AI作曲方面的研发就有了基础。
除了数据集的优势,昆仑天工在AI作曲的算法模型上也进行了很多革新和优化。
目前AI作曲成为昆仑天工跑得最快的一个,其在商业化方面已经取得了初步进展,已经有 MCN公司采购AI创作的曲子,“AI创作可以大幅降低内容生产成本,充分满足个人用户和MCN机构等企业用户的需求”,方汉表示。
昆仑万维的长期目标是把AI作曲的能力SaaS化,让第三方可以通过调用接口来生成曲谱。方汉认为,“我们在2至3年之内就能实现这个能力,用户输入关键词,AI就可以自动生成一首不错的曲子”。
除了建立音乐实验室,进行AI作曲方面的探索,昆仑万维还建立了一支VR音乐游戏研发团队,目前已经开发出三款游戏,第一款打鼓的音乐游戏今年9月30日已经上线了Oculus。后续产品也会逐步上线。11月,StarMaker VR平台成功加入Oculus开发者扶持计划,获得Oculus开发者资质认证及资金支持。
“我们对音乐很熟,又有游戏研发实力,跨界融合做音乐游戏是一个很好的竞争赛道。”方汉说。
正是基于AI作曲的成功,这一AI模型助推昆仑万维朝着全球AIGC领域延伸,成为昆仑万维全球化加速度的引擎。
做Web3时代的领先者
Web3时代是互联网演进趋势的必然,任何互联网公司想要取得长足发展都不可能回避这一浪潮。
“把技术开源是一个非常好的把握Web3时代机遇的方法。当初开发昆仑天工平台,开源就是我们首先考虑到的, 因为开源是推动AIGC生态发展的土壤和重要力量。”方汉表示。
昆仑天工是一个全模态的模型,于2020年底开始-2021年4月份做了百亿参数的中文GPT-3模型;2021年8月份开始开启虚拟人业务,研发出了基于gpt-3和metahuman的自主驱动高精度虚拟人产品; 2022年1月启动AI音乐实验室,是国内第一款商用级作曲AI模型,2022年9月份启动编程、绘画、文本方向的AIGC产品。
“我们希望利用4个模型的技术优势,未来促进多个行业、全图景式降本增效。”方汉介绍说。
目前,昆仑天工已开始在昆仑万维各多元业务中得到了融合。未来昆仑天工将全面激活昆仑万维内部多元业务的“神经系统”,提升元宇宙、文娱、社交等业务版块的内容生成能力,助推内部业务的动能切换。此外,昆仑天工也将为全球用户输出定制化AI内容生成能力,提升C端用户效能,促进多行业B端企业降本增效。
AI能够推动行业降本增效亦成为共识。AI正在重塑内容生产方式,推动人类生产关系的变革,这种变化在当下正在发生,有实力的玩家能够抓住这波浪潮,顺势而上。基于全球海量用户以及在社交、游戏、内容形成的多场景商业沉淀和顶尖的互联网运营能力,以及领先开源模型,昆仑万维将在全球市场获得全新的增量空间。
显然,昆仑天工既开启了昆仑万维的全球化加速引擎,也让昆仑万维在未来独立潮头,领先AIGC时代。(孙先锋)