(相关资料图)
证券时报网讯,12月15日,昆仑万维(300418)在北京举行aigc技术发布会,正式发布了「昆仑天工」aigc全系列算法与模型,并宣布模型开源。据了解,「昆仑天工」旗下模型包括天工巧绘skypaint、天工乐府skymusic、天工妙笔skytext、天工智码skycode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内aigc领域布局最为全面的公司之一,也是国内第一个全身心投入到aigc开源社区的公司。
昆仑万维ceo方汉表示,“昆仑天工之所以选择开源,因为我们坚信开源是推动aigc生态发展的土壤和重要力量。昆仑万维致力于在aigc模型算法方面的技术创新和开拓,致力于推进开源aigc算法和模型社区的发展壮大,致力于降低aigc技术在各行各业的使用和学习门槛。”
据介绍,ai图像方面,天工巧绘skypaint采用全球第一款多语言stable diffusion分支模型,兼容stable diffusion;使用1.5亿中英双语语料,支持中英双语输入实现文字生成图像,是国内为数不多的支持中英双语的文图生成模型。
ai音乐方面,天工乐府skymusic是国内第一款商用级作曲ai模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到92.5%,支持中文、英文、日文、韩文、法文等31种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。基于昆仑万维旗下starmaker平台大量优质作品曲库,目前面向全球音乐市场,已在美国、韩国、印尼等国家及全球180多个音视频平台发行了近20首人工智能生成歌曲。
ai文本方面,天工妙笔skytext4采用生成效果最好的开源gpt中文预训练大模型,针对中文领域构建了千亿级别的高质量数据集,通过高性能a100-gpu集群,训练200张显卡,训练4周,后续优化2周,得到百亿参数量的gpt-3生成模型,提供包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等功能,与现有大模型的比试中排列前茅。
ai编程方面,天工智码skycode采取全球第一款多语言开源编程大模型,支持多种主流代码语言skycode能够生成的代码,不仅包括使用广泛的python、java、c等,还涵盖了php、go、swift等共计十余种编程语言,使不同语言的使用者都能来体验skycode强大的代码生成能力。
公司方面表示,未来昆仑天工将全面激活昆仑万维内部多元业务的“神经系统”,提升元宇宙、文娱、社交等业务版块的内容生成能力,助推内部业务的动能切换。此外,昆仑天工也将为全球用户输出定制化ai内容生成能力,提升c端用户效能,促进多行业b端企业降本增效。
据了解,基于对人工智能技术的前瞻性判断,昆仑万维从2020年开始布局aigc领域,训练集群200张卡,投入数千万元,组建了二百余人的研发团队。2020年底至2021年4月份研发出百亿参数的中文gpt-3模型,并于2021年8月开始研发基于自有大文本模型的对话机器人,迅速刷新国内技术指标;2022年1月启动skymusic音乐实验室,2022年4月达到人工智能领域最优效果;2022年9月份启动编程、图像、文本方向的aigc产品。目前ai图像、ai文本、ai编程的模型已经在github上开源。
此外,在发布会的圆桌论坛环节,太合音乐董事长钱实穆,lvs开源项目领导者、前阿里云cto、前滴滴技术vp、中国计算机协会理事章文嵩,海通证券传媒互联网首席分析师毛云聪等业内嘉宾共同探讨了aigc未来商业化前景。(燕云)