首批深度合成服务算法备案清单出炉,百度、科大讯飞备案大模型算法-当前快报
近日,国家互联网信息办公室(以下简称:网信办)发布《境内深度合成服务算法备案清单》(以下简称:《备案清单》),是国内首批公开的算法备案清单。清单包括阿里巴巴(09988.HK)、腾讯控股(00700.HK)、科大讯飞(002230.SZ)、美图公司(01357.HK)、美团(03690.HK)、快/手(01024.HK)等公司或其关联企业的41个算法。
网信办表示,具有舆论属性或者社会动员能力的深度合成服务提供者,应当履行备案和变更、注销备案手续;深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。此次网信办公布备案清单,有利于推动AI技术规范化发展。
(资料图片)
来源:摄图网
首批深度合成服务算法备案清单公布
近日,网信办发布《关于发布深度合成服务算法备案信息的公告》,公告了首批备案的41个境内深度合成服务算法。同时,网信办表示,根据《互联网信息服务深度合成管理规定》(以下简称:《深度合成管理规定》)第十九条,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续;深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。网信办要求尚未履行备案手续的深度合成服务提供者和技术支持者尽快申请备案。
2022年12月,经工信部、公安部同意,网信办公布了上述《深度合成管理规定》,该规定自2023年1月10日起施行。《深度合成管理规定》明确,深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。
同时,《深度合成管理规定》将深度合成服务的参与者划分为提供者、技术支持者、使用者三类,并明确,深度合成服务的提供者应当落实信息安全主体责任,依法依约履行管理责任,以显著方式提示深度合成服务技术支持者和使用者承担信息安全义务。
深度合成服务提供者应当加强深度合成内容管理,采取技术或者人工方式,对深度合成服务使用者的输入数据和合成结果进行审核。深度合成服务提供者发现利用深度合成服务制作、复制、发布、传播虚假信息的,应当及时采取辟谣措施,保存有关记录,并向网信部门和有关主管部门报告。
此外,深度合成服务提供者、技术支持者提供人脸、人声等生物识别信息编辑功能的,应当提示深度合成服务使用者依法告知被编辑的个人,并取得其单独同意。
事实上,2022年以来,我国先后实施了《网络音视频信息服务管理规定》、《互联网信息服务算法推荐管理规定》、《网络信息内容生态治理规定》等多项法律法规,上述法律法规不同程度地对深度合成技术进行了规范。而《深度合成管理规定》则进一步明确了相关对象的责任。此次网信办发布《备案清单》,是对《深度合成管理规定》的落实。
中信证券在研报中表示,《备案清单》是监管侧对AI产业发展支持的里程碑式落地,该清单的出台,标志着国家对推动大模型等前沿AI技术规范化发展的决心,AI产业化落地有望加速开启,建议从算力层、算法层、应用层关注AI产业链的投资机遇。
阿里、腾讯等巨头均有算法备案,百度、科大讯飞备案大模型算法
我们梳理《备案清单》发现,本次备案的41个算法中,33个算法的角色是服务提供者,8个算法的角色是服务技术支持者。从应用场景来看,41个算法中,有10个应用于智能客服场景。阿里巴巴、腾讯控股、科大讯飞、美图公司、美团、快/手等公司或其关联企业均有算法备案。
服务提供者方面,钉钉科技有限公司(以下简称:钉钉科技)、深圳市闪剪智能科技有限公司(以下简称:闪剪智能)均有4个算法备案,北京三快科技有限公司(以下简称:三快科技)、北京百度网讯科技有限公司(以下简称:百度网讯)、广州酷狗计算机科技有限公司(以下简称:酷狗科技)均有2个算法备案。
其中,钉钉科技的钉钉语音识别算法、钉钉翻译算法、钉钉图像识别文字算法、钉钉智能客服算法均应用于钉钉APP,分别用于识别语音消息及生成识别后的文本信息、实现对特定语种的翻译服务及生成翻译后文本信息、提取识别图片中文字及生成提取后的文本信息,以及根据用户咨询内容,生成文本、图像、音频、视频等形式的回答。
闪剪智能的逗拍风格迁移算法、逗拍动作驱动算法、逗拍人脸融合算法、逗拍人脸属性编辑算法均应用于逗拍APP,分别应用于视频制作场景、人脸图像及视频生成场景、人脸图像编辑场景等。
三快科技的美团电/话智能客服算法、美团在线智能客服算法应用于美团APP,主要应用于电/话智能客服场景,用于生成用户问题的语音、文本智能回答。
酷狗科技的酷狗音乐语音克隆算法、酷狗音乐歌声合成算法应用于酷狗音乐APP,分别基于用户录音数据,提取用户音色特征,生成与用户音色一致的音频信息或制作歌曲。
百度网讯的百度文生图内容生成算法、百度PLATO大模型算法分别应用于文心一格网站、小侃星球APP。前者利用图文匹配神经网络模型和扩散生成模型,生成与输入文本语义一致的图像;后者基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答。
此外,本次备案的还有深圳市腾讯计算机系统有限公司(以下简称:腾讯计算机)的腾讯会议虚拟背景算法,该算法应用于腾讯会议APP,利用人像分割得到像素级背景区域,实现对视频背景区域的模糊或替换,生成背景虚化或背景替换后的视频;腾讯音乐娱乐(深圳)有限公司的腾讯音乐语音合成算法,该算法应用于QQ音乐APP和全民K歌APP,利用语音合成技术,将文本内容转化为有声读物。
阿里系方面,除了钉钉科技外,浙江天猫网络有限公司备案了天猫小蜜智能客服算法,杭州拣值了电子商务有限公司备案了淘特小蜜智能客服算法,上海淘票票影视文化有限公司备案了淘票票小蜜智能客服算法,杭州菜鸟物流信息科技有限公司备案了菜鸟物流智能客服算法,杭州阿里巴巴广告有限公司备案了1688阿牛智能客服算法。上述算法分别应用于手机天猫APP、淘特APP、淘票票APP、菜鸟APP及小程序,以及1688工业品APP、阿里巴巴APP及网站,用于识别文字或语音问题,生成文本、图像、音频、视频等形式的回答。浙江淘宝网络有限公司备案了淘宝人生表情动作复刻算法,该算法应用于手机淘宝APP,用于识别照片中人物表情动作,生成淘宝人生形象图片。
北京快/手科技有限公司备案了快/手短视频生成合成算法,该算法应用于快/手APP,利用生成模型对用户上传图片、视频进行属性编辑或风格转换,生成图片、视频。北京抖/音信息服务有限公司(以下简称:抖/音信息)备案了剪映特效算法,该算法应用于西瓜视频APP、轻颜APP、剪映APP、抖/音短视频APP等,基于人像理解技术和视频剪辑技术,实现对用户上传图片或视频的渲染处理与格式转换,生成编辑处理后图像或视频。
厦门美图网科技有限公司备案了美图图像深度合成类算法,该算法应用于美图设计室APP、美图秀秀APP、美颜相机APP等,基于图像内容理解结果,实现对用户上传照片的艺术化重新生成。
科大讯飞备案了讯飞语音识别算法,该算法应用于讯飞输入法APP,通过提取语音中的声学特征,结合语言模型,识别短音频,生成文本信息。
服务技术支持者方面,腾讯计算机备案了腾讯云人脸融合算法、腾讯云语音合成算法,分别服务于图像、视频编辑类的企业端客户及音频、视频合成类企业端客户,通过API提供用户面部特征融合功能及文本转语音功能。
阿里巴巴达摩院(杭州)科技有限公司备案了达摩院开放域自然对话合成算法、达摩院图像合成算法、达摩院交互式多能型合成算法,分别服务于智能对话类的企业端客户、图像合成类的企业端客户,以及问答、咨询类的企业端客户,通过API提供对话生成功能、文字信息转化为图像信息的功能、根据用户输入生成多模态信息的功能。
科大讯飞备案了讯飞星火认知大模型算法,该算法服务于问答、咨询类的企业端客户,利用文本、代码、prompt数据及用户反馈数据训练AI大模型,通过API提供文本生成服务。
抖/音信息备案了火山引擎智能美化特效算法,该算法服务于图像编辑类的企业端客户,通过API提供人脸图像美颜功能。