大模型赋能行业发展
2023-10-31 16:50 知音官网发布
10月18日,在“出版、发行与大模型应用高端论坛”上,北京师范大学新闻传播学院媒介融合与数字出版中心主任、国家新闻出版署出版业科技与标准重点实验室出版业用户行为大数据分析与应用重点实验室主任秦艳华发布了《出版业人工智能大语言模型应用研究报告》。《报告》以人工智能大语言模型应用于出版业的实践为基础,以此展开对国内外的应用现状、呈现问题、解决对策及发展趋势4个方面的分析,以期为我国出版业的发展提供助力。
应用现状
《报告》指出,ChatGPT大语言模型2022年问世后,推动了大语言模型的发展。我国研究机构、企业也研发了多种人工智能大语言模型。截至2023年9月26日,据不完全统计,国内168个单位研发出182个人工智能大语言模型。尽管数量较多,但和国外的ChatGPT相比,仍然缺乏一个断层式领先、被业界公认的人工智能大语言模型。
国内出版业对人工智能大语言模型的应用,整体呈慎重而乐观的态度。国内出版业还未将大语言模型完全应用于图书出版全流程,但在部分出版环节,比如编辑校对、文献翻译、有声制作、阅读推荐等方面已有大语言模型应用的探索和实践,多家出版机构已与大语言模型的技术支持方展开了深度合作。
2023年2月,人民交通出版社宣布将接入百度文心一言,成为首批合作伙伴之一。3月,华龄出版社出版了由人工智能大语言模型生成的图书《ChatGPT:AI革命》。7月,世界人工智能大会现场,蜜度发布蜜度文修大语言模型,90秒校对20万字,助力中文内容校对提质增效。果麦文化以1500万元增资星图比特,并签订AI文字校对软件开发合作协议。9月21日,“版阅AI内容服务平台”正式宣布上线,并启动内测版阅AI内容服务平台,依托智谱AI自主研发的GLM-130B大模型为技术支持,以及中国新闻出版研究院权威的基础研究数据,该平台具有内容生产、在线编审、逻辑判断、文章润色的功能。
相对而言,国外人工智能大语言模型在数字出版领域有较多应用。
亚马逊在2023年年初就开始上架ChatGPT大语言模型编撰的各类书籍,并专门开辟了ChatGPT大语言模型为作者的书籍专栏。截至2023年10月13日,在亚马逊官网以“高级检索”方式,检索署名作者为“ChatGPT”的书籍,已有1024本,并有以“AI”为作者署名的书籍在发售,具体销量有待进一步评估。人工智能作为作者的书籍在国外已经被大量出版。目前,在国外,大语言模型在选题策划、文本创作、插图设计、编辑校对、有声阅读制作等工作中发挥了一定作用。例如,在选题策划方面,大语言模型通过持续性对话,激发作者灵感,或提供选题参考给作者选择,进而协助图书创作。在文本创作方面,ChatGPT作为作者创作的书籍主要有自我描摹类的工具书、故事小说及基础教材等。在编辑、校对方面,可协助编辑进行文字编校、语句修改、文献检索、查重、翻译等工作。在插图设计方面,大语言模型参与设计图书封面与插图,根据内容进行具象化的形象设计。在有声阅读制作方面,基于人工智能的大模型技术在有声阅读市场具有较大的发展前景与开发空间,如微软研发的AI语音工具VALL.E,可以模仿人类说话,并带有情绪地进行语音输出。
问题与对策
针对以上问题,《报告》提出了针对性的解决措施与建议。一是完善管理制度,加强版权意识。二是大语言模型再升级,建立校对审核。三是打通云端共享渠道,推动出版落地。四是构建把关机制,提高原创积极性。五是设置风险预防规则,完善数据保护机制。六是共创素养提升体系,构建良好人机关系。
《报告》还进一步指出未来出版业应用人工智能大语言模型的发展趋势。第一,通用大模型将有望与各行业深度融合,增强专用性,出现专用出版行业的大模型。第二,大语言模型成本开销和存储空间有望实现轻量化。第三,大语言模型的可解释性与可控性未来将有望实现长足的发展。目前,大语言模型缺乏一定的透明度。并且,大语言模型存在非真实性和偏见性输出。研究人员已经从技术的角度提出提高大语言模型可解释性和可控性的方法,未来将进一步深入发展。第四,互联网巨头权力中心化。大语言模型具有天然的“自然垄断倾向”。第五,形成复杂的人机关系。基于大语言模型生成的广义上的人工智能技术,使得机器的主体性越来越强,机器能够通过自我学习实现自我不断进化,由此带来了多样复杂的新人机关系。第六,政产学研协同发展。政产学研协同合作将成为未来技术创新的组织模式,出版业人工智能大语言模型在实践中应用所产生的问题也需要回到政产学研多方主体协同合作中不断解决。
来源:中国新闻出版广电报
封面图片来源:视觉中国