中新网北京8月9日电 题:周鸿祎:让通用大模型“走下神坛”,真正进入千家万户
中新财经记者 夏宾《c8com》
ISC2023第十一届互联网安全大会9日在京召开,会议期间,360集团创始人周鸿祎在接受中新财经等媒体采访时直言,通用大模型热了一阵之后,大家都在反思通用大模型存在的一些问题。
在周鸿祎看来,通用大模型涉及的问题有两个方面。一是要真正打造一个超强的“全知全能”的大模型所需要的算力和训练成本都非常高,这对于中国市场而言还需要一点时间。
二是通用大模型对普通用户使用起来并不太友好,需要用户变成一个提示词或者指令专家,在中国要发展大模型,现阶段从国家政策来看,仍应围绕产业数字化这一战略来发展大模型。
“所以看通用大模型,我提出来走垂直化、产业化、专业化、企业化之路。因为在企业发展过程当中,有非常多的小场景比较适合大模型,垂直化、产业化的大模型选择的场景相对小切口,对于能力要求不一定那么强。”周鸿祎解释说,这甚至有点像偏科生,不一定要求综合能力很强,如果做这样的大模型,难度反而会降低,而对于企业来说可承受的成本代价包括交付时间,也会减少很多。
周鸿祎透露,360正在训练数字安全大模型,基于其庞大的网络安全大数据,现在要补上真正的深度学习的大语言模型能力,让它从数据大脑真正变成智慧大脑。
他认为,在安全领域,未来还会有各种各样的垂直类大模型,就可以解决不同问题。如果垂直类大模型不需要用千亿或万亿模型,可能用百亿、十亿、几十亿模型,这样模型的整个训练时间、调试成本、部署成本等大概会比GPT的成本低百倍以上,如此才有可能让大模型“走下神坛”,让大模型赋能百行千业、走进千家万户,才能真正掀起新一轮工业革命。(完)