宁津县鑫泽新型建材设备厂
更多>>
更多>>
更多>>
新闻中心

齐向东:既要全又要新!高质量数据是高水平AI的基础

发布日期:2024/7/1 8:03:00

浏览次数: 点赞数: 收藏数: 关注数: 【赞一个】    【举报】    【收藏】    【关注】
齐向东:既要全又要新!高质量数据是高水平AI的基础
杭州日报
6月5日,全球数字经济大会数字安全高层论坛暨BCS2024北京网络安全大会在北京举办。奇安信科技集团董事长齐向东发表了“AI驱动安全”的主题演讲。在演讲的过程中,他用同样一个恶意域名,去提问最新的ChatGPT和奇安信安全机器人QAX-GPT。结果对比发现,ChatGPT只是泛泛提供了一些建议,而QAX-GPT则回答得非常专业且有价值,不仅准确判断出该域名是恶意域名,还给出了专业的判断依据,提炼出核心知识点,基本匹敌一个安全专家的分析报告。
由此可见,经过专业知识优化的大模型在实际应用中具有显著优势,其精确性和实用性远超未优化的通用大模型。而此类高水平AI的基础则是高质量的数据。

齐向东强调,要想做好AI驱动安全,高质量的数据至关重要。高质量的数据有两个特点,一是全、二是新。只有拥有最多人才、承担最多防护任务、处理最多安全应急事件的企业,才能积累下又全又新的数据,此类数据则是稀缺资源。
他介绍,第一个特点“全”指的是足够多的基础安全数据用于训练安全大模型。安全设备覆盖越广,得到的数据量越大、越丰富。
IDC等权威机构公布的数据显示,奇安信在终端安全、威胁发现与态势感知、数据安全、云安全、安全管理平台等领域,都稳居市场第一。特别是终端安全市场,连续六年领跑。安全数据规模位居全国首位,为大模型预训练打下了坚实的基础。
齐向东介绍,目前,奇安信自主研发的数据存储平台,汇聚了总量超过380亿的全球独有样本库、超百亿的恶意网址库、国内最大的互联网漏洞库、2万亿级的DNS日解析量、200多亿条资产数据等。
第二个特点“新”指的是有足够贴近实战的一手原始语料用于大模型推理。“只有丰富的实战经验,才能磨练出专业的原始语料。”齐向东表示,奇安信有遍布全国的网络安全服务团队,人数规模超过3000人,能深入了解客户遇到的安全问题;还开通了全国首个行业服务热线95015,为各地客户解决紧急的安全事件,能第一时间获取威胁信息。
另外,奇安信还举行了近900场攻防演习活动,完成了80多场国内外重大活动网络安全保障任务,在实战过程中积累了丰富、先进的安全知识和经验。
齐向东总结,这些实战经验和知识既是训练高水平安全大模型的核心要素,也可以作为大模型推理时所需的最新实时信息,双管齐下确保生成精准的、高价值的答案。