您的位置: 首页> 资讯 > 正文

零点有数董事长袁岳:算法产业化应更多聚焦中模型发展

2023-07-10 13:09:51 来源:零点有数

【编者按】


(相关资料图)

袁岳,零点有数董事长,黑苹果青年公益理事长,飞马旅联合创始人,独立媒体人,发表关于数据科学、管理科学、社会群体研究等相关领域著作逾一千三百五十万字。2021年,在世界人工智能大会之算法峰会期间,袁岳接受亿欧专访,就“算法产业化”进程中的机遇与挑战分享了洞见。本次2023世界人工智能大会期间,袁岳再次接受媒体关于算法模型的专访,阐述当下算法模型发展的产业价值,深化大模型背景下算法模型发展的新议题。

问:ChatGPT的到来引发了对模型的广泛讨论,而在此之前,我们更多提到的是算法,您认为“模型”和“算法”之间有什么联系?

零点有数董事长袁岳:ChatGPT作为人工智能领域的热门话题之一,引发了公众对大模型的关注热潮,并将其视为一个新兴概念。实际上,"算法"和"模型"可以理解为同一概念,在我们谈论人工智能时,算法模型作为其核心的基础组成部分,不仅在模型精度上,在表达技术和系统镶嵌方式上也存在差异。

未来的人工智能在实现其功能时需要多个系列的算法模型来支撑,把整个算法系列丛串联起来,可以直观地看到若干算法模型的组成。

首先,读取算法在人工智能中扮演着关键角色,它能自动阅读不同形式的数据,包括视觉、文本、数字,还是扫描探头中的数据,并承担着学习和数据分析的任务。最后数据读取完成后,再通过分析算法进行数据分析,进一步做出相应的决策或针对性行动。

附图 2021年亿欧专访零点有数董事长袁岳

不论是推理、预测、判别、搜索、推荐、匹配、治疗、危机管理还是人员调度等任务,都涉及特定类别的算法模型。这些模型在协同工作中形成一个完整的人工智能系统,为公众提供了优越的决策支持和行动能力。未来,这些模型将不断优化,为各领域发展带来更广阔的应用前景。

问:如今业界内大、中、小模型蓬勃发展,这三者之间有何区别?在大模型时代,中小模型将如何发展?

零点有数董事长袁岳:从小模型,中模型,再到大模型,其实可以看作是模型复杂程度和应用范围的递增关系。

附图 袁岳在第三届BPAA算法应用实践典范进行主题分享

小模型通常用于解决具体的问题或细节场景,以股票交易为例,通过简单算法的开发,可设定一个止损点和最佳卖出点,当股票上涨到某个阈值时则自动卖出股票,同样地,当股票下跌到一定程度时也将自动卖出,以免造成更大损失。

而大模型具有通用人工智能的特点,涉及高密度技术学习技术、算法模块的自动组合技术,从而使其预备更强的迁移使用和算法生存能力。以ChatGPT为代表的大模型为例,其在开始阶段就涵盖多领域的算法模块,具备更丰富的模块组合能力、跨领域和多领域的行动能力及决策指导能力,能够实现聊天、决策等多种功能。另一方面,大模型也为我们利用技术学习和算法生成技术来高效建设中小模型提供了重要基础。

中模型则介于小模型和大模型之间,在特定领域中发挥作用。例如在相亲网站上找对象,需要收集各类信息,考察其在不同维度上的表现,然后进行综合判断。在这种情况下,对算法的准确性和精度要求较高,需要集成多个算法模块,形成一定规模和密集度的中模型。

如果把基础算法作为我们得以展开技术建模的算法基本工具库看成一层楼,那么通用算法就是二层楼,而GPT类的大模型建设为我们开发应用算法累积了足够强悍的二层楼机制,它不仅为很多主体提供了便捷的问题探索解决方案,还为处在三层楼的我们在特定领域开发垂直应用算法提供了高效的支持。因此,我们今天需要形成起码的小模型开发能力,在中模型领域形成实际的操作能力,再迈向具有实际意义的大模型建设。

问:2023 WAIC 数据要素与隐私计算高峰论坛上提到,数据流通与隐私安全的平衡,是大模型应用面临的一个重要问题。您如何看待模型开源的重要性?

零点有数董事长袁岳:算法本身的快速发展高度依赖于开源,作为应用算法的开发工具和基础条件,开源的算法资源库对人工智能发展至关重要。全球范围内,美国互联网大厂、软件巨头和欧美相当部分的计算机大学为基础算法的开发和开源做出了最重要的贡献,在大模型和中模型部分也汇集了大量开源的通用算法和技术。目前GPT-3.5和GPT-3.0已经在很大程度上进行开源,国内的大模型项目也提供了开源和API接入合作,大幅降低技术更新成本,极大地改善了算法开发和演进的通道。

附图 BPAA第三届应用算法实践典范正式启动

开源的另一个意义在于模型的高度重复使用性。例如在智慧政务领域,我们不再需要所有部门建立系统和算法,而是通过高度可复用的模型进行开发。在各行政部门解决类似问题的情况下,可以复用和调用其中的模块技术,通过重新集成和组合不同的可调用模块技术,更快、更高效地开发出新的深度解决问题的算法模型。因此,即使在规模庞大的情况下,开源和有限范围内的共享也能够极大地提高数字化的效率,同时降低数字化成本,极大减少重复建设的投入。在这样的背景下,算法模型将以更高的水平拓展,为社会提供更优质、更智能的服务。

总的来说,算法模型是值得投资的领域。尽管对于仅擅长或热衷于提供系统平台开发和重复开发的数字化技术企业来说,这并不能算是好消息,因为其生意总量在减少,但从可持续性和真实需求的角度来看,特别是在当前经济增长面临巨大挑战、政府财税能力受限的情况下,通过算法模型的发展进入到数字化内容建设阶段和高精度智能建设阶段是十分重要且必要的。这个阶段性价比更高,具有更清晰的建设目标和更高的建设精准度。

问:随着ChatGPT兴起,大模型爆发式涌现,有人提出大模型已成为发展趋势,推动AI迈向通用人工智能,也有人认为大模型没有投资价值,您对此持何看法?

零点有数董事长袁岳:我非常赞同最近一些业界人士的观点,即我们当前在算法模型的发展方面应聚焦于垂直领域和关键领域,并在这些领域积累基础数据语料,训练出足够精度的模型,并将其汇聚成具有领域解决能力和竞争力的综合性解决方案。从我自身的观点和敏感度来看,中模型领域是一个重点发展方向,我认为这种方法更具范例性,也更具投资价值。

附图 第三届BPAA应用算法实践典范圆桌论坛

一方面,算法模型的发展将改变对数据的要求,推动和优化数据的价值体现、供应能力和交易方式。模型的应用精度将随着数据不断丰富而提高,同时随着算法模型不断优化,其数据处理效率和数据复用能力都将显著提高。

另一方面,先进的算法需要更大的算力支持,算法的不断进化对算力的要求不断提高,需要高精度和高通量的算法支持,因此,对于建设算力中心和提供算力支持的要求变得更加明确、精准和清晰。从这个意义上说,算法实际上定义了算力和算量发展的最新方向和要求。

问:与国际相比,您认为我国算法模型发展是否已经能够与ChatGPT等大模型竞争?

零点有数董事长袁岳:随着ChatGPT的问世,网络舆论中出现了所谓“百模大战”的说法。尽管当前号称的“大模型”引起了广泛关注,给人以数量众多的印象,但这些模型在用户实际应用和竞争领域中,并未真正进入实战场景,也没有展现出实际竞争力。可以说,“百模大战”也许只是一场虚张声势。

与国际相比,我国算法模型在整个大模型项目中缺乏竞争力。尽管科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》(以下简称为《报告》)显示,中国研发的大模型数量排名全球第二,仅次于美国,但实际上我们能够真正达到大模型水平的数量有限,能与ChatGPT匹敌的模型更是没有,无论是在投入准备、开发目标还是应用经验方面,目前仍然没有与GPT技术相对应的解决方案。

《报告》显示,我国参数规模在10亿以上的大模型数达79个,其中约有1/3的为通用大模型,其余2/3被称为行业垂直大模型或行业应用大模型。

在这些通用大模型中,仅有1/5具备多领域的语料标注和实际场景的训练和应用经验,其余4/5的模型是基于GPT或准GPT等开源算法技术进行集成。这些集成提供了一些基础工具和支持,但由于缺乏特定领域或场景的语料和基础数据进行模型训练和实际应用的实践与探索,也可称为大模型壳儿或技术框架。

行业垂直大模型在某个或多个领域中具有丰富的应用功能,积累了领域内的语料标注、模型训练和应用经验,并提供了一些解决方案。然而实际上,这些模型中预训练模型、生成模型或为特定场景提供的解决方案数量很少,甚至有的尚未付诸实践。

从这方面上看,在数字化解决方法中,算法模型的投入需求已十分迫切,亟需加强对关键领域的投入和投资,包括算法模型的开发,以及算法模块和算法系列的构建。

问:您认为当前算法模型建设需要如何努力?结合本次BPAA各领域赛道的案例呈现,您对其算法产业走向深层次应用有何展望?

零点有数董事长袁岳:当前算法模型建设面临重重挑战,任重而道远。各地的人工智能项目、智慧城市建设和智慧行业建设对于模型开发的预算不足,合作伙伴、客户和供应商之间对于模型开发投入方面的观念和结构也没有发生重大调整。从这方面来说,我们不仅需要在算法模型领域进行投资,更需要加强对垂直化机制、智慧化建设和内容建设的投入。

在人才建设方面,目前也存在较大人才缺口,算法模型领域的前进步伐需要更多实用的前沿人才提供支撑,而现有人才教育机制的滞后性需要算法模型行业积极投身到算法模型人才培训的一线,提供从系统概念、开发技能,到应用方法、实案训练的全程支持。

附图 BPAA算法应用实践典范200强团队

在大模型热的背景下,应用算法为中模型及行业应用大模型的发展提供了更好的运行环境和技术基础,为算法人才发展、部署和投入提供更多支持。从2020年上海世界人工智能大会上提出要重视算法产业化建设,到如今连续三年成功举办BPAA算法应用实践典范,我们每年都积累了优秀的算法模型TOP50代表,而在第三届新设置创新组和创业组,分别评选TOP50算法模型代表,迄今为止积累了200强算法团队。这些团队是中国本土算法模型的先行者,是在中、小模型已有成就的建设者,也是未来大模型建设重要的支持力量。

在数字新基建的浪潮中,上海市首先强调算法要素建设,于2021年推出《上海新一代人工智能算法创新行动计划》,同时在普陀区也形成了属于自己的算法发展特色,为BPAA人才落地提供了有力支持。最后,期待更多算法人才和团队能够加入进来,助推上海算法产业化高质量发展。

关键词:

资讯
业界
企业
骑闻
产品
零点有数董事长袁岳:算法产业化应更多聚焦中模型发展
零点有数董事长袁岳:我非常赞同最近一些业界人士的观点,即我们当前在
2023-07-10
Spotify计划将音乐视频引入其应用程序
有一天,您也许可以在Spotify上观看音乐视频。据报道,这家音乐流媒体
2023-07-10
东海证券:给予甘源食品买入评级
东海证券股份有限公司丰毅,任晓帆近期对甘源食品进行研究并发布了研究
2023-07-10
陕西靖边:“一件事一次办”让事情更好办更易办
中国农科新闻网是农业科技报社顺应网络时代新媒体发展趋势,在三农领域
2023-07-10
白毛尖茶
白毛尖茶是一种中国特产的白茶。它产于福建省的福鼎市和建阳市等地区。
2023-07-10
建信人寿湖北分公司开展“7.8保险公众宣传日”活动
极目新闻记者徐蔚在2023年“7 8保险公众宣传日”期间,建信人寿湖北分
2023-07-10
  中新网海口1月23日电(符宇群)海南省第六届人民代表大会第五次会议23日在海口举行第二次全体会议。海南省人民检察院检察长张毅在作报告
2022-01-24
  中新网太原1月23日电 (高雨晴 冉涌 张鹏宇)记者23日从国网山西省电力公司获悉,该公司冬奥保电应急发电队伍已到达河北张家口赛区,
2022-01-24
  中新网西宁1月23日电 (记者 李江宁)据青海省地震局23日消息,中国地震台网正式测定,北京时间2022年1月23日10时21分,在青海海西州德
2022-01-24
  中新网贵阳1月23日电 (周燕玲)对外开放,是内陆开放型经济试验区贵州正在召开的两会热点词汇,如何拓展海内外“朋友圈”助力贵州经济
2022-01-24
温馨生活好young 厦门推广文旅产品火爆全网
  中新网厦门1月23日电 (记者 杨伏山)“冬日暖阳厦门好young”福建省内宣传推广线下活动22日精彩收官。主办方称,本次活动火爆全网及福
2022-01-24
宁夏非遗传承人:刻刀里的守正创新更有“年味”
  (新春见闻)宁夏非遗传承人:刻刀里的守正创新更有“年味”  中新网银川1月23日电 题:宁夏非遗传承人:刻刀里的守正创新更有“年味
2022-01-24
沧州:8个重大科技专项项目确定 引领经济社会高质量发展
为充分发挥科技在经济社会高质量发展中的引领和支撑作用,沧州市确定8个项目为2021年全市重大科技专项项目。这8个重大科技专项项目分别为:
2022-03-19
  中新网海口1月23日电(王子谦 符宇群)海南省高级人民法院院长陈凤超23日说,2021年海南法院为自贸港建设提供坚强司法保障,全年有效管
2022-01-24
  新华社武汉1月23日电(记者王贤)随着春节假期临近,从广州、深圳等地返回湖北的旅客较多。为此,23日,武汉站、汉口站、襄阳东站、十堰
2022-01-24
  1月22日0—24时,广东省新增本土确诊病例3例和本土无症状感染者1例,均为珠海报告。23日,珠海市疫情防控新闻发布会上,珠海市政府副秘
2022-01-24
青海海西州德令哈市发生3.7级地震
  据中国地震台网正式测定,1月23日11时58分在青海海西州德令哈市发生3 7级地震,震源深度9千米,震中位于北纬38 40度,东经97 35度。
2022-01-24
  北京2022年冬奥会和冬残奥会颁奖花束已于近期完成交付。与传统的鲜切花不同,这些花束全部采用上海市非物质文化遗产“海派绒线编结技艺
2022-01-24
澳华内镜: 股东减持股份结果公告(千骥创投)-天天短讯
证券代码:688212      证券简称:澳华内镜           公告编号:2022-062              上海澳华内镜股份有
2022-12-07
恩捷股份12月6日获深股通净卖出3.72亿
(原标题:恩捷股份12月6日获深股通净卖出3 72亿)同花顺(300033)iFinD数据显示,12月6日,恩捷股份(002812)现身深股通十大成交活跃股,位
2022-12-06
  中新网宿迁1月23日电 (刘林 张华东)核酸检测是当下及时发现潜在感染者、阻断疫情传播的有效方法。23日,记者从宿迁市宿豫区警方获悉
2022-01-24
  记者从天津市人社局获悉,从明天(24日)起,天津2022年度第一期积分落户申报工作正式开始,这是新修订的《天津市居住证管理办法》《天津
2022-01-24
  中新社北京1月23日电 (记者 刘亮)记者23日从中国海关总署获悉,2021年,中国海关组织开展“国门绿盾”专项行动,在寄递、旅客携带物
2022-01-24
  记者从天津市疫情防控指挥部获悉,天津疫情第341—360例阳性感染者基本信息公布。  目前,这20例阳性感染者已转运至市定点医院做进一
2022-01-24
  中新网西宁1月23日电 (记者 孙睿)据青海省地震台网测定,2022年1月23日10点21分(北京时间)在青海省海西州德令哈市(北纬38 44度,东经
2022-01-24
江西南昌:市民赏年画迎新年 书法家挥毫送春联
  (新春见闻)江西南昌:市民赏年画迎新年 书法家挥毫送春联  1月23日,“赏年画过大年”新年画作品联展江西南昌站活动在江西省文化馆
2022-01-24
  中新网成都1月23日电 (祝欢)成都市第十七届人民代表大会第六次会议23日在成都举行,成都市中级人民法院院长郭彦与成都市人民检察院检
2022-01-24
列车临时停车3分钟救旅客
  (新春见闻)列车临时停车3分钟救旅客  中新网广州1月23日电 (郭军 黄伟伟)“车长,车长,4号车厢有位旅客腹涨难忍,身体不舒服”…
2022-01-24
女子背负命案潜逃24年 因涉疫人员核查落网
  中新网湖州1月23日电(施紫楠 徐盛煜 赵学良)1998年7月,犯罪嫌疑人杜某因家庭琐事,用菜刀将自己的弟媳砍伤致死。案发后,她从老家河
2022-01-24
广东“00后”雄狮少年锤炼功夫迎新春
  (新春见闻)广东“00后”雄狮少年锤炼功夫迎新春  中新社广州1月23日电 题:广东“00后”雄狮少年锤炼功夫迎新春  作者 孙秋霞 
2022-01-24
03-19 2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
今天,天下洞庭岳阳市君山区第九届良心堡油菜花节暨2022岳阳国际旅游节开幕,菊红、粉红、水红、桃红、紫色、白色等七色组成的4万亩花海在 [详细]
03-19 2022年郴州计划重点推进文旅项目101个 总投资354亿元
2022年郴州计划重点推进文旅项目101个 总投资354亿元
3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州嘉合欢乐世界、仙福路工地清风徐来 [详细]
03-19 宿州泗县深入推进文旅融合发展 擦亮城市品牌
宿州泗县深入推进文旅融合发展 擦亮城市品牌
近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市品牌,全县文化旅游业实现高质量发展 [详细]
03-19 淡季不忘引流 京郊民宿市场有望迎来回暖
淡季不忘引流 京郊民宿市场有望迎来回暖
旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季,且受疫情变化的影响,不过各家民 [详细]
01-24 西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“一社区领导在市民咨询离市政策时发生争执”事件 涉事社区主任已停职  西部网讯(记者 刘望)日前,网络上流传一条视频 [详细]
01-24 陕西:截至23日12时 西安56.5万大中专学生已离校返家
陕西:截至23日12时 西安56.5万大中专学生已离校返家
1月23日,陕西省举行第45场疫情防控工作发布会,发布会上陕西省教育厅相关负责人通报,陕西全省疫情有效控制后,大中专学校能不能放假 [详细]
01-24 河北魏县发布北京一阳性人员在魏县的主要轨迹
河北魏县发布北京一阳性人员在魏县的主要轨迹
魏县疾病预防控制中心关于紧急寻找丰台区新冠肺炎阳性检测者同时间同空间人员的公告  2022年01月22日,接到邯郸市疾控中心转北京市疾 [详细]