广州海珠:老牌工业区转身“垂直大模型之都”

Thomas 189 0

3月的广州刚经历完一波倒春寒,连日的阴雨和大风下,气温不断下探。

但并没有影响这座城市人工智能企业的“温度”。最忙的一天,陈天接待了五、六波参观者,有来了解发展状况的政府部门人员,也有前来寻求合作机会的学校和医院。这些造访者身份各不相同,但目的指向同一个——如何在下游场景中应用大模型。

陈天是广州云蝶科技有限公司的创始人之一,现担任公司CTO。这家年轻的公司成立仅六年,大模型产品已经实现盈利。随着旗下云蝶行知大模型在去年7月通过大模型备案,商业问询明显增加。该大模型是国内首个专注于教研科研的行业大模型。

但真正的大模型热高峰出现在春节前后。DeepSeek一度重创美国科技股,各地“新春第一会”和政府工作报告纷纷喊话发展人工智能。字节、月之暗面、智谱华章、腾讯等密集发布新产品,再塑国内大模型格局。

杭州、深圳无疑是这场热潮最具风头的弄潮儿。深圳背靠腾讯、华为、比亚迪等龙头,实现大模型产业链的多点开花;杭州依靠浙江大学、之江实验室、阿里巴巴等创新主体,在通用大模型上异军突起;上海一直以人工智能为先导产业,密集出台政策打造“模都”。

相较之下,广州的声量并不大。无论是杭州、深圳为AI产业站台的讨论,还是京沪在“大模型第一城”的较量,公开的讨论中都默认将广州排除在比较对象之外。

但这不意味这个城市无意进入这个赛道。事实上,2020年,粤港澳大湾区发展拉开序幕时,广东省大湾区领导小组以1号文形式,将琶洲规划为广州市人工智能与数字经济试验区核心片区。

琶洲位于广州海珠区东部。去年来,海珠主动竞逐大模型赛道,在市级支持下建设全国首个人工智能大模型应用示范区。这是国内首次用这种形式重点发展大模型应用。

海珠区建设全国首个人工智能大模型应用示范区

高楼林立的琶洲,聚集着一批龙头企业总部和其大模型项目,包括夸克大模型、唯品会朝彻大模型、致景科技服装AI大模型、趣丸科技大模型等,应用于日常办公、电商购物、文旅等场景。

目前,海珠落地行业大模型120个,引育大模型备案项目7个,算法备案项目114个,集聚泛人工智能企业超7000家。

在备受关注的通用大语言模型上,广州没有多少水花。眼下,这座城市发展大模型的策略是,从通用走向垂域,更精准地锁定细分行业的需求,要成为“垂类模型之都”。

制图:何苗

老牌工业区转身

将地图定位至广州海珠区——这是城市中部的一个岛区,东西走向、四面环江。3月后,小岛的东部忙碌起来——从每年一届的家博会、建博会,到即将到来的广交会,比起“海珠”,国内外采购商更熟知的名词是“广交会展馆”。

第三产业是海珠区的支柱。截至2024年末,第三产业的经济比重超过八成。

但最早期,海珠区不以第三产业见长。上世纪50年代起,广州通用机器厂、广州造船厂、广州锅炉厂等30多家大中型工业企业陆续落地,这里形成规模宏大的工业区;改革开放后,承接香港和发达国家的产业转移,广州市南方制漆厂、广州百事可乐汽水厂等布局在海珠区,这里进一步发展为广州的老牌工业区。第二产业的经济比重一度超过40%

不过,老工业区的标签很快成为过去式。在珠三角一体化规划和广州城市功能提升的背景下,现代服务业逐渐成为广州产业结构调整的方向。2008年后,海珠区按照全市退二进三的产业结构调整思路对传统工业企业进行关停或搬迁,万宝冰箱、五羊摩托、广州锅炉厂、广州造纸厂等一批重点工业企业迁离海珠。

“上世纪80年代靠工业,90年代靠房地产的海珠区,在南拓背景下靠什么发展?这已经成为目前摆在海珠区面前最严峻的问题。”广州市社会科学院曾在相关研究中提到。

城央土地有限,海珠区瞄准了总部经济。2015年前后,琶洲再开发拉开序幕,围绕数字经济,海珠区以“产业先行”思路开展用地招商,不以土地财政为首要考虑条件,让利吸引产业龙头拍地建设总部型物业。腾讯、抖音、阿里巴巴、唯品会、蚂蚁、科大讯飞等总部大楼接连亮灯。

广州琶洲

引入“外援”为后续AI生态提供了基础。继阿里夸克团队、唯品会等大模型团队后,佳都科技也在海珠区成立了子公司,聚焦佳都知行大模型的技术研发和大规模落地应用,该大模型是国内首个交通行业大模型。

“做大模型是一个‘扎堆’的事情,就像北京做大模型要去海淀区。海珠区初步形成了大模型的聚集氛围,也有不少互联网代表公司,不管是前沿信息交流还是商务洽谈,这边都有优势。”佳都科技首席AI科学家王凯向界面新闻表示。

针对海珠区的商业落地,佳都科技在去年完成了慧行大模型的备案,针对底层技术进行了升级,训练效率提升了两到三倍,推理的算力需求则降低了一个数量级。

这样来看,海珠区的发展路径跟杭州较为相似,经历了从电商之都向“大模型之都”的转变,数字经济、产业互联网的生态为其发展“模都”提供了基础。

“大模型是解决问题的,产业生态越丰富,就越适合大模型企业的成长,例如阿里、腾讯具备底层技术优势,而唯品会等电商产业对应下游用户,也有发展大模型的需求。”陈天认为。

而原有的制造业基础也为大模型提供了落点。海珠区坐落着国内最大纺织商圈,本土企业致景科技切入服装AI大模型,基于款式、面料和色彩参数等行业大数据,提供设计、生产、营销等各环节的预测和建议。

云蝶科技产品

但不可否认,广州大模型产业仍被杭州拉开了明显距离。

“广州和杭州有一定的相似性,都是商贸流通的重要城市。但这个过程中,杭州发展出以阿里巴巴为代表的电商生态,B端、C端沉淀了大量数据,为发展AI做了铺垫。而广州主打专业市场,也就是厂家到零售端中间的批发模式,保守于这种模式的红利让广州错过了抓住互联网链接新渠道的机会。这种现场交易也不记录数据,广州也因此缺乏大数据学习的基础。”中山大学软件工程学院产业数字化服务中心主任、中世数字经济研究院执行院长戴欣认为。

戴欣表示,这也反映了广州存在的问题——此前本土对创新性的引领不明显,在支撑原创上乏善可陈,这种积累也无法短期投资来弥补,需要找到错位发展的赛道。

应用端错位发展

模型研发依赖大量基础学科研究,对人力、电力、算力要求高,是广州短期内难以追赶的领域。这座城市瞄准应用端错位竞争,对标垂类大模型,海珠区选准AI+教育、医疗、新型工业化、游戏等11个重点方向。

20243月,《广州市支持海珠区建设人工智能大模型应用示范区实施方案》正式印发实施,这是国内首个聚焦行业大模型产业发展的方案,在应用数量上有明确指标:到2026年,推动大模型在8个以上行业深度应用,推广典型应用场景不少于30个、储备算法超5000个,带动示范区主营业务收入超5000亿元。

“今年我们的课题就放在这一领域,发展思路也一直是往垂直方向走。海珠区科工商信局局长麦锰锰表示,海珠区计划将人工智能与传统产业进一步黏合起来,让大模型落地盈利,计划新引育大模型项目超100个,完成大模型内测超50个、上线运营超30个。

制图:何苗

“对广州来说,探索小场景、小模型的方式更现实。大模型原生底层的技术研发是上海、杭州等长三角城市的强项,短期内难以被反超。但是具体赛道应用上广州是可以突破的。”由于工作关系,科大讯飞华南有限公司副总经理恽风静常年往返于珠三角和长三角。地域优势的差异也让公司将不同板块划分给不同城市——合肥及周边更多承担技术研发,广州、深圳以产品和市场运营为主。

海珠区也在国内首创规划一个示范区发展大模型应用的模式。恽风静看来,这种形式有几个好处:更专注具体场景的应用落地,面向市场主体和场景的开放度也更高;另外,能给予相应政策性的鼓励和支持,并搭建政企合作的平台。

AI行业,应用场景落地已进入红利兑现期。过去一年,海珠区超50家大模型企业实现盈利产业规模破30亿元,包括多面科技的猎聘大模型、树根互联的根灵工业大模型、动悦信息大模型等。

陈天提到,一方面,政策对备案大模型、备案算法有相应补贴,例如算法券,此外政府也组建算力资源提供支持。这都有助于降低企业成本。

过去数年间,海珠已在数据、算法、算力方面奠定基础。如数据方面,海珠区是全省唯一的数据经纪人”“首席数据官”“数据生产要素统计核算创新改革三试点单位,在全国率先开展数据要素市场化配置改革,已推荐9家企业成为广东省数据经纪人,区县级数量全省最多。

算力支撑方面,海珠实现算力超1800P、可调度算力超4900P,后续还将实现可调度算力18000P。通过政府牵头、企业投资,建设了琶洲云脑智能计算中心等基础设施,并引导琶洲实验室、百度飞桨赋能中心等设施升级扩容。

百度飞桨是百度用时15年开发的深度学习框架,20234月在广州落成人工智能产业赋能中心,自建有算力中心12.69P,主要用于自有模型的训练和推理。百度飞桨广州中心副主任陈云峰告诉界面新闻,广州中心聚焦大模型在垂直行业的落地,中心已完成工业质检大模型、检察院大模型、法院大模型、高校大模型的训练和应用。

大模型行业不是单纯的市场行为,作为各地押注的新兴赛道之一,其中也夹杂了政府的期待。这个背景下,G端市场被率先打开。

教育被视为大模型最重要的应用场景之一。科大讯飞去年在海珠区建设大模型示范区的契机下跟海珠区教育局签订了战略合作关系,在广州市第五中学等学校规模化应用了科大讯飞星火教师助手,这是基于星火教育领域专属大模型开发的场景模型,可以分析老师在课堂教学环节中的教学用语,提供教研循证的课堂数据分析和针对性的教学改进建议。

云蝶行知大模型也指向教育,为教师提供备课辅助、论文辅助、课题申报辅助、行政公文辅助等教学辅助服务。陈天透露,此大模型今年预计投放到超过300所付费学校,用户(含试用)超10万,单品营收超过5000万元。

“新事物打开市场并不容易,政府牵头开放场景,举办对接会、介绍对应公司座谈,这样省去了我们很多协调成本。”陈天提到,公司的教育类客户和医疗类客户,不少就来自上述渠道。

佳都科技则结合海珠区交通路网开展大模型辅助信控优化,改变了以往交通信号灯靠人力调优的模式,业务范围覆盖整个区。

王凯介绍道,通过观察路面交通实时拥堵状况和异常事件,可进行片区级的交通信号灯优化配置。另一方面,通过大模型可以实现秒级异常交通事件检测,在海珠区超过30个路视频监控接入了多模态的视觉大模型,进行24小时实时分析。截止到2024年年末,AI大模型可在30秒内发现异常交通事件并输出告警,事件识别准确率超80%

去年开通的广州11号线环线中,同样运用了佳都科技基于大模型的超写实数字客服,11一复刻了广州地铁工作人员的形象,可以解答乘客任何关于11号线的问题。

佳都科技超写实数字客服

发展盈利大模型

不管是教育、交通还是医疗领域,现下海珠区的大模型场景以G端为主。戴欣认为,这是政府相对可控的资源,更容易放开。

一个行业场景打通后,市场的买单行为也随之增加,在海珠区打样的场景率先产品化。继海珠区之后,佳都科技也中标了广州花都区的交通联动系统项目,金额达3.1亿元。王凯透露,11号线的超写实数字人,其他城市的地铁站也有意引入。

但企业的商业版图不止于此,这些公司也在谋求B端和C端市场。

毕竟押注大模型就是一项“烧钱”的活。以科大讯飞为例,2024年上半年扣非后归母净利润为亏损4.83亿元,亏损扩大的主因是大模型相关投入增加。

20247月,海珠放话发展最盈利大模型,探索出符合自身发展的盈利模式,逐渐实现商业闭环。

“盈利主要是两方面,一个是成本,一个是市场。”陈天透露,云蝶科技在今年才开始融资,前五年都是自我造血。

DeepSeek的爆火让外界看见国产大模型撼动全球行业格局的可能性,但行业对“小算力、高性能”并不陌生,海珠区很多行业大模型企业都在采用这一模式。

“最初做行业模型时,我们就提出知识蒸馏KTD架构,这是一个大模型垂类训练的架构,可以快速以较低成本训练某个领域的小模型,快速从一个行业迁移到其他行业,形成对应的解决方案。”陈天告诉界面新闻。

AI技术中,蒸馏是一种模型压缩和优化的方法,能将一个大型、复杂的模型的知识传递给一个更小、更简单的模型。陈天提到,同时配合知识图谱和GPT技术,确保输出的可靠性。

DeepSeek把很多精力花在怎样用更少资源、更高效率训练一款新模型,以及一款模型训练出来后用更少算力做推理,我们的思路也是一样的。”王凯说。

科大讯飞要进一步打开C端市场

佳都科技创造了模型沙盒体系,慧行大模型也基于此进行研发。王凯解释道,沙盒会不断更新,过去的实验规律和结论可以沉淀在沙盒里,要做新模型时可以从中查找最优策略和参数配置,从而降低训练成本。

王凯表示,公司已经沉淀了一个预训练的基座,只需要少量样本做微调,就可以结合具体场景快速生成对应模型算法。此前,广州交通部门需要定制专门针对非机动车识别的算法,基于预训练基座,不到一周就实现交付。如果没有该基座,可能需要两个月。

2024年,佳都科技将知行大模型迭代升级至V2.0。王凯提到,多模态是一个突破,该体系涵盖了视觉大模型、多模态大模型和时空决策大模型,更多模态才有可能实现更全面的预测预警,解决更复杂的问题。像海珠区的信号灯调优,就运用了时空检测大模型,得以对下一个周期、下一个阶段的路面交通流进行预测。

陈天目前正在跟两家医疗类企业接洽,科研领域会率先落地,医生可以借助大模型生成的文献综述快速了解前沿动态。康复后的随访也有望实现,通过机器人的自动电话采集病人情况、分析和归类。此外,将大模型搭载到鼠标和学习机上,云蝶科技要打开个人市场。

“今年会从两个角度去拓展,第一个是场景,从教育拓展到医疗、工业。第二是技术深挖,目前更多是文本大模型,未来要研究多模态大模型,进行大模型和边缘硬件的结合。”陈天说。

科大讯飞也在加码C端应用。目前,政府端采购比重在四至五成,C端约两成。恽风静认为,B端、C端场景开放才是形成商业闭环、解决大规模落地的关键所在。

恽风静设想,未来学生都有自主学习AI助手。学习助手目前更多装载在AI学习机上,未来可能安装在PC端或家长手机端,更精准识别知识薄弱点并推送对应教学资源、形成错题库,甚至协助学生进行自批改。

但不可否认,打开这个市场也有不少挑战,如受收费敏感性、家长舆情影响,学生个性化学习路径和方式也不在当下学校或教育局的授课方案内。但恽风静仍强调,“从应用主体来看,以学生为中心、发展个性化学习是一个趋势,C端市场的潜力将超过B端或G端。”

  • 评论列表

留言评论