当前,“词元”作为大模型、人工智能产业的底层核心基础,正催生全新的词元经济新业态,成为各地抢占新质生产力、布局数字经济新赛道的重要突破口。
贵州大学多模态感知与边缘计算团队负责人杨静在接受贵州日报天眼新闻记者采访时说,贵州发展词元经济,关键不在于盲目追逐通用大模型“拼参数、拼规模”,而在于立足自身优势,走出一条差异化、特色化的发展道路。

制图 鲍贝贝
贵州日报天眼新闻记者:相比国内其他省份,贵州布局发展词元经济具备哪些得天独厚的基础优势?
杨静:贵州发展词元经济,具备多重独特优势。
词元处理本质上是算力消耗,大模型推理每生成一千个词元,背后都是电力在支撑。贵州是“西电东送”的主战场,水火互济、电价优势明显,气候凉爽,降低了数据中心散热能耗。
“东数西算”枢纽地位赋予算力底座。贵州是全国首个国家大数据综合试验区,国内三大运营商、腾讯等顶级数据中心在此集聚,形成了庞大的存算基础设施。当下,我们正致力于让这些算力不仅“存得了数据”,更能“训得好模型、推得出词元”,实现从“天然大机房”向“国家级算力枢纽”的质变。

中国电信云计算贵州信息园
我们团队一直在研究跨区域算力调度、大小模型端云协同等技术,力求解决词元推理成本高、延迟短问题。有了智能调度系统,东部发来的词元处理请求,能以毫秒级速度分派到贵州算力中心完成运算。这种“东部需求、西部计算”的模式如果发展成熟,将会成为贵州独有的核心优势。
贵州日报天眼新闻记者:在贵州的数据标注产业和数据集建设,目前处于一个什么样的水平?要真正让这些数据“原料”高效地转化为高价值的词元,还需要打通哪些技术堵点?
杨静:客观来看,贵州的数据标注产业正处于“从规模化向专业化、智能化转型”的阶段。目前大部分业务仍集中在图像拉框、文本分类等相对基础的劳动密集型环节。针对大模型逻辑推理、价值观对齐所需的高质量指令数据、偏好数据等知识密集型标注能力仍显薄弱。数据集的“量”有了,但“质”和“结构化深度”还有很大提升空间。
要真正让这些数据“原料”高效转化为高价值的词元,需要打通三个技术堵点。

云岩区数据标注产业基地
一是数据供给的自动化与智能化。当前高度依赖人工的模式,成本高、效率低。亟需发展基于大模型辅助的自动化标注技术,实现从“人标”到“机标—人校”的升级。
二是知识的体系化构建。离散的标注数据难以支撑高质量词元生成。需要构建垂直领域的知识图谱与高质量语料库,将碎片化标注升级为结构化知识体系。
三是多模态数据的高效对齐。贵州在工业、农业、少数民族方言、遥感等领域积累了丰富的图像、视频、点云等非文本数据。如何将这些多模态数据统一转化为大模型可理解的词元表达,实现跨模态的知识对齐,是我们团队正在攻关的关键方向,也是释放数据要素价值、赋能实体经济的核心突破口。
贵州日报天眼新闻记者:您认为多模态技术与词元生产、应用的深度融合,能为贵州词元经济发展带来哪些独特优势?
杨静:我认为多模态技术的深度融合,能为贵州词元经济构筑三重独特优势。
其一,赋能实体经济的感知底座优势。词元不应仅仅是文本的专利。我们研制的少数民族方言转写语音多模态模型,能将少数民族的语音、视频、文本等信息,实时转化为机器可理解的“词元”。这让贵州的词元经济不是凭空而起的虚拟概念,而是真正扎根于行业实际应用,解决多模态模型端侧部署、推理等实际痛点,实现“软硬一体”。

工作人员依托词元优化业务流程
其二,“大小模型端云协同”带来的成本与隐私优势。许多应用场景对数据安全和响应时延极度敏感,数据不可能全部上传云端。我们正致力于让多模态小模型在边缘端完成数据的初步感知与词元转化,只将脱敏后的高价值“语义词元”上传云端大模型。这种协同机制,既降低云端词元处理成本与带宽压力,又保障核心数据不离场。
其三,跨模态对齐带来的全域知识贯通优势。我们的攻关方向——视觉持续学习与零次学习,正是要解决如何让大模型看懂这些“沉默”的物理世界数据,实现文本指令与视觉场景的跨模态对齐。一旦打通,将把贵州的特色场景数据转化为稀缺的垂域词元资产,形成全国差异化竞争力。
贵州日报天眼新闻记者:贵州该如何找准自身定位,走出一条区别于东部地区、彰显贵州比较优势的差异化、特色化词元经济发展之路?
杨静:贵州发展词元经济,关键不在于盲目追逐通用大模型“拼参数、拼规模”,而在于立足自身优势,走出一条差异化、特色化的发展道路。
首先,应从“数据存储中心”升级为全国重要的“热计算基地”。当前,东部地区算力成本持续攀升,推理算力正成为词元经济发展的核心瓶颈。贵州依托“东数西算”枢纽优势,以及绿色能源、气候条件和低成本电力资源,可以承接东部溢出的推理需求,打造全国低成本、高效率的词元生产与推理中心,形成“东部创意、贵州计算”的产业协同格局。

5月21日,贵州词元宝信息科技有限公司(以下简称“贵州词元宝”)揭牌
其次,贵州真正独特的优势还在于产业场景。少数民族文化、山地农业、白酒酿造、桥梁运维、特色旅游等领域,积累了大量具有地域特色和行业价值的数据资源。应依托高校和科研平台,加快垂直领域词元、行业知识模型和智能体建设,推动特色行业知识从“数据资源”向“知识资产”转化,打造具有贵州特色的行业词元体系。
此外,随着AI推理规模快速增长,绿色低碳将成为未来人工智能竞争的重要方向。贵州应进一步发挥绿色能源优势,积极布局“绿色词元经济”,推动绿色算力与人工智能深度融合,形成具有全国辨识度的贵州特色发展路径。
扫一扫在手机打开当前页面