AI+四川方言创新应用正式发布 受访单位供图
3月18日,成都市国家数据标注基地牧山园区正式开园,标志着我国西南地区在数据要素市场化配置和产业数字化转型领域迈出关键一步。中国电信四川公司作为联合建设单位,发布系列AI+四川方言创新应用,聚焦数据标注、数据服务、人工智能、可信数据空间等领域,助力打造国家级数据标注试点基地,打通数据“云高速”。
以标注为支点 撬动AI赋能千行百业
“成都是全国首批数据标注基地建设城市之一,2024年8月便启动了牧山园区建设项目。”基地相关负责人介绍,建设过程中,四川电信为基地配备通用数据标注工具和AI智能标注工具,支持图像、视频、音频、文本、点云等多模态数据标注。其中,通用工具涵盖语音转录、实体关系标注、2D/3D框标注等基础功能;AI工具则依托大语言模型实现目标自动检测、ASR自动化标注等智能功能,大幅提升标注效率与质量。
在人工智能应用和数据流通领域,基地提供标训推一体化能力,预置近200种算法模型、多个行业数据集,支持第三方能力接入和对话式交互构建应用。依托区块链、隐私计算等新技术,基地打造高质量数据集流通市场,提供统一交易门户和全流程业务支持,覆盖从审核上架到交付结算的完整链条,有效促进数据价值变现。
“以文旅为例,基地融合运营商数据与智慧城市等数据,打通了从数据生产到应用的全链路。”该负责人表示,目前智慧消防、AI伴游、数字孪生、数字文创等文旅园区服务能力已在多个文旅平台实现应用。
从乡音到AI 一场方言数据的文化解码行动
为了让AI听懂四川方言,更好地服务广大群众,四川电信采用自研技术,研发方言发音词典,并联合成都市国家数据标注基地牧山园区,基于已采集的19个地市方言语音大数据,构建四川方言高质量数据集。“多模态四川方言语言保护”项目,更是入选GSMA全球移动通信系统协会“运营商实践AI大模型赋能垂直行业标杆案例集”。
依托方言数据集,四川电信首创“蒸馏+膨胀”联合训练算法,发布四川方言大模型,全面实现四川方言的识别、合成等功能。
“AI+政务服务热线”就是基于方言大模型的应用实践:通过智能填单系统自动解析热线会话内容,提升客服坐席效率;舆情监测引擎实时捕捉苗头性事件,实现舆情的预警、预防;结合工单智能分析技术,自动提炼民生热点问题并生成可视化报告,助力政府部门精准识别高频诉求、优化公共资源配置。
此外,四川方言大模型还在医疗、文化旅游、直播助农等领域得到了成功应用。例如,和华西医院共同研发的智慧随访系统,通过AI赋能,高效解决患者出院后健康监测、病情跟踪及个性化康复指导问题,提升医疗服务质量与效率。
目前,四川电信正加快算力基础设施建设和智算布局,在川形成“2+5+21+X”算力体系,为全省提供云边端协同、算存运融合的一体化算网调度、一站式智算服务。