第七届大数据应用实践大会暨先进算力赋能制造业“智改数转”主题大会于12月2日在雅安圆满举行。数之联受邀亮相大会并展示了“智改数转”的最新应用成果与实践探索。
数之联CEO周俊临受邀参与《“十五五”大数据产业发展规划》编制闭门研讨会议,为大数据发展建言献策。
大会以“先进算力赋能制造业‘智改数转’”为主题,由雅安市人民政府主办,四川省大数据产业联合会、雅安市经济和信息化局、雅安经济技术开发区管理委员会联合承办。大会汇聚了众多政府领导、行业专家、企业精英,围绕政策导向、技术创新、产业升级等维度展开深入交流,促进雅安市数字经济发展。 在闭门会议上,作为行业领先的大数据企业代表,周俊临指出,随着智能制造理论与技术的不断发展,机器视觉技术越来越多地应用于产品缺陷检测与分析,数之联的AI质检服务超过500家客户,对应的工业智能软件正逐渐代替人工。图像数据集作为工业制造产品缺陷检测算法和模型训练和验证的基础资源,对于提高算法性能、优化模型参数、提升计算机视觉任务的准确率等方面起到了关键作用。 一般而言,符合大模型训练标准的数据需具备质量高、规模大、样本丰富等三个特点: 首先,海量具有无毒害性、公平性等高质量特征的数据集能够提高模型效果(例如精度与可解释性); 其次,在强化学习阶段,原始数据由于存在信息量低、含有噪声或需补齐等问题,使用前需要进行数据对齐等诸多微调操作,优秀的指令数据集能够帮助大模型更好的泛化适配更多下游任务。 再次,数据丰富程度能够显著提高大模型的泛化能力,减少过拟合情况的发生,达到更优的模型效果。 从算法、算力与数据三个方面来看,高质量数据集的缺位是当前国内人工智能和大数据发展面临诸多难题之一,阻碍大模型的效果提升。大模型十分依赖大算力和高质量数据集的融合,据估算,互联网中文语料的质量和规模均大幅低于英文语料,英文文本和数据资料是中文的8倍左右,以公开渠道获取大批量、高质量的中文语料数据的难度较大。与此同时,数据孤岛问题突出,特别是专业的行业应用数据集更难获取和访问,限制了大模型可使用的数据量,从而对大模型效果提升形成阻碍。工业互联网一直以来都在企业内部如火如荼的开展,但是跨机构、跨区域、跨层级的工业互联网始终没能在实质上达到预期的效果,因此,工业行业的数据集始终难以获取。工业龙头企业之间由于市场竞争的原因,往往无法共享,可以考虑特定服务商在政府引导下进行安全、合规、高价值的数据共享,并开放给行业进行服务。 大会精心设置了“先进算力”“未来科技”及“智改数转”等多个展区和洽谈区,充分结合四川省制造业“智改数转”的战略需求和大会主题,彰显了先进算力技术对产业变革的赋能作用,参展企业通过丰富的展示形式与深度互动,为大会注入了科技前沿与产业创新的澎湃活力。 接下来,数之联将积极响应国家数字经济发展战略,以“智改数转”赋能新型工业化,推动制造行业数字化转型升级,共绘数字经济新篇章。
