必一运动上海数交所汤奇峰:建设高质量学术数据语料库 打造生成式人工智能压舱石

  新闻资讯     |      2024-06-20 07:37

  必一运动6月19日下午,由中国图书进出口(集团)有限公司举办,上海数据交易所、华为阅读等机构联合协办的2024出版与技术创新大会(PubTech Conference)在北京国家会议中心举办。大会以“AI赋能下的出版未来”为主题,吸引了来自全球的出版界精英、学术领袖及AI技术专家汇聚一堂必一运动,共同探讨和分享与出版业深度融合的新策略、新思路。上海数据交易所总经理汤奇峰出席大会必一运动,并以“AI时代数据价值挖掘——以学术数据交易为例”为题发表主旨演讲。

  汤奇峰表示,和数据密切相关,在知识传播领域里是非常重要的技术发展前沿。社会在不断生成数据、标记数据和处理数据,从支持行业发展角度来看,数据供应是源源不断的,依托数据交易机构,跨组织的数据流通中将产生更多有价值的数据供给。

  学术数据具有规模巨大必一运动、来源广泛必一运动、专业性高、敏感性高、多源异构等特征,应用场景涵盖教育、文化、科研、企业采购、语料库等。提及学术数据应用、学术数据跨境流通交易面临的挑战,汤奇峰表示,基础设施的改善使得学术数据更好地流通,区块链、可信数据空间等技术支撑至关重要。上海数交所积极投资基础设施,构建以数据交易链为基础的新一代可信数据交易基础设施,提供数据交易可信流通环境,使得数据在跨组织流动中释放价值。

  学术数据等语料数据是人工智能大模型训练的重要基础。为推动高水平语料数据供给,助力人工智能产业蓬勃发展,上海数交所建设语料专区,积极引导不同行业、不同领域、具有一定规模的高质量语料数据产品挂牌交易,推动人工智能大模型技术创新与应用落地。

  汤奇峰表示,上海数交所根据数据开放程度和数据质量两大维度,为四类供方制定差异化工作策略。比如,针对数据质量高但开放程度低的供方,通过数据交易链有效破解数据流通的信任问题,帮助确认产权、收益分配等关键问题;针对开放程度高但数据质量低的机构,搭建专业化数商服务渠道,以提高数据质量必一运动。下一步,上海数交所将继续发挥专业平台功能,通过构建安全合规高效的数据流通环境,有效促进语料数据有序流通与价值创造,支撑生成式人工智能取得更大的发展与突破。