近日,贵阳大数据交易所以全国首个数据要素登记行业节点DOID为载体,上线572个人工智能高质量训练数据集,首创数据要素行业稀有地图,为人工智能大模型发展精准赋能。
本次上线的数据集汇聚了丰富数据资源,首批高质量人工智能大模型训练数据集供给方来自中文在线、中国开放数据、拓尔思、海天瑞声、曼孚科技、粟特方舟、国信数据等16家企业和机构,涵盖“数据要素×”金融服务、工业制造、医疗健康、商贸流通等多个重点领域,涉及文字、音频、图片、视频等多种模态,旨在汇聚全面、系统、权威的高质量人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。
“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。”北京中文在线阅读公司执行董事兼总经理杜嘉说,这些数据集对于目前的AI大模型语料训练、数字图书馆建设、数字教育内容资源建设等可以发挥积极的作用,期待与贵数所协力共赢,共创数据要素新篇章。(记者 方亚丽)