國家級數據集管理平台啟用 破解AI訓練數據供給瓶頸

2026-05-12

從國家數據局獲悉,近日正式發布並啟動試運行的國家數據集管理服務平台,象徵中國高質量數據集建設邁入集約化管理新階段。該平台由國家數據局指導、國家數據發展研究院建設運營,旨在建立「物理分散、邏輯集中」的管理體系,提供覆蓋數據集全生命周期的公共服務,以促進有效供給並繁榮產業生態。

截至今年第一季,全國已建成的高質量數據集總數已超過11.6萬個,總量突破960PB,約為中國國家圖書館數字資源總量的336倍。然而,國家數據發展研究院副院長袁軍指出,目前高質量數據建設仍面臨三大痛點:建設主體分散導致管理部門難以掌握資源底數、供給端資訊不對稱易引發重複建設與品質參差不齊、需求端取得成本高且週期長,進而限制了技術創新效率。

新平台被定位為國家級的公共服務基礎設施,而非單純的監管工具或交易場所,旨在降低交易成本、提高匹配效率,實現全國數據資源「底數一本帳、調度一盘棋、協作一張網」的格局。平台已開放供需發布、全域檢索、憑證申領等基本功能,並與國家數據基礎設施及安徽省等地方平台完成對接。截至發布當日,已認證供需主體200餘家,發布數據集1000餘個。未來,平台將持續完善建設監測、質量管理與權益激勵等功能,賦能人工智能創新發展。