文 | 李安琪
編輯 | 李勤
36 氪獲悉,數據服務公司「景聯文科技」于近期完成了數千萬元 Pre-A 輪融資,投資方為杭州金投集團旗下基金。據悉,景聯文科技本輪融資將用于公共數據生產運營的布局、智能化語料工程平臺構建、以及自建垂直領域高質量標注基地,打造 " 平臺 + 基地 + 行業 " 的數據鏈閉環生態。
景聯文科技成立于 2012 年,是一家 AI 數據服務運營商。據景聯文 CEO 劉云濤介紹,公司業務經歷了從生物識別算法,到數據采集標注,再到高質量 AI 數據集生產運營三個階段演變。目前,公司聚焦的領域包括公共數據、AI 大模型、自動駕駛與醫療等。
劉云濤向 36 氪表示,高質量數據集是人工智能發展的 " 燃料 "。"AI-ready 的前提是 Data-ready,數據質量決定模型效果。高質量數據集的供給是 AI 行業化落地的關鍵要素,也是促進數據要素繁榮交易的根基。"
今年 5 月國家數據局表示,將繼續加大中央財政資金投入,支持地方、行業建設一批基礎性、公益性、長遠性數據基礎設施項目。
而聚焦公共數據生產運營,也是景聯文科技今年的業務重心。景聯文的目標是,成為地方政府的公共數據生產、運營商,幫助挖掘公共數據的最大價值。
此前,景聯文已經與華為數據存儲達成合作,聯合推出 AI 數據湖聯合解決方案,該方案旨在解決公共數據中 " 治理難、供不出、流不動、用不好、安全弱 " 等痛點,充分挖掘、盤活數據價值。景聯文表示,公司將與華為在各地落地實施該方案。
在布局公共數據運營的同時,景聯文還將進一步加強數據標注 " 基本功 "。劉云濤向 36 氪表示,數據標注已從人工標注到人機結合標注演變,人員屬性方面也從普通標注向領域標注和專家級標注轉變。因此,景聯文科技將聚焦重點行業場景,自建標注基地,以提供穩定、高效的標注服務與數據集產品。
在數據工程化方面,劉云濤表示,近年來景聯文在技術方面不斷投入研發力度,已形成從數據匯聚、數據治理、語料開發、語料沉淀、語料交易的數據全鏈路的 Solar Sence 智能語料工程平臺,平臺適配文本數據、音頻數據、圖像數據、視頻數據、多模態數據等全域數據類型。本次融資過后,景聯文將構建更智能的數據處理平臺。
劉云濤表示,今年公司預計營收增速 400% 以上,目前客戶結構已涵蓋政府、頭部 AI 廠商、AI 研究機構。而布局公共數據運營業務后,景聯文將構建完整的數據服務生態體系。