近年來,高校對數據治理的重視程度不斷提升,紛紛積極推動數據與高校人才培養、科學研究、學科建設、教師發展等核心職能的深度融合。通過構建數據共享和交換平臺,對現有業務系統數據進行集成、治理和共享,實現從數據采集、存儲、標準化到共享利用的全生命周期管理,為校級層面跨部門、跨系統應用服務提供數據支撐。
目前,高校數據治理工作聚焦于各職能部門建設的應用系統,涵蓋教學、科研、研究生、財務、人事、國資、協同辦公等業務領域,治理工作側重于支撐業務部門。隨著教育數字化的推進,作為高校最基本的教學和行政單位,二級學院由于學科專業和管理細節各不相同,其數據管理和使用需求并不能完全通過校級層面的數據治理來滿足。為此,有些高校已經開始對院系的數據治理進行了一些初步探索,但是缺乏整體性、系統性的實踐,院系層面的數據應用也相對較少。
院系數據治理的必要性
我國高校普遍實行學校和學院兩級管理模式。二級學院作為師生管理的主體,在學院層面日常工作中積累了大量教學、科研、學生管理等方面的數據。這些數據部分存儲在職能部門的業務管理系統中,還有相當一部分以表格、紙質文檔的方式線下存儲和管理。
從數據管理范圍來看,院系數據是學校教育數據的重要組成部分。業務系統主要是圍繞職能部門管理視角和業務流程來構建的,其中的數據難以涵蓋學院教育教學和管理活動的全部場景。學院層面沉淀的大量系統外線下數據,盡管分散在不同管理人員手中,但同樣也是學校數據管理的重要對象。
從數據應用場景來看,隨著教育數字化的發展,院系對數據的需求日益強烈。尤其是在學科評估、專業評估、高等教育質量監測數據填報等工作中,院系作為實際任務承擔者,需要收集、匯總與自身教育、教學和科研相關的大量數據,數據獲取的難易與數據質量的高低成為影響相關工作成效的重要因素。
當前高校職能部門數據治理已基本實現全覆蓋,但由于相關治理工作未能向院系延伸,在學院層面仍然存在數據管理薄弱、數據碎片化、數據重復填報等問題。通過開展院系數據治理,推動學院數據應用落地,滿足學院日益精細化管理要求,有助于提高院系的數字化管理水平和效率,是推進高校數字化轉型的重要支撐。
院系數據治理框架
院系數據治理是高校數據治理體系中重要組成部分,在對院系需求進行廣泛調研的基礎上,結合前期數據治理工作基礎,中國礦業大學提出了基于數據全生命周期的院系數據治理框架,主要包括數據采集、數據標準化和數據應用三個層面,如圖1所示。

圖1 院系數據治理框架
數據采集涵蓋分散在各系統中的業務數據,以及院系以線下形式管理的數據。在數據標準化層面,按學校數據標準將多源、異構、分散數據進行匯聚整合,以標準化、規范化形式存儲。在數據應用層面,根據具體數據需求,對經過精細化管理的院系數據進行分析和價值挖掘,通過嵌入業務系統、一網通辦流程和智能填報平臺等途徑,實現數據產生與打通、數據匯聚與聯接、數據分析與決策。
院系數據治理的實踐路徑
中國礦業大學以院系數據應用為驅動,基于校級數據標準規范,建立以學院為中心的數字資產平臺,在聚合院系相關業務系統數據的基礎上,對分散在各業務系統外的學院數據,如教師教學獲獎、參加學術會議、項目申報、學術兼職等,進行標準化、質量優化及共享,為院系提供豐富的數據服務,充分發揮數據價值。
數據采集全量化
數據采集是院系數據治理的前提,數據采集并不是簡單的獲取,而是在對學院數據需求進行全面盤點的基礎上,明確數據來源,規范數據標準,拓展采集形式,形成完整的院系數據采集體系。
開展數據需求收集,確定院系數據來源。面向院系教學科研需求、數據填報需求及數據應用需求,梳理院系數據需求,確定數據來源。從來源看,院系需要的數據主要分為兩類:一類是存儲在業務系統中的數據,可以稱作“業務系統數據”,例如人事系統中的教師基礎信息、科研系統的科研項目信息等,這些數據已經匯聚到學校數據治理平臺,進行了標準化治理,數據質量較高,可通過接口共享使用,無需重復采集;另外一類是未存儲在業務系統的,但在數據填報、學院管理中要用到的數據,以Word或者Excel形式分散存儲在學院管理人員或者教師個人文檔中,無法通過系統進行共享流通,這類數據可以稱作“線下數據”,是數據采集的重點對象。線下數據碎片化存儲,數據分散、孤立,數據沒有統一的標準,無法開展有效的數據應用,難以釋放數據資源的價值。
打造智能填報平臺,支撐非業務系統數據采集。為解決分散存儲在學院管理人員和教師個人手中的“線下數據”采集問題,構建智能填報平臺,提供三個重要能力:快速構建填報表單,適應學院數據采集的動態需求;統一數據采集標準,從源頭提升數據質量,有效避免數據混亂、不規范;歷史填報數據管理,填報的數據可作為后續數據源使用,滿足采集數據長期使用的需要。通過形成可持續、可擴展的院系數據采集機制,將業務系統之外的院系數據通過管理人員或者教師個人填報的方式匯集補充,審核無誤后存儲至數據倉庫。
以“高等教育質量監測國家數據平臺”數據填報工作為例,以往數據收集歸口部門人工下發Excel表格,各學院填報人員手工填寫后通過郵箱等方式上報,歸口部門人工進行數據匯總、數據標準化、不規范數據核對等后續工作。在這一過程中,存在各環節分離、人員工作量大、數據重復填報、質量參差不齊等問題。通過智能填報統一數據收集過程,使填報項標準化規范化,保證數據采集質量,有效避免數據混亂、不規范,實現了歷史數據沉淀再利用,大大減輕了各二級單位填報負擔,提升了填報效率與質量。
依托學校數據中臺,構建學院主題數據集。所有業務系統數據和智能填報采集數據匯聚至學校數據中臺后,按照學校數據標準規范進行數據清洗、轉化和標準化,根據院系數據需求將標準化后的數據通過表聯結、條件組合,形成主題庫。數據中臺通過定時或者實時的方式將主題庫中數據采集到學院數據倉庫,形成教師基本信息、本科生教學數據、研究生教學數據、科研數據等多個主題數據集,便于數據開放共享。
線下數據標準化
學院線下數據標準化是院系數據治理的關鍵環節。當前院系管理人員和教師個人手中的“線下數據”缺乏統一的數據標準,無法進行數據共享。建設學院數據標準,為學院線下數據采集提供統一規范的數據定義,有助于在數據采集、交換、應用的過程中更好地進行資源共享。為此,在國家標準和教育部標準的基礎上,結合院系對數據在采集、存儲、應用等環節的需求,與院系共同研討,明確數據來源、數據項的取值范圍等要求,形成數據項、代碼表等學院數據標準,納入學校數據標準體系。對于新增的填報采集數據,必須先落實數據標準,按照“一數一源,一次采集,重復使用”的原則,使院系數據治理工作有據可依。
關鍵數據標簽化
為了有效分析和高效使用院系數據,需要進行字段對標、對齊和屬性標記,根據學科、專業、組織管理體系進行充分關聯和對接。例如只有將教學和科研數據與教師一級學科屬性進行關聯,才能按學科分類對本單位各類數據進行查詢和導出。
對院系數據進行標簽化處理,建立數據項與數據來源的關系,可以明確數據來源的系統、負責的部門,保證數據的可追溯,有助于實現數據的可追溯性、透明度和管理的便捷性。采集的院系數據會標注數據項來源標簽,例如,從教務系統同步的數據,比如教師教學數據、教材數據、本科畢業設計數據等會標記“教務部”的標簽,通過智能填報采集的數據會標記“學院采集”標簽,由教師個人填報的數據會打上“個人填報”的標簽。
數據管理遵循“誰產生誰負責”的原則,當發現數據有誤,通過數據標簽可以快速定位數據源頭,暢通數據質量反饋路徑。如果數據來自業務系統,需要到源頭系統中進行修改;如果來自學院數據采集,需要到智能填報平臺進行調整。
數據資源目錄化
數據資源目錄化是指按照統一標準規范對數據資源進行描述,根據業務域和所屬部門對數據資源元數據進行編目發布,從而支撐各業務部門對數據資源的瀏覽、查詢、獲取。
中國礦業大學對已進行標準化治理的業務系統數據字段進行了梳理,將這些數據的元數據描述在線展示在數據資源目錄平臺,不僅包含了數據庫表、數據字段等技術屬性,還包含數據的來源系統、共享方式、數據所有者、數據管理者等關鍵業務屬性。
當院系需要采集數據時,通過數據資源目錄可以快速定位已完成治理的數據,方便院系管理人員理解數據和獲取數據。對于數據資源目錄中沒有的數據項,需要院系配合信息化部門,將缺失的數據資源集成到數據資源目錄中。
數據資源目錄為院系數據的管理和共享提供了便利,不僅有助于院系清晰直觀地展示數據資源,還有助于院系數據管理人員快速找到和獲取所需的數據,從而提高工作效率和數據利用率。
治理結果展現與應用
數據治理必須面向應用需求,才能獲得各方認同和支持。在數據采集、填報和全域數據管理的基礎上,中國礦業大學構建了面向院系及師生個人的可視化、可交互數據應用及服務,最終實現數據價值的傳遞。
學院數據資產中心
以校級數據標準為基礎建立數字資產中心,匯聚院系所有教職工的基本信息、教學數據、科研項目、科研成果、設備資產、公房管理等數據,按學院需要重構數據項,打破業務系統的界限;集中管理智能填報采集的數據,為學院管理人員和教師提供全局數據展示和查詢,隨時掌握學院數據動態和教科研成果,有效支撐學院的個性化數據需求。目前數字資產中心匯聚了各業務系統的相關數據,共30余項數據表,400多個核心數據字段,匯集了50余萬條數據。對于院系來說,可以查看、維護、導出本學院教師的各項數據,同時根據學院的數據需求制作填報表單,采集維護學院數據。
教師個人數據中心
對于教師來說,數字資產中心聚合分散在各業務系統的個人數據,如個人基本信息、授課情況、指導研究生、科研項目、科研獲獎等,可以查看并導出相關數據,同時填報維護學院發布的數據采集。如需補充或修改數據必須要到對應的源頭業務系統進行調整,之后通過數據同步更新數據,確保數字資產平臺數據來源的唯一性、準確性。數據的可視化顯示使數據與老師們見面,不斷提升數據質量。
院系作為高校辦學治校的基礎,既是數據的重要來源,也是數據治理與運用的關鍵環節。中國礦業大學從院系數據需求出發,結合已有數據治理基礎全局規劃統籌,建立適應自身發展要求的院系數據治理體系。通過制定學院數據標準、開展智能數據采集、構建數字資產中心等方式,推動學院深度參與數據治理過程、不斷深化數據應用,為學校教育數字化轉型提供了有效支撐。
基金項目:
江蘇高等教育質量保障與評價研究2021年度課題“面向教育質量評價的院部數據治理模式研究”(課題編號:201);
江蘇省現代教育技術研究2021年度智慧校園專項課題“高校院系數據治理實踐與應用”(課題編號:2021-R-96734);
江蘇高校哲學社會科學研究項目“數字化轉型視角下高校數據治理生態機制研究”(項目編號2023SJYB1054);
江蘇省高等教育教改課題“基于校園大數據平臺的高校治理與教育分析研究”(課題編號:2023JSJG171)。
來源:《中國教育網絡》2025年2-3月合刊
作者:袁莎莎、孫彥景、陳越、陳斌(中國礦業大學信息化建設與管理處)
責編:陳榮