機器學習在圖書館應用初探:以TensorFlow為例

2018/03/28     來源:大學圖書館學報閱讀原文

機器學習是人工智能的重要分支,TensorFlow是谷歌第二代開源人工智能機器學習平台。此文重點介紹機器學習(主要是深度神經網絡)的基本原理和利用TensorFlow進行機器學習的基本方法,探討在圖書館領域應用的可能和場景。以《全國報刊索引》的自動分類問題作為實驗對象,利用兩台圖形工作站,建立了TensorFlow深度學習模型,通過設定參數和閾值、系統調優等工作,實踐了應用TensorFlow的完整過程,論證了其可行性。實驗通過對170萬餘條題錄數據進行訓練和測試,克服了報刊索引數據過於簡單與中國圖書館分類法的類目過於細緻之間的矛盾,實現了大類近80%和四級分類總體近70%的準確率(其中TP類達到91%),得出基本可代替人工分類流程的結論,為全國報刊索引的分類流程的半自動化提供有力工具,從而可望大大節省人力成本。下一步將繼續利用TensorFlow的優化功能,結合更多的字段屬性,進行系統調優,力爭做到自動分類90%以上的準確率。....more

延伸閱讀