驗證碼
獲取驗證碼
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732
全網監測海量數據按需發布監測預警
實時把握輿情動態精準追溯信息源頭
8000萬頁游詞庫經過去重去噪篩選分類,我們終得到了一百多萬的數據量。剩下的700萬數據后期維護的時候可以再整整。
馬上我們開始做關于手游的詞庫,趁這個時間點,寫下關于詞庫維護的一點見解。
頁游詞庫,我們得到了3個庫,游戲庫、平臺庫、其他,游戲庫和平臺庫分別按頁游的攻略、裝備、禮包、開服、其他維度分類,其中”其他.txt”可以進行補充數據給其他維度,這里我們做頁游詞庫的時候搞過一次。
頁游詞庫后期,我們要結合數據庫來。我們的目的很簡單,得到一個游戲詞,能查出他的游戲他的維度。起碼90%的頁游詞都能覆蓋到。
怎么做呢?關鍵是文件數據結構化!每一個詞都是詞根,跟游戲、攻略組合以逗號分隔,構成行數據。
頁游數據庫,需要做6張表:頁游表、維度表、詞庫表、敏感詞庫表以及詞庫跟維度的關系表、和詞庫跟頁游詞庫的關系表。
然后做數據導入,因為我們將前面的文件數據結構化了,所以我們可以根據行數據中頁游詞跟維度、游戲的關系分別導入數據庫表中。
這樣做,對于詞庫維護有什么幫助?
以后再做頁游的seo項目,我們有大量的現成數據,覆蓋面90%左右,可以馬上用,后面還可以通過其他渠道補充數據:數據挖掘、流量統計軟件等等,大大節省了我們數據采集、篩選等等大量耗時的中間環節!
推薦閱讀
說明:如果您有任何疑問或想咨詢其他業務請撥打電話 400 685 0732