top of page
預測專利價值
將數據資料分成訓練&測試集資料後,進行各專利資料是否有出現前10、20、30名技術的判斷。
我們先以1996~2011的數據資料進行訓練與測試,訓練資料為1996~2010年的數據集,測試資料為2011年的數據集,然後利用亂數程式進行亂數後的專利資料填入附有排名技術作為特徵的EXCEL檔裡面,並依據這些技術,透過寫入程式去判斷每筆專利數據是否有出現這些技術類別 (1為有出現,0為未出現)。之後再根據各分類的結果中較好的方案去進行à(訓練:1997~2011、測試:2012 & 訓練:1998~2012、測試:2013)等數據資料進行測試。
其步驟以訓練資料為1996~2010年的數據集,測試資料為2011年的數據集為例:
(1)下圖是放程式的資料夾,我紅色框框標示的是我們跑程式將會用到的。我們首先要把”Before_Random2011”這個檔案進行整理以方便跑資料。
此圖就是”Before_Random2011”的資料
(2)再來就是要跑程式了,程式會先把剛剛放在”Before_Random2011”的資料做亂數後放在”After_Random2011”檔案中,並寫入附有排名技術作為特徵的EXCEL檔裡面(“2011”檔案),包含法律訴訟資料都需填入。接著我們把參數修改一下就可以執行了。
上圖是亂數後放在After_Random2011檔案的圖
(3)讓程式分別進行各專利資料是否有出現前10、20、30名技術的判斷,1為有出現,0則為未出現。
上圖為參數修改
經過參數修改之後讓程式將數據集進行亂數,上圖為亂數程式碼
亂數之後再讓程式進行寫入部分,上圖為程式寫入程式碼
最後讓寫入程式分別進行各專利資料是否有出現前10、20、30名技術的判斷,1為有出現,0則為未出現,上圖為2011年的前10名。
將利用二類別分類依據的三種價值定義分法結合專利之IPC技術類別資料,運用AIS演算法建立專利價值預測模型,並以測試資料進行專利價值預測。(我們設定每跑一次程式將實驗門檻值減0.05)。藉由測試出來的數據結果,再選擇何種分類方法為最佳方案並進行後續資料測試。訓練資料為1996~2010年的數據集,測試資料為2011年的數據集進行測試,其中以1為0和2、3為1前10名當作範例
以下是程式跑完的所有相關數據
bottom of page