「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
標簽:
上傳時間: 2015-12-18
上傳用戶:stvnash
24c01-24c16讀寫驅動程序,只是純驅動 沒有應用主程序
標簽: 24 01 16 讀寫
上傳時間: 2016-01-06
上傳用戶:zhaiye
Server 端可以開啟多檔,並儲存檔案下載列表,下次啟動時仍可自動載入
標簽: Server
上傳時間: 2013-12-26
上傳用戶:源碼3
無監督分類方法,可以對一堆數值自動的歸類
標簽: 分
上傳時間: 2014-12-21
上傳用戶:古谷仁美
編程珠璣,程序員的警世恒言,讓您Good reading、Happy coding
標簽: 編程 珠璣
上傳時間: 2013-12-18
上傳用戶:firstbyte
altera Quartus II 減法器使用 配合LED,可自動與手動按鈕控製。 (含電路)
標簽: Quartus altera LED II
上傳時間: 2013-12-13
上傳用戶:王楚楚
altera Quartus II FSM使用 可設定時間波形,手動調整波形頻率。 (含電路)
標簽: Quartus altera FSM II
上傳時間: 2016-02-13
上傳用戶:kbnswdifs
altera Quartus II TLC晶片控制 可控制暫存器,手動調整內碼。 (含電路)
標簽: Quartus altera TLC 控制
上傳用戶:Zxcvbnm
前段時間一直忙著學習,最近有空就用c言編的FFT算法,請大家指教。
上傳時間: 2014-01-02
上傳用戶:maizezhen
「新聞群聚」就是一項需要人力介入的新聞服務,而為了使其更為自動化,我們將文件分群(document clustering)的技術應用在新聞文件上,達到新聞分群(news clustering)的目的。
上傳時間: 2014-01-24
上傳用戶:731140412
蟲蟲下載站版權所有 京ICP備2021023401號-1