「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。
標簽:
上傳時間: 2015-12-18
上傳用戶:stvnash
C語言中使用的各種濾波器寫法
標簽: 濾波器
上傳時間: 2015-12-19
上傳用戶:jichenxi0730
這是一份適合初學者參考的C語言學習手冊,作者以工程師寫程式時所需具備的程式技巧作為出發點,對有志於成為程式設計師的人會有相當的幫助
標簽: 程式 手冊 工程
上傳時間: 2014-07-20
上傳用戶:zxc23456789
M值曲線即控制理論中的補靈敏度系數模的最大值。本例模型為:y=w+s
標簽: 控制理論 靈敏度 模 模型
上傳時間: 2013-12-23
上傳用戶:youlongjian0
擴頻同步時頻域二維分布 R=[x,y] surf(R) x:-5:0.1:5 y:-0.01:0.005:0.1
標簽: 0.1 0.005 surf 0.01
上傳時間: 2014-01-21
上傳用戶:yph853211
x,y,z的值不是非遞增的,要求實現其為非遞增。
標簽: 遞增
上傳時間: 2015-12-27
上傳用戶:change0329
cmac 訓練簡單線性函數程序,z = sin(x + y),為c++程序
標簽: cmac sin 程序 單線
上傳時間: 2013-12-27
上傳用戶:bakdesec
對于給定的n個元素的數組X[0:n-1]和Y[0:n-1],試設計一個O(logn)時間算法,計算X和Y的中位數.
標簽: logn 元素 數組 算法
上傳時間: 2014-01-15
上傳用戶:qq21508895
這是我在07年索尼杯做電動車蹺蹺板題目的源碼,可以找到平衡點,也可以尋跡,還有顯示,題目要求的基本功能都實現了,希望和大伙們分享.
標簽: 索尼 電動車 源碼 蹺蹺板
上傳時間: 2014-01-19
上傳用戶:huangld
打印函數x=y*y曲線 不使用數組來打印正弦曲線 不使用數組來打印余弦曲線 不使用數組同時打印正弦和余弦曲線,交點處用 “+”號表示,其余處用”*”表示
標簽: 打印 數組 正弦 函數
上傳時間: 2014-07-08
上傳用戶:wkchong
蟲蟲下載站版權所有 京ICP備2021023401號-1