亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁(yè)| 資源下載| 資源專輯| 精品軟件
登錄| 注冊(cè)

您現(xiàn)在的位置是:蟲蟲下載站 > 資源下載 > 多國(guó)語(yǔ)言處理 > 「我是中國(guó)人」

「我是中國(guó)人」

  • 資源大小:1634 K
  • 上傳時(shí)間: 2015-12-18
  • 上傳用戶:m472333662
  • 資源積分:2 下載積分
  • 標(biāo)      簽:

資 源 簡(jiǎn) 介

「我是中國(guó)人」,ChineseTokenizer會(huì)將之分割為五個(gè)中文字:「我、是、中、國(guó)、人」,CJKTokenizer則會(huì)將之分割為「我是、是中、中國(guó)、國(guó)人」四個(gè)二節(jié)的詞。前者的問題是沒有考慮中文詞語(yǔ)的問題,如搜尋「國(guó)中」一樣搜尋到「我是中國(guó)人」。後者的問題則是制做了大量沒意義的詞如「是中」「國(guó)人」,讓索引沒必要地增大、降低搜尋效率。

相 關(guān) 資 源

主站蜘蛛池模板: 乐至县| 滦平县| 财经| 得荣县| 铜梁县| 太谷县| 定襄县| 黄浦区| 稻城县| 黔南| 祁连县| 大同县| 开鲁县| 沙坪坝区| 抚顺县| 长阳| 虎林市| 江安县| 怀化市| 乐山市| 信宜市| 甘南县| 吴川市| 纳雍县| 临夏市| 凤翔县| 平利县| 宁国市| 绍兴市| 东山县| 锦州市| 綦江县| 安远县| 文水县| 内黄县| 凉城县| 建平县| 岚皋县| 山东| 天等县| 额尔古纳市|