官方說明:“刨丁解羊中文分詞器,主要用于對網(wǎng)絡(luò)蜘蛛或網(wǎng)絡(luò)爬蟲抓取的網(wǎng)頁進(jìn)行分詞,支持繁體中文分詞、簡體中文分詞、英文分詞,是制作通用搜索引擎和垂直搜索引擎的核心組件。該軟件在普通PC機(jī)器上測試顯示:TXT格式正文分詞速度約為3000萬字/分鐘,網(wǎng)頁分詞速度約為277.8個網(wǎng)頁/秒。該軟件采用基礎(chǔ)詞庫(63萬詞語)+擴(kuò)展詞庫(用戶可手工添加新詞)。DLL及OCX調(diào)用請聯(lián)系QQ(601069289)。”
很小的綠色中文分詞軟件,我也是從網(wǎng)上找到的,還是足夠日常中一些小場景使用,對不懂程序的同學(xué)而言,可能用這樣的小軟件比去想辦法自學(xué)程序再去研究一套分詞工具出來要干脆。當(dāng)然更復(fù)雜的需求,這個可能也解決不了。
標(biāo)簽:
分詞
分詞軟件
中文分詞
上傳時間:
2017-10-21
上傳用戶:hanboy