整個(gè)實(shí)驗(yàn)是在Windows環(huán)境下使用delphi完成的。選取了600篇文檔,數(shù)據(jù)集共分教育,商業(yè)與經(jīng)濟(jì),計(jì)算機(jī)與因特網(wǎng),娛樂與休閑,自然科學(xué)5個(gè)類別,
教育類包括31篇文檔,
商業(yè)與經(jīng)濟(jì)類有93篇文檔,
計(jì)算機(jī)與因特網(wǎng)102篇文檔,
娛樂與休閑166篇文檔,
自然科學(xué)有208篇文檔。
目錄“DataSet”:RawText中的文本分詞后保存在DataSet目錄。
數(shù)據(jù)表“WordsTable”:保存DataSet中所有文本的倒排文檔。
其中“目錄DataSet”和“DataBase.mdb”為實(shí)驗(yàn)測(cè)試所必須
標(biāo)簽:
Windows
delphi
600
實(shí)驗(yàn)
上傳時(shí)間:
2014-01-22
上傳用戶:llandlu