實現最優二叉樹的構造;在此基礎上完成哈夫曼編碼器與譯碼器。 假設報文中只會出現如下表所示的字符:
字符 A B C D E F G H I J K L M N
頻度 186 64 13 22 32 103 21 15 47 57 1 5 32 20 57
字符 O P Q R S T U V W X Y Z , .
頻度 63 15 1 48 51 80 23 8 18 1 16 1 6 2
要求完成的系統應具備如下的功能:
1.初始化。從終端(文件)讀入字符集的數據信息,。建立哈夫曼樹。
2.編碼:利用已建好的哈夫曼樹對明文文件進行編碼,并存入目標文件(哈夫曼碼文件)。
3.譯碼:利用已建好的哈夫曼樹對目標文件(哈夫曼碼文件)進行編碼,并存入指定的明文文件。
4.輸出哈夫曼編碼文件:輸出每一個字符的哈夫曼編碼。
...將該字符串變量與停用詞表中的所有單詞進行比較,若果該詞在停用詞表中出現過則不對其進行統計,否則在對該詞進行詞干抽取。
經過以上停用詞、詞干處理后得到的將是實際進行統計的“單詞”(此時的“單詞”實際上已經是所有具有相同詞干的原是單詞的統一代表)...
注:jar包中含有完整的java源程序代碼,僅供學習參考之用,傳播時請保持本軟件包的完整性 ---ZHG工作室 2008.4 E-mail:wudazhg@163.com All Rights Reserved