亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

信息抽取

信息抽取(InformationExtraction:IE)是把文本里包含的信息進(jìn)行結(jié)構(gòu)化處理,變成表格一樣的組織形式。抽取系統(tǒng)的輸入信息是原始文本,輸出的是固定格式的信息點(diǎn)。信息點(diǎn)從各種各樣的文檔中被抽取出來,然后以統(tǒng)一的形式集成在一起。這就是信息抽取的主要任務(wù)。信息以統(tǒng)一的形式集成在一起的好處是方便檢查和比較。信息抽取技術(shù)并不試圖全面理解整篇文檔,只是對文檔中包含相關(guān)信息的部分進(jìn)行分析。至于哪些信息是相關(guān)的,那將由系統(tǒng)設(shè)計時定下的領(lǐng)域范圍而定。
主站蜘蛛池模板: 始兴县| 榆中县| 德格县| 探索| 柳河县| 正蓝旗| 京山县| 水富县| 喀喇沁旗| 乌兰察布市| 同心县| 浦北县| 临澧县| 英山县| 鱼台县| 青田县| 丹凤县| 武宣县| 辽中县| 澜沧| 云梦县| 多伦县| 灌南县| 武鸣县| 乃东县| 香格里拉县| 石阡县| 望城县| 元阳县| 浦北县| 洪泽县| 东乌珠穆沁旗| 方山县| 五峰| 平乐县| 永德县| 大石桥市| 仪陇县| 新巴尔虎右旗| 九龙坡区| 安新县|