- 軟件大小:28.79M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費軟件 / 編程工具
- 更新時間:2017-07-24 13:57
- 運行環(huán)境:WinAll, WinXP, Win7, Win8, Win10
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:暫無
頂好評:50%
踩壞評:50
1.23M/中文/5.0
10.15M/中文/2.0
1.52M/中文/10.0
643KB/中文/5.0
0KB/中文/10.0
tikaapp.jar包是一款可以輕松提取文本正文工具,它集成了POI, Pdfbox 并且為文本抽取工作提供了一個統(tǒng)一的界面,提供了便利的擴(kuò)展API,用來豐富其對第三方文件格式的支持,感興趣的朋友可以下載使用!
Tika是一個用于文本解釋的框架,其本身并不提供任何的庫用于解釋文本,而是調(diào)用各種各樣的庫,如POI,PDFBox等。使用Tika,可以提取文件中的作者、標(biāo)題、創(chuàng)建時間、正文等內(nèi)容,相比于Java.io自帶的一些功能。
1.進(jìn)入Tika所有的目錄,運行以下命令:java -jar "tika-app-1.5 (1).jar" -g
2.Tika的圖形界面被打開,然后找開File-openURL:
3.點擊確認(rèn)后,即返回解釋結(jié)果。默認(rèn)情況下顯示的是文本的元信息
4.可以通過view菜單中的選項,分別查看 metadata, formatted text, plain text, main content, stuctured text等信息。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內(nèi)容