admin 发布的文章

Tesseract 4.x 新字体微调训练

####前言 首先,就个人而言,Tesseract 的 Wiki 关于训练的教程,写得真的混淆,对于英语不是特别好的人来说看得是云里雾里的。 我是看了一两天的文档,硬是理清楚是个什么样的流程...

Tesseract 迭代合并训练文件

####前言 这几天在玩图片文字识别,找到了惠普开源谷歌维护的`Tesseract`OCR识别项目。 它支持上百种语言的文字识别,对于英文来说,准确率非常之高,但是对于中文来说,就真的是不容...

Linux 软硬链接的使用

软链接: > ln -s file1 file2 1、软链接,以路径的形式存在。类似于Windows操作系统中的快捷方式 2、软链接可以 跨文件系统 ,硬链接不可以 3、软链接可以对...

Shell 脚本执行方式比较

####简单需求 使用`unrar`命令批量解压当前目录下的所有`.rar`压缩文件并删除`.rar`压缩包。 ####分析 首先,不考虑使用`unrar x *.rar`方式,实际上我也...

SpringMVC 优雅实现 301 跳转

###前言 对于做站的人来说,SEO 是一件挺重要的事情,所以当我们的网页请求规则发生改变时,为了减少丢失搜索引擎的权重,我们就很有必要对以前老的 URL 做 301 跳转了。 在 HTTP...

vncserver too many security failures 解决办法

这个问题在 Ubuntu 操作系统上遇到的可能会比较多,以前用 CentOS 的时候是没有这个问题的。 网上有人说解决办法就是杀掉进程,重新开启一个新的桌面,然而有时候我们需要保留之前打开...

Java byte[] 编码识别

####前言 最近在做[菟丝子资源社区][1]这个项目的时候,TCP 接收到的种子文件信息,读取出来的数据发现有些编码是 UTF-8,有些是 GBK,如果不做判断的话,那么在 JAVA 中直接...