1. 课程预备知识¶

本课所涉及的OCR模型建立在深度学习的基础之上,因此与其相关的基础知识、环境配置、项目工程与其他资料将在本节介绍,尤其对深度学习不熟悉的读者可以查看和学习相应内容。

1.1 预备知识¶

深度学习的“学习”由机器学习中的神经元、感知机、多层神经网络等内容一路发展而来,因此了解基础的机器学习算法对于深度学习的理解和应用有很大帮助。而深度学习的“深”则体现在对大量信息处理过程中使用的卷积、池化等一系列以向量为基础的数学运算。如果缺乏这两者的理论基础,可以学习李宏毅老师的线性代数和机器学习课程。

对于深度学习本身的理解,可以参考百度杰出架构师毕然老师的零基础课程:百度架构师手把手带你零基础实践深度学习,其中覆盖了深度学习的发展历史,通过一个经典案例介绍深度学习的完整组成部分,是一套以实践为导向的深度学习课程。

对于理论知识的实践,Python基础知识必不可少,同时为了快速复现深度学习模型,本课程使用的深度学习框架为:飞桨PaddlePaddle。如果你已经使用过其他框架,通过快速上手文档可以迅速了解飞桨的使用方法。

1.2 基础环境准备¶

如果你想在本地环境运行本课程的代码且之前未搭建过Python环境,可以根据零基础运行环境准备,根据自己的操作系统安装Anaconda或docker环境。

如果你没有本地资源,可以通过AI Studio实训平台完成代码运行,其中的每个项目都通过Notebook的方式呈现,方便开发者学习。若对Notebook的相关操作不熟悉,可以参考AI Studio项目说明。

1.3 获取和运行代码¶

本课程依托PaddleOCR的代码库形成,首先,克隆PaddleOCR的完整项目:

#【推荐】
git clone https://github.com/PaddlePaddle/PaddleOCR

# 如果因为网络问题无法pull成功,也可选择使用码云上的托管:
git clone https://gitee.com/paddlepaddle/PaddleOCR

注:码云托管代码可能无法实时同步本github项目更新,存在3~5天延时,请优先使用推荐方式。

​ 如果你不熟悉git操作,可以直接在PaddleOCR的首页的 Code 中下载压缩包

然后安装第三方库:

cd PaddleOCR
pip3 install -r requirements.txt

1.4 查阅资料¶

PaddleOCR使用文档 (中文) 中详细介绍了如何使用PaddleOCR完成模型应用、训练和部署。文档内容丰富,大多数用户的问题都在文档或FAQ中有所描述,尤其在FAQ(中文)中,按照深度学习的应用过程沉淀了用户的常见问题,建议大家仔细阅读。

1.5 寻求帮助¶

如果你在使用PaddleOCR的过程中遇到BUG、易用性或者文档相关的问题,可通过Github issue与官方联系,请按照issue模板尽可能多的提供信息,以便官方人员迅速定位问题。同时,微信群是广大PaddleOCR用户的日常交流阵地,更适合提问一些咨询类问题,除了有PaddleOCR团队成员以外,还会有热心开发者回答大家的问题。