主页 > 学生园地 >
 
图文资讯
学生园地

前端智能化:实现自己的控件识别模型

学生园地 | 2020-05-10 | 标签:前端智能化,识别模型,控件

开始之前
台式机和笔记本
首先,初学者我更推荐笔记本,因为其便携性和初期实验的运算量并不是很大,可以保证在咖啡馆或户外立即开始学习和实践。其次,现在的轻薄笔记本如小米的 Pro 款配备了 Max 150 满血版,基本可以满足常用的机器学习实验。Mac Book Pro 的用户可以考虑带 AMD 显卡的笔记本,因为在 PlaidML(intel提供的机器学习后端)支持下,Keras 的大部分 OP 都是具备 GPU 硬件加速的。需要注意,PlaidML 对很多神经网络支持不太好,比如对 RNN 的支持就不好,具体可以看 Issue。在我的16寸 Mac Book Pro上,PlaidML 对 RNN 无硬件加速效果,GPU 监视器未有负载且模型编译过程冗长。

最后,对于有条件的朋友建议准备台式机,因为在学习实验中将会遇到越来越多复杂模型,这些模型一半都需要训练数天,台式机能够提供更好的散热性能来保证运行的稳定性。

组装台式机的时候对CPU的主频要求不用太高,一般 AMD 的中低端 CPU 即可胜任,只要核心数达到6个以上的AMD 12 线程CPU基本就够用了。内存方面最好是 32GB ,16GB 只能说够用,对海量数据尤其是图片类型进行加工处理的时候,最容易爆的就是内存。

GPU方面由于ROCM的完善,喜欢折腾的人选择 AMD GPU 完全没问题,不喜欢折腾可以选择 Nvidia GPU,需要指出的是显存容量和显存带宽在预算允许的范围内越大越好,尤其是显存容量,海量参数的大模型没有大显存根本无法训练。

硬盘方面选择高速 SSD 作为系统盘 512GB 起步,挂载一个混合硬盘作为数据存储和模型参数存储即可。电源尽量选择大一点儿,除了考虑峰值功耗之外,未来可能要考虑多 GPU 来加速训练过程、应对海量参数。机箱作为硬件的家,电磁屏蔽性能好、板材厚重、空间大便于散热即可,用水冷打造性能小钢炮的除外。

选择的依据很简单:喜欢折腾的按上述内容 DIY ,喜欢简单的按上述内容买带售后的品牌机。两者的区别就是花时间省点儿钱?还是花钱省点儿时间?

操作系统
对于笔记本自带 Windows 操作系统的,直接使用 Windows 并没有问题,Anaconda 基本可以搞定和研发环境的所有问题,而且其自带的 NPM 管理工具很方便。有条件爱折腾的上一个 Ubuntu Linux 系统最好,因为在 Linux 下能够更加原生支持机器学习相关技术生态,几乎不会遇到兼容性问题。

对于台式机建议安装 Ubuntu Linux 系统,否则,这么好的显卡很容易装个 Windows 玩游戏去了……Ubuntu 的安装盘制作很简单,一个U盘搞定,一路回车安装即可。装好系统后在自己的“~”根目录下建一个“Workspace”存放代码文件,制作一个软链接把混合硬盘作为数据盘引入即可,未来还可以把 Keras、NLTK 等框架的数据集文件夹也以软链接的方式保存在数据盘里。

Ubuntu 会自动进行更新,这个很重要,很多框架和库的 Bug 在这个过程中被修复,需要注意的是在这个过程中出现长时间无响应或网络问题的情况,可以考虑用阿里云的源来进行加速,然后在命令行手动执行更新。

Python环境
教程
Python教程:https://docs.python.org/zh-cn/3.8/tutorial/index.html

安装包:
MacOS:https://www.python.org/ftp/python/3.7.7/python-3.7.7-macosx10.9.pkg

Windows:https://www.python.org/ftp/python/3.7.7/python-3.7.7-embed-amd64.zip

安装模块:
https://docs.python.org/zh-cn/3.8/installing/index.html

Node环境
教程
Node教程:https://nodejs.org/zh-cn/

安装包:
MacOS:https://nodejs.org/dist/v12.16.2/node-v12.16.2.pkg

Windows:

64-bit:https://nodejs.org/dist/v12.16.2/node-v12.16.2-x64.msi

32-bit:https://nodejs.org/dist/v12.16.2/node-v12.16.2-x86.msi

Linux:64-bit

下载页面:https://nodejs.org/zh-cn/download/

安装模块:
模块网站:https://www.npmjs.com/

安装方法:

$ npm install -g @pipcook/pipcook-cli
确保你的 Python 版本为  > 3.6 ,你的 Node.js 版本为 > 12.x 的最新稳定版本,执行上面的安装命令,就可以在电脑里拥有 Pipcook 的完整开发环境了。

快速实验
启动可视化实验环境:Pipboard
启动
命令行:

$ mkdir pipcook-example && cd pipcook-example
$ pipcook init
$ pipcook board
输出:

> @pipcook/pipcook-board-server@1.0.0 dev /Users/zhenyankun.zyk/work/node/pipcook/example/.server
> egg-bin dev
[egg-ts-helper] create typings/app/controller/index.d.ts (2ms)
[egg-ts-helper] create typings/config/index.d.ts (9ms)
[egg-ts-helper] create typings/config/plugin.d.ts (2ms)
[egg-ts-helper] create typings/app/service/index.d.ts (1ms)
[egg-ts-helper] create typings/app/index.d.ts (1ms)
2020-04-16 11:52:22,053 INFO 26016 [master] node version v12.16.2
2020-04-16 11:52:22,054 INFO 26016 [master] egg version 2.26.0
2020-04-16 11:52:22,839 INFO 26016 [master] agent_worker#1:26018 started (782ms)
2020-04-16 11:52:24,262 INFO 26016 [master] egg started on http://127.0.0.1:7001 (2208ms)
在浏览器内选择实验:
想进行手写数字识别实验,选择 MNIST Handwritten Digit Recognition (手写数字识别)点击 Try Here 按钮。想进行图像分类实验,选择 Image Classifiaction for Front-end Assets。



上一篇:上海交大对21名研究生作退学处理 大部分为外籍留学生 下一篇:没有了