数据输入输出¶
数据输入¶
Fluid支持两种数据输入方式,包括:
1. Python Reader: 纯Python的Reader。用户在Python端定义 fluid.layers.data 层构建网络,并通过
executor.run(feed=...) 的方式读入数据。数据读取和模型训练/预测的过程是同步进行的。
2. PyReader: 高效灵活的C++ Reader接口。PyReader内部维护容量为 capacity 的队列(队列容量由
fluid.layers.py_reader 接口中的 capacity 参数设置),Python端调用队列的 push
方法送入训练/预测数据,C++端的训练/预测程序调用队列的 pop 方法取出Python端送入的数据。PyReader可与
double_buffer 配合使用,实现数据读取和训练/预测的异步执行。
具体使用方法请参考 py_reader。
数据输出¶
Fluid支持在训练/预测阶段获取当前batch的数据。
用户可通过 executor.run(fetch_list=[...], return_numpy=...) 的方式
fetch期望的输出变量,通过设置 return_numpy 参数设置是否将输出数据转为numpy array。
若 return_numpy 为 False ,则返回 LoDTensor 类型数据。
具体使用方式请参考相关API文档 Executor 和 ParallelExecutor。
