paddle.text¶
paddle.text 目录是飞桨在文本领域的高层API。有Paddle内置以及PaddleNLP中提供的两种。具体如下:
内置数据集相关API¶
API名称  |  
           API功能  |  
          
|---|---|
| 
             |  
           Conll05st数据集  |  
          
| 
             |  
           Imdb数据集  |  
          
| 
             |  
           Imikolov数据集  |  
          
| 
             |  
           Movielens数据集  |  
          
| 
             |  
           UCIHousing数据集  |  
          
| 
             |  
           WMT14数据集  |  
          
| 
             |  
           WMT16数据集  |  
          
PaddleNLP提供的API¶
PaddleNLP 提供了在文本任务上简洁易用的全流程API,旨在为飞桨开发者提升文本领域建模效率。深度适配飞桨框架,提供基于最新版Paddle的NLP领域最佳实践。
安装命令:
pip install --upgrade paddlenlp -i https://pypi.org/simple
         API模块  |  
           功能简介  |  
           API用法简单示例  |  
          
|---|---|---|
| 
             |  
           数据集相关API,包含自定义数据集,数据集贡献与数据集快速加载等功能  |  
           
            
  |  
          
| 
             |  
           文本数据处理Pipeline的相关API  |  
           见链接文档  |  
          
| 
             |  
           基于Transformer结构相关的预训练模型API,包含ERNIE, BERT, RoBERTa, Electra等主流经典结构和下游任务  |  
           
            
  |  
          
| 
             |  
           提供了文本任务上的一些模型评价指标,例如Perplexity、GlLUE中用到的评估器、BLEU、Rouge等,与飞桨高层API兼容  |  
           
            
  |  
          
| 
             |  
           词向量相关API,支持一键快速加载包预训练的中文词向量,VisualDL高维可视化等功能  |  
           
            
  |  
          
