作者介绍

乔冠华,女,西安工程大学电子信息学院,2020级硕士研究生,张宏伟人工智能课题组。
研究方向:机器视觉与人工智能。
电子邮件:1078914066@qq.com

一.文心AI作画API介绍

1. 文心AI作画

文心ERNIE-ViLG,一款适合中文的跨模态AI绘画大模型。
论文地址:https://arxiv.org/pdf/2112.15283.pdf
体验连接:https://wenxin.baidu.com/ernie-vilg

文心ERNIE-ViLG是一个大规模的中文跨模态生成模型,其参数规模达到100亿。该模型首次通过自回归算法将图像生成和文本生成统一建模,增强模型的跨模态语义对齐能力,显著提升图文生成效果。

ERNIE-ViLG生成的不同风格的图像如下:

利用AI技术生成图片的最终目的是要便捷地为人类创造美的作品,激发人的想象力和创作力。在艺术创作、虚拟现实、图像编辑、AI 辅助设计、虚拟数字人等领域,文心 ERNIE-ViLG 这类跨模态大模型有着广泛的应用前景,也为这些领域未来的发展提供了无限的创意和可能。作为百度“文心”大模型全景图中的重要一员,文心 ERNIE-ViLG 也代表着百度文心在跨模态大模型领域迈出坚实步伐,从技术自主创新和加速产业应用方面持续推动中国 AI 发展。

2.接口介绍

文心AI作画API基于文心ERNIE-ViLG大模型,可根据用户输入的中文文本,自动创作图片。

文心AI作画涉及2个接口,分别为:提交请求、查询结果。

  • 提交请求:传入文本、分辨率、风格参数,创建ERNIE-ViLG AI作画任务,获得任务ID。
  • 查询结果:用于在任务创建后,查看图片生成状态。待图片生成完毕,通过查询接口即可查看生成图片的地址链接。

该接口通过自定义丰富的修饰词,生成不同风格、不同构图、不同流派的图片(每次可自定义生成1张至6张图片)。

二.注册账号并获取API Key

进入:百度智能云并创建应用获取API Key,Secret Key

1. 注册百度智能云账号

免费注册登录百度智能云账号进入下图界面,选择右上角 “控制台”模块:

选择“产品服务”中“人工之智能”模块的“智能创作平台”项目:

点击领取免费的接口资源(根据要求实名认证后可获取):

2. 获取API

在“应用列表”中点击“创建应用”,免费创建个人文本-图像生成应用模块:

创建成功的应用模块如下,从中可以获取个人应用模块的API Key和Secret Key:

三.代码实现

完整代码

  • 提交请求代码
    创建“提交请求”接口文件,并根据申请的个人API Key和Secret Key,以及自定义输入的文本和参数信息,修改并运行以下代码。(该代码可得到图片生成任务ID——“taskId”)
import requests
import jsonAPI_KEY = "自己申请的API Key"
SECRET_KEY = "自己申请的Secret Key"def main():url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/txt2img?access_token=" + get_access_token()payload = json.dumps({"text": "中国山水画",#输入中文描述"resolution": "1024*1024",#选择图片分辨率,可支持1024*1024、1024*1536、1536*1024"style": "古风",#选择图像风格,古风、二次元、写实风格、浮世绘、未来主义、赛博朋克等等"num": 2#输入要生成的图片数量,可选1~6张})headers = {'Content-Type': 'application/json','Accept': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload)print(response.text)#获取Access Token
def get_access_token():"""使用 AK,SK 生成鉴权签名(Access Token):return: access_token,或是None(如果错误)"""url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}return str(requests.post(url, params=params).json().get("access_token"))if __name__ == '__main__':main()
  • 查询结果代码
    创建“查询结果”接口文件,根据申请的个人API Key和Secret Key,以及“提交请求”代码得到的图片生成任务ID——“taskId”(有效期一个月),修改并运行以下代码。(该代码可得到最终生成的图片)
import requests
import json
from io import BytesIO#BytesIO实现了在内存中读写bytes
from PIL import Image
import os
API_KEY = "自己申请的API Key"
SECRET_KEY = "自己申请的Secret Key"def main():#API接口的url url = "https://aip.baidubce.com/rpc/2.0/ernievilg/v1/getImg?access_token=" + get_access_token()#发送请求获取网页内容 payload = json.dumps({"taskId": "提交请求代码返回的 'taskId' 的值"})headers = {'Content-Type': 'application/json','Accept': 'application/json'}    response = requests.request("POST", url, headers=headers, data=payload)print('请求的返回值:',response.text)json_result = json.loads(response.text)imgUrls=json_result['data']['imgUrls']#返回imgUrls的结果print("imgUrls的返回值:", imgUrls)#imgUrls":[{"image":"https://wenxin.baidu.com/younger/file/ERNIE-ViLG/4a90992981919xxxxxx"},{"image":"https://wenxin.baidu.com/younger/file/ERNIE-ViLG/4a90992981919a74f0b4xxxxx"}]print("imgUrls类型:",type(imgUrls))#查看imgUrls类型,是列表print("imgUrls数量:",len(imgUrls))#获得图片网址并将图片保存到本地for i in range(0,len(imgUrls)):img_url=imgUrls[i]print('imges_url:',img_url)img_url=img_url['image']print('image_url:',img_url)#保存图片到本地req=requests.get(img_url)#获取图片网址image = Image.open(BytesIO(req.content))#在内存中打开图片image.save(os.path.join('图片保存路径','{}.jpg'.format(i)), 'JPEG')#获取Access Token
def get_access_token():"""使用 AK,SK 生成鉴权签名(Access Token):return: access_token,或是None(如果错误)"""url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}return str(requests.post(url, params=params).json().get("access_token"))if __name__ == '__main__':main()

四.效果展示

  • 运行“提交请求”代码后,可以得到获得任务ID——“taskId”:

  • 根据获得的任务ID运行“查询结果”代码后即可得到最终生成的.jpg图片:


参考链接:
https://zhuanlan.zhihu.com/p/600247099
https://zhuanlan.zhihu.com/p/455523289

调用百度文心AI作画API实现中文-图像跨模态生成相关推荐

  1. 程序员盒子接入百度文心大模型文生图能力

    原文:https://www.coderutil.com/article?id=203 一.前言 AI时代是一个快速发展的时代,它带来了很多机会和挑战.对于普通人来说,AI技术的应用可以帮助我们更高效 ...

  2. AI绘画,画渣or画神?百度文心·一格AI作画平台初体验与总结

    简介 文心·一格,是基于文心大模型能力的AI艺术和创意辅助平台.用户输入一段文本描述,并选择方向.风格和尺寸,点击[立即生成], AI就会根据对文本的理解自动进行画作的创作. 体验网址 https:/ ...

  3. 百度文心一格x京东618:打造电商行业首个AI线下广告,节省80%制作成本

    小钱买到大快乐,小钱能不能买到好的营销创意?AIGC 赋予了所有行业新面貌,并逐渐成为各行各业从业者的新型生产工具.在此背景下,今年618期间,京东联合百度文心一格,将 AIGC 应用于电商营销,进行 ...

  4. 螳螂科技接入百度“文心一言”,提升营销管理AI服务能力

    2月 22日, 螳螂科技宣布成为百度"文心一言"(英文名:ERNIE Bot)首批生态合作伙伴.后续,螳螂科技将通过百度智能云全面体验并接入文心一言的能力. 接下来,螳螂科技将把百 ...

  5. 生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?

    文章目录 前言 一.生成式 AI 的发展和现状 1.1.什么是生成式 AI? 1.2.生成式 AI 的发展趋势 1.3.AI 生成内容的业务场景和分类 二.生成式 AI 从分析领域到创作领域 2.1. ...

  6. 百度“文心一言”携手酷开科技,实现AI智能领域新突破!

    进入21世纪,AI人工智能一直都是讨论度非常高的话题之一,各行各业的领导者都开始在智能领域进行了初步探索,这也证明了AI人工智能在未来一定会在很大程度上影响我们的生活.工作. 近日,深圳市酷开网络科技 ...

  7. 百度“文心一言”首批生态合作伙伴公布,Moka接入打造人力资源数字化人AI服务

    近日,百度"文心一言"(英文名:ERNIE Bot)公布首批生态合作伙伴,企业级HR SaaS服务商Moka位列其中,将优先体验并接入"文心一言",以此打造更创 ...

  8. 聚观早报 | 百度文心一言被用户挤爆;贝莱德准备竞购瑞信

    今日要闻:百度文心一言被用户挤爆:贝莱德准备竞购瑞信:Meta 在美国推出付费加「蓝 V」服务:三星正开发 3500ppi 的 FMM:老干妈冰激凌要来了 百度文心一言被用户挤爆 百度正式发布了自己的 ...

  9. 15大不同领域问答对比,ChatGPT模型大战:国产版百度文心一言、昆仑万维天工能否击败GPT-4(含百度文心一言、昆仑万维天工个人内测体验测试邀请码获取方法,亲测有效)

    目录 前言 百度内测申请 天工内测申请 申请方式 内测体验 登录界面 运行体验 内测对比 基本问答 事实性问答 科普文写作 小红书文案 项目计划撰写 古文理解 模型的常识能力和反事实推理 代码理解 法 ...

最新文章

  1. 太棒了!Jupyter 与 PyCharm 完美融合,Jupytext 来啦!
  2. Q新闻丨MongoDB更换开源协议;Redis 5.0、Angular 7.0发布
  3. 算法导论系列:分治算法
  4. react-router使用教程
  5. .Net Core 部署到 CentOS7 64 位系统中的步骤
  6. 从零开始搭建Ubuntu 环境下的Android 源码开发环境
  7. IMI 基于 Swoole 开发的协程 PHP 开发框架 常驻内存、协程异步非阻塞
  8. Bailian2943 小白鼠排队【排序】
  9. 字符编码 and cpp
  10. 如何使用TunesKit AceMovi Video Editor Mac在视频中添加贴纸
  11. 啊哈C语言 第四章 第 十 节
  12. 【rmzt:魔兽冰封王座主题】
  13. 去水印小程序源码_图片去水印|去水印喵小程序
  14. U - 计算长方体、四棱锥的表面积和体积
  15. js 彻底理解回调函数
  16. AAC 音频数据结构实例分析:
  17. SQL注入大闯关笔记
  18. 知乎文章如何复制下来
  19. mysql增加字段 first_MySQL教程41-MySQL数据表添加字段
  20. Python——计算程序运行帧率(FPS)

热门文章

  1. 使用APACHE KNOX作为proxy访问web,同时开启SSO功能
  2. 从微信直接唤起App——【提活拉新】你必须知道的事
  3. Mac本地部署蘑菇个人博客详解
  4. 事务的acid属性是指_事务的ACID特性
  5. 制作一个答题系统,随机出现二十道题.
  6. GridLayout使用
  7. 什么是J2EE?(转)
  8. word自动生成目录有图片怎么解决
  9. 活动报名丨河北(廊坊站)启动仪式-“香港科大商学院-安讯科技”2019【人工智能】百万奖金国际创业大赛...
  10. 【C#】三层登录机房重构