科技改变生活 · 科技引领未来

  • 首页
  • 资讯
  • 技术
  • 百科
  • 问答
  • 学习
  • 看看
  • 站长
  • 生活
  • 快讯

首页 > 技术 > 技术快讯

微软的研究人员使用GANs从字幕生成图像和故事板

时间:2020-05-06 12:02 作者:王悦明

由于微软研究院、奥尔巴尼大学和JD AI研究院的人才,能够根据描述绘制图像的人工智能已经成为现实。在一篇文章(“Object-driven Text-to-Image合成通过对抗训练”)计划在IEEE计算机学会计算机视觉与模式识别会议在长滩(CVPR 2019)会议上,加州团队提出了一个机器学习框架——ObjGAN能理解标题,素描一个布局,根据确切的措辞和完善细节。

这篇论文的合著者声称,他们的方法与之前的先进技术相比,在图像质量上有了“显著提高”。他们写道:“ur生成器能够利用细粒度的字(和)对象级信息来逐步细化合成图像。”“大量的实验证明了ObjGAN在复杂场景的文本-图像生成中的有效性和泛化能力。”

该团队指出,在开发文本到图像的人工智能时,一个艰巨的挑战是让系统理解对象类型,以及让它理解场景中多个对象之间的关系。以前的方法使用图像-标题对,仅为单个对象提供粗粒度的信号,即使是性能最好的模型也难以生成包含多个对象的语义有意义的照片。

为了克服这些障碍,研究人员向ObjGAN注入了生成对抗网络(GAN),这是一个由生成样本的生成器和试图区分生成的样本和真实样本的鉴别器组成的两部分神经网络随着时间的推移,人工智能系统内化了对象的外观,并学会了从语料库中同时出现的模式中综合它们的布局,最终以预先生成的布局为条件生成图像。

为了在图像生成中达到人类水平的表现,该团队在ObjGAN中模拟了艺术家绘制和细化复杂场景的方式。该系统将输入文本分解成单独的单词,并将这些单词与图像中的特定对象进行匹配,它利用两个鉴别器——一个按对象分类的鉴别器和一个按片段分类的鉴别器——来判断工作是否真实,是否与句子描述一致。

结果并不完美——ObjGAN偶尔会吐出逻辑上不一致的样本,就像一列火车被困在草坡上,标题是“一列客运列车在铁轨上奔驰”——但考虑到它们是由整块布料合成的,它们仍然令人印象深刻。

研究者在微软,微软365年动力学研究,杜克大学,腾讯的人工智能研究,和卡内基梅隆大学图像生成进一步在一个单独的纸(“StoryGAN:故事的顺序条件GAN可视化”)来描述一个系统- StoryGAN从multi-sentence段落生成comic-like故事板的能力。StoryGAN类似地构建在一个GAN上,但它独特地包含一个上下文编码器,可以动态地跟踪故事流,并在故事和图像级别上有两个鉴别器,以增强生成的序列的质量和一致性。

该团队指出,StoryGAN可以扩展为交互式图像编辑,其中可以根据文本指令顺序编辑输入图像。

相关话题

  • telnet命令(Win10如何打开笔记本Telnet功能)
  • 高考恢复是哪一年(高考是哪年恢复的)
  • kux格式转换器(如何剪辑优酷视频)
  • vivo5g手机(vivo曲屏手机5g有几款)
  • 智慧团建登陆入口(团员没编号怎么入智慧团建)
  • 手机对比参数配置(vivip30手机参数配置)
  • cdrx4序列号(cdrx4怎么标注有箭头的尺寸)
  • 学生综合素质平台(学生综合素质评价平台家长评语)
  • ac和dc的区别(DC打开时有声音怎么回事)
  • 福州高中学校排名(福州有什么高中)
  • 驱动程序无法使用(原因是关键系统驱动程序丢失或包含错误)
  • 猕猴桃的种植方法(3x2的行株距成年树留几个枝最好)
  • 林州市属于哪个市(北流市是属广西哪个地级市管辖)
  • 英语四级报考条件(考英语四级需要什么条件)
  • 东北石油大学地址(东北石油大学在大庆哪个区)
  • vsd负压吸引术(vsd技术定义)
  • gts250功耗(铭瑄gts250变形金刚高清版和9600gt)
  • 石河子大学分数线(兰州交通大学与石河子大学相比哪个好)
  • 不浪漫罪名吉他谱(目前在美国还有话语权吗)
  • 《读者》官网投稿(古体诗适合投稿哪些诗刊)

热门推荐

  • “纯血鸿蒙”要来了!华为正式官宣,与盘古大模型5.0一同亮相!
  • 小米手环 9 即将上市发布!
  • 华为P70发售“蓄势待发”,旗舰店:能留下电话等通知!
  • 真我GT Neo6 SE首发6000nit无双屏,综合功耗更低,首销1699元起!
  • 京东支付与银联国际达成合作,实现跨境便利支付!
  • iOS 17.5测试版上线:iPhone用户可从网站侧载App,与安卓相似!
  • vivo X Fold3 系列折叠屏或将支持5.5G,4月或将开启OTA 推送!
  • 京东汽车和小米汽车或联手深度合作!
  • 微软发布首批AI电脑,配专用Copilot按钮!
  • 美团成立平台产品部,整合本地商业多项任务!
  • 代号“橄榄石”,小米 Redmi Note 13 Turbo 手机新曝光!
  • 华为P70系列发布延期?爆料芯片有变化!
  • 农业银行申请云计算任务调度专利,极大提高云计算任务处理效率!
  • 荣耀将推出首款小折叠手机:给三星和苹果一点点震撼!
  • 生成式人工智能技术走进高校专业课,极大提高备课效率!
  • 腾讯公司申请区块链数据处理专利,实现快速完成相同业务数据的数据交换功能!
  • 消息称谷歌将把Bard 更名为 Gemini,并退出独立的应用!
  • 小米 14 Ultra 手机跑分成绩单曝光!
  • 谷歌浏览器将基于AI功能进行升级,计划2月上线写作助手!
  • 亚马逊AWS将投资150亿美元扩大日本云计算业务,满足客户需求!

王悦明

关注
免责声明:本文章由会员“王悦明”发布,如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务 如因作品内容、版权和其他问题请于本站联系

关注排行榜

  1. 1“纯血鸿蒙”要来了!华为正式官宣,与盘古大模型5.0一同亮相!
  2. 2小米手环 9 即将上市发布!
  3. 3华为P70发售“蓄势待发”,旗舰店:能留下电话等通知!
  4. 4真我GT Neo6 SE首发6000nit无双屏,综合功耗更低,首销1699元起!
  5. 5京东支付与银联国际达成合作,实现跨境便利支付!
  6. 6iOS 17.5测试版上线:iPhone用户可从网站侧载App,与安卓相似!
  7. 7vivo X Fold3 系列折叠屏或将支持5.5G,4月或将开启OTA 推送!
  8. 8京东汽车和小米汽车或联手深度合作!
  9. 9微软发布首批AI电脑,配专用Copilot按钮!
  10. 10美团成立平台产品部,整合本地商业多项任务!

编辑精选

Copyright ©2009-2022 KeJiTian.Com, All Rights Reserved

版权所有 未经许可不得转载

增值电信业务经营许可证备案号:辽ICP备14006349号

网站介绍 商务合作 免责声明 - html - txt - xml