科技改变生活 · 科技引领未来

  • 首页
  • 资讯
  • 技术
  • 百科
  • 问答
  • 学习
  • 看看
  • 站长
  • 生活
  • 快讯

首页 > 技术 > 技术快讯

微软的研究人员使用GANs从字幕生成图像和故事板

时间:2020-05-06 12:02 作者:王悦明

由于微软研究院、奥尔巴尼大学和JD AI研究院的人才,能够根据描述绘制图像的人工智能已经成为现实。在一篇文章(“Object-driven Text-to-Image合成通过对抗训练”)计划在IEEE计算机学会计算机视觉与模式识别会议在长滩(CVPR 2019)会议上,加州团队提出了一个机器学习框架——ObjGAN能理解标题,素描一个布局,根据确切的措辞和完善细节。

这篇论文的合著者声称,他们的方法与之前的先进技术相比,在图像质量上有了“显著提高”。他们写道:“ur生成器能够利用细粒度的字(和)对象级信息来逐步细化合成图像。”“大量的实验证明了ObjGAN在复杂场景的文本-图像生成中的有效性和泛化能力。”

该团队指出,在开发文本到图像的人工智能时,一个艰巨的挑战是让系统理解对象类型,以及让它理解场景中多个对象之间的关系。以前的方法使用图像-标题对,仅为单个对象提供粗粒度的信号,即使是性能最好的模型也难以生成包含多个对象的语义有意义的照片。

为了克服这些障碍,研究人员向ObjGAN注入了生成对抗网络(GAN),这是一个由生成样本的生成器和试图区分生成的样本和真实样本的鉴别器组成的两部分神经网络随着时间的推移,人工智能系统内化了对象的外观,并学会了从语料库中同时出现的模式中综合它们的布局,最终以预先生成的布局为条件生成图像。

为了在图像生成中达到人类水平的表现,该团队在ObjGAN中模拟了艺术家绘制和细化复杂场景的方式。该系统将输入文本分解成单独的单词,并将这些单词与图像中的特定对象进行匹配,它利用两个鉴别器——一个按对象分类的鉴别器和一个按片段分类的鉴别器——来判断工作是否真实,是否与句子描述一致。

结果并不完美——ObjGAN偶尔会吐出逻辑上不一致的样本,就像一列火车被困在草坡上,标题是“一列客运列车在铁轨上奔驰”——但考虑到它们是由整块布料合成的,它们仍然令人印象深刻。

研究者在微软,微软365年动力学研究,杜克大学,腾讯的人工智能研究,和卡内基梅隆大学图像生成进一步在一个单独的纸(“StoryGAN:故事的顺序条件GAN可视化”)来描述一个系统- StoryGAN从multi-sentence段落生成comic-like故事板的能力。StoryGAN类似地构建在一个GAN上,但它独特地包含一个上下文编码器,可以动态地跟踪故事流,并在故事和图像级别上有两个鉴别器,以增强生成的序列的质量和一致性。

该团队指出,StoryGAN可以扩展为交互式图像编辑,其中可以根据文本指令顺序编辑输入图像。

相关话题

  • 小车机油多少钱一瓶(大批假机油被查获)
  • 红塔山白色硬盒多少钱(2003年慕马案巨贪落马)
  • 电动车外胎多少钱一个(10000元左右的电动车出厂价要多少)
  • 子宫内膜厚刮宫多少钱(子宫出血小科普)
  • 快手一万快币多少钱(​快手10亿春晚红包最强攻略)
  • 红旗小轿车多少钱一辆(19)
  • 路特斯莲花多少钱(新车)
  • 做一个全身检查需要多少钱(常见癌症的体检筛查方法)
  • 习酒1988多少钱(老朋友)
  • dior口红999多少钱(过年涂什么口红好看)
  • 志邦橱柜一般多少钱(吐血整理装修材料品牌汇总清单)
  • 小车机油多少钱一瓶(丰田CH)
  • 汽车换电瓶要多少钱(汽车的电瓶寿命有多长)
  • iphone换原装电池多少钱(在苹果)
  • 生地种子多少钱一斤(中药材种植种子处理很关键)
  • 妇科阴超检查多少钱(与腹式B超相比)
  • 一件羽绒服干洗多少钱(上万的Moncler羽绒服)
  • 烤五花肉加盟费多少钱(广东最会卖肉的)
  • 火灾鉴定需要多少钱(司法鉴定都不管用)
  • 苹果7plus128g多少钱(再见)

热门推荐

  • “纯血鸿蒙”要来了!华为正式官宣,与盘古大模型5.0一同亮相!
  • 小米手环 9 即将上市发布!
  • 华为P70发售“蓄势待发”,旗舰店:能留下电话等通知!
  • 真我GT Neo6 SE首发6000nit无双屏,综合功耗更低,首销1699元起!
  • 京东支付与银联国际达成合作,实现跨境便利支付!
  • iOS 17.5测试版上线:iPhone用户可从网站侧载App,与安卓相似!
  • vivo X Fold3 系列折叠屏或将支持5.5G,4月或将开启OTA 推送!
  • 京东汽车和小米汽车或联手深度合作!
  • 微软发布首批AI电脑,配专用Copilot按钮!
  • 美团成立平台产品部,整合本地商业多项任务!
  • 代号“橄榄石”,小米 Redmi Note 13 Turbo 手机新曝光!
  • 华为P70系列发布延期?爆料芯片有变化!
  • 农业银行申请云计算任务调度专利,极大提高云计算任务处理效率!
  • 荣耀将推出首款小折叠手机:给三星和苹果一点点震撼!
  • 生成式人工智能技术走进高校专业课,极大提高备课效率!
  • 腾讯公司申请区块链数据处理专利,实现快速完成相同业务数据的数据交换功能!
  • 消息称谷歌将把Bard 更名为 Gemini,并退出独立的应用!
  • 小米 14 Ultra 手机跑分成绩单曝光!
  • 谷歌浏览器将基于AI功能进行升级,计划2月上线写作助手!
  • 亚马逊AWS将投资150亿美元扩大日本云计算业务,满足客户需求!

王悦明

关注
免责声明:本文章由会员“王悦明”发布,如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务 如因作品内容、版权和其他问题请于本站联系

关注排行榜

  1. 1“纯血鸿蒙”要来了!华为正式官宣,与盘古大模型5.0一同亮相!
  2. 2小米手环 9 即将上市发布!
  3. 3华为P70发售“蓄势待发”,旗舰店:能留下电话等通知!
  4. 4真我GT Neo6 SE首发6000nit无双屏,综合功耗更低,首销1699元起!
  5. 5京东支付与银联国际达成合作,实现跨境便利支付!
  6. 6iOS 17.5测试版上线:iPhone用户可从网站侧载App,与安卓相似!
  7. 7vivo X Fold3 系列折叠屏或将支持5.5G,4月或将开启OTA 推送!
  8. 8京东汽车和小米汽车或联手深度合作!
  9. 9微软发布首批AI电脑,配专用Copilot按钮!
  10. 10美团成立平台产品部,整合本地商业多项任务!

编辑精选

Copyright ©2009-2022 KeJiTian.Com, All Rights Reserved

版权所有 未经许可不得转载

增值电信业务经营许可证备案号:辽ICP备14006349号

网站介绍 商务合作 免责声明 - html - txt - xml