最新要闻
- 天天热讯:三峡艺术高中分数线(三峡艺术高中)
- 新华指数|钢“财”说:库存延续下行,基本面仍待改善|今日要闻
- 环球热点!长峰医院火灾系医院内部施工引燃可燃涂料所致
- 榴莲批发价1斤低至20元:海南国产榴莲也快上市了
- 2023新款超轻超弹:匹克轻弹风逸跑鞋119元狂促(原价249元)
- 《惊奇队长2》创纪录!62万踩成漫威最讨人厌的预告
- 男子被贴膏药秒倒地 官方通报:涉事膏药无迷药成分
- 驾驶舱可变大床!五菱龙卡本月上市:横竖都能拉
- 七月未央作者_七月未央
- 秦都区吴办吴家堡社区新时代文明实践站开展党建引领 “童”行同乐活动
- 热点!110万的比亚迪大把人买!仰望U8预售48小时:订单已超1.3万份
- NVIDIA大失所望:RTX 4070卖崩了!AMD成市场赢家
- 天天资讯:用户自驾突发紧急情况!最后用华为P60 Pro获救:用一次续一生
- 五一假期十大热门城市:看看有你想去的吗?
- 升空后人工引爆!下次再来 成功三分之一的Starship 新动态
- 长安C401将被称为长安辛特克斯动力来自马自达1.6 天天微资讯
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
焦点热门:AIGC的阿克琉斯之踵
摘要:现在,越来越多的企业和个人使用AIGC生成文章、图片、音乐甚至视频等内容,AIGC已经成为一种必备的工具。在游戏和原画师行业,甚至已经出现了第一批因为AI而失业的人。
本文分享自华为云社区《GPT-4发布,AIGC时代的多模态还能走多远?系列之二:AIGC的阿克琉斯之踵》,作者:ModelArts 开发 。
AIGC是继PGC(Professional Generated Content,专业生产内容)和UGC(User Generated Content,用户生产内容)之后的一个新时代,它带来了一种新的内容生产方式,并且还为内容注入了只有人类才具备的“创作”元素,开创了“模型”主导内容的时代。尽管AIGC技术已经有了相当大的提升,但仍然存在很多不足之处。
01 ChatGPT(包括GPT4)的诸多问题难以忽视
尽管ChatGPT(包括GPT4)是一个非常有用的工具,但它仍然存在许多问题。以下是一些经常出现的问题:
【资料图】
1)强语言,弱知识,“一本正经地胡说八道”:在回答问题时,ChatGPT很容易“胡说八道”,因为它的回答通常是基于大量的文本数据而生成的,而不是真正的知识。比如下面的问题:
Q:红楼梦中贾宝玉为什么要葬花?
A:据小说描写,贾宝玉葬花的原因是因为他感到世间美好事物的短暂和凋零…
Q:鲁迅和周树人是同一个人吗?
A:不是同一个人,鲁迅和周树人是两个不同的人。鲁 迅…而周树人(1895年1月25日-1968年11月6日)也是中 国著名的现代作家和翻译家,代表作品有《春蚕》、《子夜》等
2)逻辑推理不靠谱:不论是数学逻辑还是专业逻辑,比如下面的问题:
Q:3个人3天用3桶水,9个人9天用几桶水?
A:根据题目可知,3个人在三天内用了3桶水,
可以推算出每天每人用水量为:
3 桶 / 3 人 / 3 天 = 1 桶 / 人 / 天
因此,在9个人使用9天内需要的总用水量为:
1 桶 / 人 / 天 × 9 人 × 9 天 = 81 桶
所以,9个人在九天内需要用 81 桶的水。(正确答案27桶)
3)实时信息自更新慢,新旧知识难以区分,比如下面的问题:
Q:现任韩国总统是谁?
A:现任韩国总统是文在寅 。
Q:gpt4是什么时候发布的?
A:抱歉,目前还没有关于GPT-4的官方发布计划和消息
4)无法真正为领域类问题提供专业、靠谱的答案,比如下面的问题:
Q:华为手机没电了,请问能否使用苹果手机的充电器充电?
A:可以的,苹果手机和华为手机使用的充电器接口都是标准的USB接口,因此苹果手机的充电器也可以用来给华为手机充电。不过,请注意使用符合标准的充电器。
02 多模态大模型的跨模态生成能力尚不完善
虽然AIGC跨模态生成技术的视觉效果令人惊叹,但在实际应用过程中存在一些信息不对称的问题。目前,多模态大模型在跨模态生成方面仍然存在一些不完善之处,需要进一步研究和优化。从文本到图像的生成方向,Stable Diffusion的研究发现提示词与输出之间存在着显著的组合泛化问题。例如,在输入“红草绿花”的情况下,输出结果可能会是相反,这表明AI模型对于语义的理解存在错误。同样,当输入“一匹马骑着宇航员的照片”时,输出结果可能会是宇航员骑着马的照片,这也暴露出模型在语义理解方面的不足之处。为了解决这些问题,需要进一步研究和优化多模态大模型,研究方向包括改进模型的组合泛化能力、提高模型对于语义的理解、以及优化跨模态生成结果的准确性等,以使得多模态大模型在实际应用中更加可靠和有效。
(以上文图生成来自Stable Diffusion)
03 多模态大模型尚未完全理解多模态数据
GPT4大模型发布,加速了AIGC多模态的发展,当然多模态大模型的发展在近年来取得了令人瞩目的进展,但是作为一项前沿技术,仍存在着一系列问题需要解决。其中一个重要问题就是对于多模态数据的理解还不够充分。多模态数据是指来自不同感官或媒介的数据,如图像、音频、文本等。虽然多模态大模型可以同时处理多种类型的数据,但是对于跨模态数据的融合、对齐等方面,仍需要进一步探索和优化。
首先,对于多模态数据中的事实知识的理解不足。在实际应用中,很多跨模态生成任务都需要丰富的知识库和背景知识支撑。例如,文本描述和图像生成任务需要对具体事物的特征进行深入了解,而涉及到自然语言的任务,则需要对语言语义的理解更加准确。因此,建立更为完整准确的知识库是非常重要的。
其次,常识储备不足也是多模态大模型的瓶颈之一。常识是解决现实问题的基础,而在跨模态生成任务中,常识更是不可或缺。例如,在利用AIGC中AI作画的Stable Diffusion 作图的一个图像描述中,描绘出“小狗在路边玩耍”的情境更加符合日常生活的常识,而非描述为“四条腿的动物在道路上移动”,这说明常识缺失直接影响模型的表现效果。
最后,逻辑推理能力也是多模态大模型需要改进的地方。在实际场景中,有很多跨模态生成任务,需要通过逻辑推理进行相关内容的理解和生成。例如,基于文本的图像生成任务需要根据文本中的描述进行相应的推理,以便生成一张完整的图像。而当前多模态大模型的逻辑推理能力仍有待提高,未来的研究应该注重逻辑推理技术的研究和优化,以提高模型的综合表现能力。
总之,多模态大模型的未来研究应该致力于处理多模态数据的全面理解,选取合适的知识库和常识库,探索逻辑推理技术等方向,以提高多模态大模型在跨模态生成领域的表现效果。
(以上图来自视觉问答VQA)
04 多模态大模型PaLM-E离实用级还有多远?
多模态大模型PaLM-E的出现,标志着计算语言学作为人工智能领域的重要分支进入了一个新的繁荣期。PaLM-E依赖于如此庞大的参数,初步实现了对机器人的操控,但其在实用性方面还有待提高。其中,空间范围、物品种类和任务规划复杂度等方面的限制是最为突出的。目前展示出来的演示,其空间范围封闭有限,物品种类数量有限,规划任务比较简单,操作任务也相对简单。这些限制的存在,让人们对PaLM-E在真实复杂场景中的实用价值产生了质疑。
此外,PaLM-E在使用过程中还存在一些技术问题,例如需要耗费大量的时间来调试和训练,同时还需强大的计算资源才能支持其正常运行。这些问题在实际应用中都会给使用者带来极大的不便和成本压力。因此,需要从技术上不断优化和改进PaLM-E,使它能够更好地适应复杂的应用场景,并且让成本更低、易用性更高。当然,尽管PaLM-E离实用级还有一定距离,但是可以相信,随着技术的不断发展和突破,PaLM-E将结合各种场景打破技术限制,真正走进人们的生活和工作中,发挥其巨大的实用价值。
(以上图来自网络)
05 小结:多模态大模型的本质、前提与不足剖析
相比于传统的统计模型,多模态大模型有很多优势。它能够利用多种不同的信息源来进行学习和推理,从而更加全面地捕捉人类的知识、常识和逻辑推理能力;它也能够以较低成本实现自然语言处理、计算机视觉和语音识别等多项任务,提高了模型的效率和普适性;最后,多模态大模型还能够为人类提供更加直观、易懂的交互体验,让人们更加方便地获取信息和进行决策。
然而,多模态大模型也存在一些不足之处。首先,由于不同模态数据之间的差异性,多模态大模型的建立和优化过程需要消耗大量的计算资源和时间。其次,该模型尚存在着一些挑战和难点,例如如何对不同模态数据之间的关联进行建模以及如何解决数据对齐和逆向推导等问题。此外,多模态大模型还需要克服数据质量、隐私保护和数据伦理等方面的挑战,才能更好地应用于实际场景中。
因此,想要在AIGC领域发挥多模态大模型的优势,需要在技术研究、数据质量管理、隐私保护和数据伦理等方面继续深入研究和探索。只有在不断完善和优化多模态大模型的同时,才能更好地应对现实世界中的复杂情境和问题,提高人类社会的智能化水平。
点击关注,第一时间了解华为云新鲜技术~
关键词:
焦点热门:AIGC的阿克琉斯之踵
超过50多个热门的免费可用 API 分享|滚动
火山引擎 DataTester 3 大功能升级:聚焦敏捷、智能与易用,帮助企业降本增效
天天热讯:三峡艺术高中分数线(三峡艺术高中)
新华指数|钢“财”说:库存延续下行,基本面仍待改善|今日要闻
环球热点!长峰医院火灾系医院内部施工引燃可燃涂料所致
榴莲批发价1斤低至20元:海南国产榴莲也快上市了
2023新款超轻超弹:匹克轻弹风逸跑鞋119元狂促(原价249元)
《惊奇队长2》创纪录!62万踩成漫威最讨人厌的预告
男子被贴膏药秒倒地 官方通报:涉事膏药无迷药成分
驾驶舱可变大床!五菱龙卡本月上市:横竖都能拉
天语e66怎么开机?天语e66手机可以拍视频吗?
华为T8951什么时候上市的?华为T8951手机参数
中兴v987是什么型号?中兴V987手机参数
七月未央作者_七月未央
三星S3850如何恢复出厂设置?三星S3850手机参数
摩托罗拉MT620上市价格是多少?摩托罗拉MT620手机参数
C#写一套最全的SQL server帮助类(包括增删改查)
秦都区吴办吴家堡社区新时代文明实践站开展党建引领 “童”行同乐活动
热点!110万的比亚迪大把人买!仰望U8预售48小时:订单已超1.3万份
NVIDIA大失所望:RTX 4070卖崩了!AMD成市场赢家
天天资讯:用户自驾突发紧急情况!最后用华为P60 Pro获救:用一次续一生
五一假期十大热门城市:看看有你想去的吗?
升空后人工引爆!下次再来 成功三分之一的Starship 新动态
长安C401将被称为长安辛特克斯动力来自马自达1.6 天天微资讯
JS中的进程和线程-动态
linux下查看文件内容工具发布啦!
04 设置工作模式与环境(下)收集信息
天天速讯:全国首单绿色及能源保供双主题ABS在深交所完成发行
环球速讯:园企智推官“我为企业代言”推介大赛开启
全球通讯!苹果版余额宝收益4%?我可一点都不羡慕 背后有猫腻
世界视讯!你信吗?宝马MINI再道歉:吃冰淇淋的“老外”是同事 求宽容2位小姐姐
1499元起!荣耀X50i手机发布:标配256GB超大存储
环球快资讯:我国天文学家为银河系精确“称重”:约为8050亿个太阳质量
高速上惊现喷气式汽车 车尾一路滚滚浓烟 涡轮增压器坏了
海南省白沙县2023-04-20 12:36发布雷电黄色预警
MYSQL---主从同步概述与配置
Docker基础知识和命令使用入门
网络流的C++代码实现与过程讲解
每日关注!南昌大学举办潘际銮教育思想研讨会
伛偻提携往来而不绝者滁人游也翻译_伛偻提携_焦点热文
嫁入豪门?前世界首富目不转睛盯着谷爱凌,搂着爱凌合影很兴奋
绿色转型湾区“债”持续——中央结算公司2023年二季度债市研判六人谈举行
“星级酒店”旅游专列今日发车:双人大床房 24小时管家
暗黑4再次公测
当前速读:上海一商场特斯拉展车喇叭响不停 销售员束手无策 路人纷纷堵耳
华为实现自主可控的MetaERP研发:我们已经突破封锁 我们活了下来-环球速看
环球即时:德国男单全军覆没!世界冠军1:3输球,世界第六现场脱衣服换球服
双鱼座今日运势_双鱼座男生讨厌女生_今日看点
四大证券报精华摘要:4月21日
仰望U8市区上路 体型硕大:一旁70万的途锐秒变高尔夫
马斯克不止星舰发射失败 特斯拉暴跌近10%:市值一夜蒸发3780亿元
全球视讯!剧情够毁灭!漫威宣布《复仇5》 明年开拍:国人不爱看 不符合文化观?
世界速递!2399元起加量还减价!小米平板6 Pro今日首销:升级神U骁龙8+
探访风波中的宝马mini展台
读SQL进阶教程笔记13_SQL中的分组和层级
笔趣阁校花的贴身高手小说_笔趣阁校花的贴身高手 每日简讯
超预期!世界打开中国经济“一季报”的正确姿势
北京军地检察机关推动监管部门加强保护管理
【环球新要闻】提前感知这次“五一”假期有多火:酒店预订量涨4倍、淄博订单涨20倍
KMeans_世界观热点
全球热点!Rust编程语言入门之Rust的面向对象编程特性
【Visual Leak Detector】源码下载 世界热讯
【全球报资讯】手机系统相册在哪里(手机系统相册在哪里打开)
世界今日讯!邓紫棋的祝福
4nm Zen4!宏碁全球抢发AMD锐龙9 7940H笔记本:配个RTX 4050 焦点快报
环球热文:苹果最强对手来了!小米13 Ultra首销:5999元买安卓影像之王
马斯克准备了7年的超级火箭炸了!但员工们乐得开起了香槟
世界百事通!迪士尼真人版《小美人鱼》新写真出炉:黑美人鱼海底双手托腮
五一民宿预订现涨价退单潮 房东找奇葩理由:破产不干了
ST时万(600241)2023年一季报财务简析:净利润减48.39%
当前最新:用户侧100千瓦时锌溴液流电池系统并网运行
全球观天下!上市险企财险2022年年报:综合费用率均有下降
一带一路、中字头个股午后反弹 西藏天路反包涨停
女生戒指戴法的含义图解_女生戒指戴法的含义|速读
农村厕所要怎么改造
世界今热点:三只小山羊创始人杨玉勇:专业、专注、全力以赴,成就羊绒大衣专家
已致270人死亡,2600余人受伤!中国驻苏丹使馆:请尽快登记! 今日播报
21世纪仅有7次!罕见日全环食今天来了|最新
天天看点:LCD面板行业复苏,产能向大陆集中,TCL科技等龙头企业有望受益
世界实时:次新股回调多少可以买入?如何买入?
jrsnba直播吧 a直播吧 焦点精选
世界读书日|重读雷锋日记 弘扬雷锋精神 天天新视野
vivo X Fold2:更易用的折叠屏旗舰 “减重不减质”-环球热讯
亮相第十三届中国轻工业信息化大会,360数字中枢引瞩目-全球热门
一季度我国经济发展实现良好开局_全球微动态
霍勒迪:赛前告诉字母哥会为他拿下G2 我们大家都支持他-精选
记录.Net部署Docker-v指令使用
关于Java中对象的向上转型和向下转型
启明星辰(002439.SZ):预计一季度净亏损6300万元至6800万元 同比减亏
每日热点:双喜!巴萨第一次正式报价梅西:砸锅卖铁筹2亿,第8座金球在招手
微头条丨马斯克SpaceX星舰发射失败:惨烈爆炸 当空“放烟花”
人类最强火箭星舰爆炸 马斯克失落 SpaceX回应:祝贺团队完成首次飞行测试
台北101大楼遭雷击罕见瞬间曝光:紫光乍现照亮夜空_天天要闻
《灌篮高手》热映 你为青春补票吗?80/90后熬夜冲向电影院
马斯克SpaceX星舰发射失败 爆炸瞬间动图:一团火球灰飞烟灭 世界快报
全球今热点:金基集团总经理徐谱曾在龙湖任职多年 跳槽频繁但职位挺稳定
[游戏] EasyGame C++
今日最新!【前端可视化】SVG 学习知识点
平稳运行、动能积蓄——透视首季工业经济数据