不出所料,自动驾驶向ChatGPT下手了!
机器之心专栏
机器之心编辑部
ChatGPT 的技术思路与自动驾驶能碰撞出什么样的火花呢?
(资料图)
去年底,ChatGPT 横空出世。真实自然的人机对话、比拟专家的回答以及一本正经的胡说八道,使它迅速走红,风靡全世界。
不像之前那些换脸、捏脸、诗歌绘画生成等红极一时又很快热度退散的 AIGC 应用,ChatGPT 不仅保持了热度,而且还有全面爆发的趋势。现如今,谷歌、百度的 AI 聊天机器人已经在路上。
比尔盖茨如此盛赞:「ChatGPT 的意义不亚于 PC 和互联网诞生。」
为什么呢?
首先, 人机对话实在是刚需 。人工智能技术鼻祖的图灵所设计的「图灵测试」,就是试图通过人机对话的方式来检验人工智能是否已经骗过人类。能从人机问题中就能获得准确答案,这可比搜索引擎给到一大堆推荐网页和答案更贴心了。要知道懒惰乃人类进步的原动力。
其次, ChatGPT 实在是太能打了 。不仅在日常语言当中,ChatGPT 能够像人类一样进行聊天对话,还能生成各种新闻、邮件、论文,甚至进行计算和编写代码,这简直就像小朋友抓到一只「哆啦 A 梦」—— 有求必应了。
除了看看热闹,我们也可以弱弱地问一句: ChatGPT 为啥这么能打呢 ?
ChatGPT:我手握大模型,还会「杠」人类
先看一个「不要你以为,我要我媳妇以为」的例子。
之前,人类在和 ChatGPT 对话的时候,可以搬出「我媳妇这么说的」,「我媳妇说的…… 不会错」的时候,它就在稍微坚持之后就认怂并修改自己的回答。
但是经过了大量训练,ChatGPT 开始变得十分硬气。无论你是否搬出自己媳妇,它都会坚持真理,2+2 就是等于 4 了,管你是不是个「妻管严」,它都不会妥协了。
原来是 ChatGPT 被回炉重造,进行了一番真实性和数学能力的专门训练。反过来说,ChatGPT 是可以被人类带偏的。
那为啥呢?先来回答 ChatGPT 到底是个啥? 它是个基于上千亿超大语料参数组成的 GPT3.0 架构训练出来的一个自然语言处理聊天工具 。ChatGPT 的算法采用了 Transformer 神经网络架构,具有很好的时序数据处理能力,说大白话就是能很好处理上下文的语法关系。
Transformer 是一种结构简单的编解码器,几乎可以无限堆叠,从而形成一种大规模的预训练语言模型。基于 Transformer 模型构成的 GPT 架构可以很好地完成多种语言处理任务,填空、造句、分段、翻译等等,随着数据集和模型参数的大规模增长,等到 GPT3.0 的时候已经有了千亿规模,GPT 就表现出来了非常强的文本生成能力。
自然而然,一问一句的对话模式也就应运而生了。但 GPT3.5 还不是 ChatGPT。
ChatGPT 还需要使用监督学习和强化学习来实现。具体来说,ChatGPT 使用了一种叫「人类反馈强化学习(RLHF)」的训练方法,在训练中可以根据人类反馈,保证对无益、失真或偏见信息的最小化输出。
简单来说, GPT 只能保证有问就有答,不保证回答的正确,而 ChatGPT 既要保证有的聊,还要保证聊的对 。就跟小孩子一样,必须在大人一遍遍纠正发音、纠正语法和用词的训练中,学会真正的有效对话。
ChatGPT 就是利用人类反馈进行强化学习的产物。
既然 ChatGPT 这么好用。我们不妨来问它一个问题: 能不能把 ChatGPT 用在自动驾驶技术训练当中?答案是:可以 。
毫末顾维灏:把 ChatGPT 引入自动驾驶,毫末走了这三步
我估计 ChatGPT 还没涉猎过这个问题,因为关于 ChatGPT 和自动驾驶关联的内容是缺少的。不过,如果 ChatGPT 最近在中文网络中收录过相关报道的话,那么,它就会知道中国的一家人工智能技术公司已经开始思考这个问题了。
在 1 月的毫末智行的 AI DAY 上,毫末 CEO 顾维灏非常隆重地提到了 ChatGPT,并且直言,毫末已经展开对于 ChatGPT 背后的技术的研究。
顾维灏说:「实现 GPT3 到 ChatGPT 的龙门一跃最重要的是 ChatGPT 模型使用了『利用人类反馈强化学习 RLHF』的训练方式,更好地利用了人类知识,让模型自己判断其答案的质量,逐步提升自己给出高质量答案的能力。」
那这对自动驾驶有什么启发呢?毫末认为, ChatGPT 的技术思路和自动驾驶认知决策的思路是不谋而合 。
毫末在认知驾驶决策算法的进化上分成了以下三个阶段:
第一个阶段是引入了个别场景的端到端模仿学习,直接拟合人驾行为。 第二个阶段是通过大模型,引入海量正常人驾数据,通过 Prompt 的方式实现认知决策的可控可解释。 第三个阶段就是引入了真实接管数据,在其中尝试使用「人类反馈强化学习(RLHF)」。一般来说,人类司机的每一次接管,都是对自动驾驶策略的一次人为反馈;这个接管数据可以被简单当成一个负样本来使用,就是自动驾驶决策被纠正的一次记录。同时也可以被当作改进认知决策的正样本来学习。为此,毫末构建了一个 < 旧策略、接管策略、人工 label 策略 >的 pairwise 排序模型。基于这个模型,毫末构建了自动驾驶决策的奖励模型(reward model),从而在各种情况下做出最优的决策。
毫末将这一模型称之为 人驾自监督认知大模型 。简单来说,就是为了让自动驾驶系统能够学习到老司机的优秀开车方法,让毫末的认知大模型要从人类反馈中学会选择和辨别,并稳定地输出最优解。通过这种方式,毫末在掉头、环岛等公认的困难场景,通过率提升 30% 以上。
当然,如果 ChatGPT 再继续搜索和学习下去,它就会知道在 1 月初的 HAOMO AI DAY 上,毫末不仅发布了这个人驾自监督大模型,还一口气发布了另外四个大模型。这五个大模型可以帮助毫末实现车端感知架构跨代升级,将过去分散的多个下游任务都集成到一起,形成一个更加端到端架构,包括红绿灯、局部路网、预测等任务,实现跨代升级。
总得来说,人工智能技术是当前许多旧产业的改造器,也是新产业的助力器。正如当年互联网喊出的「所有行业都要被互联网重塑一番」一样,今天的一切行业都要被「AI+」改造一番。
而实际上,人工智能的这场变革并不是必然发生,它有赖于一个天才算法结构的横空出世,有赖于海量数据和算力的成本下降与容易获得,也依赖于人工智能技术从业者的勇敢尝试。ChatGPT 的出现是如此,自动驾驶的实现也是如此。
下一篇:最后一页
- 下半年房企净现金流将显著为负 违约风险难有实质性下降
- 徐州荣凯为南京荣盛置业提供不超过11亿元担保
- 天房发展收上交所问询函 包含转让吉利大厦44.81%股权事项
- 合景泰富回应整售写字楼:公司正常计划,并非为筹资
- 美好置业:延期至6月28日前回复深交所问询函
- 青岛公积金新政:首套住房贷款额度最高可达80万元
- 杭州:无房职工家庭公积金贷款购房最高可贷120万元
- 我爱我家全资持股上海相寓企业集团 后者注册资本2.5亿
- 龙湖集团副总裁温介邦已离职 此前兼任工程安全管理团队负责人
- 碧桂园拟以现金要约回购今年到期的6.834亿美元票据
-
厦门市今天92号汽油价格 厦门市今日92号汽油价格
2022年05月05日,厦门市92号汽油最新价格为:8 42元每升,调整时间为2022-04-29,相对上次调整时间2022-04-16的油价涨了0 16元,涨
-
湖人大计毁于196万反骨仔!突然逼宫交易,断送38分巨星辅佐詹皇
湖人大计毁于196万反骨仔!突然逼宫交易,断送38分巨星辅佐詹皇,湖人,詹皇,佩林卡,反骨仔,勒布朗詹姆斯,德怀特·霍华德,安东尼·戴维斯,帕特里
-
太空火箭站官网在哪下载 最新官方下载安装地址
太空火箭站怎么下载?想要比别人更加抢先抢快的玩到这款游戏,那么你获取游戏开测消息是关键,能够获取到第一手信息,你才能在最快的时间内容
-
河南:“高冷”甲骨文 校园“热”起来
开设甲骨文课,用甲骨文作画,举办“甲骨文故事讲解”活动……看起来晦涩难懂的甲骨文,郑州市惠济区锦艺实验小学三年级学生却能辨识甚至写出1
-
蚂蚁庄园不少影视剧拍完都会举行杀青答案 全球速递
蚂蚁庄园不少影视剧拍完都会举行杀青答案,影视剧拍完不少都会举行杀青仪式蚂蚁庄园今日答案为制竹简的一道工序,想要了解今日的题目我们先来了
-
疫情导致教育倒退,美教育部称公立学校近半学生落后于基准水平
根据美国教育部的一份最新报告,在进入2022-2023学年的美国公立学校学生中,近一半人的成绩落后于基准水平。美国教育部下属的国家教育统计中心
-
讯息:安卓手机上网慢怎么解决_安卓手机上网速度慢
1、前天晚上一切都很好。第二天wifi断网,没有设置。不管怎么做,都做不好。2、b:别人能连wifi,我不能?搞什么鬼?3、很多时候,我们发现手机
-
安吉金栖堂旅业开发有限公司
1、安吉金栖堂旅业开发有限公司是一家民营的房地产、酒店、旅游开发公司。本文到此分享完毕,希望对大家有所帮助。
-
【环球新要闻】按出生日期时辰取名字免费 出生日期取名免费
孩子在离开娘胎的那一刻,就是孩子的生辰,生辰的作用有很多,不局限与过生日之类的活动。那么生辰很重要的一个用处是什么呢?那
-
四川“政采贷”突破百亿元 绝大多数投向民营企业_世界观点
川观新闻记者吴忧2月9日,记者从四川省财政厅获悉,截至目前,我省“政采贷”已累计发放贷款6194笔,贷款金额100 1
X 关闭
不出所料,自动驾驶向ChatGPT下手了!
分析|信贷强势开局但结构冷热不均,社融增速或已触底
米兰1-0都灵终结四连败,特奥助攻吉鲁头槌制胜,莱奥失良机
杨志的人物形象_杨志的性格
特奥会是啥意思
X 关闭
最新快讯!国家统计局:2021年全国旅游及相关产业增加值占GDP比重为3.96%
千秋街道强化监督执纪让低保更“阳光”_微资讯
环球焦点!12月29日,博安生物-B(06955.HK)配售结束
(资料图)