正大期货咨询热线

行业动态>>当前位置:主页 > 新闻中心 > 行业动态 > >
被神话的GPT,造不出你的梦中神车

来源:正大期货  2023-06-06 08:02

ChatGPT爆火之后,AI大模型成为许多科技公司追逐的热门。从谈天对话,到图画生成,再到桌面工作,好像AI在一夜之间具有了推翻一切的神力。

热潮蔓延至轿车职业,从业者开端考虑:让GPT造车,是否可行?

有车企宣告将使用大模型技能,也有车企称要接入第三方大模型,还有车企抢着发布了带有GPT字眼的自动驾驭体系。

有从业者对深途说,智能座舱和自动驾驭,或将是大模型*使用的场景。这其间,尤以自动驾驭最让人等待。

自动驾驭是一个难度极高的赛道。除了谷歌、百度等科技巨子,一大批天才创业者投身其间,烧掉数十亿美金,至今也没到达让人满足的作用。

AI大模型杀入自动驾驭,这次会不相同吗?

GPT跟轿车,有几毛钱联络?

GPT跟轿车,外表看无直接相关,实则根由很深。故事得从六年前说起。

2017年6月,特斯拉的老板马斯克,从OpenAI挖走了一个斯洛伐克籍的研讨员。这个人叫Andrej Karpathy,他后来成为特斯拉的AI总监。

其时马斯克对人工智能表现出极大爱好,他也是OpenAI的捐资创办人之一。把Andrej Karpathy引起麾下不久,马斯克脱离OpenAI董事会,他以为特斯拉和OpenAI都在研讨AI,未来或许发生利益冲突。

后来,Andrej Karpathy在特斯拉重写了自动驾驭算法,开宣告BEV纯视觉感知技能,让特斯拉自动驾驭进入新阶段。而他的前店主OpenAI,则将悉数筹码押注在通用人工智能,终究研宣告GPT。

从产品视点看,OpenAI的GPT和特斯拉的BEV,是彻底不同的物种。但从技能底层来看,它们都依托人工智能技能,尤其是对谷歌Transformer模型进行了使用。

Transformer是一种深度学习的神经网络架构,由谷歌的8位AI科学家在2017年提出。这是人工智能职业极其重要的一项创造,今日大火的ChatGPT中的“T”,便是指Transformer大模型。

与传统神经网络RNN和CNN不同,Transformer经过自我注意力机制,去发掘序列中不同元素的联络及相关性,具有很好的时序数据处理才干。这让它在机器翻译、文本摘要、问答体系等使命上,展示出杰出的功能。

因而Transformer一开端被人们用在NLP(高档天然言语处理)范畴,用于了解人类的文本和言语。

在Transformer模型上进行预练习,经过不断的微调、迭代,OpenAI相继推出了GPT-1、GPT-2、GPT-3、GPT-4等言语练习大模型。ChatGPT是OpenAI对GPT-3模型微调后开宣告来的对话机器人。由于它能以对话的方法进行交互,普通人很好上手,且比曩昔的谈天机器人显得更“聪明”,因而大放异彩。

从根本上,ChatGPT的GPT模型、谷歌的LaMDA大模型,以及百度的文心大模型,同宗同源。

将Transformer模型用于天然言语,诞生了ChatGPT这样的谈天使用;将它用在核算机视觉,相同获得了惊人的作用,这方面的先行者是特斯拉。

Andrej Karpathy在担任特斯拉AI总监期间,担任领导自动驾驭的核算机视觉团队,经过结合Transformer模型,特斯拉成功开宣告BEV技能。

BEV全称是Bird's Eye View,即鸟瞰图。它能够将摄像头拍照的2D图画拼接转化为3D图画,一致转换到仰望视点下进行处理,构成“天主视角”。这么做的原因是:开车是在三维空间中进行的,人看到的是立体的国际,而不是2D的图画。

这项全新的感知计划,在2021年8月的特斯拉AI DAY上由Andrej Karpathy对外展示。为此特斯拉不吝重写了自动驾驭算法,对练习深度神经网络的基础设施进行了重构。

这是大模型技能初次被使用到自动驾驭职业。

今日回过头来看,尽管GPT现在首要使用在天然言语处理范畴,咱们并不能让GPT去驾驭一辆轿车,但它背面的AI大模型技能,尤其是Transformer架构,实际上早就现已在自动驾驭范畴使用了。

从天然言语处理到核算机视觉,两个范畴依据Transformer架构在建模结构上完成了一致,使联合建模愈加简单。

而跟着对AI的了解加深,轿车公司越来越像人工智能公司。除了特斯拉,抱负轿车在本年初发布公司愿景,宣称要在2030年成为一家人工智能企业。它将在本年推出的城市NOA导航辅佐驾驭体系,技能支撑便是BEV感知和Transformer模型。

让AI跟人对话,与让AI驾驭一辆轿车,好像本质上并无差异,仅仅二者落地场景不同。在将底层技能使用到详细产品这件事上,人类永久充溢想象力。

GPT教会自动驾驭的那些事

本年以来,GPT展示出来的强壮才干,让外界大受震慑。通用人工智能不再是海市蜃楼。自动驾驭职业的人开端考虑,或许生成式AI在言语模型上的使用思路,能够迁移到自动驾驭上。

本质上,言语模型是对人类的言语树立的数学模型。核算机仍是不明白天然言语,但它经过数学建模,把言语问题变成了数学问题。经过给定的文本的前史,猜测下一个词呈现的概率,直接地了解了天然言语。

换到驾驭场景,假如给定当时的交通环境,给定一个导航地图,以及一个驾驭员驾驭行为的前史,那么,大模型是不是能够猜测下一个驾驭动作?

地平线开创人余凯在本年4月举行的电动轿车百人会论坛上说,ChatGPT给他很大启示,“咱们要继续用大数据、更大的数据、更大的模型,而且无监督地去学习人类驾驭的测验,就像你从许多的、无监督的、没有标示的天然文本里去学习相同”。他以为,每个驾驭员驾驭操控的序列,就像咱们的天然言语文本相同。下一步,他想构建一个回归自动驾驭的大言语模型。

理论上,这个思路是可行的。人工智能现已具有学习才干。依据自适应的言语模型,机器会依据用户的反应不断迭代优化,学习用户的习气,然后改善模型。现在的ChatGPT就运用了这项技能。那么,让机器学习司机的驾驭习气,就不是一件很难的工作。

特斯拉的影子形式,便是把真人司机的驾驭数据,投喂给机器学习。经过比对人类驾驭员行为,来到达练习算法的意图。

GPT掀起新一轮AI热潮后,对职业形成的一个认知冲击是,经过把模型的参数规划不断变大,数据量指数型添加,也便是所谓的大模型,在到达某个临界点后,模型会忽然变得很聪明。

曩昔,模型在练习阶段需求的数据,是经过人工标示的。以自动驾驭为例,数据标示员经过许多的图片标示,告知机器什么是猫,什么是狗,猫和狗各有多少品种。标示员就像是机器的教师,一遍一遍教会它知道这个国际。

问题是,教师没教过的东西,机器仍是不会。典型的是特斯拉曾多次发生自动驾驭事端,车辆撞上侧翻的大卡车,由于机器辨认不了。

和高本钱开创合伙人何宇华对深途举过这样一个比方:广州的夏日雨天频频,在一些灯火比较暗淡的场景下,空中会有许多的飞虫。当轿车驶过期,灯火打曩昔,或许会有数以千计的飞虫撞向车头。在这种情况下,轿车的自动驾驭感知体系,或许会误以为是一堵墙。

自动驾驭体系不能尽头一切的corner case(极点场景),是其开展路上的一大难关。

ChatGPT抓取的是全网未符号的数据。在自监督学习中,数据自身被用作监督信号,而不是依靠于人工符号的标签。有一天人们发现,大模型在消化这些数据的过程中,忽然具有了触类旁通的才干。

那么,假如自动驾驭大模型也能无监督地学习人类驾驭行为,不需求“教师”手把手地教,是不是意味着,体系摇身一变,成了“老司机”?

GPT“开车”,还不靠谱

愿望很夸姣,完成愿望的路总是很骨感。

相似ChatGPT的AI大模型要在自动驾驭范畴发挥威力,现在来看至少有如下几个问题需求处理。

首先是数据来历。

ChatGPT的数据来历非常丰富,包含维基百科、书本、新闻文章、科学期刊等等,相当于全网揭露数据都是它的养料。

自动驾驭不同。驾驭员的驾驭数据、车辆行进数据不揭露,许多还触及隐私。轿车厂商、自动驾驭公司各自为营,数据关闭不流转,这让获取数据变得困难。没有数据,自动驾驭便是无源之水。

联想创投总裁贺志强对深途说,自动驾驭的中心是要有数据,数据对练习模型非常重要。比亚迪这样的主机厂有数据,但算法还需求打磨,“蔚小理”等造车新势力拿手算法,但车的销量还不行。既有数据也有算法的公司,才干充沛用好大模型。

其次是体系的核算布置方法有约束。

余凯以为,OpenAI、ChatGPT是在云端的核算,在云端有充沛的能量供应、电源供应,一起有非常好的体系,可是假如在车上依靠的是电池,依靠的是车端的散热,那么这个应战是很大的,意味着自动驾驭不能用那么大的模型、那么大的核算。

大模型对算力的耗费,导致云核算厂商成为这波AI热潮中*批吃到盈利的玩家。大厂开卷云核算,也是为大模型开路。可是在车端,这会是一个对立。

更大的问题是,大模型的可靠性没有验证。

使用过ChatGPT的人知道,ChatGPT有时候会胡言乱语,时对时错。这在业界被称为错觉(hallucination)倾向,即发生彻底没有出处的非实在内容。大模型会假造内容,而不在意内容的实在性和准确性。

谈天能够胡言乱语,自动驾驭不能够。任何一次过错的输出,导致的成果都或许是丧命的。

“ChatGPT获得巨大发展,但自动驾驭迟迟没有到来,由于自动驾驭特别是无人驾驭,或许容错率便是零,那是人命关天的工作。”余凯说。

曾在硅谷某AI创业公司担任COO的龙志勇以为,不行控、不行猜测和不行靠,是大模型商业化*的要挟。典型表现是大模型有错觉倾向。

现在,要让自动驾驭体系学会挑选和区分,并稳定地输出*解,还不太实际。

一家人工智能公司的内部人士对深途说:“视觉感知在算法层面的确有不少打破。但车这种场景,要求太高了,我个人不觉得短期能有大的打破。能够重视一下特斯拉的意向。”

但是最近科技圈有一股习尚,大大小小的公司,都要蹭一把GPT的热门。有一些轿车厂商,宣告行将使用相似GPT的技能,一堆炫酷的概念让人傻傻分不清楚。

比方某传统车企旗下的自动驾驭公司,就发布了一个自动驾驭生成式大模型,要用这个模型来练习自动驾驭,声称“职业首例”。

一位长时间重视智能轿车赛道的投资人,问询一位职业大佬怎么看该模型,对方就回了四个字:“TM扯淡。”

“彻底便是一个PR行为。”这位投资人对深途点评。

自动驾驭,会被推倒重来吗?

在特斯拉的带动下,再叠加本年鼓起的AI浪潮,自动驾驭职业逐步向大模型、大算力、大数据方向不断接近。

大模型对自动驾驭的影响,现在还不行剧烈,但嗅觉敏锐的人现已呈现出一种对立心态。

就像当年特斯拉使用Transformer将多摄像机数据从图画空间转化为BEV空间,为此不吝将原有架构推翻,重写算法。现在大模型的使用,也或许意味着原有自动驾驭算法,会被推倒重来。

贺志强以为,大模型会对自动驾驭有巨大影响。曾经自动驾驭用到许多小模型,现在变成大模型,或许需求从头来一遍。自动驾驭职业会从头洗牌。

一家AI芯片公司的自动驾驭总监赵东翔对深途说,全体端到端更改,等于从头做。

洗牌对新入局者是时机,对*者是要挟。弯道超车的故事,往往发生在技能急速革新时期。在技能日新月异的年代,在旧道路投入越多,淹没本钱或许越大,回身越困难。关于整车厂或自动驾驭公司而言,要拥抱一项新技能,不只要考虑作用,还要考虑本钱。

赵东翔表明,就当时阶段而言,自动驾驭改换技能道路没含义,“现在职业技能才干也不差,咱们花那么多钱做了那么久,没有大幅度进步的话没有换的动力。”

在去年底的AI DAY上,特斯拉将BEV升级到占用网络(occupancy network),泛化才干得到进一步提高。经过占用网络,特斯拉的自动驾驭感知体系能够不需求知道看到的物体是什么,就能够判别是否需求逃避,由此处理了更多长尾问题。

不管何种技能道路,现在都处于快速改变迭代中。曩昔的小模型或许会被大模型代替,今日的大模型也或许在未来被某种新物种代替。

但不管怎样,蹭热门、制作噱头的做法,是无益于技能进步的。“蹭热度是陋俗,踏踏实实做产品才有用。”赵东翔说。

自动驾驭真实的“王炸”,还远没有到来。咱们需求做的,是对每一轮技能革新坚持敬畏之心。被神话的GPT,造不出你的梦中神车,但至少,改变现已发生了。

*应受访者要求,赵东翔为化名。




————正大国际期货金融有限公司    

地址:香港花園道1號中銀大廈38樓   电话:   正大期货竭诚为您服务
Copyright © 2007-2019 香港正大国际期货 版权所有