正在阅读:

4万字告诉你ChatGPT到底是什么?(下)

扫一扫下载界面新闻APP

4万字告诉你ChatGPT到底是什么?(下)

人工智能系统开发是一个系统工程,需要协同各个方面的资源共同发力,才能在产业发展中占有制高点。

文 | 星船知造 钱鸿生

编辑 | 唐晓园

上周我们发布了报告上篇 《4万字告诉你ChatGPT到底是什么(上)》,今天的下篇我们将继续节选报告第三章中的“我国人工智能发展中存在的主要问题”、第四章《ChatGPT对资本市场影响的分析与研判》和第五章《我国未来人工智能发展的展望》中部分核心内容和观点。

OpenAI推出ChatGPT后不久,微软宣布将ChatGPT与搜索引擎Bing整合,谷歌宣布推出Bard应对挑战,接着Meta官网公布了一款新的人工智能大型语言模型LLaMA。

此时,人们自然而然把目光转向了中国相关企业,他们何时宣布推出类似于ChatGPT人工智能发展的时间表。

人们特别关注的企业有百度、阿里巴巴以及人工智能企业科大讯飞等等一大批中国与人工智能有关联企业的动向。

3.4.3 我国人工智能发展中存在的主要问题

我国发展人工智能面临三方面技术难点如下:

第一,人工智能的AI算法

人工智能常见的算法技术的基础性研究主要集中于国内各大高校团队,但在科研成果转化领域一直发展比较缓慢,较难实现从理论和技术向生产力的转化。

目前以华为、阿里、腾讯等公司主导的人工智能技术研发团队迅速崛起,将科研产品开发与算法技术结合,从产业领域实现人工智能算法的技术成果转化。

但是在算法的基础理论研究层面,一直以来是我们发展人工智能技术的短板。没有对大规模机器学习场景中强化学习算法模型、生成性预训练变换模型、分布式并行的研发投入,或者说由于受到资金投入与人才缺乏的影响,研究成果与世界发达企业还有很大的差距。

美国现有的人工智能系统的关键技术都是不开源的,系统深度学习框架、数据库和工具集,均限内部使用,部分仅对系统的应用接口持开源的态度,使我们无法在短时间内掌握世界最先进的人工智能系统的开发经验。

从市场的角度来看,我国目前的人工智能系统都是一些比较初级的数据采集与分析应用系统,类似于ChatGPT高度智能化的AI产品的研发还处于摸索与初级阶段,在性能和稳定性方面改善空间潜力巨大。

早在20世纪80年代,我国学术界就提出了相当完善的AI算法模型,中国多家高校有从事算法模型的研究,但大多都将算法模型应用在人脸识别系统,提高图像识别精度方面。到目前为止算法模型在AI领域的价值还没有被真正体现,这可能受限于我们的芯片制造水平难以提供支撑深度神经网络训练和预训练需要的算力。

科研领域需要更大投入,要针对目前的已有算法进行深度优化,或者另辟蹊径,提出更为先进的算法理论。要打造出符合世界产业发展最新技术水平,具有全球市场竞争力的人工智能产品,看来有相当长的一段路要走。但也不排除弯道超车或换道超车奇迹的发生。

我国AI发展现状任重而道远。

第二,人工智能AI模型软件

国内的人工智能模型软件开发已经起步,开始对标世界先进的人工智能模型,培育自己的发展环境。人工智能模型是人工智能生态中最重要的因素之一,我国需要促进国产模型软件的发展和推广,摆脱国外的标准制约。ChatGPT就是基于“生成型预训练变换模型”开发出来的自然语言聊天机器人。

第三,人工智能开发环境

人工智能开发环境是指相关算法、数据库、软件开发工具、高性能的人工智能AI计算机芯片、云计算网络的集合。国产AI模型开发需要和国产AI智能芯片及硬件进行相互适配、性能优化和应用推广,才能够形成面向行业应用的软硬件一体化人工智能平台。

国际人工智能巨头掌控着人工智能开发环境的关键技术,我们目前还较难在短时间内在AI芯片、算法、模型软件、云数据库服务等人工智能开发环境上有十分大的突破。

人工智能系统开发是一个系统工程,需要协同各个方面的资源共同发力,才能在产业发展中占有制高点。

3.4.4 AI芯片,人工智能绕不过去的坎

人工智能AI芯片是技术发展的关键之一,它是提供人工智能算力的灵魂和大脑,承载了为各种终端提供强大算力的重要任务。人工智能AI 芯片的出现,极大提高数据处理的能力,尤其在处理海量数据时明显优于传统CPU。

从技术架构来看,AI芯片一般可以分为GPU、FPGA、ASIC和类脑芯片四大类——

GPU(Graphics Processing Unit,图形处理器)

GPU是利用处理图形任务的图形处理器来计算原本由中央处理器CPU的通用计算任务。

GPU的关键性能是矩形并行计算,主流的GPU具有强大的计算能力,无论性能还是内存带宽均远大于同代的CPU。CPU 由专为顺序串行处理而优化组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。同时CPU相当一部分时间在执行外设的中断、进程的切换等任务,而GPU有更多的时间用于并行计算。

英伟达是AI芯片GPU(图形处理器单元)的主要生产厂商,无论是OpenAI的ChatGPT、还是微软的搜索引擎Bing、谷歌的人工智能系统LaMDA,都离不开英伟达提供的底层芯片GPU的算力支持,英伟达系列的A100和H100系列占全球AI芯片市场的80%以上的份额。

除了英伟达,还有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA现场可编程门阵列

FPGA(Field Programmable Gate Array)现场可编程门阵列,或称半定制化芯片。它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物,可以根据算法需求,动态重构计算架构。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

全球知名的FPGA生产厂商有:Altera,Xilinx,Actel,Lattice,Atmel,我国厂商代表有深鉴科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC专用集成电路是针对特定用户要求定制设计、制造的专门的应用程序芯片。ASIC芯片广泛应用于人工智能设备、虚拟货币挖矿设备、耗材打印设备、军事国防设备等智慧终端。

ASIC芯片还可以细分为全定制ASIC芯片、半定制ASIC芯片及可编程ASIC芯片。ASIC芯片拥有面积小、集成度高等优势,被广泛应用于人工智能终端和网络系统中。

类脑计算芯片(Brain-Inspired Chip)

类脑计算芯片是人工智能AI的一个重要组成部分,类脑芯片可模拟人类大脑信息处理方式,能以极低的功耗对信息进行并行和分布式处理,类脑计算芯片就是把微电子技术和新型神经形态器件结合,突破传统计算架构,实现存储与计算的深度融合,大幅提升计算性能、提高集成度、降低能耗。对于现有的计算体系与系统做出变革,并实现在计算能耗、计算能力与计算效率等方面的大幅改进。

IBM已经开始进行类脑智能算法与技术的探索,并已成功研制出TrueNorth芯片。

中国目前有清华大学的天机芯,浙江大学的Darwin2 (55nm)等一批研制类脑计算芯片机构和企业。

ChatGPT对资本市场影响的研判

4.2 ChatGPT背后的技术壁垒和文化控制权

ChatGPT是一种自然语言处理技术,一旦ChatGPT能从目前的实验阶段走向应用成熟阶段,将这标志着在人类活动中,人工智能将开始扮演重要角色并占据优势地位。

我们知道,在自然语言处理大模型技术上,由于受到各种因素的影响,我国的人工智能相比国外发展有一定的差距。

但在局部技术领域,我们还是具有很大优势的,比如在优化大模型中的数据库,在某些特定领域进行模型优化和云数据库建设,以及在一些与自然语言处理关系密切的学科。在国家宏观政策的指导下,发挥社会市场经济体制的优势,能集中力量办大事的原则,完全可以进行基于大模型处理方法模型的应用性研究,以适应人工智能发展对拉动国家经济上行,满足人们追求丰富多彩生活娱乐的需求。

4.3 ChatGPT可能引发的机遇与风险

我们对ChatGPT要时刻保持清醒的认知,每一次技术迭代,都将改变人类生活的内涵和方式。ChatGPT是否属于一次新的技术迭代这个问题还有进一步观察,可是以ChatGPT为代表的人工智能技术的发展和自然语言处理技术的突破,一定会对现有产业发展格局带来前所未有的重要影响。

从正面影响来看,ChatGPT可以帮助人们快速获取信息和提高工作效率,扩展知识面,提供发展AI 产业新的思路和方法。 另一方面,某些低端和重复的工作可能被ChatGPT和 AI代替,导致劳动力市场的阶段性动荡和变化。

如果人们过度依赖AI,可能会降低人们一部分的操作技能水平和创新精神。某些行业可能会发生重组甚至消失,有可能在变化过程中引发社会矛盾等。

颠覆性创新理论的提出者克里斯滕森在《创新者的窘境》这本书中,将创新分为了延续性创新和破坏性创新两种:破坏性创新难以评估市场规模增长的需求和未来的发展路径;延续性创新则会将资源推向更容易带来增长的方向。

总体而言,以ChatGPT为代表的人工智能的发展, 可能对人类的未来产生重要影响,需要积极开展相关的研究和管理,以确保国家经济技术发展不受制于人,保持社会的稳定发展和保护大多数人的共同利益。  

人工智能解决方案可以为企业和公民提供巨大的机会,但也可能带来风险,这就需要一个坚实的监管框架来确保人工智能技术的健康发展。

4.4 ChatGPT的隐患与潜在危机

尽管目前的ChatGPT还是一个验证的版本,强大的文本处理与聊天能力十分强大,但ChatGPT在短短的几个月试运行中也暴露出了很多缺陷,甚至可能会引发危机。这些问题正随着以ChatGPT为代表的生成型AI系统的推进逐渐浮出水面。人们也会更关注这些问题,并迅速采取防范措施。ChatGPT存在的缺陷与风险主要体现在以下几个方面:

4.1.1 ChatGPT在道德和法律方面的违规行为

人们在使用中发现,ChatGPT对信息、数据来源无法进行核实、核查和验证,可能存在个人数据与商业秘密被泄露,引起窃取他人信息的道德问题和提供虚假信息两大隐患。

ChatGPT从网络中获取大量信息,依托海量数据库分析运行,其中包括大量的互联网用户自行输入的信息,比如新闻工作者编写的稿子,ChatGPT目前无法追溯到文字的来源,因此当用户输入提问时,ChatGPT可能产生泄露个人数据或商业秘密等的风险。

ChatGPT涉及的法律风险不限于以下几种:

著作权:生成的内容可能会侵犯他人的著作权。

隐私权:使用ChatGPT 可能需要提供一些个人信息,因此存在泄露个人隐私的风险。

信息误导:生成的内容可能不准确或有误导性和歧视性。

侵权违规:ChatGPT生成的内容可能侵犯他人的合法权益,如商标权、出版权、著作权、专利权等。

商标侵权:ChatGPT 生成的图像和视频内容可能涉及商标侵权。

人身攻击:ChatGPT 生成的内容可能涉及对宗教和人身攻击,违反社会伦理道德。

侮辱诽谤:使用 ChatGPT 生成的内容可能侮辱他人,可能涉及诽谤等法律问题。

最近,OpenAI表示,正考虑在ChatGPT中添加模型水印,即监测模型可以识别的特殊标记,以降低信息滥用的问题。

4.1.2 ChatGPT提供虚假信息

ChatGPT常常出现“一本正经的胡说八道’”,这是ChatGPT目前被人诟病的一个主要缺点。对于有些虚假信息,需要具备一定专业知识的人才能辨别真伪,这就为不法分子恶意“训练”或“误导”人工智能,使其提供诈骗信息、钓鱼网站等内容,损害公民人身和财产安全创造了有利条件。

4.1.3. ChatGPT信息监管迫在眉睫

ChatGPT在建立语料库、生成文本时,大量使用并非公开的开源代码,或未办理许可证申请,可能会导致侵权。对于一些受著作权或版权保护的文本、视频、软件代码等,如果没有经过权利人的授权,直接复制到自己的数据库中,在此基础上修改、拼凑,极有可能侵害他人的著作权,因此对ChatGPT必须要考虑建立相关的监管机制,防止产生不良的社会影响。

4.1.4. ChatGPT提供侵权信息

一位美国众议院科学委员议员表示:“我对人工智能以及人工智能推动的社会进步感到兴奋,但也为其不受限制和不受监管感到担忧。”

纽约大学认知科学名誉教授Gary Marcus对以深度学习为中心的 AI 持怀疑态度,他认为:“生成式 AI 对社会结构构成了真实而迫在眉睫的威胁”。

各国监管机构要有切实可行的风险评估框架,并任命一个负责任的机构。此外,人工智能伦理框架的建立将为所有部门创造一个良好的创新环境。

一位资深的网络安全公司管理者认为:她的团队能够让 ChatGPT 编写网络攻击的程序,ChatGPT从编写网络钓鱼电子邮件到编写恶意代码,再到规避常见的网络安全检查,实施对其他系统的攻击,ChatGPT几乎可以成为让没有软件编码技能的人成为网络罪犯。  

无数的教育工作者谴责有人使用 ChatGPT考试作弊,美国的多所学校已经禁止学生用 ChatGPT聊天机器人答题,拒绝采用ChatGPT编写的论文和答卷。

由于ChatGPT是一种人工智能工具,只要输入提问,点击鼠标,就可以完成任何的主题文章、诗歌和电子邮件。特别是学生用ChatGPT完成试题应答和论文撰写。在国外教育界引起了轩然大波。

为此OpenAI迫于社会压力,赶紧开发出了防作弊应用软件,可以审查哪些试卷和论文是由ChatGPT提供的,以此防止学生作弊。

但是,这种新的检测工具并没有消除教师们的恐惧,反而让科技界和教育界有些失望。据测试,该系统大约只有20%的准确性,不能完全检出作弊的试卷答题。

2023年1月初,美国普林斯顿大学的学生爱德华·田(Edward Tian)开发了GPTZero工具,该工具的标语是“人类应该知道真相”,该工具可以更准确鉴别由ChatGPT提供的文档,相信不久国内也会催生出这类的应用软件和工具。

人工智能领域的竞争焦点与差距

在以ChatGPT为代表的生成类AI大模型中,对于AI芯片的要求更高,包括要求更高速的内存带宽、更大的内存容量以及更加高效的数据通信带宽。

以OpenAI的ChatGPT-3.5模型训练为例,微软公司专门为Open AI 开发了一款定制的超级计算机,使用了上万颗英伟达A100的AI芯片。

在国产AI芯片自主研发领域,国内多家厂商奋起直追,成果喜人,为我国的人工智能发展奠定了坚实基础,令世界刮目相看。

OpenAI公司发展人工智能,在微软投资100亿美元拿到49%的股权之前,OpenAI在成立的七年多的时间里,总共收到了大约40亿美元的风险投资,就是在这样巨额投资的情况下,根据OpenAI公司2022年财报显示亏损仍高达5.45亿美元(折合人民币亏损额达到将近40亿人民币)。

微软在入股OpenAI 后,为OpenAI部署了一个超级计算机,按照算力来说,该超级计算机可以进入全球超计算机的前五名。

2023年1月,微软还承诺将继续为OpenAI提供更多的超算中心的部署,让它能够更加高效完成下一代ChatGPT模型的训练。

根据OpenAI测算,目前训练一次ChatGPT模型的算力成本在450万美元左右,这里还只是计算硬件投入的成本,还不包括人工成本、网络宽带成本、数据储存、固定资产折旧等的综合成本。

实际上训练一次ChatGPT模型,有时候人力成本和运维成本支出要占据总成本很大一部分,因此Open AI雇佣了第三世界国家的低成本外来外包员工来完成指定的优化任务,从而降低人工成本。

目前ChatGPT-3参数量在1750亿参数左右。而以OpenAI发布最新的ChatGPT-3.5B模型为例,数量将达到1.7万亿。预测成本就更夸张了,训练时间也将从之前的几周变为数月甚至几个月的周期。

目前OpenAI公司有1000多名正式员工,人力成本也是非常庞大的一笔支出。因此AI产业研发成本支出是非常烧钱的行业,对于一般发展中国家来说这是一笔巨资。同样我们国家人工智能系统还处在研发阶段,资本投入也是当下面临的一个重要课题。

随着大模型训练体量的不断增加,未来算力资源、人才资源、数据资源三者的投入不可小觑。

 ChatGPT引爆全球互联网入口争夺战

从ChatGPT功能来看,还处在联网验证阶段,就是在基本的功能方面还存在很多问题和不确定性,在有些功能上更是漏洞百出,在软件编程方面还远远没有达到颠覆软件编程产业的程度。

但是全网热潮背后一定有深层次的原因:经过深度分析不难看出,其实ChatGPT引爆的不完全是AI里程碑式的技术革命,而是引爆一场全球互联网入口的争夺战。

全球互联网入口长期被谷歌占据,谷歌的搜索引擎业务占到全球市场份额的97%,谷歌内部有一个商业警戒系统,只要公司业务受到威胁就会触发,其中最高级别是红色告警。

谷歌(Google)公司1998年9月创立,自从公司成立以来,这个红色警戒系统就从来没有触发过。然而2023年2月,谷歌浏览器的下载量从全球第一降到了第二,谷歌传统的搜索引擎业务首次被微软反超,系统自动触发了红色警戒系统。

微软公司从诞生以来,从未在任何产品上投资超过100亿,这次对Open AI 投资超过100个亿,目的就是要把ChatGPT整合到微软公司的所有产品中去。

微软近期已经宣布将ChatGPT整合入微软的搜索引擎Bing,没过几天,又宣布会将ChatGPT整合进Office办公套件中去。用户使用Office时就能体验ChatGPT的对话功能。很明显微软就是要利用ChatGPT先入为主的优势,争夺谷歌搜索引擎的市场份额,目前第一阶段目标已经圆满达到。

微软一直都在厉兵秣马,以前一直被谷歌、苹果、亚马逊压得喘不动气,现在终于开始了在全球互联网入口的争夺战中的绝地反击战。

同样的情况,在我国的互联网企业中也有发生。在ChatGPT成功的示范效应带动下,以及国家支持数字经济发展两个强力点的支撑下,相信不远的将来,中国的AI 产品将像雨后春笋一样拔地而起。

浅谈未来我国人工智能发展趋势

随着科学技术的飞速发展,国家已经把人工智能作为战略性新兴产业,作为新增长引擎加以扶持和培养,人工智能的未来发展将会带来更多的惊喜和机遇,下面就让我们浅谈一下我国人工智能发展趋势。

在国家宏观政策的大力支持下,我国的人工智能将迎来重大的发展机遇期,国内的人工智能企业,互联网企业,科研机构应当抓住这个难得的机遇,为国家的数字经济转型发展作出应有的贡献。

特别是华为、阿里巴巴,腾讯、百度、科大讯飞、字节跳动等等大型企业和科研单位,应该发挥各自优势强强联手,他们有义务、有责任,承担起这个时代赋予的历史使命。

强化企业在研发投入中的主体地位,继续加大企业研发费用,建立起金融支持企业在AI领域的创新工作机制,打通科技、产业、金融的全产业链条。

人工智能产业属于新型的高科领域,目前世界上尚未形成占绝对主导的技术路径依赖。

在世界产业生态也没有形成绝对壁垒的人工智能开创初期,我们要结合国情把软硬件协同发展,作为提升人工智能发展的主要手段,单纯的数据与算法优化已不能满足我国人工智能产业发展需求。

面对这一发展契机,我国应强化人工智能产业发展的顶层设计,加强人工智能软硬件协同布局。重点布局具有我国自主知识产权的“框架软件+AI芯片”架构,构建起有利于我国人工智能发展的生态环境,力争在人工智能领域取得主导优势。

类脑芯片研发属于AI芯片的前瞻性领域,我国类脑芯片的研究尚处于理论阶段,涉及的企业不多,应充分发挥国内高校以及科研院所力量进行前沿布局。

国际龙头企业还没有形成明确的技术及知识产权壁垒,IBM研制的TrueNorth类人脑计算有突破性进展,随着存储、逻辑、传感技术的改进,将来类脑计算芯片有望取得更大的发展,在AI领域将发挥更大的作用。

结束语

总之,人工智能的未来发展将会是一个充满机遇和挑战的过程,随着技术的不断发展和成熟,人工智能已经开始渗透到我们日常生活的各个方面,人工智能不仅可以帮助改善人们的生活品质、丰富人们的娱乐生活,也将会在工业自动化、军事装备现代化、提高医疗诊断水平、提升教育能力,拓展学生的知识面等各个领域得到更加广泛的应用,从而帮助我们更好地解决问题、提高效率、改善生活。

我们也需要保持警惕,推动建立人工智能安全可控的治理体系,积极面对技术发展中出现的各种问题和挑战。

让我们以开放的心态迎接新技术的出现,宽容新技术存在的不足之处,在国家宏观政策的大力支持下,发挥举国体制的优势,积极推动人工智能与经济社会深度融合,在重大应用场景中锤炼技术、升级迭代、培育市场,从而使我国的人工智能技术能够为全人类社会的进步和发展做出更加积极的贡献。

参考资料:

[1].ChatGPT翻开了硬币的哪一面?北京邮电大学人工智能学院教授邓伟洪、中国信通院云大所内容科技部副主任石霖

[2].采访报道ChatGPT“火出圈”我们该“急眼”吗?中国经济网2023年2月20日

[3].OpenAI官网(ChatGPT:优化对话的语言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

4万字告诉你ChatGPT到底是什么?(下)

人工智能系统开发是一个系统工程,需要协同各个方面的资源共同发力,才能在产业发展中占有制高点。

文 | 星船知造 钱鸿生

编辑 | 唐晓园

上周我们发布了报告上篇 《4万字告诉你ChatGPT到底是什么(上)》,今天的下篇我们将继续节选报告第三章中的“我国人工智能发展中存在的主要问题”、第四章《ChatGPT对资本市场影响的分析与研判》和第五章《我国未来人工智能发展的展望》中部分核心内容和观点。

OpenAI推出ChatGPT后不久,微软宣布将ChatGPT与搜索引擎Bing整合,谷歌宣布推出Bard应对挑战,接着Meta官网公布了一款新的人工智能大型语言模型LLaMA。

此时,人们自然而然把目光转向了中国相关企业,他们何时宣布推出类似于ChatGPT人工智能发展的时间表。

人们特别关注的企业有百度、阿里巴巴以及人工智能企业科大讯飞等等一大批中国与人工智能有关联企业的动向。

3.4.3 我国人工智能发展中存在的主要问题

我国发展人工智能面临三方面技术难点如下:

第一,人工智能的AI算法

人工智能常见的算法技术的基础性研究主要集中于国内各大高校团队,但在科研成果转化领域一直发展比较缓慢,较难实现从理论和技术向生产力的转化。

目前以华为、阿里、腾讯等公司主导的人工智能技术研发团队迅速崛起,将科研产品开发与算法技术结合,从产业领域实现人工智能算法的技术成果转化。

但是在算法的基础理论研究层面,一直以来是我们发展人工智能技术的短板。没有对大规模机器学习场景中强化学习算法模型、生成性预训练变换模型、分布式并行的研发投入,或者说由于受到资金投入与人才缺乏的影响,研究成果与世界发达企业还有很大的差距。

美国现有的人工智能系统的关键技术都是不开源的,系统深度学习框架、数据库和工具集,均限内部使用,部分仅对系统的应用接口持开源的态度,使我们无法在短时间内掌握世界最先进的人工智能系统的开发经验。

从市场的角度来看,我国目前的人工智能系统都是一些比较初级的数据采集与分析应用系统,类似于ChatGPT高度智能化的AI产品的研发还处于摸索与初级阶段,在性能和稳定性方面改善空间潜力巨大。

早在20世纪80年代,我国学术界就提出了相当完善的AI算法模型,中国多家高校有从事算法模型的研究,但大多都将算法模型应用在人脸识别系统,提高图像识别精度方面。到目前为止算法模型在AI领域的价值还没有被真正体现,这可能受限于我们的芯片制造水平难以提供支撑深度神经网络训练和预训练需要的算力。

科研领域需要更大投入,要针对目前的已有算法进行深度优化,或者另辟蹊径,提出更为先进的算法理论。要打造出符合世界产业发展最新技术水平,具有全球市场竞争力的人工智能产品,看来有相当长的一段路要走。但也不排除弯道超车或换道超车奇迹的发生。

我国AI发展现状任重而道远。

第二,人工智能AI模型软件

国内的人工智能模型软件开发已经起步,开始对标世界先进的人工智能模型,培育自己的发展环境。人工智能模型是人工智能生态中最重要的因素之一,我国需要促进国产模型软件的发展和推广,摆脱国外的标准制约。ChatGPT就是基于“生成型预训练变换模型”开发出来的自然语言聊天机器人。

第三,人工智能开发环境

人工智能开发环境是指相关算法、数据库、软件开发工具、高性能的人工智能AI计算机芯片、云计算网络的集合。国产AI模型开发需要和国产AI智能芯片及硬件进行相互适配、性能优化和应用推广,才能够形成面向行业应用的软硬件一体化人工智能平台。

国际人工智能巨头掌控着人工智能开发环境的关键技术,我们目前还较难在短时间内在AI芯片、算法、模型软件、云数据库服务等人工智能开发环境上有十分大的突破。

人工智能系统开发是一个系统工程,需要协同各个方面的资源共同发力,才能在产业发展中占有制高点。

3.4.4 AI芯片,人工智能绕不过去的坎

人工智能AI芯片是技术发展的关键之一,它是提供人工智能算力的灵魂和大脑,承载了为各种终端提供强大算力的重要任务。人工智能AI 芯片的出现,极大提高数据处理的能力,尤其在处理海量数据时明显优于传统CPU。

从技术架构来看,AI芯片一般可以分为GPU、FPGA、ASIC和类脑芯片四大类——

GPU(Graphics Processing Unit,图形处理器)

GPU是利用处理图形任务的图形处理器来计算原本由中央处理器CPU的通用计算任务。

GPU的关键性能是矩形并行计算,主流的GPU具有强大的计算能力,无论性能还是内存带宽均远大于同代的CPU。CPU 由专为顺序串行处理而优化组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。同时CPU相当一部分时间在执行外设的中断、进程的切换等任务,而GPU有更多的时间用于并行计算。

英伟达是AI芯片GPU(图形处理器单元)的主要生产厂商,无论是OpenAI的ChatGPT、还是微软的搜索引擎Bing、谷歌的人工智能系统LaMDA,都离不开英伟达提供的底层芯片GPU的算力支持,英伟达系列的A100和H100系列占全球AI芯片市场的80%以上的份额。

除了英伟达,还有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA现场可编程门阵列

FPGA(Field Programmable Gate Array)现场可编程门阵列,或称半定制化芯片。它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物,可以根据算法需求,动态重构计算架构。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

全球知名的FPGA生产厂商有:Altera,Xilinx,Actel,Lattice,Atmel,我国厂商代表有深鉴科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC专用集成电路是针对特定用户要求定制设计、制造的专门的应用程序芯片。ASIC芯片广泛应用于人工智能设备、虚拟货币挖矿设备、耗材打印设备、军事国防设备等智慧终端。

ASIC芯片还可以细分为全定制ASIC芯片、半定制ASIC芯片及可编程ASIC芯片。ASIC芯片拥有面积小、集成度高等优势,被广泛应用于人工智能终端和网络系统中。

类脑计算芯片(Brain-Inspired Chip)

类脑计算芯片是人工智能AI的一个重要组成部分,类脑芯片可模拟人类大脑信息处理方式,能以极低的功耗对信息进行并行和分布式处理,类脑计算芯片就是把微电子技术和新型神经形态器件结合,突破传统计算架构,实现存储与计算的深度融合,大幅提升计算性能、提高集成度、降低能耗。对于现有的计算体系与系统做出变革,并实现在计算能耗、计算能力与计算效率等方面的大幅改进。

IBM已经开始进行类脑智能算法与技术的探索,并已成功研制出TrueNorth芯片。

中国目前有清华大学的天机芯,浙江大学的Darwin2 (55nm)等一批研制类脑计算芯片机构和企业。

ChatGPT对资本市场影响的研判

4.2 ChatGPT背后的技术壁垒和文化控制权

ChatGPT是一种自然语言处理技术,一旦ChatGPT能从目前的实验阶段走向应用成熟阶段,将这标志着在人类活动中,人工智能将开始扮演重要角色并占据优势地位。

我们知道,在自然语言处理大模型技术上,由于受到各种因素的影响,我国的人工智能相比国外发展有一定的差距。

但在局部技术领域,我们还是具有很大优势的,比如在优化大模型中的数据库,在某些特定领域进行模型优化和云数据库建设,以及在一些与自然语言处理关系密切的学科。在国家宏观政策的指导下,发挥社会市场经济体制的优势,能集中力量办大事的原则,完全可以进行基于大模型处理方法模型的应用性研究,以适应人工智能发展对拉动国家经济上行,满足人们追求丰富多彩生活娱乐的需求。

4.3 ChatGPT可能引发的机遇与风险

我们对ChatGPT要时刻保持清醒的认知,每一次技术迭代,都将改变人类生活的内涵和方式。ChatGPT是否属于一次新的技术迭代这个问题还有进一步观察,可是以ChatGPT为代表的人工智能技术的发展和自然语言处理技术的突破,一定会对现有产业发展格局带来前所未有的重要影响。

从正面影响来看,ChatGPT可以帮助人们快速获取信息和提高工作效率,扩展知识面,提供发展AI 产业新的思路和方法。 另一方面,某些低端和重复的工作可能被ChatGPT和 AI代替,导致劳动力市场的阶段性动荡和变化。

如果人们过度依赖AI,可能会降低人们一部分的操作技能水平和创新精神。某些行业可能会发生重组甚至消失,有可能在变化过程中引发社会矛盾等。

颠覆性创新理论的提出者克里斯滕森在《创新者的窘境》这本书中,将创新分为了延续性创新和破坏性创新两种:破坏性创新难以评估市场规模增长的需求和未来的发展路径;延续性创新则会将资源推向更容易带来增长的方向。

总体而言,以ChatGPT为代表的人工智能的发展, 可能对人类的未来产生重要影响,需要积极开展相关的研究和管理,以确保国家经济技术发展不受制于人,保持社会的稳定发展和保护大多数人的共同利益。  

人工智能解决方案可以为企业和公民提供巨大的机会,但也可能带来风险,这就需要一个坚实的监管框架来确保人工智能技术的健康发展。

4.4 ChatGPT的隐患与潜在危机

尽管目前的ChatGPT还是一个验证的版本,强大的文本处理与聊天能力十分强大,但ChatGPT在短短的几个月试运行中也暴露出了很多缺陷,甚至可能会引发危机。这些问题正随着以ChatGPT为代表的生成型AI系统的推进逐渐浮出水面。人们也会更关注这些问题,并迅速采取防范措施。ChatGPT存在的缺陷与风险主要体现在以下几个方面:

4.1.1 ChatGPT在道德和法律方面的违规行为

人们在使用中发现,ChatGPT对信息、数据来源无法进行核实、核查和验证,可能存在个人数据与商业秘密被泄露,引起窃取他人信息的道德问题和提供虚假信息两大隐患。

ChatGPT从网络中获取大量信息,依托海量数据库分析运行,其中包括大量的互联网用户自行输入的信息,比如新闻工作者编写的稿子,ChatGPT目前无法追溯到文字的来源,因此当用户输入提问时,ChatGPT可能产生泄露个人数据或商业秘密等的风险。

ChatGPT涉及的法律风险不限于以下几种:

著作权:生成的内容可能会侵犯他人的著作权。

隐私权:使用ChatGPT 可能需要提供一些个人信息,因此存在泄露个人隐私的风险。

信息误导:生成的内容可能不准确或有误导性和歧视性。

侵权违规:ChatGPT生成的内容可能侵犯他人的合法权益,如商标权、出版权、著作权、专利权等。

商标侵权:ChatGPT 生成的图像和视频内容可能涉及商标侵权。

人身攻击:ChatGPT 生成的内容可能涉及对宗教和人身攻击,违反社会伦理道德。

侮辱诽谤:使用 ChatGPT 生成的内容可能侮辱他人,可能涉及诽谤等法律问题。

最近,OpenAI表示,正考虑在ChatGPT中添加模型水印,即监测模型可以识别的特殊标记,以降低信息滥用的问题。

4.1.2 ChatGPT提供虚假信息

ChatGPT常常出现“一本正经的胡说八道’”,这是ChatGPT目前被人诟病的一个主要缺点。对于有些虚假信息,需要具备一定专业知识的人才能辨别真伪,这就为不法分子恶意“训练”或“误导”人工智能,使其提供诈骗信息、钓鱼网站等内容,损害公民人身和财产安全创造了有利条件。

4.1.3. ChatGPT信息监管迫在眉睫

ChatGPT在建立语料库、生成文本时,大量使用并非公开的开源代码,或未办理许可证申请,可能会导致侵权。对于一些受著作权或版权保护的文本、视频、软件代码等,如果没有经过权利人的授权,直接复制到自己的数据库中,在此基础上修改、拼凑,极有可能侵害他人的著作权,因此对ChatGPT必须要考虑建立相关的监管机制,防止产生不良的社会影响。

4.1.4. ChatGPT提供侵权信息

一位美国众议院科学委员议员表示:“我对人工智能以及人工智能推动的社会进步感到兴奋,但也为其不受限制和不受监管感到担忧。”

纽约大学认知科学名誉教授Gary Marcus对以深度学习为中心的 AI 持怀疑态度,他认为:“生成式 AI 对社会结构构成了真实而迫在眉睫的威胁”。

各国监管机构要有切实可行的风险评估框架,并任命一个负责任的机构。此外,人工智能伦理框架的建立将为所有部门创造一个良好的创新环境。

一位资深的网络安全公司管理者认为:她的团队能够让 ChatGPT 编写网络攻击的程序,ChatGPT从编写网络钓鱼电子邮件到编写恶意代码,再到规避常见的网络安全检查,实施对其他系统的攻击,ChatGPT几乎可以成为让没有软件编码技能的人成为网络罪犯。  

无数的教育工作者谴责有人使用 ChatGPT考试作弊,美国的多所学校已经禁止学生用 ChatGPT聊天机器人答题,拒绝采用ChatGPT编写的论文和答卷。

由于ChatGPT是一种人工智能工具,只要输入提问,点击鼠标,就可以完成任何的主题文章、诗歌和电子邮件。特别是学生用ChatGPT完成试题应答和论文撰写。在国外教育界引起了轩然大波。

为此OpenAI迫于社会压力,赶紧开发出了防作弊应用软件,可以审查哪些试卷和论文是由ChatGPT提供的,以此防止学生作弊。

但是,这种新的检测工具并没有消除教师们的恐惧,反而让科技界和教育界有些失望。据测试,该系统大约只有20%的准确性,不能完全检出作弊的试卷答题。

2023年1月初,美国普林斯顿大学的学生爱德华·田(Edward Tian)开发了GPTZero工具,该工具的标语是“人类应该知道真相”,该工具可以更准确鉴别由ChatGPT提供的文档,相信不久国内也会催生出这类的应用软件和工具。

人工智能领域的竞争焦点与差距

在以ChatGPT为代表的生成类AI大模型中,对于AI芯片的要求更高,包括要求更高速的内存带宽、更大的内存容量以及更加高效的数据通信带宽。

以OpenAI的ChatGPT-3.5模型训练为例,微软公司专门为Open AI 开发了一款定制的超级计算机,使用了上万颗英伟达A100的AI芯片。

在国产AI芯片自主研发领域,国内多家厂商奋起直追,成果喜人,为我国的人工智能发展奠定了坚实基础,令世界刮目相看。

OpenAI公司发展人工智能,在微软投资100亿美元拿到49%的股权之前,OpenAI在成立的七年多的时间里,总共收到了大约40亿美元的风险投资,就是在这样巨额投资的情况下,根据OpenAI公司2022年财报显示亏损仍高达5.45亿美元(折合人民币亏损额达到将近40亿人民币)。

微软在入股OpenAI 后,为OpenAI部署了一个超级计算机,按照算力来说,该超级计算机可以进入全球超计算机的前五名。

2023年1月,微软还承诺将继续为OpenAI提供更多的超算中心的部署,让它能够更加高效完成下一代ChatGPT模型的训练。

根据OpenAI测算,目前训练一次ChatGPT模型的算力成本在450万美元左右,这里还只是计算硬件投入的成本,还不包括人工成本、网络宽带成本、数据储存、固定资产折旧等的综合成本。

实际上训练一次ChatGPT模型,有时候人力成本和运维成本支出要占据总成本很大一部分,因此Open AI雇佣了第三世界国家的低成本外来外包员工来完成指定的优化任务,从而降低人工成本。

目前ChatGPT-3参数量在1750亿参数左右。而以OpenAI发布最新的ChatGPT-3.5B模型为例,数量将达到1.7万亿。预测成本就更夸张了,训练时间也将从之前的几周变为数月甚至几个月的周期。

目前OpenAI公司有1000多名正式员工,人力成本也是非常庞大的一笔支出。因此AI产业研发成本支出是非常烧钱的行业,对于一般发展中国家来说这是一笔巨资。同样我们国家人工智能系统还处在研发阶段,资本投入也是当下面临的一个重要课题。

随着大模型训练体量的不断增加,未来算力资源、人才资源、数据资源三者的投入不可小觑。

 ChatGPT引爆全球互联网入口争夺战

从ChatGPT功能来看,还处在联网验证阶段,就是在基本的功能方面还存在很多问题和不确定性,在有些功能上更是漏洞百出,在软件编程方面还远远没有达到颠覆软件编程产业的程度。

但是全网热潮背后一定有深层次的原因:经过深度分析不难看出,其实ChatGPT引爆的不完全是AI里程碑式的技术革命,而是引爆一场全球互联网入口的争夺战。

全球互联网入口长期被谷歌占据,谷歌的搜索引擎业务占到全球市场份额的97%,谷歌内部有一个商业警戒系统,只要公司业务受到威胁就会触发,其中最高级别是红色告警。

谷歌(Google)公司1998年9月创立,自从公司成立以来,这个红色警戒系统就从来没有触发过。然而2023年2月,谷歌浏览器的下载量从全球第一降到了第二,谷歌传统的搜索引擎业务首次被微软反超,系统自动触发了红色警戒系统。

微软公司从诞生以来,从未在任何产品上投资超过100亿,这次对Open AI 投资超过100个亿,目的就是要把ChatGPT整合到微软公司的所有产品中去。

微软近期已经宣布将ChatGPT整合入微软的搜索引擎Bing,没过几天,又宣布会将ChatGPT整合进Office办公套件中去。用户使用Office时就能体验ChatGPT的对话功能。很明显微软就是要利用ChatGPT先入为主的优势,争夺谷歌搜索引擎的市场份额,目前第一阶段目标已经圆满达到。

微软一直都在厉兵秣马,以前一直被谷歌、苹果、亚马逊压得喘不动气,现在终于开始了在全球互联网入口的争夺战中的绝地反击战。

同样的情况,在我国的互联网企业中也有发生。在ChatGPT成功的示范效应带动下,以及国家支持数字经济发展两个强力点的支撑下,相信不远的将来,中国的AI 产品将像雨后春笋一样拔地而起。

浅谈未来我国人工智能发展趋势

随着科学技术的飞速发展,国家已经把人工智能作为战略性新兴产业,作为新增长引擎加以扶持和培养,人工智能的未来发展将会带来更多的惊喜和机遇,下面就让我们浅谈一下我国人工智能发展趋势。

在国家宏观政策的大力支持下,我国的人工智能将迎来重大的发展机遇期,国内的人工智能企业,互联网企业,科研机构应当抓住这个难得的机遇,为国家的数字经济转型发展作出应有的贡献。

特别是华为、阿里巴巴,腾讯、百度、科大讯飞、字节跳动等等大型企业和科研单位,应该发挥各自优势强强联手,他们有义务、有责任,承担起这个时代赋予的历史使命。

强化企业在研发投入中的主体地位,继续加大企业研发费用,建立起金融支持企业在AI领域的创新工作机制,打通科技、产业、金融的全产业链条。

人工智能产业属于新型的高科领域,目前世界上尚未形成占绝对主导的技术路径依赖。

在世界产业生态也没有形成绝对壁垒的人工智能开创初期,我们要结合国情把软硬件协同发展,作为提升人工智能发展的主要手段,单纯的数据与算法优化已不能满足我国人工智能产业发展需求。

面对这一发展契机,我国应强化人工智能产业发展的顶层设计,加强人工智能软硬件协同布局。重点布局具有我国自主知识产权的“框架软件+AI芯片”架构,构建起有利于我国人工智能发展的生态环境,力争在人工智能领域取得主导优势。

类脑芯片研发属于AI芯片的前瞻性领域,我国类脑芯片的研究尚处于理论阶段,涉及的企业不多,应充分发挥国内高校以及科研院所力量进行前沿布局。

国际龙头企业还没有形成明确的技术及知识产权壁垒,IBM研制的TrueNorth类人脑计算有突破性进展,随着存储、逻辑、传感技术的改进,将来类脑计算芯片有望取得更大的发展,在AI领域将发挥更大的作用。

结束语

总之,人工智能的未来发展将会是一个充满机遇和挑战的过程,随着技术的不断发展和成熟,人工智能已经开始渗透到我们日常生活的各个方面,人工智能不仅可以帮助改善人们的生活品质、丰富人们的娱乐生活,也将会在工业自动化、军事装备现代化、提高医疗诊断水平、提升教育能力,拓展学生的知识面等各个领域得到更加广泛的应用,从而帮助我们更好地解决问题、提高效率、改善生活。

我们也需要保持警惕,推动建立人工智能安全可控的治理体系,积极面对技术发展中出现的各种问题和挑战。

让我们以开放的心态迎接新技术的出现,宽容新技术存在的不足之处,在国家宏观政策的大力支持下,发挥举国体制的优势,积极推动人工智能与经济社会深度融合,在重大应用场景中锤炼技术、升级迭代、培育市场,从而使我国的人工智能技术能够为全人类社会的进步和发展做出更加积极的贡献。

参考资料:

[1].ChatGPT翻开了硬币的哪一面?北京邮电大学人工智能学院教授邓伟洪、中国信通院云大所内容科技部副主任石霖

[2].采访报道ChatGPT“火出圈”我们该“急眼”吗?中国经济网2023年2月20日

[3].OpenAI官网(ChatGPT:优化对话的语言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文为转载内容,授权事宜请联系原著作权人。