查看““文心一言”发布会李彦宏演讲全文”的源代码
←
“文心一言”发布会李彦宏演讲全文
跳转至:
导航
、
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
3月16日,百度发布类ChatGPT产品“文心一言”,以下为李彦宏在发布会上的演讲全文: [[文件:“文心一言”发布会李彦宏演讲全文1.jpg|700px]] 各位媒体朋友,各位嘉宾,大家好。欢迎参加文心一言新闻发布会。非常感谢大家对文心一言的关注和支持。 最近一段时间,很多朋友问我,“为什么是今天,你们真的ready了吗”。其实从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的发布是过去多年努力的延续。 但也不能说我们完全ready了,文心一言对标chatGPT,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。 那为什么是今天?因为市场有需求。百度的很多产品,从搜索到智能云,再到自动驾驶,大家都有需要,更重要的是我们的客户需要,合作伙伴需要,从我们承认文心一言的存在到现在,短短一个月的时间,就有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型。 当然,一旦发布,有了真实的人类反馈,文心一言的进步速度会非常快,我们都希望它快点成长,早日为用户和客户创造价值。 百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。 十月怀胎,一朝分娩。现在,我就带大家来看看,百度新一代大语言模型、生成式AI产品文心一言。 下面,我会演示五个场景的Demo,包括文学创作、商业文案创作、数理推算、中文理解、多模态生成。 首先来体验一下文学创作。《三体》是非常知名的科幻小说,我们就以这个开头。 Demo1: [[文件:“文心一言”发布会李彦宏演讲全文2.jpg|700px]] 刚才的演示中,“总结三体的核心内容”,体现的是文心一言的总结、分析能力。 续写《三体》,体现的是内容创作生成能力。 《三体》的作者是谁?他是哪里人?电视剧三体演员都有谁?文心一言回答是正确的。大家可能知道,生成式AI这类产品,在回答事实性问题时,有时候会出错。 文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。 于和伟和张鲁一有哪些共同点、于和伟和张鲁一谁更高?这类问题背后,则体现的是文心一言的推理能力。比如,它得先知道两人的准确身高,才能得出正确答案。 我们再来试试文心一言在商业文案创作方向的能力。以常见的公司起名字、写slogan、写新闻稿为例。 Demo2: [[文件:“文心一言”发布会李彦宏演讲全文3.jpg|700px]] 刚才的演示,展现了文心一言连续三次内容创作生成。 AI要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。 这背后有一个基础,就是庞大的数据规模。人类常说“读万卷书”,而AI可以说是“读书破千亿卷”。文心一言大模型的训练数据就包括,万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。 有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生“智能涌现”,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。 我们接下来看文心一言对数理逻辑推算任务做的怎么样。鸡兔同笼是锻炼人类逻辑思维的经典题,这个对生成式AI同样有挑战。 Demo3: [[文件:“文心一言”发布会李彦宏演讲全文4.jpg|700px]] 对于第一道题,文心一言经过演算,认为可能是题出错了。 对于第二道,文心一言不但给出了正确结果,还详细给出解题步骤。 可以看出,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。 文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。当然,现阶段准确率还不是100%,我们还需要给它更多的时间来学习和成长。前面三个例子,我们演示了大语言模型比较常见的优势和能力。 下面我们演示一下文心一言的中文理解能力。 Demo4: [[文件:“文心一言”发布会李彦宏演讲全文5.jpg|700px]] “洛阳纸贵”,“藏头诗”,这很考验AI对中文和中国文化的理解。 作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。这个例子就比较清楚的展示了我们在中文上的优势。 相对应的,一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来我们还要加紧训练,不断完善这些能力。 接下来,我再演示一个多模态生成方向的Demo。 Demo5: [[文件:“文心一言”发布会李彦宏演讲全文6.jpg|700px]] 刚才这一段演示,文心一言生成了文本、图片、音频和视频,展示了多模态生成能力。目前的版本,已经能够生成文字、图片和语音。生成视频因为成本比较高,还没有对所有用户开放,未来我们会逐步接入。但是熟悉百家号创作的朋友,应该都体验过这个功能了,每天有几万篇文章通过这个能力转成视频内容在百度分发。 多模态是生成式AI一个明确的发展趋势。 未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。 上面这些演示案例,在发布会后,大家也可以亲自去测试体验。 从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。 但整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它一定会飞速发展,日新月异。 通过定向微调,可以在百度内外部各类产品上逐步展示出惊人的亲和力,让每一个产品离自己的用户和客户更近。 文心一言这样的大语言模型,会成为每个人必不可少的生产力工具。 不过,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。 人类进入人工智能时代,IT技术的技术栈发生了根本性变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。 今天,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。 文心一言位于模型层。2019年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求。这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。 大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。尤其是,框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了4D混合并行技术。 另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断去调优迭代,越做越好。更好的大模型,会让用户体验不断升级。 我还想强调一点,在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,百度的优势非常独特,相信大家会在后续文心的迭代速度上有明显感受。 自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态,感谢每一位伙伴的支持。 这也意味着,很多的企业已经理解到,文心一言和生成式AI,代表了一个新的技术范式,是一个每家企业都不可以错过的巨大的机会。AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。 我们对文心一言的定位,是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。 文心一言不仅仅会影响搜索或者互联网公司,而是会影响到每一家公司,由于它超强的自然语言理解和表达能力,它让任何公司都有机会离自己的客户更近,有机会通过这些能力去创建最好的客户体验,从而比其他人更能抓住客户,获得更强的竞争优势。 文心一言对个人的改变也会是巨大的,有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。很多人的工作性质会发生不可逆转的改变。 我认为生成式AI,将催生新产品、新业态,会有很多创业和投资机会。 对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济。 对于大部分创业者和企业来说,真正的机会是,基于通用大语言模型,抢先开发重要的应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等各种超级应用。 [[文件:“文心一言”发布会李彦宏演讲全文7.jpg|700px]] 我认为大模型时代将产生三大产业机会: 第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言,将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。 文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。百度智能云将于近期举办发布会。发布基于文心一言的云服务和应用产品,我们既有公有云服务和也可以做私有化部署,请大家期待。 第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Know how,调用通用大模型能力,为行业客户提供解决方案。我们的文心大模型,已经在电力、金融、媒体等领域,发布了10多个行业大模型。在各行各业都有机会。非常欢迎大家来跟我们合作。 第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。这里面的机会非常多,可以说每家企业在现在这个阶段都有机会。 我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。 文心一言发布之后,将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你“士别三日,当刮目相看”的惊喜。 最后我想说,文心一言不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物,是我们服务亿万用户,赋能千行百业的全新的平台,是创新驱动发展的最佳证明。 谢谢大家的关注和支持。
该页面使用的模板:
模板:4
(
查看源代码
)
返回至
“文心一言”发布会李彦宏演讲全文
。
导航菜单
个人工具
登录
名字空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
社区主页
新闻动态
最近更改
随机页面
帮助
华师附中老三届
站群链接
社友网(sn)
产品百科(cpwiki)
产品与服务(sn)
社区支持农业(sn)
工具
链入页面
相关更改
特殊页面
页面信息