7月4日,2024年国际人工智能大会(WAIC)在上海盛大开幕,汇聚了全球AI范畴的精英与立异效果。本年大会的主题聚集于“以共商促同享,以善治促善智”,强调了在全球范围内促进敞开协作、推进AI技能健康开展的重要性。在这个充溢才智磕碰的舞台上,职业首领、学者和政策制定者一起探讨了人工智能的未来趋势、道德办理以及对社会的深远影响。
不得不提的是,本届大会共有500余家企业承认参展,市外企业和国际企业占比超50%,展品数量超1500项。展览规划、参展企业数、亮点展品数、首发新品数均达前史最高。因而,动点科技也选取了本次颇具代表性的展商及其展品,供读者参阅。

蚂蚁集团
据介绍,初次展现的“支付宝智能助理”是国内首款就事型的AI日子管家。依托支付宝这一国内最大的服务型App,用户不必找进口,经过“闲谈”就能完结就事、问诊、打车等服务。为了让智能助理的服务才能得到具象化展现,蚂蚁展区搭建了智能助理与咖啡机器人的联动。记者参加了现场体会,只需简略对话,就能取得一杯热火朝天的咖啡。一起,AI点单这一新功用,也已在支付宝App敞开测验,第一批支撑星巴克、瑞幸、喜茶、霸王茶姬、蜜雪冰城等12个茶饮品牌的支付宝小程序。用户经过支付宝智能助理下达指令,比方“我想点一杯星巴克的中杯冰拿铁”,AI便会进入小程序自动下单,用户承认并付款后,就能到邻近的线下门店取到咖啡。
治病求医,是一般人的日常刚需。运用AI大模型、数字人等技能,支付宝打造了“AI就医助理”计划,助力医疗机构为患者供给就医前、中、后全流程服务。蚂蚁展区展现的形象亲热的“安诊儿”,便是浙江省选用支付宝AI就医助理计划推出的全国首个AI陪诊员,协助浙江省人民医院前台咨询量减少了50%。现在全国医院、医疗机构也正在凭仗这一计划打造愈加便当、更具温情的就医服务。
“多模态AI鉴真”是模仿蚂蚁大模型安全检测渠道“蚁天鉴2.0”的AIGC检测和证照深度组成检测两大才能推出的互动产品。观众可挑选证照、音频、视频等多样化资料,该互动会先对这些资料做一番假造模仿生成。之后,该产品能对上述假造的资料快速进行精准辨别,并构成检测陈述。在实在的出产场景,蚁天鉴AI鉴真处理计划,支撑多模态内容实在性和深度假造检测,防备深度组成技能乱用危险,图画辨认准确率99.9%,到达信通院测评职业最高优异等级,现已具有了引领性的AI安全对立才能。
在“谍影重重”互动设备前,观众还可用一场情景剧的方法翻开深度假造(Deepfake)的攻防“魔盒”。首要,用户在该设备上传一张相片,可经过AI换脸组成一张新的人脸相片。下一步,可运用组成后的相片乃至视频去刷脸,该互动可以辨别出该相片或许视频是否是AI组成,然后阻挠危险举动。

腾讯集团
在“腾讯元宝”展区,现场观众可以与腾讯元宝App进行互动,经过互动设备,生成个人多风格专属头像。作为一款依据腾讯混元大模型开发的AI原生运用,腾讯元宝掩盖作业提效、日子文娱两大场景,除了供给AI查找、AI总结、AI写作等中心功用,还供给构思绘画、白话陪练、百变AI头像等风趣好玩的特征运用,以及更多用户创立的智能体。而在“腾讯元器”展区,参会嘉宾可以经过增加提示词、插件、常识库等自在创立智能体,也可以在智能体商铺挑选、运用智能体,以满意不同场景下的需求。
由腾讯多媒体实验室打造的云境智能XR演播室、Tencent266高清低码直播、全息视频6DoF等多款技能运用,专心于多媒体和相关范畴的前沿技能探究、产品研制和运用落地,助力传媒、文明、游览等职业的开展。
摇动极光作为腾讯首款体感健身运用,用户无需额定置办其他外部设备,1台智能电视、1部手机,在家翻开腾讯视频极光TV就能随时高兴健身、暴汗燃脂;以抓宠为中心玩法的手游《发明吧!咱们的星球》以图片模型操练技能构建与玩家的互动,供给“成为星球远航者”、“张狂啾啾城”等轻量AI组成玩法。
在养老范畴,腾讯则聚集老年人安全、健康等痛点问题探究科技处理计划,经过公益赋能、计划共创的形式,联合生态同伴一起探究出隐形护理员AI关照摄像头、天籁inside助听器、银发听力健康小程序等才智助老产品,让参观者深化体会到科技带给银发人群的实在协助和关心。

合合信息
本次合合信息展现的文档解析技能是支撑大模型语料操练的要害技能之一,面临着从海量文档中高效提炼“才智燃料”的艰巨任务。合合信息的文档解析引擎具有强壮的“动能”,最快1.5秒可解析百页长文档中的文本、表格、图画等非结构化数据,也是当时市面上同类文档解析引擎中处理速度最快的产品之一;一起,引擎还具有优异的文档“了解力”,可智能复原文档阅览次序,加快了模型在预操练、开发、运用落地等多方面的流程。
在文档解析范畴中,针对图表类资料的辨认、内容了解是大都大模型亟待处理的妨碍,合合信息大模型“加快器”则打通了这一堵点:引擎可以深度“洞悉”图表内容,对研报、论文等文档中的柱状图、折线图、饼图、雷达图等十余种常见图表进行“复原”,奇妙转化大模型可以了解的markdown格局,使数据和图表的价值潜能充沛开释。
在文档解析引擎的协助下,大模型可以直接获取图表原始的结构化数据,高效地学习了解商业研报和学术论文等专业文档中的证明逻辑,提高言语了解、数据处理、常识推理剖析的功率和准确性,满意更高价值的金融和学术等运用场景的需求。
百川智能
展会现场,百川智能展现了其一年多时间里大模型的研制开展。建立以来,百川智能先后发布了Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型,以及Baichuan2-192K、Baichuan-NPC、Baichuan 4等7款闭源大模型。此外,还与国家级研究机构鹏城实验室一起发布了128K长窗口大模型“鹏城-百川·脑际33B”,模型研制速度抢先职业水平。
本次展会上也带来了其通用医疗增强壮模型和AI医疗运用的最新打破。百川智能的通用医疗增强壮模型不只在USMLE(美国医考)的评测中逾越了GPT-4,而且在由医师(协和、北医等头部三甲高年资主任、主治医师)和心理学专家作为评测主体,对模型进行多视点评测的实在人工评测中,相同逾越了GPT-4。
在此根底上,百川智能研制了一款全新的AI医疗运用——AI健康参谋,AI健康参谋依托百川智能的通用医疗增强壮模型打造,不只具有丰厚的医药学常识,而且还具有医师思维。它可以像从业多年的全科医师相同,在用户提出问询之后,依据用户的问题继续发问,从更多维度更深化地了解症状,收集到满意多病症信息后再进行归纳判别,给出确诊效果和用药主张。比方,用户问AI健康参谋“我肚子疼,该怎么办?”,收到问题之后,AI健康参谋会相继向用户提出,“是否有吐逆、厌恶、腹泻等其他的症状?是否发烧?肚子疼的具体位置?”等多个视点的问题,最终依据用户的答复归纳判别病因,给出医治主张。

科大讯飞
本次大会,科大讯飞带来了新近推出的依据全国产算力渠道“飞星一号”操练的全民敞开大模型——讯飞星火V4.0。讯飞星火V4.0七大中心才能全面提高,全面临标GPT-4 Turbo。
值得一提的是,本次科大讯飞还展现了大模型助力企业数字化转型的处理计划——星火企业智能体渠道。星火企业智能体渠道的“任务链”功用自动链接外部威望信源,“常识库”功用自动链接企业内部常识体系,打通表里信息距离,为企业出产经营快速精准找到要害信息,活络触达大模型企业落地“最终一公里”。
用户只需在星火企业智能体渠道上“拖拖拽拽”,或许直接用语音操控,以零代码、低代码的方法就能完结企业场景运用开发,装备出各种专业功用的智能体,每一个岗位都可以快速装备特定功用模块的AI岗位帮手,每一个人都可以界说自己的AI个人帮手,大幅下降企业研制本钱。

特斯拉
特斯拉在本年的 WAIC展现了其赛博越野游览车、Optimus人形机器人、FSD(彻底自动驾驭才能)最新效果等。
赛博越野游览车是国际上第一款选用48V低压架构的车,改造了职业沿袭七十多年的传统架构,大幅提高了车辆全体的能效体现,为更多智能化功用的布置拓宽了空间。它也是首款选用线控转向的量产车型,即彻底用电能完结转向,完结更安全活络的转向操控。
赛博越野游览车巩固的外骨骼,经得住外部洼陷、损坏和腐蚀的检测,48V技能使得车辆可以搭载线控转向和后轮转向技能,避免了机械结构的磨损。作为一辆电动越野车,它具有近5吨的牵引才能(适当于一头非洲象的均匀体重),最大载荷1134千克(适当于一头成年野牛)。
依据大规划行进路程、自研运算渠道、巨大算力的深度布局,搭载HW4.0的特斯拉FSD彻底自动驾驭继续晋级迭代,已进入V12.4阶段,可以对适当杂乱的路况做出灵敏准确的反响。特斯拉2024年第一季度安全陈述显现,运用Autopilot自动辅佐驾驭体系的特斯拉,让行车安全到达美国均匀水平的11.4倍。与此一起,特斯拉正将高效推理核算机技能引进电动车中,并将在未来的Optimus人形机器人项目中进一步运用。

值得一提的是,本次特斯来带来的是新一代Optimus人形机器人,虽然未在会场进举动态展现,但据介绍,该机器人将可以凭仗视觉神经网络和FSD芯片协助人类进行一些工业出产操作。特斯拉估计将于下一年开端定量出产人形机器人,并将有超越1000个Optimus在特斯拉工厂协助人类完结出产任务。
商汤科技
在本次大会上,商汤科技带来了首个面向C端用户的可控人物视频生成大模型——Vimi。Vimi依据商汤日日新大模型的强壮才能,仅经过一张恣意风格的相片就能生成和方针动作共同的人物类视频,并支撑多种驱动方法,可经过已有人物视频、动画、声响、文字等多种元素进行驱动。
才智医疗方面一直是商汤重视的要点,商汤医疗全面打造了大模型驱动的数智化病理科全体处理计划,串联切片数字化扫描、高性能阅片、AI智能辅佐确诊、数据存储等病理才智化确诊全流程,可适配很多品牌扫描仪及存储设备,完结千人并发秒级无卡顿调阅,一起大模型支撑百余种临床辅佐确诊任务,满意多院区病理智能剖析需求,敞开大模型赋能下的病理确诊“新纪元”。
针对临床治疗范畴,商汤医疗为医院供给一站式智能印象剖析,完结掩盖诊、疗、愈全流程的AI辅佐。除了医疗AI运用模块扩容至近30款外,选用立异的“通专交融”途径,充沛发掘医疗大模型的智能调度才能,统筹调用掩盖CT印象、MR印象、DR印象、病理图画等多种数据模态的AI辅佐模型及智能东西,然后打破单一模态的约束,供给愈加丰厚的交互才能,协助医师进一步提高确诊的准确性和功率。
跟着新能源车工业的开展,自动驾驭日益遭到重视。DriveAGI是商汤绝影研制的首个运用于驾驭决议计划规划的智驾大模型,由多模态大模型支撑的下一代自动驾驭技能。DriveAGI可充沛增强端到端智驾计划的可解说性,不只让车辆可以更像人相同了解杂乱的实际国际,洞悉各类交通参加者的行为动机,快速学习各种交通规则,把握瞬息万变的路途信息,还能向用户解说驾驭决议计划的推理进程。DriveAGI还提高了端到端智驾计划的交互性,用户不只可以经过问询让自动驾驭体系解说自己的决议计划进程,还能经过语音或手势指令来操控自动驾驭行为。

猿力科技
猿力科技于本年5月经过大模型存案后,初次经过WAIC展现其自研大模型支撑的教育产品“全家桶”,其间包含飞象星球、猿编程、小猿学练机、海豚AI学等国内教育服务产品,及旗下两款AI教育出海产品CheckMath、LeapMath。
从展会现场了解到,猿力科技大模型技能已掩盖对话教导、白话陪练、阅览了解等面向家长教育端的运用场景,以及作业修改、学情剖析、答疑教导等服务于政府和校园端的教育运用场景。
海豚AI学所展现的“AI答疑功用”与“超时空对话AI名人”在展会现场引发围观。AI答疑再晋级,区别学练场景。学习环节新增视频AI答疑,运用多模态技能,学生可以与视频内容实时问答。操练环节,选用苏格拉底启发式AI答疑,首要运用于数学和物理习题解析场景,多轮问答引导孩子自动考虑、把握原理。
小猿学练机本次展出了与大语文场景深度交融的“AI伴读大模型”与“AI百科大模型”,其间,“AI伴读大模型”可就阅览内容与学习者打开深度互动,完结自动阅览、自动考虑,然后提高深度表达、了解和写作才能。
展会现场还露脸了此次WAIC上为数不多的规划东西类产品“Motiff妙多”。面临观众随机提出的需求,Motiff妙多给观众们展现了一系列AI生成UI的内容。“创立一个欧洲杯直播App界面,要有实时谈论区域,主题色彩是绿色。”输入这段描绘性指令,不到一分钟,Motiff妙多就生成了一版规划稿。进一步输入更多指令后,还可以生成赛事预告、小组比分、最佳射手、最佳助攻等界面,和当下抢手的体育类App别无二致。除此之外,Motiff妙多还给观众展现了生成餐饮、金融、媒体、交际等不同职业、不同类型的App规划稿,生成的规划稿还可在Motiff妙多的编辑器中不断调整优化,直至定稿。

岩芯数智 RockAI
RockAI此次在WAIC初次展现自家Yan 1.2大模型,据悉,该大模型可以“原生无损”地以6+tokens/s的速度运转于算力仅一般电脑八分之一的树莓派上,并在这个仅有信用卡巨细的芯片上完结超强的多模态才能,不只能“传闻读”,还可以辨认含糊指令,进行学习、创造及互动。
大会现场,研制团队展现了一款布置了Yan1.2多模态大模型的智能机器人小智,它可以依据Yan1.2的语音和视觉处理才能,实时辨认环境、准确了解用户的含糊指令和目的,并据此操控其机械躯体高效完结各类杂乱任务。值得一提的是,此次“小智”机器人搭载的中心硬件是以低算力著称的树莓派第五代芯片。在极低算力的设备上完结了强壮的多模态才能。
比方,小智可以依据“让一让,我要放东西”的含糊指令辨认其目的和举动方向,然后做出相应的躲避动作。当有人问“小智,你现在看到了什么”或手捧书本约请小智一起看书时,它可以依据多模态才能进行学习和创造,准确描绘环境和人物特征、学习书本信息。而关于需求大脑和躯干和谐完结、杂乱程度翻倍的任务,小智的体现相同毫不逊色,如“在四步之内创造出以枫叶为主题的一首古诗”。

除机器人外,此次大会RockAI团队不只展现了Yan1.2的云端运用才能,也向在场观众展现了Yan1.2多模态大模型在树莓派端、手机端、PC端等其他低算力设备上的无损运转才能。
在PC端和手机端,Yan1.2可流畅地履行大规划数据集的自然言语处理任务和杂乱核算,无需依靠云端即可完结快速呼应,完结每秒20+tokens的输出,其Agent联动才能可依据用户指令进行图文辨认、主体创造等多项任务,为用户供给更优质的体会。而在树莓派这样的微型核算机上,Yan模型乃至完结了每秒6-7个tokens的呼应速度。
摩尔线程
本次大会,摩尔线程展现了夸娥集群办理渠道(KUAE Platform),该渠道是摩尔线程大规划GPU核算集群产品可视化办理渠道,是用于Al大模型操练、分布式图形烘托、流媒体处理和科学核算的软硬件一体化渠道,深度集成全功用GPU核算、网络和存储,供给高牢靠、高算力服务。经过该渠道,用户可灵敏办理大都据中心、多集群算力资源,集成多维度运维监控、告警和日志体系,协助智算中心完结运维自动化。
MT AIReality(MT AIR)是摩尔线程自研的新一代的AI烘托渠道,以AI赋能烘托,最大化发挥摩尔线程全功用GPU的图形才能与核算才能。AIR的愿景是大幅下降高质量财物制作门槛与本钱,构建具有相片级、视网膜级、堪比物理国际实在度的实时烘托管线,谋福影视、动画、游戏、乃至元国际等范畴。
九章云极 DataCanvas
本次露脸的DataCanvas Alaya NeW智算操作体系是九章云极面向智算工业的又一AI软件力作。经过算力办理内核、人工智能服务以及内置自研及生态同伴的前沿大模型和智能体,Alaya NeW凭仗多层次算力需求满意、一体化AI服务、原生合适高性能智算、大幅提高算力效能和运用率,以及低门槛、高功率的AI运维等产品优势,成功贯穿智算工业根底硬件根底设施和软件根底设施,然后加快大模型运用的广泛落地。
本次展览中,九章云极展出了DataCanvas Alaya文旅职业大模型和制作职业大模型。DataCanvas Alaya职业大模型产品是DataCanvas Alaya九章元识大模型矩阵的中心成员,依据公司自研的通用大模型,以及高品质、多范畴垂类语料库和图库,DataCanvas Alaya 职业大模型具有丰厚的垂类常识储藏和强壮的逻辑推理才能,可以为广阔职业用户供给愈加精准、丰厚和深化的大模型服务和体会,赋能其加快职业个性化数据的价值转化。
结语
近一年来,通用大模型正飞速开展。业界普遍认为,虽然通用大模型在推进工业开展方面展现出巨大潜力,但在落地进程中仍面临着三个“才能短板”。首要,范畴常识的相对缺少约束了AI模型在特定职业的运用深度。其次,杂乱决议计划的应战标明,AI在处理高度不确定性和多变量决议计划时仍显缺乏。最终,对话交互与有用协同之间存在差异,突显了AI在了解语境、完结真实协同作业方面的前进空间。
面临这些应战,本届大会不只是一个展现最新AI技能效果的渠道,更是一个寻求务实处理计划、推进技能前进的论坛。与会者经过深化沟通和思维磕碰,探究怎么战胜这些短板,促进AI技能的立异和运用,以完结更广泛的社会和经济效益。跟着对生成式人工智能的沉迷逐步曩昔,业界愈加呼喊那些可以实在落地、处理实际问题的AI运用和服务,这正是2024国际人工智能大会所承载的任务与等待。