2023q?span lang="EN-US">3?span lang="EN-US">18日,清华大学?sh)子工程p?span lang="EN-US">?/span>C代h工智能技术发展研讨会(x)暨系友论?span lang="EN-US">?/span>在清华大学罗姆楼三层报告厅顺利D行?span lang="EN-US">14位来自学术界和业界的h工智能领域专家学者、企业代表参加论坛ƈ作主旨报告,320名嘉宄下出席,2万名嘉宾U上参与Q共同就C代h工智能技术发展中的关键技术进行深入探讨,开展行业间互动交流Q展望未来发展趋ѝ无限基?span lang="EN-US">SEE Fund理合伙?rn)、中金资本副ȝ理黄兰、金沙江创投合伙人杜頔康L论坛Q清华大学电(sh)子工E系pML玉致Ƣ迎辞?/span>

汪玉致辞
开q致辞中Q汪玉代表清华大学电(sh)子系对各位领导和专家、校友的到来表示热烈Ƣ迎Q他回溯?jin)校友论坛的发展Q肯定了(jin)校友论坛在集智集力和文化传承中的重要作用。汪玉表C,下一?span lang="EN-US">10q将是中国硬U技发展的黄金时_(d)如何有效地推动中国硬U技的发展成Z待解决的问题。电(sh)子系期望以中国顶U高校的技术ؓ(f)源头Q校友ؓ(f)核心(j)体Q促(j)q学研怺?jin)解Q羃短理Z实践的距,增进技术与资本的交。面对h工智能将深刻地改变生产力、重塑生产关pȝ新时代背景,汪玉表示Q电(sh)子系十四五规划将?span lang="EN-US">?/span>培养世界一研I生?/span>为ȝ标,鼓励研究生面向社?x)提?span lang="EN-US">?/span>真问题”,同时集社?x)合力,一起培养面向未来具有“器识力”的人才?/span>
C代h工智能技术进?/span>
吴翼 Reinforcement Learning for Humans
清华大学交叉信息学院助理教授吴翼分n?jin)“强化学?fn)”(Reinforcement LearningQ主题下团队的最新研I成果。他用生动诙谐的案例剖析?span lang="EN-US">AI目标与hcȝ标的Ҏ(gu)区别Q指?span lang="EN-US">AI目标是理性的最大化奖励Q而hcȝ标则有时存有׃和感性等因素。吴DC,AI未来的学?fn)目标应?gu)人的不同行ؓ(f)q行反馈q不断调整目标,自己与团队的研究愿景是让AI体实?span lang="EN-US">Adaptive, Communicative, and Human-like embodied。他以游戏和机器人控制下的多个研I案例展CZ(jin)阶段成果Qƈ在最后展望了(jin)AGI技术发展的未来前景?/span>

吴翼作主旨报?/span>
代季?/span> 视觉通用大模?/span>
清华大学?sh)子工程pd教授代季Cl了(jin)“超大规模视觉通用感知模型”的发展挑战和研I现状。在研究q展斚wQ代季峰首先介绍?jin)团队创新的“多模态多dl一预训l”算法,该训l模式首ơ将现有各种预训l算法统一在一个框架中Qƈ实现多模态多dl一预训l,q让训练程z高效,训练q程易于监控q排除故障。随后,他介l了(jin)“超大规模图像主q网l”的研发成果Q它以可变ŞL(fng)的方式取得了(jin)囑փ领域标杆d的最优性能Q打破了(jin)Vision Transformer对视觉大模型的垄断,越包括微Y?span lang="EN-US">Meta、谷歌等机构的视觉大模型。最后,他介l了(jin)多Q务兼容解码网l?span lang="EN-US">Uni-Perceiverpd的发展,q表C未来的研究目标是降?span lang="EN-US">AI模型研发的边际成本?/span>

代季峰做L报告
王井?/span> 癑ֺ文心(j)·CV大模?span lang="EN-US">VIMERQ算法与应用
癑ֺ计算觉首席科学家王井东ȝ?jin)业应用驱动的“视觉大模型”在当下的研I共识、发展挑战、应Ҏ(gu)案与业界应用。他从“自监督视觉表征预训l”方法在q年的发展讲P随后展示?jin)百度基于预训练发展出的诸多业务应用案例Q如燃气行业、能源行业、电(sh)子制造行业大模型、度目h体数据属性分cd自动N长尾数据挖掘{。最后,王井东分享了(jin)文心(j)·CV大模?span lang="EN-US">VIMER的设计逻辑。回过dq深度学?fn)的历程Q他认ؓ(f)ChatGPT的出C(j)使h们重新思考技术创新模式,应从学术端的法创新Q到更多x企业端的产品创新?/span>

王井东做L报告
人工基础底
下午Session 2举行Q来自业界、学界的五位嘉宾围绕?/span>人工基础底?/span>q行分n与讨论?/span>
周伯?/span> ChatGPT & GPT-4与下一代协同交互智?/span>
清华大学?sh)子工程p长聘教授周伯文重点介绍?span lang="EN-US">ChatGPT?span lang="EN-US">GPT-4的核?j)技术,q指出协同交互智能如AI与hcȝ户在推理、知识和价D斚w的对齐在其中的巨大意义。他表示Q我们正面(f)着生成式h工智能的持箋H破Q从而进一步验证了(jin)AI的高价值场景在于更多参?span lang="EN-US">System 2Q逻辑分析pȝQ,而不?span lang="EN-US">System 1Q直觉无意识pȝQ,而最q大模型核心(j)q展也在?span lang="EN-US">AI在这个新范式下和人的协同和交互学?fn)的提升Q而不仅仅是参数量变大?/span>
他重点讲解了(jin)ChatGPT的几Ҏ(gu)?j)技术如In-context learningQ?span lang="EN-US">chain-of-thoughts, ?span lang="EN-US">instruction tuning, 指出大模型底座存在的~陷也从理论上探讨了(jin)大模型涌现能力的隐式贝叶斯解释,q分享了(jin)清华大学协同交互研究中心(j)q展与主要工作,中心(j)?span lang="EN-US">2022q初{徏式及(qing)锁定人机新协同交互、多模态统一表征与融合?span lang="EN-US">AI与环境的协同演化{前L研I课题,q以q些技术方向进一步推动可信赖人工的进展?/span>

周伯文做L报告
李徏?/span> AI新范式下Q?span lang="EN-US">GPU创新M(f)之道
清华大学无线늳校友、登临科技创始人兼执行总裁李徏文从底层g端出发,讲述AI新发展对芯片的挑战与目前的加速解x案?/span>
目前的挑战在于,传统GPU其基架构原ؓ(f)囑Ş加速和高性能计算而设计,针对AI计算存在着计算密度不高Q计效率不高以?qing)对外部带宽依赖太强{问题。此外,传统GPUq存在计成本高、功耗高Q性能不优{问题,已无法满?span lang="EN-US">AI计算对于力的指数增长需求。李建文?span lang="EN-US">AI计算架构核心(j)需求出发,提出GPU+Q基于通用GPU的Y件定义的片内异构体系架构Q结合片上高速内存子pȝQ可最大化发挥g能效Qƈ以其公司pd产品GoldwasserZQ对比国际旗C品,展示?span lang="EN-US">GPU+对大模型计算的显著能效比优势。此外,他强调,大量开源生态的应用开发基设施是在CUDA软g生态上完成的,因此成熟且完备的软g体系对芯片硬件亦十分重要。最后李建文表示Q登临将持箋通过架构创新Q解决生成式AI大模型场景下Q算力品的能效比问题?/span>

李徏文做L报告
黄民?/span> 可控可信可配的对话大模型
清华大学计算机系副教授黄民烈梳理人机交互历史Q概q当?span lang="EN-US">AI体现状。他过往AI发展分ؓ(f)三个阶段Q以规则Z的时代、智能助理时代和大模型、大数据的深度学?fn)时代,q点介l现有功能型AI与拟人型AI?/span>
功能?span lang="EN-US">AI理性,具备机器Q?span lang="EN-US">ChatGPT?span lang="EN-US">Claude是大模型阶段的功能型AI代表Q这c?span lang="EN-US">AI通过Z人类反馈的指令学?fn)、强化学?fn)逐步成ؓ(f)通用型对话助手。而拟人型AI感性,在大模型阶段?span lang="EN-US">Google LaMDA?span lang="EN-US">Meta BlenderZ表。只有将机器q一功能属性与cMhq一人格属性相l合Q才能创?span lang="EN-US">AGI水^的对话智能体。黄民烈?qing)其团队研发?span lang="EN-US">OPD作ؓ(f)拟h?span lang="EN-US">AIQ支持根据用户反馈实时修复模型生成结果中的问题,从而在交互中不断P代改q模型。他ȝ现有大模型特点ؓ(f)架构l一Q参数规模持l增大、数据处理能力不断增强,q认为模型会(x)通过模仿Q不断对齐hcd好和价值取向,最l在多个应用场景中落地?/span>

黄民烈做L报告
刘知q?/span> 大模型值得x的重要特?/span>
清华大学计算机系副教授刘知远从研I角度分享大模型值得x的主要特性,提供更多大模型研I\径。他指出整个AI已经q入大模型时代,预训l?span lang="EN-US">-微调成ؓ(f)最新范式,基础模型已经在多个领域发挥作用。与此前相比Q大模型最大的区别是它通过自监督学?fn)实C(jin)面向大规模无标注数据的深度学?fn)?/span>
刘知q表C,验证?jin)“更多数据、更多智能”原则适用性的Chat-GPTQ只是这条新路径的v点,未来创新不必锚定GPT-4。他认ؓ(f)大模型仍有值得q一步开发的Ҏ(gu),q主要有三点Q大模型微调难、计复杂度高与应用模式受限、大模型无法利用外部复杂工具且生成信息缺乏依据。刘知远认ؓ(f)大模型的强大通用性其有望成为智能时代基设施Qƈ介绍?jin)其团队?span lang="EN-US">OpenBMB开源社区,q一C能支持中型企业、团队更好地利用大模型?/span>

刘知q做L报告
陈维?/span> 高性能GPU赋能产业?/span>
清华大学集成?sh)\pL友、沐曦集成电(sh)路创始h陈维良从GPU产业出发Q指出随着技术、计Ş式和时代变化Q算力需求与供给的矛盾越发突出,而高性能GPU赋?span lang="EN-US">AI发展?/span>
陈维良将CPU?span lang="EN-US">GPUq行Ҏ(gu)Q指?span lang="EN-US">GPU以其强大的ƈ行数据计能力成为通用计算力基础。他指出GPU的演q主要靠实际应用推动Q其架构变迁通常是ؓ(f)?jin)满_际中的需求。其中,l一渲染器是GPU的革命性创斎ͼ其体pȝ构从固定水UŞ式演变ؓ(f)可编E的q行计算机制Q能Ҏ(gu)令、纹理、数据精度等各方面提供更完善的支持。他Q高性能GPU是大模型的算力支撑,业界在做芯片的同时要x芯片的Y件生态和兼容性,国芯片惌取得q展Q需要从?/span>能用?/span>走到?/span>好用?/span>?span lang="EN-US">?/span>易用?/span>QYg协同设计、低q移成本和高兼容性都是未来需要努力的方向?/span>

陈维良做L报告
圆桌论坛 人工基础底
分n之外Q嘉宾们围绕“h工智能基底”ؓ(f)主题q行圆桌讨论Q针对“如何在自n领域开展h机协同这一问题”发表看法,q回应了(jin)当下q轻一代对大模型流行取代个体的担忧。M而言Q?span lang="EN-US">AI时代下,人应当更U极地进行反思、直面挑战,发掘自我价g的创造性,发挥自n不可被替代的优势?/span>

“h工智能基底”圆桌讨论,刘知q(?span lang="EN-US">2Q、李建文Q左3Q、黄民烈Q右2Q、陈l良Q右1Q?/span>
变革中的人工应用
Session 3 嘉宾们围l?span lang="EN-US">?/span>变革中的人工应用?/span>主题q行分n?/span>
杨帆 AI 2.0 —?/span>大模型带来的新时代浪?/span>
清华大学?sh)子工程pL友、商汤联合创始h、商汤大装置总裁杨帆重点介绍?jin)h工智能领域的重大U技H破和即引领的C代技术革命内宏V他梳理?span lang="EN-US">AI领域在科学技术、内容生成和自然语言处理三个重要方向的突_(d)(x)U学技术领域包括生物与生命U学、等d体物理、材料分子模拟和药物研发{进步;AI内容生成?span lang="EN-US">AIGC领域Q主要与l画、泛׃和医疗相l合Q自然语a处理工具目前?span lang="EN-US">Chat-GPT最为出名,可以和在U社交、传媒、医疗等领域融合发展?/span>
杨帆认ؓ(f)Q?span lang="EN-US">AI技术不断P代的背后是大模型、大力和大数据的支持,?span lang="EN-US">AI技术的不断发展也对力{h工智能基设施产生?jin)更多的需求。他介绍?jin)商?span lang="EN-US">Sense Core大装|?span lang="EN-US">AI云及(qing)AI开发^C品,q表C未来h工智能生产范式将q来重大转变Q从传统软g模型时代{变ؓ(f)大模型时代,也将?x)颠覆既有行业的发展逻辑Q触发新的商业变革,AI产业也将q来一个更J荣?span lang="EN-US">?/span>大航h?span lang="EN-US">?/span>?/span>

杨帆做主旨报?/span>
张鹏 预训l大模型Q生成式AI时代的基?/span>
清华大学计算机科学与技术系校友、智?span lang="EN-US">AI CEO张鹏从大模型背景出发Q他介绍预训l大模型是新一代h工智能应用的基础设施Q其通用能力强ƈ正在向多模态发展,已成为各国h工智能技术新方向Q因此我们亟需建立以中文ؓ(f)核心(j)的超大规模预训练模型?/span>
他进一步以ChatGPT背后的技术演变ؓ(f)立点,分析?jin)千亿大模型的普惠性难题和面(f)的种U挑战,q介l了(jin)AI GLMpd模型的新成员—?/span>中英双语对话模型 ChatGLM-6BQ可以进行多轮问{、文字冒险游戏甚臛_作剧本杀剧本。此外,AI也推Z(jin)认知大模型^?span lang="EN-US">Bigmodel.aiQŞ?span lang="EN-US">AIGC产品矩阵Q包括高效率代码模型CodeGeeX、高_ֺ文图生成模型CogView{,提供API服务。通过认知大模型链接物理世界的亿用户、赋能元宇宙数字人、成为具w机器h的基座。最后,他认为大模型的智能涌C未看到极限,如果要让机器像h一h考,人工q有无限的发展可能?/span>

张鹏做主旨报?/span>
李力?/span> AIGC for Code
北京心(j)U技有限公司Q?span lang="EN-US">aiXcoderQ?span lang="EN-US">COO李力行介l,aiXcoder是一Ƒ֟于深度学?fn)模型的~程机器人,其主要内容包括两个方面:(x)代码和意图。当l代码分析意图时Q这个过E就是程序理解;当意囑֏以自动生成代码辅助时Q这个过E就是代码自动生成。ؓ(f)?jin)解册两个问题Q团队更多基于采用深度神l网l的技术,通过构徏专门针对代码的深度模型,l过大量与代码数据学?fn)的训练Q最l解军_软g开发中的各U子d。李力行介绍Q他所在的团队是最早介入程序分析和E序生成领域的团队,在开创性的工作后,团队一直保持对代码生成和代码理解方向的聚焦Q尝试探索更多的子Q务和q一步的产业实践?/span>
在研I和探烦(ch)外,团队也一直坚持整套技术的产品化,最新的模型可以Ҏ(gu)自然语言描述自动生成完整Ҏ(gu)代码Q还可以自动l合、裁剪已学习(fn)的代码来匚wl定需求。最后,他抛Z(jin)一个问题:(x)模型大好吗?Ҏ(gu)团队实践Q李力行认ؓ(f)Q从本质来说Q代码和自然语言的差距决定了(jin)现在q很Ơ缺针对代码的深度学?fn)模型?/span>

李力行做L报告
胡一?/span> 大语a模型如何重塑数字化劳动力
清华大学?sh)子工程pL友、来也科技联合创始人兼CTO胡一川从数字化劳动力入手Q分析了(jin)大语a模型对培L字员工能力的作用。他认ؓ(f)Q因为工厂自动化E度q高于办公室自动化程度,而且适龄力_力h口持l下降,?jng)场?gu)字化力_力的需求也愈发紧迫。数字化力_力主要依托新型技术来完成企业对前端用户及(qing)内部员工的服务优化,以及(qing)中后台运营协同作业等d?/span>
传统力_力与数字化劳动力相结合,可ؓ(f)企业建立“智能员工队伍”,通过U技赋能传统力_力提高生产效率,降低q营成本Qƈ优化员工体验。他q一步介l了(jin)来也U技的数字化力_力^収ͼq表C大语言模型提供的通用的语a理解和生成能力和自然的hZ互方式都可以帮助数字化劳动力q_的徏设,也将培养出更力的数字员工q简化其开发过E。他认ؓ(f)Q未来大语言模型?x)重塑数字化力_力的挑战Q达到每个Y仉具备对话能力、每个h都拥有数字员工的愿景?/span>

胡一川做L报告
陈徏?/span> Building Humanoid General Intelligent Robots
清华大学交叉信息研究院(IIISQ助理教授陈建宇分n?jin)构Zh形通用机器人的愿景与技术,他指出,人Ş机器人在g和Y件上都是最复杂的机器hQ创造它也是机器Z家和全hcȝ梦想。h形机器h能完适应人类C会(x)与环境,拥有无限的应用潜力,未来也会(x)定义新的商业生态?/span>
他介l了(jin)团队所研发的高性能、低成本人Ş机器人硬件本体,以及(qing)Z强化学习(fn)的h形机器h控制法。通过l合强化学习(fn)以及(qing)人类q动数据Qh形机器h能先在仿真中实现快速奔跑、拟人步态行走、崎岖\面穿行等各种h挑战性的dQƈ最l实C模拟到真实世界的q移?/span>

陈徏宇做L报告
圆桌论坛 变革中的人工应用
分n之外Q嘉宾们围绕“变革中的h工智能应用”ؓ(f)主题q行圆桌讨论Q针对“h工智能应用如何在演进变革中的技术浪潮中扑ֈ深层发展的策略”、“初创企业在当下应该如何把握Z(x)推出创新”、?span lang="EN-US">GPT-4时代我们应该做教?span lang="EN-US">?/span>{问题,各自发表见解?/span>

“变革中的h工智能应用”圆桌讨论,杨帆Q左2Q、张鹏(?span lang="EN-US">3Q、李戈(?span lang="EN-US">3Q、胡一川(?span lang="EN-US">2Q、陈建宇Q右1Q?/span>

论坛合媄(jing)