微信分享
GOPS全球运维大会暨XOps技术创新峰会 · 北京站

使用微信扫一扫分享到朋友圈

活动详情

GOPS 全球运维大会暨 XOps 技术创新峰会由高效运维社区(GreatOPS)和 DevOps 时代社区联合主办,指导单位为 DAOPS 基金会、开放运维联盟(OOPSA)。GOPS  大会是国内第一个运维行业大会,面向互联网、金融、通信及传统行业广大运维技术人员,旨在传播先进技术思想和理念,分享业内最佳实践。


迄今为止,GOPS 已经举行了二十二次,大会参会嘉宾累计突破8万人次,国内每一站均为本地区最大规模的高端运维盛会,满意度和推荐度高达97%以上。第二十三届 GOPS 全球运维大会暨 XOps 技术创新峰会将于2024年6月28-29日在北京市朝阳区望京昆泰酒店(朝阳区望京启阳路2号)召开。大会将为期2天,侧重大模型研发与运维、平台工程、可观测、信创运维、XOps、持续测试、SRE、云原生等热门技术领域。特设了如大模型+运维、银行数字化转型、平台工程、AIOps 最佳实践、互联网名企等特色专场。


GOPS 大会主要面向运维行业的中高端技术人员,包括运维、开发、测试、架构师等群体。目的在于帮助 IT 技术从业者系统学习了解相关知识体系,让创新技术推动社会进步。您将会看到国内外知名企业的相关技术案例,也能与国内顶尖的技术专家探讨技术实践,使企业可以根据最佳实践确定自己的选型方案,并提前预估相关的风险和收益,实现技术落地。


大客门票:刘    欣  15801115386   (微信同号)(联通、移动、电信、平安集团、华为、腾讯、阿里、百度等)


商务赞助:周   静   130 7118 2180 (微信同号)               任   怡   132 6958 7068(微信同号) 

门票咨询:刘毅菲   130 2108 2989(微信同号)               高   维   132 6188 5689(微信同号)

议题申报:李向伟   175 3519 6935(微信同号)               刘   杰   156 5212 7323(微信同号)




荣誉顾问—大会顾问团—大会主席团

WechatIMG17.jpg


五大亮点

WechatIMG39.jpg


专场规划

WechatIMG3180.jpg


精彩议题


北京站日程-对外6.24xlsx_Sheet1 (1).png


演讲嘉宾
  • 闵 栋
    中国信息通信研究院
    云计算与大数据研究所 副所长
    演讲主题: 领导致辞
    个人简介: 闵 栋,互联网医疗健康产业联盟副秘书长、中国互联网协会互联网医疗健康工作委员会秘书长、国家卫生健康委健康促进与教育委员会委员、国际电信联盟(ITU)健康医疗人工智能焦点组(FG-AI4H)副主席、人工智能医疗器械创新合作平台检测技术组组长、中国卫生信息学会远程医疗专委会常务理事。 多年从事互联网医疗健康、医学人工智能、生物医药工业互联网等领域研究,主持与参与多个数字健康领域国家重大科技专项、国家863项目等,多次参与工业和信息化部、国家卫生健康委、国家发改委、科技部、中央网信办等领域政策支撑,负责或参与十余项国家/行业标准的制定工作,在国内外期刊发表论文30余篇,申请专利多项。 (主持与参与多个国家重大科技专项、国家863项目等,多次参与工业和信息化部、国家卫生计生委、国家发改委、科技部、网信办等领域政策支撑,负责或参与十余项国家/行业标准的制定工作,在国内外期刊发表论文30余篇,申请专利4项。并在多个行业组织担任重要职位:中国互联网协会互联网互联医疗健康委员会秘书长,互联网医疗健康产业联盟副秘书长,国家卫生计生委健康促进与教育委员会委员,中国卫生信息学会远程医疗专委会常务理事,中国通信标准化协会TC11 业务平台与应用组组长,移动智能终端技术创新与产业联盟应用创新组组长,人工智能医疗器械创新合作平台测评技术工作组组长等。)
  • 牛晓玲
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部副主任
    演讲主题:组织级数字化新动能—国际 DevOps 标准体系助力企业走向全球
    个人简介:牛晓玲,DevOps 标准工作组组长,DevOps 国际标准编辑人。长期从事云计算研究的相关工作,包括云服务业务功能测试以及运维管理系统审查等相关工作。参与编写《云计算服务协议参考框架》、《对象存储》、《云数据库》、《研发运营一体化能力成熟度模型》系列标准、《云计算运维智能化通用评估方法》等多个云服务评估方法标准20余项。
  • 高蕊
    中信银行
    软件开发中心 测试管理板块 板主
    演讲主题: 中信银行数字化测试质量总控舱实践之路
    议题简介:中信银行从全局视角构建测试全过程质量画像,基于“五跃天” AI 智能业务解析及数字化质量管控平台,全新打造形成金融业测试阶段质量总控舱,通过“看得到”——最大化透视能触达的一切质控要素、和“控得住”——全过程无死角数字化客观精准机控这两大策略,切实有效提高了投产版本交付的信心、打消了对新人潜在质量隐患的担心、扫除了近千人团队实际测试执行与否的忧心,为全行企业级高质量高效率业务交付保驾护航,为建设质量强国添砖加瓦。
    演讲提纲:
    1、透视质控全过程
    2、建立数字化测试质量总控舱
    3、强化数字化建设
    听众收益:
    1、深入理解中信银行打造测试质量总控舱的核心战略及具体实施路径;
    2、学习借鉴中信银行数智化质控的关键步骤及最佳实践。
    个人简介: 高蕊,中信银行软件开发中心测试管理板块 板主
    中信银行用户体验、业务测试创始人,资深质控专家
    工信部互联网高级工程师;金融业软件测试框架研究编委会专家;
    Ai Testing 本地化编委会专家;中国金融学会金融科技首批专业委员会专家。
    曾发明100余项相关创新专利,多次荣获人行科技进步奖,“五跃天”曾荣获中信集团科技创新奖、中国银行业数字化转型优秀案例等多个部级奖项。
    曾发表多篇科技类论文,多次荣登《中国金融》专刊、《中国金融电脑》、《金融电子化》等专业期刊。
    多次在 TID、TOP100、DevOps、CIO 峰会等行业峰会发表主题演讲。
  • 曹峰
    中国信息通信研究院
    人工智能研究中心
    平台与工程化部主任
    演讲主题: 人工智能 x 工程化的趋势与思考
    个人简介:曹峰,中国信息通信研究院云计算与大数据研究所人工智能部副主任(主持工作),中国人工智能产业发展联盟评估工作组组长,南京新一代人工智能研究院有限公司 CEO,RPA 产业推进方阵常务副理事长。长期支撑工业和信息化部,发改委,网信办等部委,曾参与《关于数据中心建设布局的指导意见》、《关于促进云计算创新发展培育信息产业新业态的意见》、《关于规范云服务市场经营行为的通知》、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》等国家政策、方案和产业报告的起草、制定和推动落实,支撑AIIA新一代人工智能产业创新重点任务重点企业评审和推荐工作。 目前主要从事人工智能公共服务平台和评估评测能力建设,标准体系研究,深度学习计算服务平台等评估规范制定与评测,政府和产业重大咨询项目等,牵头中国人工智能产业发展联盟评估体系建设工作。
  • 王一男
    腾讯 研发效能技术产品专家
    智能化软件工程数据与评测团队负责人
    演讲主题:评测驱动代码大模型“码力”提升
    议题简介:代码大模型是 Copilot 等代码智能化产品的核心“大脑”。模型“码力”的强弱直接关系到产品能力和市场竞争力。如今开源和企业内部训练的代码大模型种类和数量越来越多,能力也越来越强,如何给代码智能化产品选择合适且优秀的模型,并持续迭代模型使产品能力越来越强,这成为了代码智能化产品重点解决的问题之一。如何全面、准确、快速评测各个模型的代码能力,并通过评测准确反馈、推动下一轮模型迭代?是各个代码智能化产品团队都在探索实践的问题。
    演讲提纲:
    1. 代码大模型评测方法介绍
    2. 代码能力评测数据集制作流程
    3. 代码大模型评测反馈闭环实践
    听众收益:
    1. 了解企业内代码大模型评测方法与评测数据集的建设经验
    2. 了解当前代码大模型评测的难点与解决方案
    3. 了解当前代码大模型评测的局限及突破方向
    个人简介:王一男,腾讯研发效能技术产品专家,智能化软件工程数据与评测团队负责人。曾任百度工程效能部产品负责人,开源中国产品总监。北京航空航天大学软件工程本科、硕士。致力于通过设计软件研发效率工具,推动软件工程实践落地来提升组织的研发效能。曾主笔制定企业软件工程规范,主导多个企业级研发效能平台的规划设计与系统开发。
  • 王植萌
    去哪儿网
    技术高级总监 基础架构团队负责人
    技术委员会主席
    演讲主题:面向故障场景的稳定性建设
    议题简介:2023年,去哪儿网的稳定性做到了一个很高的水平,故障率达到了0.14%,进入到了一个故障很少的状态 ,但是我们仍能从24年出现的极少的故障中获得启示,看到稳定性建设未来发展的方向。在本次分享中,我将通过去哪儿网2024年上半年的3个故障案例,从故障定责和改进思路的角度说明24年稳定性建设的思路和落地实践。
    演讲提纲:
    1.发布故障的定责思路变化-平台工程的演进思路
    2.对你的外部依赖可以放心嘛?不易察觉的维护力度对齐
    3.基础设施有那么稳健嘛?需要怎样维护好基础设施
    听众收益:
    1.去哪儿网在故障治理水平已经很好的情况下遇到的新问题,听众可以代入式的一起思考
    2.新问题在去哪儿网的解决方案
    个人简介:王植萌,去哪儿网 技术高级总监/基础架构团队负责人/技术委员会主席目前专注于业务系统及技术基建的稳定性建设以及 AI 研发流程赋能。
  • 辛新
    中国邮政储蓄银行
    软件研发中心 副处长
    演讲主题: 自动化测试的智能化转型探索与实践
    议题简介:邮储银行近年来持续加大在信息科技领域的投入,深入推进智慧、平台、体验、生态和数字化“加速度”科技战略实施。邮储银行软件研发中心测试团队结合数字化转型带来的机遇与挑战,自主编制形成“星光计划”(STARS),作为测试工作的总体规划,并基于星光计划打造了一体协同的测试中台——“星辰平台”。“金牛座自动化测试系统”作为“星辰平台”的重要组成部分,承担着提质增效的责任,致力于自动化测试的数智化转型,包括自动化测试平台提升、自动化测试过程改进、自动化测试效能度量、大模型的应用落地等。
    演讲提纲:
    1、邮储银行自动化测试发展历程
    2、自动化测试效能度量模型
    3、自动化测试的智能化实践
    听众收益:
    1、了解邮储银行自动化测试智能化转型的实践成果
    2、共同探索大模型、图像处理等技术在自动化测试领域的应用
    个人简介: 辛新,资深测试专家,现任中国邮政储蓄银行软件研发中心测试处副处长,星辰平台金牛座自动化测试系统项目负责人,主导中心自动化测试体系和能力建设。曾任 IBM 中国研发中心测试架构师、PICC 信息技术部车险条线测试负责人,从技术实践到团队管理,深耕自动化测试十余年。
  • 赵邦欧
    中信银行
    软件开发中心 处长
    演讲主题:中信银行“懂你”设计体系
    听众收益:
    1、了解银行业用户体验的发展现状,痛点问题及未来发展趋势
    2、了解股份制银行在体系化解决整体体验问题的建设情况
    3、共同学习探索行业,体验工作模式思路
  • 闫鑫
    中信银行
    软件开发中心 处长
    演讲主题:为质量护航:中信银行“云上”测试环境保障
    听众收益:
    1、DevOps 体系下测试环境建设的历程—动态中的稳定
    2、基于云化、AI 大模型重塑测试环境的实践;
    个人简介:闫鑫,中信银行软件开发中心测试管理域 CTO ,深耕测试领域10余年,负责过多个大型测试项目实施。作为中信 DevOps 建设者,借助工具化平台化沉淀测试能力与解决方案,为交付质量保驾护航。现负责全面测试管理、测试环境运维、测试保障、测试数字化研发工作。
  • 吴志刚
    中信银行
    软件开发中心 处长
    演讲主题:中信银行客户接入服务数字化转型实践
    演讲提纲:
    1、客户接入服务的痛点和难点
    2、信联客户接入服务体系数字化建设及运营实践
    3、大模型/AIGC 技术客户接入服务应用实例
    听众收益:
    1、了解中信银行数字化信联客户接入服务体系发展现状及运营实践
    2、了解大模型、AIGC 在客户接入服务的应用实践
    个人简介:吴志刚,资深测试专家,曾担任中信银行新核心、凌云等多个大型项目系统测试负责人,获得人行科技发展二等奖,历任中信银行系统测试处处长、业务测试处处长,现任软件开发中心业务测试域 CTO。
  • 刘光宇
    中信银行
    软件开发中心 副处长
    演讲主题:中信银行软件全生命周期的性能保障体系实践
    议题简介:介绍中信银行非功能保障管控体系建立的背景,建设过程,体系在软件全生命周期(需求-设计-开发-测试-投产运维)的每个阶段是如何工作和发挥管控作用的,获得的价值,并穿插中信银行的实际项目案例进行分享,以及对未来发展的规划和思考。
    演讲提纲:
    1、中信银行非功能管控体系的由来(背景);
    2、中信银行非功能管控体系建设过程;
    3、中信银行非功能管控体系工作机制;
    4、中信银行非功能管控体系价值;
    5、未来发展思考和探索;
    听众收益:
    1、了解股份制银行非功能质量的发展现状及未来发展趋势;
    2、了解非功能管控体系在软件生命周期中发挥的作用及价值;
    3、共同学习探索行业,垂直领域质量保障的建设思路
    个人简介: 刘光宇 ,本科毕业于北京邮电大学市场营销专业,先后在神州数码公司及中信银行总行任职。2013年进入中信银行总行工作至今,现任中信银行总行软件开发中心业务测试处副处长,主要负责非功能测试及质量保障工作。2023年被中国信通院稳定性保障实验室评为银行业系统稳定性行业专家;共获得专利9项(第一发明人2项,非第一发明人专利7项);《软件测试技术趋势白皮书》性能测试技术发展趋势章节作者,曾多次作为演讲嘉宾在 Qecon,Tid,CSTQB 等大会上分享相关实践经验。
  • 张希婷
    中信银行
    软件开发中心 副处长
    演讲主题:中信银行“五跃天”数字化质控平台
    议题收益:
    1、了解中信银行“五跃天”质控体系实践破局思路
    2、了解中信银行基于MBT测试的实施成果
    个人简介:张希婷,研究生毕业于中国人民大学软件工程专业,先后在阿里等企业工作,十余年质量体系建设、自动化测试等方面经验,现任中信银行总行软件开发中心系统测试处副处长。
    曾发明20余项测试相关专利,担任“五跃天”数字化质控平台项目实施负责人,荣获2021年中国银行业数字化转型优秀案例奖,2021年中信集团科学技术二等奖、2021年人行金融科技发展奖三等奖等。曾多次在Tid、TOP100、BDIE、精益软件工程大会等行业峰会发表主题演讲
  • 蔡兵克
    中国工商银行
    软件开发中心 高级经理
    演讲主题: 攻防相长,工行 DevSecOps 探索与实践
    议题简介:习近平总书记在“引领网信事业发展的思想指南”中强调,没有网络安全就没有国家安全。金融、能源、电力、通讯、交通等领域的关键信息基础设施是社会运转的神经中枢、是网络安全的重中之重,软件安全的探索与实践正是全面贯彻落实总体国家安全观,更好统筹发展和安全的具体体现。DevSecOps 则是软件安全探索与实践的文化内涵。
    DevSecOps 不是特定的工具或流程,是一种文化,是 IT 团队、安全专家和其他所有参与软件交付的人员都须维护共同价值观,即软件安全应该是重中之重,在作出任何与应用相关的决定之前都应该考虑安全问题。
    工行 DevSecOps 探索与实践将与同业分享软件安全体系演化过程、工行在软件安全能力建设方面的思路、探索和实践,探讨在 AI 时代科技创新为软件安全带来的风险与挑战以及 AI 赋能软件安全的展望。
    演讲提纲:
    1、行业软件安全体系演化
    2、工行软件安全能力建设
    3、工行 DevSecOps 探索与实践
    4、工行 DevSecOps 展望
    听众收益:
    1、了解行业软件安全体系建设演化过程
    2、工行在软件安全能力建设的思路与实践成效
    3、共同学习探索在软件安全能力建设方面的思路与最佳实践
    个人简介:蔡兵克,工商银行软件开发中心高级经理,致力软件安全、可观测体系等领域研究与实践,在 DevSecOps、高效运维等方面有丰富的实践经验。作为工行第一代 DevOps 体系及工具链建设者,在 DevSecOps 理论探索到落地过程中发挥核心作用。
  • 胡稳安
    民生银行
    信息科技部
    技术支撑平台研发团队 总监
    演讲主题: 民生银行 BizDevOps 研究与实践
    议题简介:近年来,监管总局、人行等金融管理部门,在数字化转型、金融科技相关的规划和指导意见里,都提到了业技融合、BizDevOps 的重要性。民生银行也一直在参与 BizDevOps 相关行业发展和标准的制定,同时结合民生银行实际情况,理论与实际相结合,探索 BizDevOps 在金融业的落地实践,增强快速响应市场和产品服务开发能力,更好的支撑数字化业务快速发展。
    听众收益:
    1、对 BizDevOps 的理解,落地推广经验以及给企业带来的收益。
    个人简介:胡稳安,中国民生银行信息科技部技术支撑平台研发团队 总监,主要从事云原生、服务治理、DevOps 相关领域的研发工作
  • 魏 巍
    民生银行
    开发安全负责人
    演讲主题: 支撑敏捷研发的数字化开发安全能力建设实践
    议题简介:介绍分享民生银行在支撑敏捷研发过程中的数字化开发安全能力建设实践,包括核心战略、实践路径和应用效果。
    听众收益:
    1、深入理解民生银行在开发安全能力建设方面的核心战略及具体实施路径;
    2、学习借鉴民生银行敏捷开发安全能力建设关键步骤及最佳实践;
    个人简介:魏巍,博士,长期在金融行业从事网络安全领域研究和体系建设工作,在业务安全反欺诈、敏捷研发安全、零信任、网络安全架构规划等方面有丰富的实践经验,所负责项目多次获得人民银行金融科技发展奖,多次参编金融领域安全技术标准和研究报告,拥有国内外发明专利近10个
  • 刘 伟
    民生银行
    数据中台及配置管理负责人
    演讲主题: 民生银行运维数据治理及中台建设探索与实践
    议题简介:随着智能运维、运维大数据分析各类场景的不断深入,数据质量问题逐步凸显,主要体现在数据治理缺乏方法论指导、数据孤岛现象普遍、数据质量难以保证、数据定义及标准不统一消费难、数据服务自助化程度低五个方面,为了未来更好地推进数据中心数字化转型,构建智能高效的数据中心,亟需推动运维数据治理建设,构建完善的运维数据治理体系,不断提升数据质量,为数字化数据中心夯实数据基础。
    听众收益:
    1、深入理解民生银行在运维数据中台方面核心战略及具体实施路径;
    2、学习借鉴民生银行运维数据治理建设思路,以及治理过程中的痛点问题和解决方案。
    个人简介:刘 伟,有12年从事银行科技软件系统设计、开发和管理相关工作经验,负责包括流程平台、配置管理、数据分析、智能运维等项目落地,目前主要负责运维数据治理、运维数据中台、运维数据分析等工作,推动数据中心管理向主动型、预防型转变,提高生产管理的智能化水平。
  • 王 婓
    民生银行
    监控流程经理
    演讲主题: 民生银行监控运营建设
    议题简介:民生银行打造自主+开源的监控体系,保障数据中心关键基础设施稳定运行,实现应用监控、主机监控、云监控、硬件监控、网络监控和机房监控等维度,提供告警报送、异常分析、故障定位等能力,支撑我行业务平稳运行。本次介绍监控配置统一化建设、实施服务化建设、监控可靠性建设和数据场景化建设。
    听众收益:
    1、深入理解民生银行在监控领域核心战略与运营保障;
    2、学习借鉴民生银行在‘监控’运维服务化的关键步骤与最佳实践。
    个人简介:王斐,十年从事监控流程建设、大数据监控运营、开源与国产软件可观测建设,以及项目管理与软件开发。目前就职于民生银行,担任监控流程经理岗,提供面向全行的监控管理规范与实践方案,建设云原生、国产化、大数据的监控一体化平台。
  • 宋 双
    民生银行
    高级质量管理工程师
    演讲主题: 测试资产管理体系建设
    议题简介:随着软件行业的快速发展,测试成为确保软件质量的重要环节,测试资产是测试经验的有效沉淀,是测试知识传承的有效载体,对测试资产的有效管理对于提高测试效率、降低测试成本具有重要意义。
    目的:构建完善、高效的测试资产管理体系,实现测试资产的规范化、标准化管理,将测试资产管理与测试实施过程进行高效融合,实现测试资产实施保鲜,增加测试资产复用率,提升测试工作的整体效能
    听众收益:
    1、学习了解民生银行测试资产管理体系建设工作思路
    2、学习借鉴民生银行测试资产管理体系建设的关键步骤及最佳实践
    个人简介:
    宋双,中国民生银行高级质量管理工程师,10多年银行 信息科技领域工作经验,具有丰富的质量与测试管理实施经验。
  • 吴晟
    Tetrate 创始工程师
    SkyWalking 创始人
    演讲主题:SkyWalking v10 APM 原生数据库发布 与 云原生下复杂部署关系的识别
    议题简介:如今典型的中国现代云原生应用,大多会采样容器+云基础设施+自建服务的混合模式。
    如使用 Java 作为常用语言依托 Spring 构建分布式服务,并采用 docker 容器部署到 AWS EKS 上,并同时依赖 S3,DynamoDB,RDS(MySQL) 样的云上服务,以及自建的 Kafka,MongoDS, Redis 集群。
    这是一个复杂的现代架构体系,从底层的 EC2(Linux),EKS,云服务,分布式应用和依赖的开源/闭源服务,构成一个复杂的拓扑结构。
    这个拓扑结构不仅存在的调用依赖,还存在部署上的上下级依赖。
    在本次分享中,我们会通过 Apache SkyWalking v10 中 layer 以及 service hierarchy 的特性,区分收集到的不同监控源的数据。
    包括传统的探针,最新火热的 ebpf 探针,OpenTelemetry Collector 的 AWS-Distro 分发版本,以及 AWS 自带的 CloudWatch+OTEL 数据管道,构建一套整合多数据源的统计多层次拓扑分析。包括基础设施(EC2)层,EKS 的节点性能以及网络性能,服务性能,服务与 AWS 服务依赖关系等多种视角,一体会的展现复杂的依赖关系,并统一化的管理 SLO 告警。
    同时,在 SkyWalking 专有的 BanyanDB 数据库加持下,可以借助 S3 和 EBS, 进一步优化监控数据的存储效率,保证在支持上百个服务的环境中,消耗依然是可接受的。
    听众收益:
    1、了解在云原生条件下,监控面临的挑战
    2、了解 SkyWalking 提出的新版本和新概念,以及如何使用新概念,更好进行复杂多层次环境下的监控
    3、传统存储的问题和消耗,APM 原生数据的起因、发版和首次发布
    个人简介:吴晟,Tetrate 创始工程师。Apache SkyWalking 创始人,项目 VP 和 PMC (项目管理委员会)成员。Apache 软件基金会首位(2021)中国董事。Apache 孵化器 PMC 成员和孵化器导师。 CoC Asia 筹办人和出品人。KubeCon Program Committee 成员。
  • 刘昭炜
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部 高级业务主管
    演讲主题: 大模型时代下DevOps 加速迈向平台工程的最新思考和研究成果分享
    议题简介:本次演讲将从两个视角进行阐述,一是在平台工程方面,将深入探讨业务价值创造与实现的关键要素,通过构建高效、灵活的平台架构,支撑业务快速创新与发展。二是在大模型加持下,AI+DevOps 的技术趋势愈演愈烈,作为其关键技术承载的平台工程也将发挥更大的作用,本次演讲也将深入解析 AI 赋能下的平台工程化演进新发展、新理念。
    个人简介: 刘昭炜,新加坡南洋理工大学信息管理硕士。从事开发运维方面的相关研究工作,参与编写《研发运营一体化(DevOps)能力成熟度模型》系列标准、《业务研发运营一体化(BizDevOps)模型》等标准。参与多篇白皮书、调查报告等编制工作,包括《中国 DevOps 现状调查报告(2021、2022、2023)》等。参与评估 DevOps 能力成熟度评估超过40个项目,具有丰富的标准编制及评估测试经验。
  • 白瀚雄
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部 业务主管
    演讲主题: 由效及质,以点带面:证券行业研运转型新观察
    议题简介: 介绍证券行业DevOps发展和落地现状,根据最新评估情况说明行业发展趋势及难点,拉通行业建设痛点及问题。讨论DevOps转型之下成本、效率、质量三者的平衡关系,寻找痛难点解决方案,以及新形式下DevOps的价值、可持续性以及演进趋势。
    个人简介: 白瀚雄,中国信通院云大所 审计与治理部业务主管,负责重点行业 DevOps 、持续测试等研运一体化相关标准和自主可控标准的制定和评估工作,参与2022、2023年中国 DevOps 、 AIOps 现状调查报告的编制。
  • 白璐
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部工程师
    演讲主题:
    议题一:降本增效:企业 IT 资源精细化管理实践路径
    议题简介:伴随全球数字经济的高速发展以及企业数字化转型的深入推进,IT 需要最大限度地满足复杂多变的市场环境中企业业务需求,帮助企业在市场上迅速形成竞争优势。一方面,企业 IT 支出持续增加,IT 基础设施资源规模不断扩张,随之而来的管理成本的上升,也增加了企业对 IT 基础资源精细化管理的诉求;另一方面,IT 基础架构也在发生改变,传统数据中心架构、云计算基础架构和超融合基础架构使得企业 IT 基础资源更加多样化。如何保障资源供给效率与弹性,实现 IT 资源共享与按需分配,实现资源效能的最大化是当前企业关注的重点。IT 基础设施资源运营能力成熟度模型建立了一套 IT精细化管理理论体系,从预算、交付、容量、成本等多个维度帮助企业梳理并提升 IT 资源运营能力水平,实现 IT 效能的最大化,进一步助力企业降本提效,促进产业高质量发展。
    演讲提纲:
    1、IT 资源管理背景及现状
    2、IT 资源精细化实践路径
    3、IT 资源精细化运营能力成熟度标准及评估
    听众收益:
    1、了解 IT 资源精细化管理实行业实践现状
    2、深入了解 IT 资源精细化管理的先进实践方法论及《IT 基础资源运营能力成熟度》标准
    3、可参与首批评估并发布

    议题二:大模型技术助力企业 IT 运维智能化升级
    听众收益:
    1、了解大模型技术在企业 IT 运维中的应用和价值
    2、了解国内首个运维大模型标准内容
    3、掌握大模型技术在企业 IT 运维中的实践方法,提升运维效率和质量
    个人简介:白璐,专注于 XOps 研发运营领域研究,包括 DevOps、AIOps 智能运维、FinOps、企业架构治理等多领域,参与编制《中国 AIOps 现状调查报告(2023)》《中国 FinOps 现状调查报告(2023)》,为《智能运维可观测性能力要求》《IT 基础资源运营成熟度模型》《企业架构数字化治理能力成熟度》等标准主要参编人员,具备多年 IT 资源管理、企业数字化管理等领域经验。
  • 武仪
    中国信息通信研究院
    云计算与大数据研究所
    审计与治理部 研究员
    演讲主题:大模型时代下,DevOps 加速迈向平台工程的最新思考和研究成果分享
    议题简介:大模型时代,大型企业正加速落地平台工程,本次分享将围绕平台工程深入探讨业务价值创造与实现的关键要素,通过构建高效、灵活的平台架构,支撑业务快速创新与发展。
    个人简介: 武仪,中国信通院云大所研发运维工作组成员,从事开发运维方面的研究工作,参与编写《研发运营一体化(DevOps)能力成熟度模型》系列标准、《企业信息技术 需求过程管理能力成熟度模型》标准等。参与多篇白皮书、调查报告等编制工作,包括《中国通信运营商业务研发运营一体化(BizDevOps)实践报告》等。参与多个DevOps 能力成熟度评估项目。
  • 谢荣良
    中国工商银行
    软件开发中心 经理
    演讲主题: 工行 IT 架构资产与元数据管理体系建设揭秘
    议题简介:工行 IT 架构资产与元数据的管控机制以及这些资产在 Devops 全流程中发挥的作用。
    演讲提纲:
    1、工行 IT 架构资产与元数据管控体系概述
    2、IT 架构资产与元数据在 DevOps 全流程应用实践
    听众收益:
    1、了解工行 IT 架构资产与元数据管控体系,对照和参考提升企业内部管控机制
    2、交流和探索架构资产和元数据赋能 DevOps 全 流程的实践,形成与企业架构匹配的持续交付体系
    个人简介:谢荣良, 中山大学软件工程专业毕业,2014软件本科,2014年7月参加工作,先后在中国银行软件开发中心、工商银行软件开发中心、担任架构师、项目负责人等职位,作为架构资产管控系统、元数据及软件资源与信息管理的架构师、产品经理和项目负责人,具备丰富的元数据和数据中台研发经验和团队管理经验。
  • 任庆峰
    中国邮政储蓄银行 软件研发中心
    高级信息安全工程师
    演讲主题:大语言模型在金融业务安全领域的探索与实践
    议题简介:随着新技术应用、新业务模式的不断发展,银行在开展数字化转型的过程中,在业务安全领域面临的攻击形势愈发严峻和复杂多变。大语言模型具有强大的数据处理能力、自动化和智能化、预测预警能力以及可扩展和灵活性,相较于传统的信息安全防护手段,将大模型与业务安全技术相结合,可以提供更准确、实时和自动化的安全防护和风险管理能力。本次演讲将介绍我们基于大模型技术在智能业务安全漏洞检测、欺诈场景智能防护、业务安全需求智能客服等方面的探索实践,并针对后续基于大模型驱动的业务安全新防护场景进行初步展望。
    演讲提纲:
    1、银行业务安全领域面临的新挑战
    2、大模型在业务安全领域的探索实践
    3、大模型驱动的业务安全新场景展望
    听众收益:
    1、了解大模型在银行业务安全运营领域的发展现状,应用场景及未来发展趋势
    2、了解大模型相关技术在业务安全细分场景的实践关键思路、难点。
    个人简介: 任庆峰,深耕信息安全领域多年,拥有超过8年的实践经验,在研发安全、安全运营、安全攻防、业务安全等领域具备一定的理论功底和实战技能。曾参与多个大型信息系统的安全需求、安全架构设计工作,多次参加国家级重保演练活动及大型安全赛事,目前主要探索 AI 等新技术在业务安全运营保障方面的应用。
  • 王守宇
    中国银河证券股份有限公司
    资深研发效能专家
    演讲主题:五年磨一剑:银河证券从0到1的 DevOps 体系建设之路
    议题简介:银河证券经过5年的建设,形成了成熟且覆盖大部分研发人员的 DevOps 体系。本次演讲将分享银河证券 DevOps 体系从零开始的建设过程,讲述不同阶段建设的要点、遇到的问题和解决方法。
    演讲提纲:
    1、综述银河证券 DevOps 体系建设的五个阶段
    2、第一阶段:以提效为目标,自下而上开始引入 DevOps 工具
    3、第二阶段:以度量为抓手,自上而下推动搭建 DevOps 平台
    4、第三阶段:以过级为契机,以评促建试点落地 DevOps 标准
    5、第四阶段:以标杆为参照,横向纵向规模推广 DevOps 实践
    6、第五阶段:DevOps 体系建设的未来展望
    听众收益:
    1、了解大型券商 DevOps 体系演进思路
    2、了解 DevOps 体系建设中的常见问题和解决方法
    3、DevOps 的收益和未来建设方向
    个人简介:王守宇,10 年互联网、证券行业 DevOps 工具链建设和研发效能提升经验,曾就职知乎和字节跳动,长期负责持续交付、质量管理、效能度量等工具平台的建设和推广。现就职于银河证券,负责推进组织 DevOps 转型和敏捷转型。
  • 韩金阳
    中国银河证券股份有限公司
    研发效能治理负责人
    演讲主题:银河证券研发效能治理体系持续创新之路
    议题简介:近年来,银河证券研发了一系列金融产品和服务,提升了市场竞争力,业务的不断推陈出新对企业的软件研发效能提出了更高的要求。银河证券研发效能治理体系,以数据驱动为核心,使用高效发现问题、改进过程可管理可跟踪、改进经验可沉淀的持续改进模式,建立了度量平台系统和运营机制,实现效能提升完整闭环,从而支撑企业在转型期、扩张期的有序管理和持续创新。
    演讲提纲:
    1、建设背景和历程
    2、体系介绍
    3、创新点
    4、应用现状
    听众收益:
    1、了解券商研发效能体系的建设和实践经验;
    2、开拓研发效能治理的思路;
    3、共同探索研发效能提升路径
    个人简介:韩金阳,具有丰富的研发和项目管理经验,对研发效能、敏捷和 DevOps 有深入的理解,就职于中国银河证券股份有限公司,主导建设了银河证券研发效能体系,目前主要负责银河证券研发度量体系建设、企业级 DevOps 体系建设,致力于持续提升企业研发效能。
  • 王洋
    中信建投证券股份有限公司
    DevOps 平台技术负责人
    演讲主题:中信建投证券数智研运一体化平台建设探索与实践
    议题简介:随着金融科技的快速发展,数字化转型已成为证券行业的必然趋势。中信建投证券通过持续探索和实践,构建了数智研运一体化的平台,助力业务快速交付与稳定运营。 通过数智一体化平台建设,实现云原生应用的全周期持续交付。提升了应用交付的效率和质量,确保系统安全合规。积极推广 DevOps 文化,打造了协作高效的研发运维一体化团队。通过优化流程、引入自动化工具等手段,有效缩短了从开发到上线的周期,大幅提升了业务响应速度。探索大模型技术的应用。利用大模型自动生成代码、撰写文档等功能,提高了开发效率,助力数字化转型。
    通过此次分享,观众将全面了解中信建投在数智研运一体化平台建设方面的创新实践,并获得在 DevOps 文化推广和大模型应用等方面的宝贵经验,为自身数字化转型提供借鉴。
    演讲提纲:
    1、信创混合云,云原生应用全周期持续交付。
    2、DevOps 文化在组织中的推广
    3、大模型在 DevOps 应用探索与实践。
    听众收益:
    1、了解 DevOps 在证券行业的实践案例。
    2、了解大模型在 DevOps 中的应用实践办法。
    3、认识 DevOps 文化在企业中的推广策略。
    个人简介:王洋,DevOps 平台技术负责人。10多年研发经验,8年金融行业从业经验,多年从事效能研发、自动化、云原生领域。
  • 刘晨
    中信建投证券股份有限公司
    技术专家
    演讲主题: 金融行业数据库应用优化和实践
    议题简介:80%的数据库问题是由数据库应用引起的(包括数据库对象设计、SQL 语句等),而这其中80%的问题又来自于20%的数据库应用设计或 SQL 语句等,一条“简单”的 SQL 语句或者一个不当的设计就可以轻易地搞垮整个数据库,从而造成一次严重的业务故障。如果解决这20%的问题,无论对开发人员的能力提升,还是对系统的稳定运行,都可能起到事半功倍的效果。通过我们在技术管理过程中的探索和实践,来聊聊这些问题,如何发现、如何规避,以及从中得到的一些借鉴。
    演讲提纲:
    1. 优化基础
    2. 案例、现状和痛点
    3. 建议和实践
    听众收益:
    1. 介绍一些数据库应用优化的思路和方向。
    2. 通过案例讲解一些很容易犯错的数据库设计和 SQL 写法,做到事半功倍。
    3. 从技术管理等层面,讲解一些数据库性能优化的经验。
    个人简介: 刘晨,具有十二年以上的应用运维工作经验,现阶段主要从事技术标准化、技术管理、数据库应用研发能力提升等相关工作,Oracle ACE(Alumni),腾讯云 TVP,墨天轮 MVP,拥有 Oracle OCM & OCP、EXIN DevOps Master、OBCA、腾讯云 CloudLite、PCSD、SCJP 等国际认证,国内首批 Oracle YEP 成员,OCMU 成 员,《DevOps 最佳实践》中文译者之一,CSDN & ITPub 专家博主,公众号"bisal 的个人杂货铺",长期坚持分享技术文章,多次在线上和线下分享技术主题。
  • 江菊
    方正证劵
    质量效能部负责人
    演讲主题:方正证劵研发效能框架及运营实战
    议题简介:本主题主要介绍方正证劵在研发效能方面所面临的挑战、以及研发效能所经历的几个阶段及实施效果,期待能给同行带来启发跟思考。
    演讲提纲:
    1、方正证劵研发效能面临的挑战
    2、研发效能框架
    3、研发效能实施效果
    听众收益:
    1、了解证劵公司研发效能的框架,这套框架跟互联网公司的区别
    2、研发效能在运营时会碰上哪些痛点,该如何解决这些痛点
    个人简介: 江菊,20+年工作经验,互联网行业工作15年,曾经就职于百度、58集团、京东,2019年加入方正证劵,目前在方正证劵负责质量效能团队
  • 鲍中帅
    科大讯飞
    基础架构网络总监
    演讲主题:万卡级超大规模智算集群网络运维挑战及实战
    议题简介:基于科大讯飞建设的业内第一个万卡国产化大模型集群“飞星一号”,介绍大模型网络在规模、性能、连续性方面遇到的挑战,同时基于科大讯飞的具体实践,分享创新破局之道。
    演讲提纲:
    1、大模型的发展及讯飞星火大模型迭代概述
    2、超大规模万卡集群的网络挑战
    3、万卡集群运维运营创新实践
    听众收益:
    1、了解智算集群进入万卡规模后,集群所面临的具体挑战和难题
    2、了解超大规模智算集群的运维实践
    3、共同探索超大规模智算集群网络的未来演进方向
    个人简介: 鲍中帅,亚太地区领先的人工智能企业数据中心网络部门负责人,12年从业经验,业内第一个超大规模国产万卡智算集群网络架构师,对于通用计算、智能计算的网络有着丰富的设计和建设经验,同时对于智算中心的运维运营有着深刻的理解及企业实践。
  • 京东  前测试架构师陈磊
    陈磊
    京东 前测试架构师
    演讲主题:接口测试遇见大模型:难点,弯路与实践指南
    议题简介:通过讲解在当前大模型的浪潮之下,选择不同大模型的应用技术赋能接口测试的实践,给出一种行之有效的大模型赋能接口测试的技术方案,详细讲解接口测试的生成、测试数据的解决方法以及大模型在使用过程中的思考和趟过的坑。
    演讲提纲:
    1、大模型时代下测试技术的困境
    2、大模型应用技术的选择
    3、测试和大模型走过的弯路
    4、大模型驱动下的接口测试
    5、大模型驱动下的测试数据生成
    6、一次运行的执行流程
    7、大模型技术选择的教训
    听众收益:
    1、了解大模型的技术难度和技术成本
    2、了解大模型解决接口测试代码的问题
    3、熟悉大模型解决测试数据生成的实践方案
    4、实践大模型技术的选择方法
    个人简介:陈磊,阿里云 MVP,华为云 MVP,中国商业联合会互联网应用工作委员会智库专家,中关村智联软件服务业质量创新联盟软件测试标准化技术委员会委员,中移联合智库专家, Asian Journal of Physical Education & Computer Science in Sports 编委会委员、 EXIN DOM 。《接口测试方法论》、《持续测试》、《软件研发效能权威指南》《京东质量团队转型实践:从测试到测试开发的蜕变》、《软件研发行业创新实战案例解析》作者,在极客时间开设过专栏“接口测试入门课”,在拉勾教育开设过“软件测试第一课”,担任过《软件研发质量管理体系白皮书》、《测试敏捷化白皮书》编委。具有多年质量工程技术实践经验,精通研发效能提升、手工测试团队自动化测试转型实践、智能化测试等,公开发表学术论文近 30 篇,专利 20 余篇,并且是国内 TID 、 NCTS 、 MAD 、 MPD 、 TICA 、China DevOpsdays 、 QECon 等技术峰会的演讲嘉宾或出品人。
  • 刘晓辉
    中航信
    应用运维开发团队负责人
    演讲主题:运维平台可观测与数字孪生的落地实践
    议题简介:应用运维工作在整个运维体系中的位置是比较上层的,依赖于各个下层提供的数据,对数据的准确性和及时性有强烈的需求。同时应用运维作为用户直接触点,对用户满意度的提升有非常重要的作用。当下业界的基本处在自动化阶段,并且向智能化阶段进行迈进。在这个过程中,可观测和数字孪生是比较普遍的技术方向,中国航信在可观测方面,利用审计日志实现调用链路分析,支持双态运维模型,提供多种智能算法进行异常检测,提升监控精度。在数字孪生方面,通过运维流程与运维工具的相互作用与持续提升,初步实现了数字孪生的多个场景,基于诊断和快照,实现故障根因分析,未来计划结合可观测和数字孪生,实现对生产系统的全景展示,并通过 ai agent 的的方式实现更加快速高效准确的故障定位。
    演讲提纲:
    1. 关于应用运维的问题与思考
    (1) 运维痛点
    (2) 应用运维在整个运维体系中的位置
    (3) 运维平台建设路径
    (4) 运维平台整体架构方案
    2. 端到端的可观测监控
    (1) 监控整体架构方案
    (2) 现有监控关于三要素的能力以及对可观测能力的支持
    (3) 基于审计日志的调用链路分析
    (4) 基于多重周期时序数据的智能异常检测
    3. 数字孪生
    (1) 思路与对象
    (2) 运维流程与运维工具的相互作用与持续提升
    (3) 数字孪生的初步具体实现
    (4) 基于诊断和快照的根因分析
    4. 未来展望
    (1) 可观测和数字孪生的结合
    (2) AI Agent 和大模型在运维过程过程中的可能应用场景
    听众收益:
    1. 了解公司在应用运维方向的实施路径与整体架构
    2. 了解在运维平台中实现可观测性与数字孪生的具体实践
    个人简介: 刘晓辉,应用运维开发团队负责人,资深开发和运维人员。具备丰富的民航领域业务经验以及主机系统与开放系统的运维经验,主导并参与了多个大型项目的运维工作,积累了丰富的实战经验,近年来带领团队在公司内与行业内与合作伙伴共同完成多个运维开发项目,推动公司内应用运维平台与相关团体标准建设。当下着眼于可观测与数字孪生在运维平台的实战并取得了部分成果,未来计划紧跟技术风口,在智能运维和大模型领域寻找可能的运维落地场景并尝试实践验证。
  • 独立 DevOps 咨询师王晓翔
    王晓翔
    独立 DevOps 咨询师
    演讲主题:别让平台工程成为面子工程
    议题简介:Gartner 发布的2023年10大重要战略技术趋势报告中,“平台工程 Platform Engineering” 位列其中,一时间平台工程的热度急速上升。与此同时,我们又不得发出这样的疑问,平台工程到底是什么?它能解决什么问题?为什么是在这个时间提出?
    本次分享我首先会和大家一起探讨平台工程的重要性和必要性,挖掘平台工程真正要解决的问题。然后分享平台工程的核心思想和关键实践,避免将平台工程做成外表光鲜的“面子工程”。最后,运用产品开发的思想,带你识别企业内部平台建设过程中,用户的痛点、痒点和爽点。
    演讲提纲:
    1、平台工程解决什么问题?
    2、介绍平台工程的核心思想和关键实践。
    3、识别平台建设中的痛点,痒点和爽点。
    听众收益:
    1. 了解平台工程与 DevOps 的关系;
    2. 了解平台工程的核心思想
    3. 了解平台工程的建设思路
    个人简介:王晓翔,本人在软件配置管理、过程管理和工程效率领域有近20年的工作经验。前去哪儿网工程效率部高级总监,现为独立咨询师,专注为企业提供 DevOps 转型咨询和辅导。《DevOps 实践指南(第2版)》译者之一。研发运营一体化(DevOps)能力成熟度模型核心专家。2019年 GOPS 深圳大会金牌讲师;2019运维行业年度优秀技术专家。先后在中国海关数据中心、 索尼移动通信产品(中国)有限公司、中体彩、北京趣拿软件科技有限公司、奇安信等多家公司工作。
  • 张雁丽
    中国移动通信集团北京有限公司
    SRE 运维专家
    演讲主题: OnCall 驱动下的 IT 系统稳定性运营实践
    议题简介:北京作为国家的战略核心,北京移动 IT 支撑系统稳定性具有放大镜效应,如何执行系统保障至关重要。基于以上背景,北京移动依据国家信息安全标准、行业最佳实践制定分级保障要求,设置 OnCall 策略,并基于大模型、元宇宙打磨出一套高效响应、精准定位、快速恢复的 OnCall 机制。该机制依据节假日、上线变更、营销活动、社会重大活动等不同的场景,分级制定保障要求及标准。通过实时获取故障信息、科学调配资源配置,确保出现异常时,能够迅速调动跨部门专业团队进行问题排查与修复,从而最大限度的降低系统故障对业务连续性的影响。
    演讲提纲:
    1、实施背景与目标
    2、运营商故障管理实践
    3、未来展望
    听众收益: 1、了解北京移动 IT系统分级保障实践,共同探讨、优化保障方法
    2、了解大模型、元宇宙等前沿技术在IT系统保障中的应用方法与作用
    个人简介:张雁丽,中国移动通信集团北京有限公司,从事 IT 系统运维工作。
  • 王昕
    微软(中国)有限公司
    高级技术战略专家
    演讲主题:面向大模型的新编程范式
    议题简介: OpenAI 的 ChatGPT 模型自面世以来,不仅个人用户通过它提升自己的工作效率,企业用户和软件开发者也开始基于以 GPT 模型为代表的大语言模型(LLM)改造自己的应用。每一代新的软件技术和平台,都会带来设计模式和编程范式的革新,以 ChatGPT 为代表的大模型技术也不例外。本次演讲将结合示例介绍一些围绕大模型衍生出来的编程范式。
    演讲提纲:
    1、介绍采用大语言模型(LLM)实现应用所需要的关键技术和相关挑战
    2、介绍围绕 LLM 衍生出来的新编程框架
    3、结合示例,展示新编程框架的用法和最佳实践
    听众收益:
    1、了解采用大语言模型(LLM)实现应用所需要的关键技术和相关挑战。
    2、了解围绕 LLM 衍生出来的新编程框架。
    3、学习掌握采用大模型实现应用的最佳实践。
    个人简介:王昕,有20年从事软件系统设计、开发和产品管理的经验,10年云计算相关技术产品的研发经验。他曾就职 IBM、VMware 和阿里云等主要云计算相关企业,目前在微软中国从事技术战略和技术生态孵化工作,推广基于 OpenAI 等大语言模型技术的新应用架构。从业期间王昕主要从事软件定义网络、云原生 PaaS 平台和人工智能产品的产品架构和研发工作,在云计算领域有10多项国内外发明专利。王昕对 IT 行业新技术始终保持第一线的跟踪,多年在 GOPS、InfoQ,CSDN 等技术论坛从事技术布道和经验分享工作。
  • 顾铮
    京东
    研发效能架构师
    演讲主题:从 DevOps 到平台工程,让工具更好的为业务服务
    议题简介:前两年《 DevOps 已死-平台工程才是未来》的文章爆火,平台工程是不是未来需要不断实践,但 DevOps 的思想还在延续。此次基于在京东内部的平台工程探索,探讨平台工程的理念如何落到持续交付平台的设计,梳理研发流程的方法,建设平台能力,以及如何落地的问题。
    演讲提纲:
    1、平台工程概述与价值
    2、研发模式的梳理方法
    3、持续交付平台的设计思路与能力建设
    4、持续交付下的效能指标建设
    听众收益:
    1、了解平台工程的行业趋势,解决的问题
    2、了解持续交付平台的设计思想,如何与研发模式集合
    3、共同探索平台工程,开发者门户等的未来发展方向
    个人简介: 顾铮,十余年研发效能,测试开发经验,主导过多个领域的平台工具从0到1建设。擅长 CI/CD,容器技术,质量自动化体系,开发提效等
  • 韩光星
    高德地图
    高级技术专家
    演讲主题:智能运维在高德业务故障定位方向的落地实践
    议题简介:高德作为国民出行 App,对稳定性和运维效率有着极高的要求。高德故障辅助定位系统在日常告警处理、故障应急、节假日稳定性保障等方面发挥了重要作用。本次演讲主要介绍智能运维在高德业务故障定位方向的落地实践
    演讲提纲:
    1、高德故障定位背景
    2、高德故障定位系统的演化
    3、总结展望
    听众收益:
    1、了解业务故障定位的背景和挑战
    2、了解高德在业务故障定位领域的探索之路
    3、共同学习探索故障定位领域的未来方向
    个人简介:韩光星,目前就职于高德地图,研发效能和运维研发方向负责人,主要负责高德研发效能和运维平台化建设,通过智能化平台化的方式,夯实稳定性基础,帮助业务降本提效。
  • 阎斌
    蚂蚁集团
    容灾架构师
    演讲主题:蚂蚁集团容灾技术原理与体系化建设之路
    议题简介:介绍蚂蚁集团全站范围内容灾架构设计、容灾切换原理及容灾演练等相关实践。
    演讲提纲:
    1. 蚂蚁架构基础
    2. 蚂蚁容灾原理
    3. 蚂蚁容灾实践及效果
    听众收益:
    1. 了解金融级稳定性约束下的蚂蚁基础架构,特别是其中与流量路由有关的设计要点。
    2. 了解蚂蚁全链路各层的容灾架构设计,以及容灾切换原理。
    3. 了解蚂蚁容灾的日常运营机制,容灾建设的实际成果。
    个人简介: 阎斌(花名:移舟)于2017年加入蚂蚁集团平台工程与技术风险部,负责过多个内部平台、及业务线的稳定性工作。近年来主要牵头蚂蚁的容灾架构工作,负责蚂蚁全站的容灾架构设计,容灾风险治理,相关平台系统研发等方向。
  • 张炜
    马上消费金融股份有限公司
    科技运营部门 总监
    演讲主题: 构建高质效创新组织:技术管理与稳定性运营的实践
    议题简介:在数字化转型的浪潮中,技术管理和运营的角色变得尤为关键,它们不仅关乎技术的实施和维护,更触及到利益相关者的参与、沟通以及组织内部的协作与协调。以下是技术管理和运营工作的概括介绍,涵盖了DevOps 实践、SRE 策略、流程改善和 IT 成本管理等多个方面:
    1.技术愿景与治理:我们构建了一个清晰的技术愿景,将技术治理作为推动组织变革的引擎,与业务战略紧密结合,确保技术决策与公司目标一致。
    2.DevOps 实践:通过持续集成和持续部署(CI/CD)流程,我们强化了开发与运维团队之间的协作,实现了快速迭代和软件的高质量发布。
    3.SRE 策略:我们采用 SRE 原则来确保系统的高可用性和可靠性,通过自动化运维流程和实时监控系统性能,提高了服务的稳定性和用户的满意度。
    4.流程改善:我们不断审视和优化技术流程,通过引入精益管理和敏捷方法论,减少了不必要的步骤,加快了交付速度,同时保持了操作的高标准。
    5.IT 成本管理:我们通过精细化的预算管理和成本效益分析,确保了资源的合理分配和使用,优化了 IT 投资,提升了整体的财务效率。
    6.数据驱动的决策支持:我们利用数据分析为技术决策提供支持,确保决策基于实证和预测分析,提高了决策的质量和效率。
    通过这些综合性的技术管理和运营工作实践,介绍马上消费金融如何确保组织在技术驱动的市场中保持竞争力,同时实现长期的可持续发展。
    演讲提纲:
    1、数字经济的快速崛起所带来的的新变化和新挑战
    2、构建面向未来的新型数字智慧组织
    3、技术运营管理工作全景及运营机制
    4、用户价值为导向的 IT 流程管理实践
    5、敏捷开发与持续交付管理
    6、联邦制组织机构的技术运营管理实践
    7、构建 IT 投资管理体系
    听众收益:
    1、学习如何构建一个能够适应数字化转型的联邦制组织结构,包括文化、流程和技术的整合,以提高组织的灵活性和创新能力。
    2、深入了解技术运营管理的核心要素,包括如何构建有效的运营机制,以及如何通过技术运营推动组织的战略目标。
    3、掌握以用户价值为导向的 IT 流程管理方法,学习如何通过流程优化提高服务效率和质量。
    4、了解敏捷开发的核心原则和实践,以及如何实施持续交付,以加快产品上市速度并提高市场响应能力。
    5、探索联邦制组织结构的技术运营管理的实践,包括如何推进端到端的稳定性保障机制,确保系统的稳定性和可扩展性。
    6、学习如何构建和维护一个有效的 IT 投资管理体系,以确保技术投资与业务目标一致,实现最大的投资回报率。
    个人简介: 张炜,拥有超过16年的技术运营管理经验,目前担任马上消费金融股份有限公司的科技运营部门负责人。在公司成功实施了多项 DevOps 实践,极大提升了软件交付的速度和质量,同时确保了生产环境的高可用性和稳定性,基本形成需求到生产端到端闭环运营管理。
    作为 DevOps 文化的积极推动者,专注于通过自动化和持续集成/持续部署(CI/CD)流程来优化研发生命周期,通过构建跨功能团队,促进了开发、测试和运维之间的紧密协作。
    在技术运营方面,带领团队在公司建立了基于联邦组织机制的 SRE 体系,通过自动化、监控和灾难恢复等措施,确保系统的高可靠性和业务连续性。推动了从传统的 IT 运维向现代化 SRE 实践的转型,显著提升了公司的技术服务质量和客户满意度。
  • 隋吉智(左知)
    阿里巴巴 基础设施事业部
    云原生应用可观测专家
    演讲主题: 大规模、多云主机统一可观测实践
    议题简介:随着云原生架构和微服务的流行,如今许多企业在云计算环境中拥有着大量分散的主机资源。要有效地监控和管理这些广泛分布的资源对于保障系统的稳定性和性能至关重要。《大规模、多云主机统一可观测实践》旨在探讨在这种复杂环境中实施高效、统一的可观测性策略。在本次技术分享中,将深入分析面向大规模多云主机环境的可观测的挑战,介绍业界领先的可观测性工具如 Prometheus、Grafana 等,并探讨它们如何相互协作提供全面的监控视角。我们将涵盖关键话题,包括复合云环境下的数据采集、指标标准化、日志聚合、以及统一警报策略。
    具体实践部分,我们将分享统一监控平台的搭建方法,这包括了如何处理跨云边界的监控、如何实现大规模主机的监控数据聚合以及管理。
    演讲提纲:
    1、大规模、多云主机可观测面临的挑战、难点、行业现状
    2、如何实现多云主机指标采集、统一存储、统一观测技术方案
    3、实践效果,主机统一观测核心关注点经验积累,多维度主机横向对比、聚合、告警收益
    听众收益:
    1、了解多云主机可观测的挑战、难点,以及目前行业发展现状
    2、了解阿里云在多云主机可观测的实践技术方案
    3、了解落地实践效果,主机可观测的实践经验
    个人简介: 隋吉智(左知),目前在阿里云基础设施事业部可观测团队,任阿里云 Prometheus 商业产品核心研发工程师,在可观测领域尤其指标场景有较丰富经验,针对大规模集群指标采集和处理有较多生产实践积累,采集探针性能调优和稳定性建设有落地实践。在可观测领域的指标场景,针对典型问题和超大规模集群采集需求,提出有效技术解决方案,并在阿里云 ASI 超大规模集群采集场景落地实践,在主机观测方向具有丰富经验。
  • 李攀
    中国移动通信集团 广东有限公司
    IT 架构规划专家
    演讲主题: 云原生和国产化双场景下的 IT 转型变革与破局之道
    议题简介:广东移动 IT 系统近几年同时面临 IT 云迁移、云原生转型和国产化替代等几大项工作。如何在同一时间协同推进并完成这几项工作,广东移动探索了一套行之有效的方法和实践。对于国企外包模式下 IT 高效转型具有一定借鉴意义,希望能与业界分享交流。
    演讲提纲:
    1、形式倒逼 IT 变革
    2、变革之挑战
    3、破局之道
    4、实践成效
    听众收益:
    1、了解云原生&信创国产化双场景下面临哪些问题
    2、一种云原生&信创国产化的实践方案
    个人简介: 李攀,2007年参加工作,17年电信行业系统研发经验,中国移动 IT 条线2022、2023年度优秀 IT 专家,广东移动省级专家,广东移动 BM 域系统 IT 云迁移、云原生转型、信创国产化演进贡献者。
  • 田野
    中国电信集团
    云网运营高级项目经理
    演讲主题:运营商 IT 一体化运营思路
    议题简介:运营商 IT 专业经历了多个历史阶段的发展。随着业务的开展,前后端协同,跨专业协同的重要性越来越明显,需求-开发-上线-运维-复盘优化 的循环逐步衍生了 IT 一体化运营的思路。本次分享我会和大家探讨运营商 IT 一体化运营的思想,展现一体化运营的意义和价值,最后通过具体的实施举措展现 IT 一体化运营的蓝图。
    演讲提纲:
    1、IT 发展历程。
    2、IT 一体化运营目标。
    3、“八个一”工作思路
    个人简介:田野,在云网运营后端维护部门工作多年,有丰富的系统运维经验,熟悉后端云网运维体系,对云改数转和云网运营一体化有深刻的认识。在职业中,积极推动云网运营一体化进程,在维护作业中,倡导研究型运维,在人才培养上,重视实操能力的提升。希望能够与各位同行深入交流,互相借鉴。
  • 刘志
    长沙银行
    数据中心 生产运营中心经理
    演讲主题:多云融合架构下中小银行的建云、上云和用云指南
    议题简介:受技术发展阶段性因素和当前国家创新战略导向双重影响,银行同业或多或少都面临多云技术底座共存的问题,多云混合在这一阶段几乎是多数银行云建设所面临的“常态”。在多云同在的“常态”下,如何统一规划建设?业务系统该如何上云?开发及运维该怎么用云?成了我们重点思考的问题。长沙银行通过 PaaS 侧兼容适配 A/B 两个 IaaS ,在应用层级拉通两朵云;围绕在国产创新条件下盘活“旧云”资源,旨在云原生服务能力与行内应用体系融合统一,充分发挥 A 云/ B 云的特性效能;让应用无感底层差异,轻松用云。通过多云融合的架构的探索,建设资源协调统一、应用云化标准一致、用云简单高效的新数字化基础设施。
    演讲提纲:
    1、多云现状的痛点和发展方向
    2、如何打破多云带来的底层“掣肘”,统一上云“口径”
    3、多云融合架构的实现以及技术难点
    4、融合架构带来的收益及后续挑战
    听众收益:
    1、国产创新背景下,中小银行如何建设适合本行的全栈云
    2、多云常态下,如何建云、上云、用云
    个人简介: 刘志,长沙银行生产运营中心经理,负责长沙银行整体运维体系建设规划,推动长沙银行运维数字转型的进程,参与长沙银行云原生规划与设计,是长沙银行从传统运维到数字化运维的见证者与参与者。
  • 京东  资深技术专家井亮亮
    井亮亮
    京东 资深技术专家
    演讲主题:技术故障应急协同机制的探索
    主题简介:主要探讨技术故障的重要性、全生命周期管理、应急协同机制的建立与落实。首先,将明确技术故障的定义和其对业务运行的关键影响。接着,分析技术故障的全生命周期,包括预防、发现、应对和恢复等阶段。然后,重点讨论如何构建有效的应急协同机制,以快速响应和减少故障影响。最后,对本次议题进行总结,并对未来技术故障管理提出展望。
    演讲提纲;
    1、技术故障重要性及定义
    2、技术故障的全生命周期
    3、如何落地应急协同机制
    4、小结及展望
    个人简介:
    井亮亮,Certified DevOps Enterprise Coach,GOPS 大会金牌讲师,京东资深技术专家,负责京东技术风险方向 SRE 基础设施平台设计与开发,十多年深耕 DevOps 方向,在持续交付、SRE 运维平台建设有丰富的实践经验。曾就职于用友,负责用友集团持续交付工具平台的研发和建设工作,2015年加入京东,曾负责京东云持续交付体系平台与 DevOps 产品的规划和推动。
  • 思码逸  创始人兼 CEO任晶磊
    任晶磊
    思码逸 创始人兼 CEO
    演讲主题:AI 落地研发的“最后一公里”暨《 DevData 24研发效能基准报告》数据解读
    议题简介:企业应用 AI 编程工具,研发效能提升了吗?本演讲将从这一“灵魂拷问”开始,探讨 AI 落地企业研发的路径和终点。为了回答此类问题并帮助技术管理者了解行业普遍的研发效能现状,我们组织了 DevData 2024 研发效能基准数据调研,首创性地采用以客观数据为主、结合主观问卷的方式。本演讲将介绍本次调研的基本情况,展示核心研发效能度量指标的行业基准数据,以及高效能团队的特征和水平,为技术管理者提供参考。同时,本演讲将分享通过交叉分析从调研数据中挖掘出的若干有价值的洞察,帮助技术管理者把握提质增效的关键点。
    3、演讲提纲:
    1. AI 落地企业研发的路径与“最后一公里”
    2. DevData 2024 研发效能基准调研介绍
    3. 行业研发效能数据洞察和解读
    4、听众收益:
    • 获得数据和认知应对 AI 落地企业研发面临的挑战
    • 了解业界在主要研发效能指标上普遍达到的水平
    • 找到自身团队的长短板,获得驱动改进的数据抓手
    • 洞察研发效能改进的关键因素 个人简介:个人简介:任晶磊,清华大学计算机系博士,前微软亚洲研究院研究员,斯坦福大学、卡内基梅隆大学访问学者;《软件研发效能度量规范》标准核心起草专家。多篇论文发表在 FSE、OSDI 等顶尖国际学术会议上;曾参与微软下一代服务器系统架构设计,获 4 项美国发明专利;Apache DevLake 开源项目发起人。现任思码逸 CEO,专注为软件团队构建先进的效能度量分析平台及 AI 辅助编程工具。思码逸为企业提供专业的软件研发数字化、智能化解决方案,致力于提升全行业的软件工程水平,助力研发团队创造更多价值。
  • 江国龙
    腾讯安全云鼎实验室
    安全专家
    演讲主题:攻击者视角下的安全运营实践
    议题简介:随着攻击技术日趋复杂化,企业攻击面出现了不断快速增长的态势,面临着大量复杂的攻击威胁。由于思维方式和专业技能的差异,攻击者与防御者在风险认知上存在重大差异,安全运营正在由传统的安全告警驱动向暴露面风险驱动转换,实现持续的风险暴漏管理(CTEM)。本次分享将结合安全验证等技术,介绍如何基于攻击者视角,进行持续的风险发现、风险验证与风险管理,实现更加智能敏捷的安全运营。
    演讲提纲:
    1、为什么安全运营的思路需要向攻击者视角转化
    2、如何实现安全验证度量
    3、如何实现持续的风险暴漏管理
    听众收益:
    1、了解如何基于安全验证实现持续的风险暴漏管理
    2、了解如何提升安全运营效率与安全运营质量
    个人简介:江国龙,腾讯安全云鼎实验室 高级研究员。主要负责云安全相关领域的技术研究与安全能力建设、腾讯云安全治理与运营,有着丰富的云安全技术和实践经验。
  • 贺安辉
    博睿数据
    产品总监、AIOps 首席专家
    演讲主题:一体化可观测数据模型和 AIOps 的融合实践
    议题简介:大语言模型是大家公认的“大模型”,而在运维领域中的“可观测数据模型”有其独特且出色的应用场景。本次分享主要介绍“一体化可观测数据模型”在与 AIOps 结合的过程中发挥的突出价值和落地效果
    演讲提纲:
    1、可观测数据模型的由来
    2、可观测数据模型的建设
    3、可观测数据模型和 AI 的融合实践
    听众收益:
    1、了解可观测数据模型在智能运维领域的应用实践
    2、了解 AIOps 的前沿成果
    3、了解业内领先的可观测平台的最新进展
    个人简介:贺安辉,目前担任博睿数据产品管理部负责人,AIOps 首席专家, 14年智能运维领域从业经历,曾供职于中国工商银行、蚂蚁集团等企业,对运维体系、技术、产品形态和方法论有丰富的经验。
  • 王国梁
    腾讯云
    日志服务 CLS 研发负责人
    演讲主题: 告别运维负担:腾讯云对 Prometheus Serverless 化的实践
    议题简介:随着 Kubernetes 和云原生技术的成熟和大规模应用,Prometheus 作为广泛使用的开源监控和告警系统在生产环境中遇到很多挑战,难以继续很好的满足我们的需求:例如本地存储空间不足;单个实例的写入能力、数据规模有限,并且查询性能也无法满足要求;社区方案 Cortex 在一定程度上缓解了Prometheus 的上述问题,但仍存在很多不足,例如高可用架构存在诸多缺陷,查询性能无法满足10万 TimeSeries 规模以上的查询、缓存不能多可用区容灾、Ingester 节点重启耗时过长以及异常情况下影响写入、本地数据上传对象存储过于集中限制了集群规模等等,我们系统性解决了以上的问题,在兼容 Prometheus 的基础上实现了Serverless 的存储和计算架构,大幅提升架构稳定性,查询性能相比社区版本提升了10倍以上。
    演讲提纲:
    1、Prometheus 的兴起以及面临的挑战
    2、常见的解决方案和选型对比
    3、如何实现 Serverless 化的 Promethus 服务?
    4、Promethus 在 Serverless 后的收益和优势
    听众收益:
    1、获得 Promethus 运维问题的解决策略
    2、了解如何将服务进行 Serverless 化改造的经验
    3、了解到大规模时序数据的处理和查询优化策略
    个人简介: 王国梁,腾讯云日志服务研发负责人,腾讯 OpenTelemetry Oteam PMC 和 OpenTelemetry 社区贡献者,现负责腾讯云日志服务平台(CLS)核心系统设计及研发。拥有大规模云原生设施的实操落地经验,深耕云原生可观测性领域,致力于通过业务云原生化系统改造,推动技术架构优化升级,持续稳定提升云原生成熟度。此前也是开源 Kubernetes 社区成员和活跃贡献者( kube-scheduler Reviewer);
  • JFrog  (中国) 高级解决方案架构师李威
    李威
    JFrog (中国) 高级解决方案架构师
    演讲主题:高效与安全并重:AI 软件供应链管理策略与最佳实践
    议题简介:随着 AI 大模型在每个企业普及与运用,大模型管理的也成为企业软件供应链管理的一个环节,这包括模型存储、模型版本管理、开源大模型安全扫描等。本话题帮助听众全面了解如何高效、安全、合规地管理AI软件供应链。
    演讲提纲:
    1. 什么是 AI 软件供应链,AI 软件供应链管理有什么痛点
    2. AI 软件供应链引入与管理的最佳实践
    3. 大模型版本管理与治理的最佳实践
    4. 开源大模型安全扫描与开源许可证合规管理方案
    听众收益:
    听众将获得全面的 AI 软件供应链管理策略与最佳实践,学习如何高效、安全、合规的管理 AI 软件供应链。
    个人简介:李威
    JFrog (中国) 高级解决方案架构师
    DevOps 教练,GDevOps、TGO 鲲鹏会金牌讲师。
    曾就职于京东、烽火等互联网企业及传统企业,十年一线开发及运维经验,带领团队从零到一实践 DevOps 转型。
  • 陈海超
    字节跳动
    服务器运营 质量工程师
    演讲主题:大规模服务器集群的线上质量运营实践
    议题简介:近些年,随着互联网迅猛发展,特别是云计算爆发式增长,各大云计算厂商的服务器运营总量剧增,陆续形成多家超过百万级服务器的大规模集群。在数量增长的同时,服务器型号和配置也随着业务应用场景多样化而层出不穷,服务器底层硬件器件也在快速迭代更新中。
    因此,不可避免会遇到各类与服务器硬件相关的质量问题,严重威胁线上服务器的稳定运行。特别是近两年的 AI 大模型应用的兴起,对服务器稳定性提出更高要求。如何未雨绸缪、如何处乱不惊、如何高效稳妥的开展大规模服务器集群的线上硬件运营质量工作,尤为重要。
    本主题,将结合多年服务器运营工作经验,对大规模服务器集群线上质量运营实践进行分享和探讨。
    演讲提纲:
    1、线上质量在服务器运营中的作用
    2、服务器线上质量体系的建立
    3、线上质量运营实践和重点专项介绍
    听众收益:
    1、了解线上质量在服务器运营中的重要性
    2、了解服务器线上质量体系的建立
    3、了解线上质量运营实践和重点专项介绍
    个人简介: 陈海超,在字节负责服务器线上运营质量,包括质量体系建设、质量数据分析、质量问题处理和改进。
    曾负责腾讯服务器故障监控标准制定与自动化运营流程建设、故障分析跟踪系统搭建;主导了 CPU\网卡\硬盘等关键部件的质量数据分析和专项质量提升、A100/A800/H800 等 GPU 新机型质量重保;具备丰富的超大规模服务器运营和质量提升经验。
    曾担任华为服务器兼容性测试工程师、售后支持负责人,组织并攻关解决华为云、腾讯、招商银行、美国 AT&T、泰国 AIS、韩国 NAVER、俄罗斯 Sberbank 等客户服务器软硬件相关的各类疑难问题;具备丰富的服务器硬件、OS 兼容性问题处理经验。
  • 汪喆
    字节跳动
    云原生架构师
    演讲主题:字节跳动资源画像和时间序列预测的运营实践
    议题简介:在生活中人们的生活活动习惯总是符合一定的规律,比如早晚高峰的叫车行为,晚上黄金档的电视剧收视最高,在互联网领域也同样如此,比如晚上刷视频的行为就会比白天高,而深夜休息后一切的流量又变小,对于这些现象,我们可以通过过去的监控数据来预测到今天或者未来的数据,这样我们就可以通过时间序列预测能力来判断未来的趋势,从而在生产上进行应用,比如可以根据预测数据来指导服务的副本扩缩容,指导调度的行为,指导负载的资源配置,指导集群的自动伸缩等。
    本主题就根据此种问题,将字节跳动的一些时间序列预测功能和对应的落地实践进行分享。
    演讲提纲:
    1、资源画像和时间序列预测介绍
    2、具体的落地实践
    3、未来的展望
    听众收益:
    1、了解如何挖掘已有的监控数据的价值
    2、时间序列预测在生产中的价值
    3、应用资源画像能获得的收益
    个人简介: 汪喆,专注于云原生调度策略方向,在在离线混部、统一调度等方向有大规模集群下的实战与落地经验。目前就职于字节跳动,主要参与云原生资源效能方向的工作;Katalyst 开发者。
  • 苗永昌
    字节跳动
    云原生混合云架构师
    演讲主题:字节跳动 Kubernetes 集群2w+节点性能优化实战
    议题简介:Kubernetes 自v1.6 以来,官方支持的规模一直是 5,000 个节点和 150,000 个 Pod,这在当前的互联网背景下是不够用的,随着企业业务规模扩大、业务多样性上升、业务复杂度提升,这种规模已成为一种瓶颈。截至目前,字节跳动在内部已经建设了完善的云原生基础设施支撑抖音、今日头条等业务发展:拥有 500+ 生产集群,最大集群规模 2w+。在这次交流中,我们将分享如何针对超过 2 万个节点的 Kubernetes 进行优化。

    本次分享内容包含字节内部大规模集群优化的实践经验,涵盖 K8s 参数调优以及基于字节跳动丰富实践开源的云原生组件:有着出色 APIServer 流量管理能力的组件 KubeGateway,和强大的存储组件 KubeBrain。
    演讲提纲:
    1、字节跳动大规模集群落地实践
    2、大规模 Kubernetes 集群下 APIServer 流量治理
    3、高性能 Kubernetes 元信息存储实践
    听众收益:
    1、了解大规模集群优化实践和优化手段
    2、通过开源组件来帮助企业提升集群规模
    个人简介:苗永昌,专注于云原生领域,在 K8s 大规模集群优化、混部、企业传统架构向云原生转型等领域有着丰富的实战经验。
  • 李汉波
    字节跳动
    云原生工程师
    演讲主题:字节跳动基于 KubeAdmiral 的多云分布式云原生实践之路
    议题简介:随着分布式云原生技术与架构的快速迭代,越来越多的企业与组织开始选择使用多云架构满足多云多活,异地容灾备份、降本增效、防止厂商锁定等需求。对于企业来说,需要做好多云策略,需要平衡好负载,需要构建好适合自身的分布式云架构。
    字节跳动基于开源 KubeFed V2 并结合字节内场大规模集群联邦经验,打造 KubeAdmiral 多云多集群联邦系统,融入众多新技术:包括 Kubernetes 原生 API 支持、多集群应用智能调度、调度框架插件化、多集群应用自动故障迁移、跟随调度、单集群资源无缝接管等,并且以 KubeAdmiral 为基础打造企业级分布式云原生系统,让基于 KubeAdmiral 的多云方案无缝融入云原生技术生态,为企业提供从单集群到多云分布式云架构的平滑演进方案
    演讲提纲:
    1、业务需求驱动分布式云架构建设
    2、字节跳动基于 KubeAdmiral 的集群联邦技术实践
    3、从集群联邦到分布式云原生多云多集群管理实践
    4、分布式云原生的下一阶段
    听众收益:
    1、了解分布式多云多集群部署架构的发展与优势
    2、了解字节对于分布式云多云多集群管理技术的实践与战略规划
    3、帮助解决企业中分布式云多云多集群管理痛点
    4、共同参与多云多集群联邦系统建设
    个人简介: 李汉波,目前从事分布式云原生系统相关研发工作,负责大规模集群联邦系统构建,对 Kubernetes 及云原生技术有深入的见解,开源多云容器编排项目 KubeAdmiral 与 Karmada 社区 Maintainer 和资深贡献者
  • 姚潮生
    广东电网公司
    数字化系统质量总监
    演讲主题:电力行业信创基础设施的评测关键技术研究与应用
    议题简介:基于自主可控的行业和技术背景,介绍广东电网在自主可控的基础设施上如何开展测评关键技术的研究与成果应用,具体包括基于自主可控仿真环境下基础软硬件和信息系统适配测试技术研究成果,自主可控大模型在电网领域的测评方案设计与技术特点等内容。
    演讲提纲:
    1、基于自主可控仿真环境的评测关键技术
    2、面向电力行业的自主可控大模型的评测关键技术
    听众收益:
    1. 了解在能源行业中,如何结合传统行业的数字化转型,开展自主可控的评测工作,建设符合行业要求的技术标准和测评关键技术
    2. 随着 AI 大模型的大规模研究与行业应用,了解在能源行业如何对自主可控大模型进行评测评价,结合行业和企业特点设计合理的评测方案和评测技术
    个人简介: 姚潮生,2012年毕业于华南理工大学软件工程专业,2012-2022年在腾讯公司负责移动应用质量技术与管理工作,2023年作为高水平人才引进广东电网公司,担任数字化系统质量总监、领军级技术专家,负责公司核心业务系统的质量评测、大型专项评测工作、AI 模型的质量测评体系搭建、数字化工程质量标准与体系建设等。在软件质量管理与工程效能体系建设方面深耕多年,有扎实的理论技术基础与丰富的项目类型实践。
  • 牛万鹏
    百度 工程效能部
    Comate 架构师
    演讲主题: 百度 AI 原生研发范式变革的探索之路
    议题简介:议题背景(要解决的问题、痛点,思考的方向等): * 理解私域知识:大模型催生的第一代智能编码产品重点集中在续写、通用问答上,背后全部基于模型压缩的通用知识,越来越多的开发者希望 AI 可以理解自己的本地代码库、理解私域知识(因安全等问题无法在通用模型中获得),从而生成业务量身定制的代码,以及通过和『代码库』对话掌握代码逻辑
    * 替代繁琐工作:开发者大量开发过程是参考现有代码逻辑增加新代码,而这些重复性的工作比较繁琐,占据开发者大量开发时间,而无法投入到创造性的工作。通过让新一代的智能开发工具掌握代码库全部逻辑、私域文档全部知识点,他理解开发者想做什么,又理解代码的细节,从而帮助开发者解决繁琐、重复性的问题,让开发者更加专注创造性的逻辑设计。
    当 AI 掌握了编程现场的上下文,它不再是一个『助手』,而是一个『助理』,时刻保持和开发者同频,像一个真正的研发伙伴随左右,帮助开发者解决繁琐、重复的问题,这可以极大地减少复杂性,提高效率,从而构造全新的人机协同模式——即开发者专注创造性的、复杂性高的逻辑设计并进行决策,这是在 AI 时代一次研发范式的重大变革。
    演讲提纲:
    1、在 AI 前夜——百度研发现状
    2、在 AI 时代——智能研发助手
    2.1、从大模型到代码模型(代码领域的 MoE 架构)
    2.2、理解私域知识(需求、代码、文档、测试用例,面向垂类研发知识的 RAG 框架)
    2.3、独立分析需求(面向智能研发助手的 Agent 框架)
    2.4、人机结对编程(不局限于续写、会话的交互形态)
    2.5、从编码到全链路智能化(基于 Agent 的全自主框架)
    3、在 AI 未来——人机协同新范式
    3.1、交互形态革新
    3.2、组织重新分工
    3.3、开发焦点转变
    听众收益:
    * 针对一线开发者,了解如何基于大模型,构造全新的人机协同研发新范式,『人』和『机』的分工是什么样的,如何有效提高编码效率
    * 针对团队 Leader,了解如何通过 AI 工具优化团队协作和项目管理,在新的研发范式下组织如何分工
    * 针对工程效能团队,了解百度如何进行探索以及思考的,如何在万人研发规模下落地的,以及什么样的人机协同是可控的、是高效率的
    个人简介: 牛万鹏,百度资深研发工程师,吉林大学计算机系毕业,毕业后入职百度,早期负责 DevOps 工具的孵化和落地,涵盖项目管理、代码管理、流水线、制品库、应用部署、运维管理等平台建设和商业化。现负责百度研发智能化,通过构造全新智能编码工具 Comate,搭建全新的产品形态,推动百度万人研发范式的变革。
  • 刘克飞
    咪咕互动娱乐有限公司
    应用运维总监
    演讲主题:云游戏全栈自主可控的底层逻辑与应用探索
    议题简介:云游戏是一种基于云计算的游戏内容提供方式,所有游戏都在云端服务器运行,渲染完毕后的游戏画面经过压缩编码后通过网络传输给用户,实现无时无刻、即点即玩的游戏体验,脱离了游戏包体和高性能终端设备需求。在云游戏的自主可控进程中,涉及底层IT资源、网络、配套应用软件,尤其在 CPU 和 GPU 的应用上存在关键性的挑战,除此之外云游戏的国产化的标准、私有化协议、编解码能力及虚拟化技术更是核心的内容。本次主要分享如何在保证云游戏用户体验的前提下实现全栈自主可控,以及在 CPU 和 GPU 国产化应用过程中的探索和应用。
    演讲提纲:
    1、云游戏简介
    2、云游戏自主可控的关键点和全栈分析
    3、云游戏全栈自主可控的探索和应用
    听众收益:
    1、云游戏在自主可控过程中的关键点
    2、云游戏全栈自主可控的探索过程情况
    3、云游戏的国产 CPU 和 GPU 的应用能力和表现
    个人简介: 拥有10年以上的 IT 系统维护经验,精通系统架构设计和平台能力优化。从事5年以上云游戏相关的维护工作,擅长数据分析、算力管理和业务支撑。基于公司业务产品的特点制定系统化和数字化的运维体系,着力技术创新、自动化协同和持续集成,重点保障企业系统运行的可靠性、安全性和可扩展性,助力业务产品的稳定、快速发展。
  • 曹立江
    中国联通软件研究院
    业务架构师
    演讲主题: 中国联通超大规模 IT 系统下稳定性保障能力落地实践
    议题简介:聚焦超大规模 IT 系统稳定性保障工作的困难与挑战,结合中国联通数字化监控平台稳定性保障能力体系,以故障发现、故障定位、故障应急、故障预防全生命周期为主要研究场景,介绍稳定性保障能力落地实践。
    演讲提纲:
    1、超大规模 IT 系统稳定性保障的挑战
    2、稳定性保障体系整体架构
    3、以故障全生命周期为主要研究场景的稳定性保障能力落地实践与工作成效
    听众收益:
    1、了解中国联通基于超大规模 IT 系统稳定性保障相关工作经验,了解系统稳定性保障体系架构框架,稳定性保障平台工具建设配合运营保障管理支撑体系,才能够发挥成效,保障系统稳定性提升。
    2、了解中国联通以故障全生命周期为主要场景的系统稳定性保障能力落地实践,了解可观测性、稳定性测试、变更管理、自动化作业、隐患管理等能力在故障全生命周期中的关系以及如何发挥成效。
    3、了解中国联通在故障事前、事中、事后全流程线上闭环管理经验。
    个人简介: 曹立江,中国联通软件研究院数字化监控平台项目业务架构师,负责数字化监控平台整体技术功能架构设计与优化演进,以及产品能力内部运营落地与对外输出。致力于完善“平台+应用” 生态体系,依托大数据与人工智能技术,打造全集团自动化生产和智慧化运营的生产运营平台,助力企业数字化业务高效、稳定运行,从传统运维向自动化生产、智慧化运营转变。
  • 赵真灵
    蚂蚁集团
    架构师 技术专家
    演讲主题:微服务下一站,Koupleless 模块化研发框架与运维调度系统
    议题简介:单体应用和微服务应用是两种常见的软件架构风格,单体应用开发简单但协作管理复杂,微服务极大解决了组织专业化的问题但资源成本高。这两种软件架构面临着一些挑战:
    1. 大单体应用存在多人协作冲突和交付效率低问题:业务开发者需要感知复杂基础设施,多人协作并行迭代困难,巨型应用速度慢(分钟级),导致研发效率低
    2. 微服务拆出应用过多导致资源和管理成本高:拆分后每个子应用都包含公共部分(框架、中间件等),资源成本高,且需要长期维护
    3. 拆分微服务的敏捷度难与业务、组织发展的敏捷度一致:怎么拆?拆多少?拆到什么粒度?如何合理的拆分微服务始终是个老大难的问题
    在研究了这些痛点之后,蚂蚁集团的中间件团队设计了对传统微服务拆分模式的升级,解决以上痛点,提供同时拥有“Speed as you need(多人协作无阻塞、秒级应用构建启动)”、“Pay as you need(资源复用、按需部署)“、“Deploy as you need(部分变更)”、"Evolution as you need(轻松演进为 微服务或回到单体应用)” 特性的架构演进方式:Koupleless 模块化。
    Koupleless 模式不仅解决了基础架构抽象问题,并且细化了开发和运维的粒度。传统微服务仅进行横向拆分,而 Koupleless 模式包括纵向和横向的划分。在纵向拆分上,应用垂直划分为基座和模块,因此模块不消耗额外的机器容量(节省资源),模块开发人员只需关注他们的业务逻辑(低认知负担)。在横向拆分上,应用拆分为多个模块,允许开发人员独立迭代,不受干扰(高协作效率)。
    这种新的架构模型已被蚂蚁集团内所有 BG 采用,整合了70万核机器的应用程序。在 Koupleless 模式下,构建产物已从 GB 减少到 MB,业务启动时间从分钟级降到秒级,平均迭代效率提升 10 倍,赢得了业务团队的认可和赞誉。
    演讲提纲:
    1. 传统微服务的问题与挑战
    2. Koupleless 研发框架解法
    o 解决思路:分层屏蔽基础设施,拆分避免协作阻塞
    o 该模式需要建设的完整能力有哪些
    o 该模式带来的优势和劣势,如何权衡
    4. Koupleless 运维调度平台
    5. 实践过程与案例
    6. 未来规划与展望
    听众收益:
    o 了解蚂蚁集团在应用架构上前沿的技术和成果
    o 开拓一些新思路,用新方法思考如何合理拆分微服务,解决拆分过多,或未拆分带来的问题,同时也避免微服务的额外损耗
    o 了解该新模式是如何权衡利和弊,在隔离与共享之间找到能解决当下问题的最佳平衡点
    o 了解目前这种新模式在领域里的现状与挑战,以及未来的展望
    个人简介: 赵真灵,8 年互联网研发经验,主要从事云原生、Serverless 和微服务领域方向。2018 年加入蚂蚁集团, 曾负责基于 K8s Deployment 的应用发布运维平台建设、K8s 集群的 Node / pod 多级弹性伸缩与产品建设。当前主要负责应用架构演进和 Serverless 相关工作,完成蚂蚁新应用架构研发框架与平台的设计落地,全面应用于蚂蚁集团内部业务线,为线上 70W core 提供秒级验证发布能力,获得 2022 年信通院云原生技术创新奖。同时,也是 SOFAArk 社区的开发和维护者以及 KNative 社区的贡献者。
  • 崔宸
    去哪儿旅行
    高级开发工程师
    演讲主题:AI 生成 checklist:Qunar 使用 AIGC 在测试域的提效实践
    议题简介:随着 ChatGPT 的广泛应用,大量的自然语言处理工作得以自动化。而在测试流程中,checklist 的编写是 qa 角色对需求文档这样一种自然语言的梳理,翻译以及理解的过程,因此可以借助大模型 AI 对需求文档进行自动化生成 checklist 的工作,从而降低人工成本。在 qunar 内部,对于非自测自发的项目,往往需要 qa 花费0.5pd以上项目外工时进行编写;对于自测自发的项目,则没有 checklist 编写与核对的步骤,开发自测的质量不能很好的把控。因此,引入大模型 AI 后可以缩短非自测自发项目 qa 的 chekclist 工时,并且自动为自测自发项目生成 chekclist 辅助开发自测,提高项目开发及测试的效率与质量。
    演讲提纲:
    1、去哪儿在测试域的痛点介绍
    2、AI checklist 项目的设计方案
    3、对自动生成 case 的效果评估方案
    4、成果及后续计划
    听众收益:
    1、了解 AI 生成 checklist 的 prompt 技巧
    2、了解 AI 生成 checklist 的 prompt 技巧
    3、了解 AI 在测试域提效的效果测量方案
    个人简介:崔宸,2022年加入去哪儿旅行基础架构-基础平台团队,主要负责测试域工具的研发。参与过自动化测试、联调平台、写压测等项目,对录制回放场景有深入了解。
    熟悉 AI 大模型通识,23年开始主攻 AI 大模型应用方向,完成 AI 在测试域、需求域提效的应用落地。在去哪儿 AIGC HACKATHON 大赛获得冠军。
  • 张静
    京东科技
    智能运维资深算法经理
    演讲主题: 让运维更智能:大模型时代下京东科技 AIOps 之路
    议题简介:
    1、京东科技海量运维日志与监控指标智能化检测分析,提升业务可观测性实践
    2、京东科技 AIOps 算法赋能传统根因定位到运维专家知识融合生成式故障定位编排的演进路线
    3、京东运维大模型的探索现状
    演讲提纲:
    1、 京东科技海量运维日志与监控指标智能化检测分析,提升业务可观测性实践
    2、 京东科技 AIOps 算法赋能传统根因定位到运维专家知识融合生成式故障定位编排的演进路线
    3、 京东运维大模型的探索现状
    听众收益:
    1、如何从0-1搭建运维算法学件,找到合适的场景落地,AI 算法让运维更智能,赋能业务可观测性实战经验;
    2、了解京东运维大模型构建思路、探索现状,应用场景及未来发展趋势;
    3、IEEE 智能运维方向论文收录经验,知识产权创新点挖掘方法;
    个人简介:张静,硕士毕业于东北大学,持续深耕智能运维领域多年,带领团队致力于京东智能运维算法应用于京东线上横向业务场景,纵向监控、数据库、资源调度、硬件故障预测、DC 节能等多个场景取得突破。申请智能运维发明专利60余项,IEEE 国际会议论文收录10篇。具有将技术在业界推广的经验,提升京东智能运维行业影响力的经验,做客2023 AiDD AI+ 软件研发数字峰会智能运维专题演讲,2023 DAMS 中国数据智能管理峰会-信创运维专题演讲,2023 Gdevops 峰会北京站-智能运维专题演讲,ArchSummit 2022 全球架构师峰会智能运维专题演讲,2021数据技术嘉年华.ON LINE (第二期)《解密 StarDB 国产数据库智能运维的核心算法》技术分享;参与中国信通院《云计算智能化运维(AIOps)能力成熟度模型 第1部分通用能力要求》与《云计算智能化运维(AIOps)能力成熟度模型 第2部分系统与工具技术要求》白皮书撰写。
  • 孔帅康
    滴滴出行
    网约车质量效能中台负责人
    演讲主题:网约车全链路压测仿真度度量实战
    议题简介:仿真度是全链路压测长期重点建设事项,也是线上容量保障的核心抓手,但是当前仿真度在发单峰值和压测流量增长方式的仿真度上欠缺比较大,一般压测的发单峰值流量会锚定为历史节假日峰值的1~2倍,但是由于线上从未出现过压测的峰值,所以压测在流量增长侧的仿真度一直无法准确衡量,当前压测流量的增长方式有线性增加和阶梯增长的方式,但是在线上的流量曲线是非线性的, 如果能够准确预估压测发单流量的增长曲线,并预测出各个子链路接口流量峰值,这将在模块限流、容量预估等场景中提供指导。
    演讲提纲:
    1. 背景
    * 导言
    * 流量预估模型的必要性
    * 流量预估模型面临的技术挑战
    * 模型的技术目标及风险
    2. 流量预估模型框架
    * 流量曲线拟合基线
    * 模型准确度分析
    * 流量比例相似度分布假设验证
    * 验证结论
    * 流量预估模型
    * 投票分桶
    * 保序回归
    * 分桶合并
    * 线性拟合
    * 数据集及结果验证
    * 数据准备
    * 数据清洗
    * 度量指标
    * 结果验证
    3. 网约车压测落地效果
    4. 总结和展望
    听众收益:
    1、出行行业内领先的全链路压测建设心路历程
    2、全链路压测在公司层面组织协调推动策略
    3、链路压测仿真度度量方案演进历史
    个人简介:孔帅康 ,多年一线互联网大厂工程效率/稳定性领域工作经验(百度云、阿里云、滴滴出行),技术专家,长期工作在一线,专注于研发效能提升、系统稳定性保障、敏捷与平台工程实践落地,滴滴网约车业务全链路负责人,具备千人规模效能平台设计实践经验。
  • 李建彪
    汽车之家 服务端基础架构组
    系统架构师
    演讲主题:汽车之家 IDC 多活实践之缓存同步实战指南
    议题简介:在这次分享中将为大家介绍汽车之家的核心业务双活建设以及双活建设中缓存同步工具链的建设。双活架构能够提供高可用性和数据一致性的服务,从而保证业务的稳定运行。在双活建设过程中,缓存同步工具链扮演着非常重要的角色,它能够确保数据在双活环境中的同步。将分享汽车之家在双活建设过程中遇到的挑战,以及我们如何通过构建缓存同步工具链来解决这些挑战。此外,还会介绍所采用的技术方案和实际效果。此次分享将涵盖双活架构、缓存同步工具链以及相关技术细节。
    演讲提纲:
    1、汽车之家双活建设背景与概述
    2、之家缓存同步工具建设
    3、缓存同步工具核心技术解析
    听众收益:
    1、听众将了解双活架构的基本概念以及其在汽车之家业务中的应用,从而对双活架构有更深入的了解。
    2、听众将学习到汽车之家在双活建设中采用的缓存同步工具链技术方案,并了解其在实际应用中的效果。
    3、听众可以从中学习到如何解决双活架构中遇到的挑战,以及如何应用相关技术来提高业务的可用性和数据一致性。
    个人简介: 李建彪,汽车之家系统架构师。拥有多年传统行业、互联网行业系统架构经验。擅长微服务架构、传统应用迁移上云、云原生架构、异地多活架构。现负责汽车之家服务网格落地以及云原生服务治理、云原生可观测架构的相关工作。
  • 黄泳
    上海嘉银科技 SRE 负责人
    演讲主题:全链路监控在嘉银科技的落地实践
    议题简介:嘉银科技使用自研的一站式运维平台对接 prometheus,skywalking ,日志监控,公有云等监控告警.然后通过 CMDB ,知识库,故障诊断等一系列自研平台进一步丰富告警对象,给出告警解决方案,故障诊断,以及部分告警故障自愈.并且通过引入人工智能大模型,监控巡检自动识别动态的故障风险.
    演讲提纲:
    1、prometheus 监控架构介绍
    2、skywalking 监控介绍
    3、告警平台建设实践
    4. 告警知识库建设和引入
    5. 告警故障诊断
    6. 监控智能化巡检
    听众收益:
    1、大规模 prometheus 监控架构设计思路
    2、完整的监控告警流程设计思路
    3、告警故障知识库建设思路和智能化故障处理思考
    个人简介: 黄泳,12年互联网运维工作经验,在多家中大型公司担任运维负责人,曾主导设计支付宝秒杀场景大规模运维架构,十万级学员在线高并发系统运维.在 K8S 云原生,运维架构,监控等方面有丰富的实战经验.
    现担任嘉银科技 SRE 负责人,全面负责嘉银科技运维工作.
  • 赵舜东
    高效运维社区核心成员
    GOPS 全球运维大会金牌讲师
    演讲主题:基于开源工具的运维可观测性建设实践
    议题简介:分享基于开源工具如 Promethus、Elastic Stack、StackStorm 等,进行运维可观测性工程全链路的项目建设和二次开发实践。
    个人简介:赵舜东,昵称“赵班长”,高效运维社区核心成员,GOPS 全球运维大会金牌讲师,阿里云 MVP,中国 SaltStack 用户组发起人;《 SaltStack 入门与实践》、《运维知识体系》和《缓存知识体系》作者;现任速云科技 CEO,专注于 DevOps 和自动化运维。
  • 韩洪雷
    高效运维社区
    资深 DevOps 专家
    演讲主题:驱动研发质效提升的新探索-你的平台工程服务了谁?
    议题简介:
    1、了解平台工程的核心思想
    2、了解工具和管理规范如何默契的实现对开发者体验的优化
    3、了解一些工具上可以尝试的优于“自服务”的自动化能力
    个人简介: 韩洪雷,高效运维社区资深 DevOps 专家,系统工具条线负责人。曾就职于汽车之家,58赶集集团,用友,曾担任云平台部产品运营负责人,配置管理负责人等。有多年的配置管理及 DevOps 产品设计经验,对组织级研发效能提升有着较深的认识。专注于企业系统工具建设,曾主导和参与企业内部多个研发管理平台的建设,包括不限于项目管理,CI/CD,度量等系统的开发设计与落地。
  • 活动门票
    活动筹备中
    售票推广中
    活动结束
    选择票
    门票名称
    单价(¥)
    截止时间
    数量
    普通票
    4,200
    2024-06-29 18:00
    已售罄
    1、可参加大会两日所有的技术演讲;
    2、不含酒店中午自助餐
    3、如有疑问请咨询 :刘毅菲:130 2108 2989(微信同号)
    标准票
    4,600
    2024-06-29 18:00
    已售罄
    1、可参加大会两日所有的技术演讲;
    2、含酒店中午自助餐
    3、如有疑问请咨询 :刘毅菲:130 2108 2989(微信同号)
    参展证
    4,200
    2024-06-29 18:00
    已售罄
    嘉宾普通票
    4,200
    2024-06-29 18:00
    已售罄

    退票说明:不支持退票

    优惠或邀请码
    票价
    0
    合作伙伴
    铂金赞助
    黄金赞助
    媒体及社区合作
    GOPS全球运维大会暨XOps技术创新峰会 · 北京站
    GOPS全球运维大会暨XOps技术创新峰会 · 北京站
    GOPS全球运维大会暨XOps技术创新峰会 · 北京站
    GOPS全球运维大会暨XOps技术创新峰会 · 北京站
    GOPS全球运维大会暨XOps技术创新峰会 · 北京站
    活动主办方