发布时间: 2024-09-05 03:21:09 来源:产品中心
当前,数字化转型正持续深入推动,对各行各业带来了深远影响。同时,在国产化政策推动和大模型技术快速的提升的双重影响下,超融合因其高可靠性、高灵活性、高扩展性等优势,正慢慢的变成为企业构建灵活、可扩展的IT基础架构的重要选择。
在超融合赛道,青云科技是强有力的竞争者。根据IDC发布的《中国软件定义存储及超融合市场研究报告,2024Q1》显示,中国超融合整体市场规模已突破27亿元人民币大关。同时,超融合软件市场占比超过10%。其中,青云以10.9%的市场占有率排名第三位。
青云科技于2015年涉足超融合领域,2019年正式对外发布云易捷品牌,定位为专为中小算力规模打造的轻量化私有云产品。
“近5年时间,云易捷累计发布了16个版本,大约每3-4个月便推出新版,发布周期与频率相较于同行业的其他厂商而言是较为迅速的。青云希望能够通过这种快速迭代的方式,让产品更加贴近真实的用户使用需求。”青云科技云易捷产品经理曹振在接受各个媒体采访时如是说。
值得一提的是,今年7月推出的云易捷v5.0在保持“可靠、简单、智能”的基础上,逐渐增强了VMware迁移能力和分布式存储运维的易用性,从而为企业数字化转型提供了更全面、便捷的支持。具体来看:
第一,多集群管理。将分布在不同地点/区域的云易捷数据中心进行统一化管理,实现对多个集群的集中监控和管理,降低运维复杂性和成本。
第二,存储易运维。随义务拓展和时间推移,在集群存储空间不足或磁盘损坏时,页面提供纵向扩容磁盘以及磁盘替换等能力,轻轻松松完成存储场景的运维操作。
第三,VMware迁移多方案。提供多种VMware资源迁移方式,VMware纳管迁移,NFS文件离线迁移、在线热迁移,可依据需求场景选择最合适的迁移工具。
第四,AI开发推理平台。基于云原生架构的一体化的大模型训推平台,提供企业级AlOps管理系统,集成计算能力、尖端模型和加速优化,简单快速地进行大模型训练和部署。
曹振表示,基于四个特性,希望云易捷v5.0能距离产品愿景和理念更进一步,让IT基础设施的管理变得更顺畅和更简单。随后,他围绕三大场景,详细阐述了云易捷v5.0的更新内容:
VMware国产化替换是当前IT圈中的热门话题。替代的问题大多包括成本效益考虑、技术创新需求和自主安全可控要求。
在VMware替换场景下,云易捷提供了提供五个替换方案:一是云易捷虚拟化,云易捷提供纯IaaS虚拟化服务,并结合青云自主研发的SDN网络技术,可以与现在的VMwareVVS和VVEP这两个产品套件对标;二是云易捷超融合,云易捷在虚拟化的基础上,增加了高性能分布式块存储,与VMware的VVF产品套件对标。特别是青云科技目前正在研发的全新SDS(软件定义存储)v5.0架构,在存储性能上表现卓越,其IOPS可高达百万级;三是云易捷容器引擎,在云易捷超融合的基础之上,提供“VM+容器”两种资源,以此对标VMware“VVF+Tanzu”产品套件,以满足客户微服务架构改造需求;四是平滑升级全栈私有云,对标VMware的VCF,当客户完成早期的虚拟化品牌替换,甚至超融合架构的替换后,最终的核心目标是实现其核心业务系统的全面替换;五是云易捷混合云,也是与VMware中的VCF套件对标,就目前而言,这种混合云场景在国内仍属于较为小众的方案,尚未被广大客户所普遍接受,但也可以将此作为替换VMware的可选方案之一,供客户根据自身需求进行选择。
需要指出的是,无论采取何种替代方案,都不可避免地要面对一个核心需求,即VMware虚拟机迁移。对此,青云科技对云易捷v5.0进行了升级与迭代,推出了VMware纳管迁移、NFS离线迁移和在线热迁移三种迁移能力,旨在为客户提供了一个更加高效、便捷且灵活的迁移方案,优化迁移流程与用户体验。
除了迁移能力之外,云易捷v5.0还提供了角色权限、配额管理、安装部署优化、HTTPS一键改造、虚拟机快照&大页内存等一系列辅助功能和零星的功能补充,对于提升用户体验、确保流程顺畅以及降低迁移前后的不适应性都具有重要意义。
随着AI技术的快速发展,各行各业都在积极探索AI应用。基于此,青云科技推出了云易捷AI开发推理平台,不仅提供模型部署、任务调度、训练任务等可视化管理功能,更具备以下核心能力:
一是多元基础设施的整合能力。针对当前多元芯片的现状,平台提供异构算力的统一管理,兼容主流的英伟达及国产GPU/NPU等算力设备。在存储方面,平台支持多样化存储服务能力的对接,包括对象存储、第三方并行文件存储等。同时,平台还能对各类硬件资源使用情况进行评估分析,采集节点负载、GPU利用率、功耗等指标,并在管理页面上实时展示。
二是AI数据资产管理能力。平台能对企业AI数据资产中的数据集、模型、算法、镜像等进行统一管理,并通过访问权限控制确保企业AI数据访问的安全性。在AI场景中,模型、算力、数据是三大核心要素,其中数据的安全性对企业而言至关重要。因此,AI应用的落地往往需要将企业数据和敏感业务数据存放在私有云中,以确保合规性、安全性和客户资源保密性。
三是AI服务中台能力。平台通过内置Notebook、VsCode以及pySpark等在线IDE环境,提供交互式建模和数据分析功能。在训练任务方面,平台内置了成熟的AI训练和推理框架,如DeepSpeed、Ray、colossal-ai等,并在调优场景下支持LLaMa-Fatory、Megatron等框架及主流的LLaMa3、Qwen、ChatGLM等大型模型。在创建调优任务时,用户可通过页面操作方式设置多种方法,如Pre-traning、SFT、RM以及PPO、DPO和ORPO等参数,从而有效提高AI模型训练和应用开发的效果。
边缘计算场景在智慧城市、物联网等领域有着广泛的应用。然而,异构设备纳管难、资源调度和管理不便以及网络稳定性无法保障等问题一直困扰着运维人员。针对这些问题,青云科技在云易捷新版本中进行了多项迭代、升级和优化,具体措施包括:
1、跨区域管理:不限区域,不限地点,只要网络能触达,即可在中央控制页面上,完成集群的统一纳管。
2、进程级资源开销:运行在管理节点上的进程服务,对CPU/内存/存储等资源消耗极小,可忽略不计。
3、不限版本,不限架构:不受限云易捷集群版本,以及底层物理节点的芯片架构,只要网络能互通,均可构建集群的统一管理。
4、总部与分支间的高效协作:总部作为管理中心,能够在空闲时段自动向各边缘集群推送更新后的镜像,有效规避网络延迟问题,避免因实时更新和下载镜像而导致网络负载过高的情况。
5、快速部署:从安装启动至用户界面呈现,只需要在一分钟内就能完成,实现了高效率地部署流程。
6、优化存储管理:针对边缘集群的存储部分进行了较大的存储简化的优化,磁盘替换或扩展时,在物理机器上只需要进行拔盘与加盘操作,剩下的全部在页面上操作就能轻松完成。同时,对底层存储层进行了全新的版本升级,在单个节点或整个集群遭遇断电、断网等极端情况后,也能实现自动恢复,极大减少了人工干预的需求。
目前,云易捷已在医疗、金融、教育、工业制造等众多行业广泛应用,服务于1000+企业和机构。
以某集成电路厂商为例,作为世界领先的电路晶圆代工企业之一,该企业为全球客户提供服务。随着新一轮科技革命和产业变革的到来,芯片产业的重要性越发显著,这对底层IT能力建设提出了新的要求。
首先,数字化IT能力的构建需要具备工业互联网智能制造的能力,以支持业务系统向云原生架构的转型。其次,为提升运维管理效果,各厂区需根据产能规模进行集群规模的构建,并实现总部与各分部资源的统一管理,以降低运维管理难度。最后,国产化替代已成为中国制造业发展的重要方向之一。
青云科技针对各个分厂的分布情况,采用了3-6节点或10节点的不同规模超融合集群,以此构建底层IT承载平台,承载工厂的OA、研发及开发等环境,满足日常办公场景的应用。
其底层数据通过多副本机制确保数据安全性,并通过零信任安全管理策略对终端登录用户行为进行有效管理。并且云易捷还提供了审计分析功能,实现事后审计的纠源。
在超融合集群之上,提供了Docker容器资源,并配合负载均衡、虚拟私有云等功能,为开发人员提供多种类型的资源,以推动业务系统的容器化改造。
在多套IT集群网络互通的情况下,分部集群可与总部的全栈私有云环境打通,实现统一管理。这使得集团的运维管理人员能够进行全局资源分配和管理,及时了解各工厂的运行情况,从而降低管理交付工作的复杂性。
从客户的人力分配角度来看,每个分部无须设置过多的管理人员岗位。分部仅需一人配合总部运维管理团队,即可完成总部到分部的统一管理,从而实现对人力的优化。总部和分部的架构通过SD-WAN网络光盒实现简化和管理广域网。在网络控制功能中,从传统的硬件设备中将功能进行了抽离,通过软件的方式进行网络统一管理,例如提供冗余链路的管理、链路加密、访问策略控制、安全审计、漏洞扫描等各种网络策略与管理功能,保证总部到分部之间的链路访问的高效和稳定。
第一,提升基础设施能力。基础设施的全面云化升级,大幅增强了企业的IT支撑能力,为业务的快速发展奠定了坚实基础。
第二,降低运维成本。跨域统一管理与自动化运维工具的应用,显著降低了运维复杂性与成本,提升IT资源的利用效率。
第三,增强数据安全/业务连续性。全面的数据安全策略与高可用架构设计,保障了业务数据的绝对安全与业务的持续稳定运行。
第四,驱动业务创新。云原生平台的引入,为企业搭建了创新的试验田,加速了新产品与服务的开发与推广,助力企业在激烈的市场竞争中脱颖而出。
通过以上案例可以看出,云易捷不仅显著提升了企业的运营效率,还为其在激烈的市场竞争中保持领先地位奠定了坚实的基础。
除此之外,曹振还透露了云易捷后续各个版本中的重大更新内容:
1、云易捷v5.1。此版本主要有两个更新:一是全面构建SDS(软件定义存储)v5.0架构。其中,在性能层面上,新架构的存储IOPS及延迟相较于现有架构将提升3-5倍。在功能层面,进行了丰富的完善,最重要的包含眼神集群、EC(纠删码),以及硬盘、机柜和节点级别的高可用。
另外,新版本还能检测并自动隔离磁盘和网络的亚健康状态,从而全面提升存储产品实力。除了存储性能的提升,还对集群告警和巡检功能进行了升级,能够将复杂的开发语言或机器语言翻译成客户易于理解的解决方案,使运维管理人员能够处理80%-90%的运维场景。
2、云易捷v5.2。青云科技将对AI推理开发平台能力进行再升级,主要聚焦于扩展算力兼容性的优化。除了AI异构算力兼容优化外,还将提供多存储兼容的优化。这意味着,除了当前的高性能并行文件存储外,系统还将支持对象存储、NAS或MINIO等存储方式,这在一定程度上有助于降低整体产品成本。
3、云易捷v5.3。青云科技将针对AI推理场景进行全面升级和优化,提供RAG、向量数据库、知识图谱等技术的管理能力,使AI平台更加贴近实际应用场景和使用。
4、云易捷v5.5。青云科技将对所有云易捷子产品体系进行升级,包括各集群的监控、报表、计量、计费等功能,旨在丰富产品特性并增强其市场之间的竞争力。
可以说,云易捷通过不断地版本迭代与更新,为企业业务的发展和创新注入了源源不断的动力,这无疑为企业的长远发展奠定了坚实基础。
数字化浪潮奔涌而来,超融合架构作为一种新型IT基础架构,扮演着逐渐重要的角色。展望未来,云易捷产品线凭借其前瞻性的规划和持续的技术创新,必将加速推动企业数字化转型,实现可持续、高水平质量的发展。