- 已编辑
关于我们
阿里云存储是国内领先的云存储服务提供商,拥有丰富全面的存储产品线,涵盖块存储、对象存储、文件存储等多个存储领域。
我们是存储部门的存储基础技术团队,专注于为各类存储产品提供高性能网络、一致性协同服务等分布式环境下的核心技术能力。同时,我们也为阿里巴巴经济体内的其他业务提供强有力的支持。团队业务核心,工作氛围融洽,团队成员均以技术为本,沟通高效简单。我们会为每一位实习生配备经验丰富的师兄进行一对一专职辅导,助力快速成长。
本次招聘为部门直招,简历将直接推送给小组 Leader,反馈迅速,机会难得,期待你的加入!
团队职责
夸父
专注于研发高性能存储网络组件,涵盖 RPC 框架、RDMA、DPU、智能网卡等领域,为通用计算和 AI 智算场景下的存储产品提供核心技术支持。团队技术氛围浓厚,在业内率先构建了超大规模自研用户态协议栈和 RDMA 网络,并在 NSDI、SIGCOMM 等网络领域顶级会议上发表了多篇高质量论文,致力于推动技术创新与工业落地。核心职责包括:
- 高性能 RPC 框架研发:设计并实现基础 C/C++ 运行时库,涵盖内存管理、任务调度等核心功能;构建兼容多种 RPC 协议和传输层协议的高性能框架,具备易扩展性、可观测性和卓越性能,为分布式系统提供坚实的基础支撑。
- RDMA 和网络协议研发:通过基于 DPU 和智能网卡上的软硬协同设计、拥塞控制算法优化,为数据中心提供低延迟高可用的传输层。
- 跟踪业内前沿实践:持续关注并研究业界最新技术动态,例如 BF3 等 DPU 在 AI 领域的应用、Falcon 等新型协议的发展与落地,推动产品持续创新。
女娲
阿里云自研的飞天操作系统中的分布式协同基础服务,广泛支撑着阿里云的计算、存储、网络、大数据等几乎所有云产品,覆盖从单地域到全球化部署的各类规模下的数据协同需求。团队致力于构建坚实可靠的分布式协同基础设施,助力云产品的全球化扩展与高效运行,积极推动无主共识等系列技术创新与工业落地,并在 VLDB 等存储领域国际顶级会议发表高质量论文。核心职责包括:
- 自研分布式协调服务:基于 Paxos、Raft 等共识协议,打造高性能、高可靠的分布式协调服务,提供分布式锁、元数据存储、服务发现等核心管控能力,为云产品的稳定运行保驾护航。
- 提供多层次容灾解决方案:针对阿里云各可用区、多可用区以及跨地域等不同规模的分布式协同需求,设计并实现一站式、灵活高效的容灾方案,确保系统在全球范围内的高可用性和强一致性。
- 探索前沿技术与工业落地:紧跟分布式共识领域的技术发展趋势,积极探索并实践创新性技术方案,如去中心化广播协议、无主发号器、多活锁、无主日志、无主复制状态机等,推动先进技术在实际生产环境中的应用与优化。
职位要求
- 对新技术充满好奇心与热情,乐于钻研底层技术原理,能够快速学习并适应新技术;
- 具备扎实的编程素养,重视代码质量与可维护性,善于利用工具提升开发效率;
- 具备扎实的计算机理论基础,熟悉操作系统、计算机网络、数据结构等核心领域,并能够将理论知识灵活运用于实际问题的解决中;
- 具备扎实的工程实践能力,熟练掌握 C/C++ 编程语言 ,并对学习和掌握其他编程语言(如 Python、Go 等)持有积极意愿和开放态度;
- 具备优秀的学习能力、独立解决问题的能力以及团队协作精神,善于沟通,乐于分享;
加分项
- 有大型互联网公司相关岗位实习及项目开发经历;
- 在相关领域国际顶级会议、期刊发表论文,或相关学术会议组织的权威比赛中获奖;
- 熟悉 gRPC、bRPC 等 RPC 框架;熟悉 TCP、RDMA、QUIC、Falcon 等网络协议;有 DPDK、SPDK 等用户态 I/O 框架的开发经验;
- 熟悉 Paxos、Raft、Gossip 等经典共识协议并有相关的开发经验;熟悉 EPaxos、Accord 等无主共识协议;熟悉 Etcd、Redis、Tair、Kafka 等主流分布式中间件;
工作地点
杭州