Vị trí SRE (Site Reliability Engineer) đảm bảo cho hệ thống được vận hành trơn tru, ổn định cao bằng cách sử dụng các kỹ năng, phương pháp, lập trình phần mềm vào việc vận hành hệ thống. Vị trí này ngoài việc hiểu về Hardware, Networking, OS, System bạn cũng cần có kỹ năng về lập trình phần mềm.
Đối với team nhỏ thì bạn cần có càng nhiều kỹ năng trên càng tốt, còn trong team lớn thì thường mỗi người sẽ đảm nhiệm chuyển sâu về một mảng.
Thông thường các công việc vận hành hệ thống thường có nhiều việc xử lý manually cần được tự động hoá nhiều nhất có thể để tránh các lỗi do con người.
Các công ty lớn có đội ngũ SRE riêng thì họ thường tự viết các tools để xài, trong khi các công ty nhỏ có thể dùng các công cụ nguồn mở hoặc sử dụng các dịch vụ DevOps của bên thứ 3.
Tôi thấy có các nguồn tài liệu hay cho các bạn muốn theo hướng làm SRE hay DevOps ở dưới
- Google sre books : https://landing.google.com/sre/books/
- Awesome sre list : https://github.com/dastergon/awesome-sre#readme
- Devops as a service : https://blog.gruntwork.io/
No comments:
Post a Comment